王者GPT-4已来,32k上下文!OpenAI首届开发者大会最新爆料,全新UI可定制GPT,xAI大模型大范围可用

转载
363 天前
3513
AI之势

文章转载来源:AI之势

文章来源:量子位

编辑:桃子 润

OpenAI首届开发者大会开启前,ChatGPT各种爆料已出,全新UI界面,人人可定制GPT,将引领「智能体工程师」新职业诞生。另一边,马斯克自家的xAI大模型也开启了大范围内测。

OpenAI首届开发者大会,开启了倒计时!

还记得周一,OpenAI悄无声息地解禁了ChatGPT的两大能力:一是上传PDF、数据文档等文件,另一个是无需转换即可使用所有工具。

这不,OpenAI开发者论坛上,已经有网友发现「GPT-4(ALL Tools)」开始灰度测试了。而且ChatGPT界面也有了不同的变化。

简单来说,就是把之前ChatGPT Plus的几个单独选择的功能全部集合到一起,让它可以同时联网,调用代码解释器,DALL-E 3,以及使用各种插件。

而另一边,马老板流量加持的xAI推出了第一个AI助手——「Grok」,已经开始了小范围的测试。

X上网友纷纷晒出了自己的「Grok 初体验」。

网友贴出自己通过X Premier+获得了体验Grok的机会,问了一个关于X上最火的几个账户的问题,结果是Grok可以根据X上的数据进行实时的回复。


32k上下文,王者GPT-4(All Tools)


值得一提的是,GPT-4(ALL Tools)配上了32k上下文窗口。

但是如果我们单独使用DALL·E 3、浏览器等工具,仅有8k的上下文窗口。

具体信息,可以从代码图中看出:

已经开启权限的网友开始了试玩。

天津师范大学副教授Wang Shuyi表示,GPT-4 (All Tools)打通各个模式之后,拿来当助教非常合适。你可以让它识别幻灯帮你讲解,还能立即给你写出程序代码的例子来。

还有人表示,使用GPT-4功能全程无受限。

以图绘图不再是梦。

有网友直接给出提示:查找人口最多的国家的最新人口数据,在该国穿着民族服装的人持有的板上显示价值,并列出来源。

然后,ChatGPT通过「网络浏览」确定了印度和1,425,775,850的人口。不过,DALL·E 3尝试了几次才(几乎)在图像上显示字母。

再来一个例子:


全新UI,可定制GPT


如上,我们看到的是ChatGPT即将迎来更新的一部分能力。

在OpenAI开发者大会还未开启之前,已经有各种风格消息曝出ChatGPT将迎来重大更新,甚至面向开发者的API更加优惠。

具体包括:

全新的UI界面——新的ChatGPT原型Gizmo V8,知识截止日期为2023年4月。

定制聊天机器人

首先,OpenAI将发布专门用于创建、管理和选择自定义聊天机器人的Gizmo工具,功能:

- 沙盒测试:提供导入、测试和修改现有聊天机器人的环境

- 自定义操作:使用OpenAPI规范为聊天机器人定义附加功能

- 知识文件添加:添加聊天机器人可参考的其他文件

- 基本工具:提供浏览网页、创建图片等基本工具

- 数据分析:查看和分析聊天机器人使用数据

- 草稿保存:为您创建的聊天机器人保存和共享草稿

- 发布:发布完成的聊天机器人

- 共享:设置和管理聊天机器人共享

- 市场:浏览和分享其他用户创建的聊天机器人

「Magic Creator」或「Magic Maker」

将协助用户通过互动界面定义聊天机器人,识别用户意图,实时测试,并通过对话迭代修改聊天机器人的行为。

- 通过互动界面定义聊天机器人

- 识别用户意图并创建聊天机器人

- 实时测试创建的聊天机器人

- 通过迭代对话修改聊天机器人行为

- 共享和部署聊天机器人

更多详细的信息如下图:

还有ChatGPT的终极工具箱。

工作空间和团队计划提供了新的企业订阅和工作空间管理功能

团队计划以每月30美元的价格提供,年订阅为每月25美元,但至少需3名用户。

最低月费用达到90美元,提供无限制快速GPT-4访问、更长上下文和高级数据分析模型的无限使用等额外好处。

工作空间功能为个人和工作空间提供了分隔,并允许定义角色、部门或其他元数据,预计可以整合外部ERP和CRM系统。

ChatGPT「上下文连接器」

可以链接Google Drive和Microsoft 365,使文件、表格或演示文稿能够附加到聊天中或用作对话的上下文。

英伟达高级科学家Jim Fan表示,我要去参加OpenAI开发者日!如果泄漏属实,这将是人工智能消费市场的关键时刻: 

OpenAI正在成为一个成熟的UGC平台,用户可以在其中创建和共享任何AI Agents。它将包括RPA、角色AI、插件存储等等功能。市场将销售BEHAVIOR,而不是像Wolfram Alpha这样的软件扩展。 

将有一些工具可以帮助任何用户在沙盒中快速构建和测试agent,可以访问插件、浏览器、本地文件和远程文件(通过GDrive/Microsoft连接器)。

机器人的行为不会通过SDK进行编程,而是通过简单的迭代聊天进行编程。我觉得这特别有趣,因为它大大降低了门槛。

你无需编码或编写系统提示,而是通过对话询问和完善您想要的内容。我想agent也可以提出后续和澄清问题,因为它正在「在上下文中训练」。它与DALLE·3的直观界面一致,类似于我们作为人类入职新员工的方式。 

一切似乎都离Karpath认为的「GPT作为新操作系统」的愿景更近了一步。如果市场和收入分享模式真正起飞,「Agent Devs」将是一个新的职业,就像「iOS Devs」一样。

还有大V认为,如果OpenAI新功能的泄露属实,「Agents开发者」将会变成继iOS开发之后的新职位。

25k上下文,Grok更多内测

根据X上一位大V的爆料和总结, 到目前为止Grok:

- 支持SuperPrompt的上下文窗口的大小大约是25k的token 
- 响应时间会非常快 
-个性鲜明,搞笑且机智,远离枯燥的「政治正确」 
-目前微调的数据来源是 886.03 GB版本的「The Pile」数据库,以及整个X平台的海量数据 
-「实时」搜索引擎,数据来源优先从X上获取 
- API功能确定会推出。
- 支持语音输入提示词,输出回复 
- 图像生成,图像识别,语音识别等多模态未来一定会支持,当前模型已经有相关的一些能力。
-轻量版Grok可以在特斯拉上本地化部署运行。

这位网友在获得体验资格之后,先和Grok来了一场骂战,结果是Grok大获全胜,马老板亲自回复:笑哭。

而在目前公开的主流LLM服务中,似乎只有独此一家可以满足这个需求。

而大部分吃瓜网友,对马老板号称能「探究这个世界真相的」AI助手,还是相当看好的,虽然没有人用过,但是已经有1/4的网友相信,它半年内就会成为最领先的大预言模型。

看来网友对于xAI还是有一股「谜之他信」,虽然现在大部分的网友目前都没办法体验「Grok」,但是很多网友对它已经非常期待。

一位初创公司的CEO表示,就名字而言,就已经薄纱了现在所有的LLM,Grok代表着的「顿悟」,非常有品味。

已经被大模型政治正确搞得很厌烦的网友,似乎非常期待获得一个性能强劲,性格又不那么死板的AI助手了。

那么,代价是什么呢?

马老板也官宣了Grok的早期获取方式——订阅「