一次10万token!GPT4最强对手史诗升级,百页资料一分钟总结完毕

转载
558 天前
1869
AI梦工厂

文章转载来源:AI梦工厂

来源:量子位

号称ChatGPT“最强竞争对手”的Claude,今天迎来史诗级更新——

模型记忆力原地起飞,现在1分钟看完一本数万字的小说,已经不在话下。

消息一出,评论区直接炸了,网友们蜂拥而至,“woc连连”:

疯了疯了!
事情进展得太快了,又是为人类担心的一天!

原来,这次更新,将模型的上下文窗口token数提到了足足10万,相当于7.5万个单词

这意味着,大模型“记性”不好的缺陷现在得到补强,我们可以直接丢给它上百页上万字的材料,比如财报、技术文档甚至是一本书。

而它都能在一分钟之内帮你分析总结完毕!

要知道,之前市面上几乎所有AI聊天机器一次都只能读取有限数量的文本,理解长资料里的上下文关系非常灾难。

而我们人类自己去处理大篇幅的文本又太慢了,比如光是要读完10万token的材料,就需要大约5个多小时,更别提还要花更多的时间去理解去消化才能进行总结。

现在,Claude直接一把搞定。

这波,简直是“五雷轰顶”、“反向开卷”GPT-4,因为,刚刚后者也不过才做到3.2万token。

所以,一次性比GPT-4多出3倍的处理量,Claude效果提升究竟如何?


Claude重磅更新:一次记忆10万token


据Anthropic官方介绍,升级后的Claude-100k版本,对话任务处理能力双双得到极大提升。

一方面,是“一次性可处理文本量”的增加,直接拓宽了Claude的可从事岗位类型。

之前,大模型最多用来处理个几十页的文档。

现在,Claude已经能速读公司财报年报、技术开发文档、识别法律文件中的风险、阅读上百页研究论文、乃至于处理整个代码库中的数据。

最关键的是,它不仅能通读全文总结其中的要点,还能进一步完成具体任务,如写代码、整理表格等。

例如,快速理解几百页的开发文档,并根据文档开发应用程序demo。

以Claude之前没见过的一项新技术LangChain作为示例:

当交给它一个240页的LangChain API报告后,要求它快速给出一个LangChain的demo演示:

几乎没用多少时间,Claude就快速给出了一个基于LangChain开发的应用程序demo:

又例如,甩给它一个漫长但又不得不听的5小时知识播客

它不仅能将重点转成文字提取出来,还能快速整理表格,对观点进行分析:

难度增大一点,30页的研究论文也能很好地处理,甚至能准确指定它整理某一章节的某一段落:

除此之外,还能帮导演处理剧本选址一类的问题。如给出《沙丘》的电影脚本,问Claude最适合拍摄的地点,它很快就能给出几个对应的参考地址:

最后,官方还给出了一个《了不起的盖茨比》案例,虽然没有demo演示。

他们将这篇喂给Claude后,替换了其中一个角色Mr. Carraway,把他的角色变成“Anthropic里的一位工程师”,再交给Claude阅读,让它找不同。

几乎只用22秒钟,Claude就读完这本书,并发现了Mr. Carraway的“不同身份”。

另一方面则是“记忆力”的增加,带来了对话题掌控度的提升、以及聊天能力的提升。

此前大模型经常会出现“聊着聊着忘了话题”的情况,对话窗口总字数超过几千字后,开始胡言乱语。

举个栗子