免费使用,谷歌投资3亿美元的Anthropic正式推出Claude2,直接对标GPT-4

转载
495 天前
4885
Kyle

文章转载来源:Kyle

图片来源:由无界 AI 生成

微软凭借对OpenAI 的投资在这场 AI 变革中大杀四方,其竞争对手谷歌不甘示弱,试图使用相同的方式来迎战,重金押注了 OpenAI 的竞争对手生成式 AI 初创公司 Anthropic。Anthropic 之于谷歌,就像OpenAI 之于微软。

Anthropic本身就与 OpenAI 的渊源颇深。由于在OpenAI在发展方向上产生分歧,担心微软对OpenAI的首次10亿美元的投资后,会使其走上更加商业化的道路,偏离初衷,彼时为OpenAI研发副总裁Dario Amodei领导的团队选择离开并在 2021 年成立了 Anthropic。

截至2022 年底,Anthropic 已筹集 7 亿美元资金,其中 5 亿美元来自 Alameda Research。 谷歌的云部门随后投资3 亿美元获得 10% 的股份,该交易要求 Anthropic 从谷歌云购买计算资源。2023年5月,Anthropic在Spark Capital领投的一轮融资中筹集了4.5亿美元。至此,Anthropic 已经筹集了近 15 亿美元资金。

今年3 月份,Anthropic 发布了一款类似ChatGPT的AI聊天机器人产品 Claude。Claude 有 520 亿个参数,最初通过 Slack 集成在封闭测试版中提供,现在用户可以通过 Quora 的 Poe 应用程序以及其他六个聊天机器人访问Claude。然而,Claude 的热度明显远不及 ChatGPT 和最新的 GPT-4。

7月 11 日,Anthropic 推出了新版人工智能聊天机器人:Claude 2,目标直接与 GPT-4 竞争。

Anthropic表示,最新模型 Claude 2 提高了编码、数学和推理方面的性能,可以生成更长的响应。

Claude 2具有包含 100k 个 token 的上下文窗口,是所有商用模型中最大的。Claude 2 能够一次性处理大约7.5万个单词的文本。用户可以输入大量数据集,并要求以备忘录、信件或故事的形式进行总结。相比之下,ChatGPT可一次性处理3000个单词的文本,而GPT 4则可以处理25000个单词的文本。Claude 2 训练数据集中 10 % 为非英语数据,在处理中文请求时不在话下。


Claude 2 对比 GPT-4 


英伟达高级AI 科学家 Jim Fan 表示,Claude 2 比 GPT-4 更便宜,并且在推理和编码方面比旧版强大得多。

但在标准考试中,它还没有完全达到GPT-4,但与 Claude v1.3 相比已经快速赶上。 

  • GRE口语考试:165 vs 169(GPT-4 获胜)
  • GRE写作考试:5 vs 4(Claude 2 获胜)
  • GRE数学考试:154 vs 163 (GPT-4 获胜)
  • USMLE(美国职业医师资格考试):~67 与 ~85 (GPT-4 获胜)
  • Bar(美国律师执照考试):76.5 vs 75.7(Claude 2 获胜)


在推理基准测试中:

    • HumanEval编码:71.2% vs 67%( Claude 获胜)。 值得一提的是,GPT-3.5 的得分仅为 48%。 Claude 的编码能力得到了显着的提高。
    • GSM-8K小学数学:88% 与 92% (GPT-4 获胜)。 与之前的版本相比,Claude 从 85.2%提高到 88%。
    • Claude 2(100K 上下文)比 GPT-4-32K 便宜 4-5 倍! 假设 token 长度相似,Prompt 代币成本为 11 美元/百万token vs 60 美元/百万token,完成成本为 32 美元/百万 vs 120 美元/百万。


Claude 2的知识更新截止日期是2023年初,而GPT-4是2021年9月。所以 Claude 2 的内容要新鲜得多。
除了这些基准测试,Claude 2在编码、数学和推理方面的进步让人眼前一亮。

凭借对超量文本的支持,有用户认为Claude2 杀死了所有“chatPDF”工具——您现在可以上传 PDF 文件,让Claude2 帮你分析。Claude2 目前支持同时对最多 5 个 10 MB 以内文档同时进行总结分析。支持 pdf、text、csv 等格式。

一位用户尝试将特斯拉最新的第一季度财报上传,并询问,“特斯拉第一季度财报更新的主要内容是什么?您能对价格做出任何预测吗?”

Claude 2 能够完美地回答这个问题,并有消息来源。

还有用户上传了谷歌最新的财报记录,并要求其总结要点。结果比带有代码解释器的ChatGPT 好得多,后者具有 8k token 限制。

Claude 2 目前已经面向 UK 和 US 用户免费开放使用(https://claude.ai/),有兴趣的人可以科学尝试一下,在 GPT-4 需要付费订阅的情况下,这是一个不错的替代选择。