字节GPT账户突遭冻结,OpenAI:正在调查不当行为

转载
335 天前
3678
AI之势

文章转载来源:AI之势

原文来源:量子位

图片来源:由无界 AI生成

字节跳动,陷入大模型舆论风波。

据The Verge报道:

字节跳动一直在秘密使用OpenAI的技术,来开发自家大语言模型(LLM)。

而在此消息被披露不久,The Verge进一步称OpenAI已经暂停了字节跳动的账户

具体而言,OpenAI发言人Niko Felix发布的声明如下:

虽然字节跳动使用我们API的量很少,但我们已经暂停了他们的账户,同时我们会进一步调查。
如果我们发现他们的使用不符合规则,我们将要求他们进行必要的更改或终止他们的帐户。

这里提到的“规则”是指在OpenAI的服务条款中有一项明确的规定,那就是OpenAI提供的模型能力,不允许用来被“开发任何与之产品和服务形成竞争的 AI 模型”。

据了解,字节跳动是通过微软购买的OpenAI访问权限,但是微软也制定了与OpenAI同样的政策。

The Verge表示正在向微软做进一步的咨询,是否也会跟OpenAI采取同样的措施暂停字节跳动的账户。

那么,此次的抄袭风波具体是怎么一回事呢?


内部文件被曝光


根据The Verge的说法,证据是来自字节跳动的一份内部文件——海外版飞书Lark的聊天记录。

这份文件表明,字节跳动在代号为“种子计划”(Project Seed)基础大语言模型项目中,几乎是在每个开发阶段都依赖OpenAI的API来进行开发,包括训练和评估模型。

“种子计划”是大约在一年前启动,目前主要研发两个产品,一个是在国内已经上线的Doubao;另一个是针对商业用户的聊天机器人平台,目前正在开发中。

据称,参与“种子计划”的员工是深知过度依赖OpenAI API的后果,于是他们就开始讨论如何通过“数据脱敏”来粉饰证据。

以至于经常会出现员工达到OpenAI API的最大访问上限的情况。

更具体而言,字节跳动更多的是在“种子计划”的早期阶段使用了OpenAI的技术。

The Verge根据内部文件表示,字节跳动大约是在几个月前下达了“模型开发的任何阶段停止使用 GPT 生成的文本”的命令。

不过也正是在这个时候,字节跳动发布了自家大语言模型Doubao。

但The Verge表示即便到了这个时候,字节跳动依旧没有停止违规行为:

字节跳动继续以违反OpenAI和微软服务条款的方式使用 API,包括评估豆包背后模型的性能。

并且还表示一位对字节跳动内部情况有一手消息的人指出:

他们说他们想确保一切都是合法的,但他们实际上只是不想被抓住把柄。


字节跳动已作回应


在The Verge发出这篇报道之后,字节跳动发言人Jodi Seth做出了如下回应:

GPT 生成的数据在“种子计划”的早期开发中用于注释模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。
字节跳动得到了微软的授权,可以使用GPT API。
我们在非中国市场利用GPT支持我们的产品;但在中国市场,则是使用我们自研的模型来支持Doubao

微软方面,发言人Frank Shaw则表示:

像Azure OpenAI服务这样的Microsoft AI解决方案,属于我们的有限访问框架的一部分,意味着所有客户都必须申请并得到 Microsoft 的批准。
我们还制定了标准,并提供资源帮助客户负责任地使用这些技术,并符合我们的服务条款。
我们有流程来检测滥用,并在发现违反行为准则的公司时,将停止他们的访问权限。

量子位也在第一时间与字节跳动取得了联系,但目前字节跳动并未做出正式回应。

我们将在评论区对此次事件的进展做进一步跟进。

参考链接:
[1]https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm
[2]https://openai.com/policies/business-terms