一周AIGC丨OpenAI暂停字节跳动账户,Gemini自曝中文使用百度文心一言训练

转载
333 天前
2688
邱祥宇

文章转载来源:邱祥宇

在外媒报道字节跳动使用 GPT 训练人工智能模型后,账户被 OpenAI 暂停。随后字节跳动回应称,已采取措施保证对 GPT 的 API 调用符合规范要求。谷歌 Gemini 自曝中文使用百度文心一言进行训练,目前百度方面尚未回应此事。

图片来源:由无界AI 生成


融资


消息人士:零一万物拟融资 2 亿美元,阿里云或参投

据路透社 12 月 14 日报道,两位熟悉内情的消息人士透露,创新工场董事长兼 CEO 李开复成立的 AI 公司零一万物正在进行新一轮融资,最多 2 亿美元资金。消息人士称,阿里云早些时候已承诺在本轮融资中提供资金,但目前未回应评论请求。上个月,零一万物估值达到 10 亿美元。

Mistral AI 完成 3.85 亿欧元的新一轮融资,将推出新的大语言模型

据彭博社 12 月 11 日报道,法国人工智能初创公司 Mistral AI 在新一轮融资中筹集了 3.85 亿欧元(约 4.15 亿美元),将用于推进其开源软件。本轮融资由硅谷风险投资公司 a16z(Andreessen Horowitz)和初始投资方光速投资公司(Lightspeed Ventures)领投,对该公司的估值约为 20 亿美元。Mistral AI 表示将推出新的大语言模型,并开放商业平台。

前谷歌搜索团队创办的 AI 公司 Glean 正寻求以 20 亿美元的投前估值融资至少 2 亿美元

据 The Information 12 月 14 日报道,两位知情人士透露,前谷歌搜索工程师创办的初创公司 Glean 正在与投资者谈判,希望以 20 亿美元的投前估值融资至少 2 亿美元。

据其中一位知情人士透露,Kleiner Perkins 公司也曾投资过 Glean 的前三轮融资,该公司正在讨论共同主导最新的融资。此次融资将使 Glean 的估值比 2022 年 5 月翻一番,而且截至本季度,该公司的年经常性收入已增至 3000 多万美元,比去年同期至少高出三倍。

知情人士:法律 AI 初创公司 Harvey 正洽谈新一轮融资,估值 7 亿美元

据 The Information 12 月 14 日报道,两位熟悉融资情况的人士透露,法律人工智能初创公司 Harvey 正在洽谈一轮 7000 万到 8000 万美元的融资,包括投资在内的估值将达到 7 亿美元。据悉,这笔融资是其 4 月份宣布的估值的四倍多。

知情人士称,风险投资公司 Kleiner Perkins 和个人投资者 Elad Gil 将共同领投本轮融资,后者曾投资过该公司的种子轮和 A 轮融资。此外,现有投资者红杉资本和 OpenAI 创业基金也将参与本轮投资。

AI 招聘平台 HelloBoss 获数百万美元 Pre-A 轮融资,云启资本领投

据《科创板日报》12 月 12 日报道,日本 AI 招聘平台 HelloBoss 完成数百万美元 Pre-A 轮融资,由云启资本领投,Golden Egg 跟投,银橡资本担任独家财务顾问。本轮融资将用于产品研发、市场拓展和团队建设等方面。HelloBoss 瞄准的赛道是 AI+HR 服务,帮助企业和求职者通过 AI 快速匹配,完成招聘工作。

人工智能医疗设备研发商“瑞图生物”完成超亿元 B2 轮融资

据每日经济新闻报道,近日,瑞图生物完成超亿元 B2 轮融资,由国科投资、国内知名基金领投,深投控资本参与投资,点石资本担任独家财务顾问。本轮融资将主要用于核心产品的生产、商业化及研发迭代等。瑞图生物是一家人工智能医疗设备研发商,公司主要从事提供人体全标本、全流程、全自动化、全智能化检验产品,研发了基于人工智能新一代 DeepCell。

AI 初创公司 Arcane 获得 500 万美元融资,Accel 领投

据 Business Insider 12 月 14 日报道,总部位于伦敦的人工智能初创公司 Arcane 获得 500 万美元融资,美国风险投资公司 Accel 领投,Cocoa、Firstminute Capital、Kima Ventures 和 Seedcamp 参投。此外,包括 Meta 生成式 AI 产品副总裁 Connor Hayes、Monzo 创始人 Tom Blomfield、Supercell 首席执行官 Ilkka Paananen 和 WeWork 总裁 Anthony Yazbeck 在内的天使投资者也支持了本轮融资。


大模型


外媒:字节跳动正秘密利用 OpenAI 技术打造自家大模型

据金十援引 The Verge 12 月 16 日报道,字节跳动正在秘密使用 OpenAI 的技术开发自己的大语言模型(LLM)。在人工智能领域,这种做法通常被认为是不合适的。这也直接违反了 OpenAI 的服务条款。当字节跳动使用 GPT 训练他们的人工智能模型的消息曝光后,OpenAI 暂停了他们的账户。然而,字节跳动大部分的 GPT 使用是通过微软 Azure 平台完成的,而不是直接通过 OpenAI。目前还不清楚微软是否会效仿 OpenAI,暂停字节跳动的访问权限。

字节跳动回应称,已采取措施保证对 GPT 的 API 调用符合规范要求。

Gemini 自曝中文使用百度文心一言进行训练

据量子位 12 月 18 日报道,谷歌 Gemini 中文语料来自百度文心一言。经测试,在谷歌 Vertex AI 平台使用该模型进行中文对话时,Gemini-Pro 直接表示自己是百度文心大模型。在谷歌 AI Studio 中,Gemini-Pro 则表明其在中文的训练数据上使用了百度文心。目前百度方面尚未回应此事。

微软发布 27 亿参数语言模型 Phi-2,性能可媲美或优于比它大 25 倍的模型

AI 新智界讯,12 月 13 日,微软发布 27 亿参数的语言模型—Phi-2。据介绍,由于在模型缩放和训练数据整理方面进行了创新,在复杂的基准测试中,Phi-2 的性能可媲美或优于比它大 25 倍的模型。

据悉,Phi-2 是一个基于 Transformer 的模型,在 1.4 T 的词块上进行了训练,这些词块来自 NLP 和编码的合成数据集和网络数据集。在 96 个 A100 GPU 上对 Phi-2 的训练耗时 14 天。Phi-2 是一个基础模型,没有通过人类反馈强化学习(RLHF)进行调整,也没有经过指导性微调。尽管如此,与经过对齐的现有开源模型相比,Phi-2 在毒性和偏差方面有更好的表现。

在各种综合基准测试中,Phi-2 超越了 Mistral 和 Llama-2 模型在 70 亿和 130 亿参数下的性能。值得注意的是,在多步骤推理任务(即编码和数学)上,Phi-2 的性能是 Llama-2-70 B 模型的 25 倍。此外,Phi-2 的性能与最近发布的 Google Gemini Nano 2 不相上下,甚至更胜一筹。

魔搭社区上线 Mistral AI 首个开源 MoE 模型 Mixtral-8x7B

据站长之家 12 月 14 日报道,Mistral AI 近日发布了首个开源 MoE 模型 Mixtral 8x7B,并宣布在魔搭社区上线。

Mixtral-8x7B 是一款混合专家模型(Mixtrue of Experts),由 8 个拥有 70 亿参数的专家网络组成,在能力上,Mixtral-8x7B 支持 32k token 上下文长度,支持英语、法语、意大利语、德语和西班牙语,拥有优秀的代码生成能力,可微调为指令跟随模型。该模型在 MT-Bench 评测上达到了 8.3 分,与 GPT3.5 相当。

阿里研究部门推出专为东南亚量身定制的 AI 大模型 SeaLLM

据站长之家 12 月 12 日消息,阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能大语言模型 SeaLLM,凸显了该公司在更广泛地区发展市场的雄心。阿里巴巴研究部门表示,东南亚 LLM(SeaLLM)在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅甸语数据集上进行了预训练,并且在语言和安全任务方面优于其他开源模型。

中科闻歌发布雅意 2.0 大模型:300 亿参数,支持 128k 上下文窗口输入

据《科创板日报》12 月 15 日报道,由中国科学院孵化的中科闻歌公司,今日发布雅意 2.0 大模型,为 300 亿规模参数,支持 128k 上下文窗口输入,图文多模态能力,十余种语种对话,以及智能工具调用。中科闻歌董事长王磊表示,雅意 2.0 是为数不多的从头进行预训练的国产原生大模型,专注于安全可靠政企大模型,开源支持商用,构建安全、金融、媒体、舆情等领域大模型生态。据悉,中科闻歌于今年 6 月发布雅意大模型。


应用


Midjourney V6 模型将在下周发布,支持绘制更复杂的内容

据站长之家 12 月 18 日报道,Midjourney V6 模型将在下周发布,Midjourney 今日正式开始社区风格评价。根据社区评价中的一些图片,V6 模型在还原复杂画面信息和内容方面有了大幅提高,同时也更敢于绘制更复杂的内容。

消息称谷歌 Pixel 9 系列手机将内置全新的专属 AI 助手“Pixie”

据 IT 之家 12 月 16 日报道,综合 The Information、9to5 Google 等外媒报道,谷歌正在开发一款全新的 AI 助手,它基于自家最新的 Gemini 模型,将是 Pixel 设备的专属助手,名为“Pixie”。

报道称,Pixie 将成为一个“更具个性化”的谷歌助手,其目标是执行复杂的多模态任务,使用 Pixel 系列手机上的 Gmail、地图和其他来自谷歌产品的数据。例如,向用户推荐离自己最近的商店。

联想 AI PC 将在明年率先搭载个人大模型

据《科创板日报》12 月 14 日报道,联想集团副总裁、中国区首席市场官王传东表示,AI 时代,AI PC 将成为 AI 普惠的首选终端,而联想 AI PC 将在明年率先搭载个人大模型。未来、AI 与 PC 结合将形成“算力平台 + 个人大模型 + AI 应用”的新型混合体。

南京农业大学研发全国首个古籍 AI 大模型“荀子”

AI 新智界讯,据“南京农业大学校友会”官方公众号,近日,南京农业大学信息管理学院王东波教授研究团队在北京发布“荀子”古籍大语言模型。

据介绍,“荀子”大模型包含《四库全书》在内的绝大多数传世古籍文献,拥有超过 20 亿字的大型语料库,是该校团队在国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”的支持下,联合中华书局古联公司推出的专门进行古籍处理与研究的智能工具。该模型包含基座模型 XunziALLM 和对话模型 XunziChat 两部分,用户还可根据自己的需求使用本地训练语料微调基座模型,从而使其在古籍下游处理任务上取得更优越的处理性能。

百度上线文心一言插件商城,提供思维导图、音视频提取等功能

AI 新智界讯,12 月 13 日晚间,百度 AI 官方公众号发文宣布,文心一言插件商城现已正式上线,内含插件覆盖办公提效、多模态内容理解生成、专业信息查询等各种使用场景。

用户只需通过简单指令,即可实现 PPT 生成、音视频提取、思维导图制作等多场景多模态下的需求。目前上线的插件包括思维导图工具、PPT 生成器、输入网址就能提炼视频关键信息的“视频助理”等。

美图推出移动端 AI 生图工具 WHEE,基于 MiracleVision 大模型

AI 新智界讯,12 月 13 日,美图宣布移动端 AI 生图工具 WHEE 上线,基于美图 MiracleVision 大模型,提供一站式 AI 视觉创作服务。


政策


上海市徐汇区印发《徐汇区关于支持人工智能大模型发展的若干意见(试行)》

据证券时报 e 公司 12 月 15 日报道,上海市徐汇区印发《徐汇区关于支持人工智能大模型发展的若干意见(试行)》,其中提出,加强市区算力统筹,实施算力伙伴计划,对开展通用大模型、垂类大模型训练优化的创新主体的算力成本予以分档支持。相关创新主体购买或租用算力的,经认定,最高可按实际发生费用的 30%、给予不超过 1000 万元的补贴支持。


大公司


分析:英特尔 Gaudi AI 芯片订单已达 20 亿美元

据《科创板日报》12 月 14 日报道,美国券商 Raymond James 近日表示,虽然个人电脑销售下滑,英特尔短期内可能面临困难,不过投资人应该关注的是该公司的长期机会,比如人工智能。分析师 Srini Pajjuri 于 12 月 12 日重申英特尔股票“优于大盘”的评级,并将目标股价由 42 美元上调至 48 美元。分析师指出,英特尔 Gaudi AI 加速器订单已达 20 亿美元,这是英特尔专门针对 AI 研发的产品,预计英特尔有能力将这些芯片出售给企业,用于较小型产业特定 AI 模型。

大摩:微软将 H100 AI 服务器订单减至 8 万台,部分订单转移至 B100

据《科创板日报》报道,根据大摩最新消息,微软可能会将 2024 年 H100 AI 服务器的订单从 12 万台减少至 8 万台,并将部分订单转移到 B100,预计 2024 年第四季出货,因为 B100 的运算能力至少是 H100 的两倍,但价格仅高出 50~60%。另外也有部分转单至超微 MI300。


观点


李彦宏:百模大战是对社会资源的极大浪费,更多资源应该放在超级应用

据第一财经报道,12 月 16 日,百度创始人、董事长兼 CEO 李彦宏与极客公园创始人兼总裁张鹏对谈时指出,“百模大战是对社会资源的极大浪费,更多资源应该放在超级应用。”大模型的发展有三个关键点:产业政策鼓励 AI 原生应用开发;现有企业能利用大模型对核心指标产生正向作用;超级应用的出现。

另据新浪科技报道,李彦宏还表示,大模型的价值可能是产生新的超级应用,也可能是对现有产品的改造。他举例说,微软基于 Office 360 推出 Copilot,一个月 30 美金,全年收入比 OpenAI 高出几倍。所以,企业要多去思考,AI 如何与自己的现有业务去结合。

李开复:大模型最终能活下来五六家,做 AI 应用的机会刚刚开始

据第一财经报道,12 月 14 日,在一场 AI 相关的对话中,零一万物 CEO 李开复在被问到大模型赛道最终能有几家活下来时表示,“除了大厂,中美加起来应该可以支撑五六家左右。”在他看来,做巨大的预训练模型的机会不能说关闭了,但会越来越难,可能需要新的技术才能够再有机会,但是做其他方面比如 AI Infra(人工智能基础框架技术)、做 AI 应用等等,机会才刚刚开始。

Sam Altman:AI 发展就像龙卷风,理解外界担忧,OpenAI 需要突破极限

据澎湃新闻报道,当地时间 12 月 11 日,在美国亚特兰大举办的 HOPE 全球论坛上,OpenAI CEO Sam Altman 登台亮相并接受了媒体采访。Altman 表示,AI 将会“举起整个世界”,推动医疗保健和教育等领域的潜在进步。Altman 还谈到,在文艺创作中,“终结者”等冷酷无情的 AI 形象让自己震撼,他可以理解人们对于 AI 的担忧;但是,为了充分实现这项技术的潜力,包括 OpenAI 在内的公司需要努力去“突破极限”。

谈到 AI 带来的技术革命和此前技术的不同点时,Altman 承认,AI 技术的发展速度“有些让人害怕”,并且 OpenAI 已经“跳入了这场不会停止的龙卷风”。Altman 也在会上宣布,自己将和美国组织 HOPE 的创始人 John Hope Bryant 一同在亚特兰大创建一个新的 AI 道德委员会。


研报


报告:未来七年,生成式 AI 技术有望为印度 GDP 增加 1.5 万亿美元

据站长之家 12 月 18 日报道,根据安永印度公司的一份报告,未来 7 年,生成式人工智能有可能为印度的 GDP 累计增加 1.2-1.5 万亿美元。

这份题为《印度的 AIdea: 生成式人工智能加速印度数字化转型的潜力》的报告提供了对该行业在拥抱通用人工智能方面的准备和挑战的见解。根据该报告,到 29-30 财年,新一代人工智能可能为印度的 GDP 累计增加 1.2-1.5 万亿美元。预计近 69% 的整体影响将来自商业服务(包括 IT、法律、咨询、外包、机械设备租赁等)、金融服务、教育、零售和医疗保健等行业。

机构:AI 人才供不应求 ChatGPT 研究员平均月薪 6.7 万元

据证券时报 12 月 16 日报道,日前,脉脉高聘发布的《2023 年度人才迁徙报告》显示,2023 年,新经济人才持续饱和,人才供需比从 2021 年的 0.32 上升至 2023 年的 2.04,平均 2 个人争夺 1 个岗位。但 AI 相关岗位人才供不应求,在高薪岗位 TOP20 中,以 ChatGPT 研究员、算法、深度学习为代表的 AI 岗位拥有 10 席。ChatGPT 研究员以平均月薪 6.7 万元位列高薪榜榜首。

报告:2022 年游戏科技对 AI 的跨行业科技进步贡献率达 31.37%

据金十 12 月 15 日消息,在今日举行的 2023 年中国游戏产业年会上,由中国音数协、工信部工业文化发展中心联合发布的《超级数字场景源动力——游戏科技与创新应用研究》报告首次提出超数化指数概念,其中量化了游戏科技跨领域的贡献率。报告显示,2022 年游戏科技对芯片、AI、云计算、手机、XR、自动驾驶等行业的跨行业科技进步贡献率分别为 18.65%、31.37%、51.08%、46.76%、72.45% 和 57.19%。

工信部赛迪研究院:今年我国生成式 AI 企业采用率达 15%,市场规模约 14.4 万亿元

据工业和信息化部赛迪研究院消息,今年,我国生成式人工智能市场规模有望突破 10 万亿元。生成式人工智能正在加速渗透制造业、零售业、电信行业和医疗健康等四大行业。数据显示,今年,我国生成式人工智能的企业采用率已达 15%,市场规模约为 14.4 万亿元。在制造业、零售业、电信行业和医疗健康等四大行业的生成式人工智能技术的采用率均取得较快增长。专家预测,2035 年生成式人工智能有望为全球贡献近 90 万亿元的经济价值,其中我国将突破 30 万亿元,占比超过四成。