小米交卷大模型,全新小爱同学实测来了

转载
458 天前
6498
AIcore

文章转载来源:AIcore

来源:量子位

作者:梦晨 明敏

在雷军的年度演讲分享中,讲武大求学经历,分享学霸4年大学2年完课经验;讲被《硅谷之火》点燃,勤奋练习写最好的代码,开启第一次创业的往事;最后加入金山、创办小米,一路坚持梦想、实现梦想、不断成长的知行合一……

于是雷军超燃演讲刷屏之下,自家大模型前脚刷新的纪录、引发的热议,都被盖过了。

不仅如此,发布会上一系列小米技术的最新进展,也被盖过了——但再回头来看,其实都很重要很值得关注,比如AI大模型装进手机小爱同学的大模型升级仿生四足机器人新落地……

以及雷军还亲自公布了小米的科技战略、AI公式AI即将对小米展开的全方位刷新

这也是为什么小米的这波AI新进展值得详谈。

我们先从四两拨千斤的小米大模型说起。


AI全面赋能,把大模型塞进手机


小米自研大模型MiLM,在雷军演讲前一日就现身GitHub,也卷也不卷。

不卷在规模,主打6B、1.3B(64亿参数,13亿参数)版本,妥妥的轻量级选手。

卷在了性能,把更小巧的1.3B参数版本塞进手机,做到在很多场景上可以媲美云端大模型效果。

小米大模型团队由栾剑带队,向小米集团技术委员会AI实验室主任王斌博士汇报。从今年4月开始研发,短短4个月时间已经交卷。

成绩如何,先上评测结果:

6B参数版本,在C-EVAL权威榜单上取得同参数量级排名第一,CMMLU中文向大模型取得排名第一

具体来说,C-EVAL数据集是一个全面的中文基础模型评测数据集,涵盖了52个学科和四个难度的级别。

CMMLU 数据集是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。

自去年11月ChatGPT来袭,最先行动起来的多是云计算公司如微软谷歌亚马逊。

但随着技术进一步成熟,端侧大模型成为行业下一个发力点,苹果方面已有传闻,而小米抢先跑进第一梯队。

把大模型塞到手机里,好处在哪?

首先,本地运行不用担心信号差、飞机无网络等情况,且响应速度更快。

同时,用户隐私更有保障,也便于提供更个性化的服务。

总结一下就是:随时随地享受AI带来的先进生产力。

与此同时,量子位也获得了新版小爱同学邀测资格

还是那个熟悉的声音,不过在大模型加持下,小爱同学真的可以说进化成智能助手了 。

先按能力推荐,解释一下最近很火的超导概念,不成问题。

还记得当初难倒一众国内外大模型的弱智吧难题“我爸妈结婚为什么不邀请我”吗?

小爱同学表示根本不上这个当好吧。

如果一时不知道小爱大模型还有什么玩法,也可以来到探索专区找找灵感。

从这里也可以看出,小爱大模型还与系统做了一定程度的融合

比如在小米金牌客服模式,刚刚上新没几天的旗舰折叠手机也介绍的头头是道,并能一键跳转去商城。

据小米透露,小米搞大模型就是瞄准系统级能力,或许未来整个手机操作系统都会像这样进化成“智能操作系统”也说不定。

但手机大模型并不是小米AI唯一的发力方向,这次一起亮相的机器狗二代铁蛋就藏着不少AI秘密。

为什么二代铁蛋能比一代体型更小、运动能力更强呢?

背后小米自研的CyberGear力控微电机,就是通过AI算法模拟,让电机在性能优化的同时,还轻了20%。

行为方面为了更加仿生,小米也基于真狗的动作,在小米机器人强化学习平台,模拟了3万只机器狗进行并行训练。

AI技术像这样离开纯虚拟环境,来到手机、机器狗,未来到更多智能家居设备上,不单纯是一种“赋能”,还能发现新的创新优化方向。

过去我们就曾看到,小爱同学语音交互技术用在机器狗上,就与手机、音箱的环境大不一样。

机器狗自身会移动,也常出现在室外噪音较大的环境,给语音识别和降噪算法提出了更高的要求,反过来推动了算法的进化。

语言大模型、多模态大模型将来同样会遇到类似的情况,最终把新应用场景需要的特性内化到模型本身。

这也就是学术界也在探索的具身智能,大模型之后最重要的新方向之一了。

我们可以看到,今年小米发布会除了新机型之外,AI的比重明显更高了。

对于背后更深层次的思考,雷军从一个公式开始讲起。


小米的科技战略,为什么有AI次方?


在小米给出的(软件×硬件)ᴬᴵ 公式里暗含了一层意思:

AI是最为关键的变量,它能带来指数级的改变。

这也更进一步体现出小米对于AI的重视。

而背后原因不难理解,结合AI趋势本身的发展以及小米所处终端市场的动向,便能找到答案。

先来看AI领域内

大模型趋势之所以轰轰烈烈,是因为它给技术底层、行业应用都带来深刻影响。

一方面,ChatGPT腾空出世验证了当模型规模突破一定量级后,会出现智能涌现的现象。这种特性让大模型具备“举一反三”的能力,更进一步让AI应用规模化落地成为可能。

同时ChatGPT、Stable Diffusion也推动AI向生成式方向发展。当AI具备更丰富的创造力后,人机交互方式也会因此发生改变。最直观的体现便是当智能助手接入大模型后,能推动人机交互向更加自然便捷的语言沟通方式发展。

另一方面,ChatGPT引发全球全社会热议,让AI概念迅速破壁,走进千行百业和普罗大众认知中,这使得AI应用落地及商业化脚步加快。

业内普遍认为,在基础大模型之上搭建的行业大模型,将会成为未来大模型市场中的主要构成,也是带动实际应用的主力之一。

大模型侧,厂商们在过去半年来都在积极推动和产业界合作;垂直领域内,也有以大模型为底层技术的玩家开始展露头角,如InflectionAI—一个主打感情陪伴的聊天机器人公司估值已达40亿美元。

透过这些当下最新的趋势变化,不难感受到一个事实——

AI作为一项底层、基础且核心的技术,正在快速变革当下时代

而在以往技术周期里,能够承担如此角色的代表技术,分别是蒸汽技术、电力驱动、计算机。

换言之,如今的AI也能如同它们一样,成为未来生产力,带来指数级增长

那么,怎么利用好这一未来生产力,就成为各行业当下最关心的事。

以小米所处的终端市场为例,大模型趋势正在向这里演进。

现在,手机接入大模型成为诸多厂商的“大招”

不仅是让智能助手和云端大模型结合,并从自身场景出发大力开拓端侧模型

比如谷歌被视为拿来对标GPT-4的PaLM 2,就在发布时推出了最小“壁虎”版本,可在移动设备上快速运行,包括离线状态,每秒可处理20个token。

更底层的芯片层面,也在为端侧部署大模型做好准备。

高通目前通过量化、编译和硬件加速优化,能够在搭载第二代骁龙8移动平台手机上,以15步20步推理的速度应用Stable Diffusion,生成512×512像素的图片。

这背后反映出,大模型和手机终端正在双向奔赴。

对于大模型来说,手机场景构建了最为丰富、广阔的移动应用,是离普罗大众最近的一块屏幕,是大模型加速落地的关键地带。所以为了适应手机场景,更轻量化、可端侧部署的模型一定要出现。

对于手机而言,大模型正在加速重构移动应用、变革人机交互,手机行业一定会受到影响。在激烈变革下,抓住趋势就能抓住新的增长动力,所以对于手机乃至终端厂商而言,拥抱大模型也是必然。

综上,也就不难理解小米的最新动向里,为何AI含量如此高。

无论是推出大模型版小爱同学,还是发布自研端侧模型,都是从小米自身出发,拥抱趋势后的成果。

雷军在今年个人演讲中提出(软件×硬件)ᴬᴵ 这一公式,也更深入揭示了小米当下对于最新AI趋势的理解。

今年,雷军的年度演讲主题选定了“成长”这一主题,在三小时的演讲和年度新品发布中,他分享了过去30多年经历的几次关键成长和感悟。

对应来看,在这个AI发展史上一定会被重点标记的年份里,小米也站在了新的关键节点上——

小米集团宣布进行科技战略升级,公布科技理念,明确科技探索原则

而这些新变化里,AI含量非常高。


AI成为新小米的关键变量


在小米最新升级的科技战略里,确立了四个原则:

  • 深耕底层技术
  • 长期持续投入
  • 软硬件深度融合
  • AI全面赋能

里里外外传递出一层信息:AI将成为新小米的关键变量。

实际上,趋势内外,小米这次直接生在风口里。

首先,最新一波AI浪潮引发的变革,与小米技术布局和长板“天然适配”

在2016年,AlphaGo腾空出世把AI概念更进一步推向大众时,小米成立了首支AI团队。

当时AI趋势里,深度学习和计算机视觉领域快速发展,这不仅体现在基础算法上,也体现在应用落地方面。如国内AI四小龙,最初都是以计算机视觉起家。

小米成立的第一支AI团队,锚定的也是计算机视觉方向。

紧接着2017年,“Attention is all you need”来了。

Transformer架构的出现,不仅直接推动NLP领域发展,同样影响计算机视觉、语音等领域,更是当今AIGC趋势的核心底层技术——要知道,目前市面上绝大多数大模型,底层都是基于Transformer架构。

这一年,小米在AI方面的动作更大,正式成立AI实验室,多方位布局,覆盖声学、语音、NLP、知识图谱等领域,甚至大模型也被列入其中。

之后几年里,AI趋势正酣,有了较为坚实的底层算法做基础,行业应用落地脚步更快,尤其是细分领域进展迅速。

从手机这一场景来看,典型的两个例子是智能助手和AI影像。

它们都需要和产品深度结合,才能完成更进一步的探索。这方面,小米AI有布局,更可以说是有长板。

这次全面升级的小爱同学诞生于6年前,应用了小米NLP技术,并为如今大模型的接入应用积累了海量场景训练数据。AI影像算法方面,小米也专门成立团队,如“夜枭算法”已应用在了成熟产品上。

今年4月,小米大模型团队火速成立,完成了趋势下的最新一次扩展。到如今小米AI团队规模已超3000人。

所以AI大模型浪潮,小米生在其间,积累和蓄力早已完成,需要的只是把好钢用到“刀刃”上,聚集资源实现更大的突破。

其次,技术因场景而强大,小米技术的天然优势背后,核心还是小米业务和产品具备的场景优势,而且小米上下都已经敏锐地感知到了这一趋势。

一方面,技术深入到场景中去,才能发挥更大价值。

远的不说,就说今天最火的概念“大模型”早在2017年就已起步,但一直以来AI研究届以刷学术指标测评榜单为主要前进方向,并未掀起太多波澜。

直到ChatGPT以直面普通消费者的姿态问世,才打开聊天机器人和智能助手的应用场景,以及后面的AI物种寒武纪大爆发,几乎要把每个行业改造个遍。

小米多年来正是这个理念的践行者。这也是为什么最新提出的公式中,(软件×硬件)作为底数。

小米的场景天生从软硬件一体出发,如智能助手小爱同学,拥有1.1亿月活用户,支持5900余款智能设备。

在多终端方面,“手机是基本盘,IoT是想象空间”是很多人对小米的描述。

主阵地手机端,小米就是以软硬件一体奠定地位的。AIoT方面,雷军在2013年便看到智能硬件和物联网的趋势,并率先成为AIoT智能生活的定义者。

2021年,雷军亲自挂帅小米造车,补齐了小米在“人车家”的最后一环,由此小米全场景智能生态构建完成。

乃至仿生机器人方面,小米如今已推出两代CyberDog、人形机器人CyberOne,提前布局未来家居场景。

另一方面,技术深入到场景中去,才有了融合进化的空间。

比如小米手机上广受好评的“万物追焦”功能,其实最早是从CyberDog机器狗上的“主人追踪”技术;小米自动驾驶进展非常快,得益于2017年创办的小米人工智能实验室;同样,自动驾驶部门的很多技术,也应用在CyberOne上,又构成了仿生机器人的大脑。

而在最新大模型趋势下,如手机、仿生机器人等,都是正被广泛热议的落地场景。

也正是小米拥有的如此丰富的场景,让AI的技术应用和迭代更加令人期待,毕竟AI归本溯源,不论是深度学习算法还是如今的大模型范式,背后最核心的竞争力还是基于数据的迭代。而小米拥有的场景、终端、数据体量,都是AI技术落地和体验的绝佳保障。

以及别忘了,小米还有AI迭代的最可靠保障——米粉用户

在ChatGPT的一鸣惊人之后,基于人类反馈的强化学习机制被反复提起,而这种关键的机制方法要素,没有哪个玩家比小米更有方法论和话语权。

最后,AI之所以一定会刷新小米,最关键的还在于决心

这种决心,既是小米的技术底色和研发投入上的有史为鉴,更有程序员出身的雷军始终如一对技术的坚定和知行合一。

一直以来,小米的产品体验太强而让技术被迫“失色”,以至于不少人忽略了小米的技术之强,布局之全。

所以“新小米”并不是说小米才刚刚开始改变,而是把一直以来在技术创新上做出的持续努力更好地展现在台面之上。

在雷军演讲现场,他专门强调了小米技术研发已布局12个技术领域,包括5G移动通信技术、大数据、云计算及人工智能,同时基于智能制造,进入机器人、无人工厂、智能电动汽车等,涉及99个细分赛道。

雷军披露,在最体现实力的技术专利方面,截至2023年3月31日,小米全球授权专利数超3.2万件。其中,在中国信息通信研究院发布的5G标准必要专利声明有效全球专利族企业排名中,小米全球专利族占比4.1%,首次进入前十——是最年轻玩家。