HuggingFace最受欢迎15大AI机构出炉!清华第五,OpenAI第十,冠军竟是它?

转载
356 天前
8303
AI之势

文章转载来源:AI之势

来源:新智元

Hugging Face作为开源AI社区的代表,总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里,哪些机构对于开源AI贡献最大。

Hugging Face上最受欢迎的15个AI公司出炉了!

目前的冠军,是Stability AI

开源英雄Meta AI,取得亚军之位。

而我们熟知的微软、谷歌、OpenAI,分别名列第八、九、十的位置。


15个最受AI开源社区欢迎的公司


截止23年11月24日,榜单如下——

1. Stability AI,20000个赞

2022年AI大爆炸的两个标志性事件,一个是ChatGPT,一个就是Stable Diffusion。

作为开源的图像生成模型,可以说,Stable Diffusion的发布将AI生图提高到了全新的高度,影响不亚于Open AI发布ChatGPT。

Stability AI,就是大名鼎鼎的Stable Diffusion背后的公司之一,掌门人和联合创始人是Emad Mostaque。

不过,他此前有一些不好的传言。

另外,Stability AI也开源了自己的大语言模型——StableLM。

2. Meta AI,20000个赞

实至名归,Llama模型的开源鼻祖,如今大模型领域开源和闭源模型能够分庭抗礼,没有全被OpenAI、谷歌等明星初创公司和大科技公司垄断,Meta AI功不可没。

也因此,小扎被公认为「开源英雄」,而图灵三巨头之一的Yann LeCun,在Meta也起着定海神针的作用。

虽然排名第二,但是赞数和第一完全没有差距。可以说Meta AI就是最受开源社区欢迎的AI公司。

正所谓,「开源AI社区共一石,Meta独占八斗」。如果没有Meta和LeCun对于AI开源社区的贡献,整个AI行业的格局都会完全改变。

整个AI行业和开源AI的未来的发展,某种程度上都要倚仗LeCun和小扎继续真金白银的投入,以及不断地摇旗呐喊。

3. Runway,11000个赞

视频生成工具Gen-2,已经成为生成式AI视频领域的标杆,每次一发布更新,都能引起业内不小的震撼。

从三无青年到15亿美元独角兽CEO,Runway CEO的故事,不过是又一个「平平无奇」的硅谷神话。

2018年,Cris Valenzuela(CEO)、Anastasis Germanidis和Alejandro Matamala-Ortiz 在纽约创办Runway, 今年5月,Runway已完成了1.41亿美元的C轮融资,估值达到15 亿美元。

4. CompVis,10000个赞

Stable Diffusion,是Stability AI、RunwayML、LMU Munich、EleutherAI 和LAION的研究人员合作的结果。

在CompVis领导下的Stable Diffusion V1,改变了开源AI模型的性质,在全球范围内催生出了数百个其他模型和创新。

Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach领导了这个项目,他们在海德堡大学CompVis小组的研究奠定了这个项目的基础。

在海德堡大学,他们创建了广泛使用的VQGAN和Latent Diffusion。这两个模型再加上OpenAI和Google Brain的成果,使Stable Diffusion得以实现。

5. 清华KEG,7,000个赞

清华KEG实验室,一直是国内AI技术的领头羊。

中国顶尖开源大模型ChatGLM2-6B,可以说是清华系的ChatGPT,由清华知识工程研究室和智谱AI训练。

ChatGLM2-6B允许免费商用后,我国的开源大模型也开启了「安卓时刻」。

而清华系17人,则直接撑起了中国大模型创业的半壁江山。

6. BigScience,7,000个赞

BigScience Research Workshop,不是正式成立的实体,而是由HuggingFace、GENCI和IDRIS发起的开放式协作组织,以及一个同名的LLM研讨会,汇聚了全球1000+研究人员。

这1000多名志愿研究者,在BigScience项目中创建了拥有1760亿参数的模型BLOOM。

BLOOM是BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的缩写,全名代表着大科学、大型、开放科学、开源的多语言大模型。

7. 阿联酋技术创新研究所,7000个赞

阿联酋技术创新研究所隶属于阿布扎比政府先进技术研究委员会 (ATRC) ,负责监督酋长国的技术研究。

2023年9月6日,阿联酋(UAE)技术创新研究所(TII)推出Falcon180B,再次突破生成式AI的界限。

Falcon 180B拥有惊人的1800亿参数,经过3.5万亿个token的训练,在预训练LLM的HuggingFace排行榜上名列前茅。甚至,它在各种基准测试中,都胜过了Meta的LaMA 2这种级别的竞争对手,包括推理、编码、熟练程度和知识测试。

而且作为第一个有影响力的不限制商用的开源模型,Falcon用中东金主爸爸的豪气,把开源模型的限制彻底打下来了。

这就不奇怪为什么开源社区对他们好感爆棚。

8. 微软,6500个赞

在ChatGPT大爆发之后,突然化身「创业公司」的微软,成为了硅谷大厂中今年最亮的一颗星。

微软快速跟进,利用大模型能力改造了Bing,加班加点推出Copilot,并把他们塞进了自家的拳头产品Office和Windows之中,给科技圈秀了一把这家「年近50」科技巨头的「狼性」。

另一边,微软Azure作为云计算行业的头部玩家,无缝驶入了AI算力需求的快车道。

他们和Meta合作,对Llama 2等开源模型提供的良好支持,也进一步刷了一波在开源社区的好感度和存在感。

在最近的OpenAI惊天宫斗系列剧中,微软差点通过「OpenAI 0元购」,成为了AI赛道的「终极寡头」。

9. Google AI,6000个赞

作为对于AI技术投入最早也最大的科技巨头,谷歌在AI社区中的影响力不用怀疑。

从AI基础研究到AI产品,谷歌早已浑身上下都流淌着AI的血液。

DeepMind在强人工智能领域不断地取得令人瞩目的突破,谷歌云作为AI算力提供商是AI行业的基础设计建设中最重要的一环。

虽然谷歌Bard和Palm大模型暂时在竞争之中不占优势,但传说中的Gemini似乎迟早要将谷歌拉回AI行业舞台的最中心。

而对于开源社区的发展,谷歌的贡献同样功不可没,无数的开源项目已经成为AI开源社区的基石。

10. OpenAI,4000个赞

作为AI行业今年大爆发的直接引领者,OpenAI的地位是毋庸置疑的。

虽然被调侃为「ClosedAI」,但是OpenAI对于AI开源社区的贡献也是有目共睹的。

Whisper作为开源且性能最好的语音识别模型,几乎所有相关的从业人员都能从中受益。

希望刚刚结束了「权游」的OpenAI,能继续瞄准AGI,为整个AI行业开拓上限。

11. BigCode Project,4,000个赞

BigCode是一个开放的科学合作组织,致力于为编码应用程序进行负责任的LLM训练。

他们的主要工作有——

StarCoder,一种最先进的代码语言模型。

BigCode项目中的StarCoder,是一个160亿参数的模型,它使用了80多种编程语言、GitHub问题、Git提交和Jupiter 笔记本的一万亿个token。

StarCoder可以通过聊天进行微调,创建一个性化的编码助手StarChat。

另外还有OctoPack,用于指令调优大型代码模型的工件;The Stack,最大的可用预训练数据集,具有外围代码;SantaCoder,一个1.1B参数的代码模型。

12. MosaicML,4000个赞

在今年6月被DataBrick斥资13亿刀收购的独角兽MosaicML,非常引人瞩目。

从此,MosaicML的生成式AI平台和Databricks的数据管理能力结合,将形成双赢。

这家公司创立于21年,仅有62人。

创始人Naveen Rao是创办的第一家公司Nervana Syatems,被英特尔收购。另一位创始人Hanlin Tan,是一位连续创业者,曾创立云计算公司,以及在谷歌、微软和英特尔担任职位。

MosaicML提供了一些开源、可商用的LLM,比如MPT模型。

MPT-7B和MPT-30B两个模型,是目前最先进的开源、可商用的LLM之一。

13. UKP Lab,3000个赞

UKP Lab(无处不在的知识处理实验室)由Iryna Gurevych教授于2009年创立,是达姆施塔特工业大学计算机科学系的一部分。

UKP Lab在自然语言处理(NLP)方面开展前沿研究,重点关注大型语言模型、对话式人工智能、问答、跨文档NLP以及新颖的数据集和问题定义。

14. EleutherAI,3000个赞

EleutherAI成立于2020年7月,由Connor Leahy、Sid Black和Leo Gao创立,从一个讨论GPT-3的Discord服务器,发展成为一个专注于大规模人工智能研究的非营利性研究机构。

现在,它是是一个开源的社区人工智能项目,旨在创建一个完全去中心化的、具有自治文明的单例人工智能。任何能连接互联网且有GitHub帐户的人都可以参与。

2021年,EleutherAI发布了The Pile,是一个825GB的多样化文本数据集。

2021年6月,EleutherAI公布了GPT-J,它是一个60亿参数的模型,在Pile上训练。发布时,它是世界上最大的公开GPT-3风格的语言模型。

随着GPT-NeoX的出现,EleutherAI计划将参数一直提高到1750亿,发起了争夺最大GPT-3模型的挑战赛。

2023年4月,它发布了Pythia系列大模型。

15. Salesforce,3000个赞

Salesforce,是创建于1999年3月的一家客户关系管理(CRM) 软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台。

创始人是Marc Benioff。27岁时,他就成为Oracle历史上最年轻的高级副总裁。

正是因为预见到,会有越来越多的企业通过互联网得到软件服务,他才选择离开Oracle,在37岁时创立Slesforce。

他提出了云计算和SaaS的理念,被誉为「软件终结者」。

当下Salesforce正在推出AI功能,试图将人工智能整合到办公空间即时通讯应用Slack等产品中,并为销售人员等推出了一款名为Einstein GPT的生成式人工智能产品。

Benioff称,「我们非常渴望确保Salesforce成为第一大人工智能CRM。」

参考资料:

https://twitter.com/osanseviero/status/1727260746289905920