文章转载来源:AIGC
来源:36氪神译局
图片来源:由无界 AI生成
编者按:人工智能技术的发展日新月异,有很多人工智能领域的初创公司脱颖而出。在本文中,让我们看看红杉资本和凯鹏华盈等公司的投资者选择了哪些有前途的人工智能初创公司。本文来自编译,希望对您有所启发。
如果你只有几分钟的空闲时间,那么以下是投资者、经营者和创始人应该了解的关于人工智能最令人兴奋的初创公司。
人工智能是今年科技故事的主线。自上一期“What to Watch in AI”系列报道以来,该领域不断吸引资本、人才和关注度。当然,并非所有的关注都是积极的。尽管人们对这项技术的能力普遍感到兴奋,但在过去的四个月里,业内重量级人物表达了他们的担忧,监管机构也开始设计一些防范措施。在接下来的几个月和几年里,人工智能将对我们的生活产生全面的影响,并在全球范围内产生新的赢家和输家。
我们的“What to Watch”系列旨在帮助读者为即将到来的时代做好准备,更清楚地预见未来。对于那些希望了解人工智能前沿涌现的技术,并利用正在发生的变革的人来说,这是一个很好的起点。为此,我们邀请了人工智能领域最令人印象深刻的投资者和创始人,介绍他们认为最有前途的初创企业。
用人工智能来改善体外受精技术
在任何生育过程中,都有需要人类决策的时刻,其中与试管婴儿最相关的两个环节是“卵巢刺激”和“胚胎选择”。
“卵巢刺激”指的是确定患者接受的药物剂量,以刺激卵巢中卵泡的生长,以及何时进行触发注射,刺激卵泡释放卵子。注射触发针的时机至关重要,太早的话,你可能会得到不成熟的卵子;太晚的话,你可能会得到太成熟的卵子,或者得不到尽可能多的卵子。
“胚胎选择”是指选择使用和植入哪个受精卵。目前,临床医生和胚胎学家与大多数医学专家一样,会结合自身的经验和培训、形态学分级系统以及反复试验来决定。如果在一个周期中剂量或时间不合适,他们会在下一个周期中进行调整。这对医生专业能力的要求非常高,而在这一点上,医生们水平参差不齐,且他们的技术对结果非常重要。对于生育这个供应严重受限的市场来说,这意味着高昂的价格,尤其如果你想看到最佳结果的话。
Alife在构建人工智能工具,来改善体外受精(IVF)结果。该公司通过人工智能工具,利用大量的输入和结果数据集,为从业人员提供“超能力”,以增强他们的决策准确度。现在,通过一个简单的界面,医生就可以输入患者的特征,并在生育过程中的关键时刻获得精确的建议,这些建议来自之前数千个周期的结果。这些数据集来自已经存在的大量患者信息,并且随着每位患者使用Alife产品,这些数据集会变得更好。
这些工具将改变生育行业的本质。Alife的研究表明,他们的机器学习模型可以帮助医生优化50%的触发时机,并帮助平均多取三个成熟卵子、两个受精卵和一个胚胎。Alife 的产品可以大大拓宽不孕不育治疗的渠道,通过降低所需药物剂量和提高试管婴儿周期的成功率,来降低每位患者的成本。这还将使医生的竞争环境变得更加公平,使那些缺乏第一手经验的人能够获得更广泛的知识和信息。
最终,你可以想象 Alife 的工具可以为一个过程中的判断时刻提供所有信息,并允许医生以外的从业人员进行操作,从而显著改变该行业的成本结构和可用性。更重要的是,数据驱动的精准医疗会通过个性化建议来增强(或最终取代)一个人的判断,这并非试管婴儿领域所独有。在整个医学领域,这样的时刻成千上万,我们有机会利用数据极大地改变关键程序和治疗的结果和可及性。
——丽贝卡·卡登(Rebecca Kaden),联合广场投资公司(Union Square Ventures)普通合伙人
企业搜索
在工作中,当你需要的时候,准确找到所需信息应该是快速而简单的。由于每个人在完成工作时都会使用大量的应用程序,并由此产生大量的数据和文档,因此情况并非总是如此。随着“知识”的指数式增长和工作性质的日益分散,查找现有知识所需的时间也越来越长。换句话说,在工作中“搜索东西”是相当困难的。
为了帮助雇主解决这个问题,阿尔温德•贾殷(Arvind Jain)和他的团队建立了一个基于人工智能的工作场所统一搜索平台Glean。它为员工配备了一个直观的工作助手,帮助他们准确地找所需信息,并主动发现他们应该知道的信息。
该公司的使命从一开始很简单:帮助人们更快地找到所有职场问题的答案,减少挫败感和时间浪费。但后来公司的成果却远远超出了搜索的范畴。举例来说,Glean 不仅能搜索所有的工作场所应用程序和知识库(Slack、Teams、Google Drive、Figma、Dropbox、Coda 等),还能理解自然语言和上下文,根据人们的角色和公司内部/外部关系个性化用户交互。它能智能地显示公司最受欢迎和经过验证的信息,帮助你发现团队所了解的信息,并保持一致,而且所有这一切都是以权限的方式进行的。
随着组织变得越来越分散,知识也变得越来越碎片化,像 Glean 这样的直观工作助手不再是锦上添花,而是提高员工工作效率的关键工具。该公司的发展将打破阻碍进步的藩篱,创造更积极、更富有成效的工作体验。
此外,Glean 的搜索技术使其能够在遵守企业严格权限和数据管理要求的同时,将生成式人工智能带入工作场所。如今,阻碍企业将人工智能应用交付生产的主要障碍之一是,它们无法实施适当的治理控制。通过将实时数据权限插入企业的内部环境,Glean 已成为帮助企业大规模解决治理问题的理想解决方案,并让企业可放心地利用其内部数据进行模型训练和推理,从而发挥企业级人工智能数据平台/向量存储的作用。
随着时间的推移,我们相信每家公司都将拥有自己的人工智能版本,以了解业务和员工的细微差别。我们相信,Glean 公司正在抓住这一机遇。
——乔什·科因(Josh Coyne),凯鹏华盈(Kleiner Perkins)合伙人
多模态数据的存储和管理
我们都玩过 Midjourney,而且大多数人都看过 GPT-4的演示。Midjourney (文本到图像) 和 GPT-4 (图像到文本/代码) 说明了当模型变得多模化时,在文本、图像和音频等不同形式的媒体之间架起桥梁的可能性。虽然目前的人工智能热潮大多围绕着基于文本的模型,但多模态模型才是建立更准确世界表征的关键所在。
随着我们在机器人、医疗、制造业、娱乐和广告等行业掀起下一波人工智能应用浪潮,越来越多的公司将在多模态模型的基础上进行构建。Runway和 Flair.ai 等公司就是各自领域新兴领导者的典范,它们的产品已获得大量用户需求,而谷歌等现有公司也已开始发布类似的多模态功能。
但是,使用多模态模型会带来一个挑战:如何存储和管理数据? Parquet 等传统存储格式并没有针对非结构化数据进行优化,因此大型语言模型团队在数据加载、分析、评估和调试时都会遇到性能缓慢的问题。此外,由于缺乏单一事实源,大型语言模型工作流在一些细微之处更容易出错。Lance 是最近出现的一家应对这一挑战的公司。Midjourney 和 WeRide 等公司正在将 PB 级数据集转换为 Lance 格式,与 Parquet 和 TFRecords 等传统格式相比,其性能有了显著提高,而且增量存储成本也降低了一个数量级。
Lance并没有止步于存储,他们已经认识到需要重建整个数据管理堆栈,以更好地适应我们正在迈向的世界,在这个世界里,非结构化、多模态数据将成为企业最宝贵的资产。他们的首个平台产品 LanceDB(目前处于内测阶段)为希望在其应用程序中构建多模态功能的开发人员提供了无缝嵌入式体验。
Lance 只是公司将开发人员带入多模态未来的一个例子,我非常期待看到其他技术的出现,以推动多模态应用的发展。随着人工智能的发展,用不了多久,这样的未来就会成为现实。
——萨尔州·古尔(Saar Gur), CRV 普通合伙人
遏制人工智能强化的网络攻击浪潮
对于生成式人工智能,我是一个毫不掩饰的乐观主义者,但在这个问题上并不天真。例如,我担心“社会工程”攻击(如鱼叉式网络钓鱼)的激增,这种攻击通常使用电子邮件提取敏感信息。自去年 ChatGPT 爆红以来,这种攻击的发生率急剧上升。
根据 Abnormal Security 的数据,在过去的一年里,每千人受到的攻击次数从不到 500 次猛增到超过 2500 次。攻击的复杂程度也在急剧上升。就像任何学生都可以用 ChatGPT 写出一篇完美的作文一样,ChatGPT也可以被用来发送语法完美、危险的个性化欺诈信息。
据联邦调查局称,自2013年以来,这种有针对性的“商业电子邮件泄露”攻击已造成超过500亿美元的损失。而且情况还会变得更糟。每天都有数不清的网络犯罪分子和其他坏人利用“WormGPT”这样的黑帽工具(这是一种聊天机器人,旨在挖掘恶意软件数据,以策划最有说服力、最具规模的欺诈活动)来进行欺诈活动。
幸运的是,Abnormal的联合创始人埃文·瑞瑟(Evan Reiser)和桑杰·贾亚库玛(Sanjay Jeyakumar)正在努力使用人工智能来对抗这种威胁。你可以把这想象成是用AI来对抗AI。从历史上看,电子邮件安全系统会扫描已知不良行为的特征,比如特定的IP地址或试图访问个人身份信息(PII)的行为。
利用人工智能的力量,Abnormal颠覆了这一切。由于在人工智能的加持下,很多攻击看起来是合法的,因此 Abnormal 的方法是充分理解已知的良好行为,即使是细微的偏差也会被察觉。该公司使用大型语言模型来构建其数字内部和外部运作的详细表征,例如哪些人通常会相互交谈,以及他们可能会围绕哪些内容进行互动。如果我的合伙人里德·霍夫曼(Reid Hoffman)给我发了一封电子邮件说:“嘿,请给我发 Inflection.AI 的最新资料。”Abnormal的人工智能引擎很快就会发现,里德很少以“嘿”开头,也很少发送单句,而且他从来没有要求我给他发送过有关 Inflection.AI 的文件。(作为公司的联合创始人和董事会成员,他比我有更多的机会接触这些文件!)。
毫不奇怪,随着对生成式人工智能的安全担忧不断增加,Abnormal 公司的企业客户需求也在加速增长。我认为 Abnormal 的成功非常令人欣慰,因为它能如此迅速地利用人工智能来应对因人工智能而加速的问题。在颠覆性技术变革时期,不良行为者往往享有漫长的先发优势。毕竟,他们可以利用创新,而不必担心产品质量、安全性或尚未制定新法律的监管机构。
与此同时,可以理解的是,科技初创公司正专注于为其创新开发强大的新用例,而不是阻止非法或破坏性的创新。但就像所有与人工智能有关的问题一样,滥用人工智能可能造成的网络破坏也是惊人的。由于Abnormal团队的先见之明,网络犯罪的新常态可能至少会变得不那么容易发生。
——萨姆·莫塔梅迪(Sam Motamedi), Greylock 公司合伙人
增强知识工作者的能力
很明显,大型语言模型将提高知识工作者的效率。但目前尚不清楚具体会如何做到。Dust 正在努力弄清这个问题。如果知识管理者不能访问企业内部数据,那么他们在企业中就帮不上什么忙。因此,Dust建立了一个平台,对企业的内部数据(Notion、Slack、Drive、GitHub)进行索引、嵌入和实时更新,并将其公开给大型语言模型支持的产品。
Dust 联合创始人加布里埃尔•休伯特(Gabriel Hubert)和斯坦尼斯拉斯•波卢(Stanislas Polu)将一家公司卖给了 Stripe,并在那里工作了5年。他们亲眼目睹了快速增长的公司如何在规模问题上作斗争的。他们亲眼目睹了所谓的“信息债务”,而现在他们正专注于应用大型语言模型来解决与之相关的一些主要痛点。目前,Dust 正在其平台上探索以下应用:
虽然内容繁多,但 Dust 的创始人相信,这些数据流中的大部分最终都将汇聚成一个统一的产品。他们仍处于探索的早期阶段,正在形成 Dust 的最终图景。根据初步迭代,他们相信已经证实了自己的核心假设:知识工作者的能力可以通过大型语言模型得到增强(而不是取代),并且可以基于此构建一种新的‘团队操作系统’。
——康斯坦丁·布勒(Konstantine Buhler),红杉资本合伙人
释放业务数据
“大数据的兴起”已经持续了20多年,尽管企业在不断摄取比以往更多的数据,但许多企业仍然难以利用这些数据从人工智能模型中获得洞察力。数据处理和解释仍然是人工智能过程中最繁琐、最昂贵的部分,但也是对高质量结果最重要的部分。即使预先训练的大型语言模型有所增加,但企业依旧需要专注于使用自己的专有数据(跨多种模态)来创建具有独特优势的生成式人工智能,从而提供差异化的服务和洞察力,并提高运营效率。
Labelbox 简化了企业将数据集输入人工智能模型的方式,从而解决了这一难题。它可以帮助数据和机器学习团队找到正确的数据,对其进行处理和解释,将模型推向应用,并持续测量和改进性能。
Labelbox的新平台利用了生成式人工智能的优势。Model Foundry允许团队快速试验来自所有主要封闭和开源提供商的AI基础模型,使他们只需点击几下就能预先标注数据并快速进行试验。这样,他们就能了解哪种模型在其数据上表现最佳。Model Foundry 可为每次实验运行自动生成详细的性能指标,同时对结果进行版本控制。
其影响可能是深远的。传统上,人类需要花费数天时间来完成一项简单但耗时的任务,比如对包含多段文本的电子商务列表进行分类。而有了 GPT-4,这项任务可以在数小时内完成。Model Foundry 可以让企业自己发现这些高效的方式。
这并不是唯一的例子。早期的结果表明,超过88%的标注任务可以通过一个或多个基础模型进行加速。Labelbox 可以让任何人只需点击几下,就能对数据进行预标注,而无需编码和将数据输入模型。这个工具旨在增强团队协同工作的能力,并利用跨职能的专业知识来维持对数据质量保证的人工监督。这一功能允许语言模型专家和中小型企业轻松评估模型、丰富数据集并合作构建智能应用程序,从而实现人工智能访问的大众化。
事实证明,Labelbox 为沃尔玛、宝洁、基因泰克和 Adobe 等全球最大的企业显著降低了成本,提高了模型质量。
对于企业来说,如何在其专有数据上释放这些基础模型的力量,以解决业务问题,现在是一场竞争。我们期待看到 Labelbox 将如何帮助企业释放数据,以更高的效率提供更好的产品。
——罗伯特•卡普兰(Robert Kaplan),软银合伙人
全新的创意套件
人工智能无处不在,并日益成为一种商品。在大多数情况下,公司将人工智能作为聊天机器人来丰富现有的应用程序。很少有人工智能应用重塑产品体验,利用这项技术从根本上改变我们与产品的互动方式,就像谷歌的搜索引擎改变了我们浏览互联网的方式,或者Instagram改变了我们从手机上分享照片的方式一样。这些人工智能应用需要深刻理解现有的用户体验、有远见的产品思维和前沿技术。
Runway就是这样一家公司的领先范例,它利用应用人工智能研究来重新构想创意体验,并建立了一个全新的创意套件。
自2022年10月以来,Runway已经开发了30多个AI“魔法工具”,涵盖视频、图像、3D和文本,服务于创作过程的各个方面,从前期制作到后期制作。他们的客户群包括财富500强和全球2000强公司,如哥伦比亚广播公司的斯蒂芬·科尔伯特晚间秀(The Late Show with Stephen Colbert)、新百伦(New Balance)、Harbor Picture Video、阳狮(Publicis)和谷歌(Google)。该平台还被用于剪辑奥斯卡提名影片,如好莱坞热门影片《瞬息全宇宙》(Everything Everywhere All at Once)。
最令人兴奋的人工智能应用改变了现有的产品体验,重新思考了用户与产品的交互方式。有了 Runway,用户可以在几秒钟内完成新的视频创作,无论他们是第一次拍摄视频还是专业制作工作室。这是一个革命性的转变,也是人工智能如何重塑不同行业的一个例子。
——格蕾丝·伊斯福德(Grace Isford),莱克斯资本(Lux Capital)合伙人
重塑细胞命运
细胞是地球上最复杂的计算机系统。就像电脑芯片一样,DNA也是由基本单元组合而成的,从而产生复杂的功能。与基于“位”的代码不同,基于原子的代码具有随机性和分层性。一个系统依赖于另一个系统,而另一个系统又依赖于其他物理系统,每一个系统都受到热量、酸度和细胞微环境中分子的影响。
尽管存在这些相互依存的关系,但细胞机器代码(DNA)依旧可以有效地运行不同的程序。尽管你的肝细胞和皮肤细胞含有相同的基因组,但这些细胞类型的外观、感觉和功能都不同。为什么?因为它们在执行不同的表观遗传程序。
2006年,高桥(Takahashi)等人使用四种转录因子(TF)蛋白组合将成熟细胞重编程为干细胞,开创了表观遗传重编程领域。转录因子是一种蛋白质,可以调节基因,本质上是改变正在运行的“程序”。高桥和山中(Yamanaka)的发现促成了诱导多能干细胞(iPSCs)的诞生,并获得了诺贝尔奖。此后,许多研究小组开始应用独特的TF组合来改变细胞状态,使受损细胞恢复活力,并恢复年轻的细胞表型。
虽然表观遗传重编程变得更容易处理了,但这仍然不是一件小事。研究小组必须分辨哪种TF组合能有效地将细胞从A状态转变为所需的B状态。例如,未来的TF组合可能会让我们把患病细胞转变为健康细胞,从而开发出一类新药。我们需要超大规模的重编程筛选,因为许多应用领域还不知道TF的确切组合。人类原生 TF 超过 1,500 种,因此需要一种更有效的搜索方法。我们相信,NewLimit 正在设计这样一种方法。
在单细胞测序和机器学习技术进步的推动下,NewLimit正在将以前的手工学科转变为数据驱动的科学。该公司在分子生物学家和计算生物学家之间有一个健康的分工,为构建一个越来越高效的闭环平台奠定了必要的文化基础。结合专业知识和多模态读数(scRNA-Seq、scATAC-Seq等),NewLimit 的目标是发现治疗性重塑因子,以治疗以往难以治愈的疾病。
在每一轮实验中,NewLimit都会使用机器语言技术来:
除了出色的团队、技术实力和雄心勃勃的愿景外,我们还钦佩NewLimit的务实精神。虽然该公司尚未公开分享其最初商业战略的细节,但我们相信这种方法是创造性的,合理地降低了风险,并可能为人类带来变革。创始团队一致认为,平台生物技术可能被比作昂贵的科学项目,而不会产生短期资产。为此,NewLimit 公司自成立以来一直保持透明,并对其技术进展进行了编目。
我们应该对大自然的复杂性感到谦卑。可以肯定的是,生物学比我们自己设计的硅器件更难编程。Dimension 的目标是帮助像 NewLimit 这样的创业先锋,让他们能够在技术和生物学的交界处探索可能性的边界。
——西蒙·巴尼特(Simon Barnett), Dimension研究总监
用于软件开发的基础人工智能
OpenAI专注于通用人工智能,DeepMind专注于科学发现,而人工智能的第三个基本用例是理解和创建软件。
GPT-4在经验丰富和新手开发人员的工作流程中根深蒂固。但这种模式转变仍处于起步阶段。从过去几个月的情况推断,人工智能辅助编程将很快变得无处不在。随着这一趋势进一步发展,自然语言将成为构建软件的抽象基础。
虽然其他公司也发布了类似 StarCoder 这样的大型纯代码模型,但还没有任何一种方法的性能接近 GPT-4。我认为这是因为只对代码进行训练的模型无法产生强大的软件开发能力。我就是这样认识 Poolside 的。这家公司由 GitHub 的前首席技术官杰森·华纳(Jason Warner)和 source{d} 的前创始人艾索·康德(Eiso Kant)创立,source{d} 是世界上第一家研究代码人工智能的公司。
Poolside 的独特之处在于,他们采用了OpenAI基础模型方法,但只关注于一种功能:代码生成。他们的技术战略取决于代码可以被执行这一事实,从而在学习过程中获得即时和自动的反馈。这使得通过代码执行进行强化学习成为可能,与基于人类反馈的强化学习(RLHF)相比,这是一个令人信服的替代方案。这是艾索早在2017年就开始探索的事情。
虽然通用人工智能(AGI)造福人类的潜力不可否认,但它的实现仍然很遥远。那么,为什么要等待AGI呢?通过专注于推进人工智能的特定领域,比如软件开发,我们可以拆除更多的创造障碍。我很期待 Poolside 团队有朝一日能够实现建立专用软件基础模型的愿景。
——马坦·格林伯格(Matan Grinberg), Factory联合创始人兼首席执行官
法国的 OpenAI 竞争对手
最近,生成式人工智能领域项目的爆炸式增长照亮了巴黎。或许你会问为什么?我的想法是,巴黎拥有生成式人工智能领域最大的世界级人才库,而这些人才还处在 OpenAI 的事件视界之外。在这些项目中,最大胆的无疑是 Mistral。Mistral 是由纪尧姆·蓝珀(Guillaume Lample)、亚瑟·门施(Arthur Mensch)和蒂姆特·蓝科若西(Timothe Lacroix)创立的,其使命是建立最好的开源语言模型,目标是围绕这些模型建立一个繁荣的生态系统。
我认识纪尧姆已经四年了,我们都在深入研究将大型语言模型应用于数学领域,尤其是形式数学。在 OpenAI 和 Meta 工作期间,我们建立了友好的竞争关系。纪尧姆是我有幸共事过的最有才华的研究人员之一,我有幸见证了他从在 Meta 从事研究到创立 Mistral 的过程。在这个过程中,我还结识了亚瑟·门施(Arthur Mensch)。他的工作一直给我留下了深刻印象,尤其是 Chinchilla,它重新定义了高效训练大型语言模型的含义,还有 RETRO,一种检索增强语言建模的方法,要我说,这种方法仍然没有得到充分的探索。
现在,让我们深入探讨一下 Mistral 之所以成为 Mistral 的原因。这家初创公司的愿景是建立一个以一流开源模型为基础的生态系统。这个生态系统将成为项目、团队和公司的启动平台,加快创新和创造性使用大型语言模型的步伐。
以基于人类反馈的强化学习(RLHF)为例。通常,进行 RLHF 需要耗费大量时间,因此成本也很高。它涉及人工智能行动的手动“标记”,这可能需要大量的工作。只有当人工智能模型的前景足够好时,这种努力才是值得的。对于像 OpenAI 这样的大型企业来说,在这一过程中进行投资是有意义的,公司有足够的资源来实现这一目标。但传统的开源社区通常需要一个“领袖”站出来,承担起这一重任。
Mistral有机会做到这一点,投资在开源模型上进行RLHF。通过这样做,Mistral 将为创新的寒武纪大爆发打开大门。开源开发者将有机会获得标签清晰的模型,他们可以根据不同的需求对其进行调整和定制。最终的赢家将是更广阔的市场,我们将有机会获得比一家封闭公司单独产生的更具体、更引人注目的用例。
谁拥有最好的开源模型,谁就更能吸引人们的兴趣和价值。我看好 Mistral,因为该团队正在积极推动效率/性能前沿的发展。同时,Mistral 在这方面的人才也是迄今为止全球最优秀的。
Mistral已经确保了团队和资源来执行这个最初的愿景。公司还找到了合作伙伴,在企业级用例中对这些模型进行评估。请密切关注 Mistral 公司,他们已经准备好与 OpenAI 一决高下了。
——斯坦尼斯拉斯·波卢(Stanislas Polu), Dust 联合创始人
更智能的工业机器人
我们经常听到有人预测,从长远来看,人工智能和机器人技术将增强人工任务或使其自动化。如今,这已日益成为一项紧迫的商业任务。
到2030年,欧洲适龄劳动人口预计将减少1350万,劳动力成本正以20多年来最快的速度上升。随着电子商务的兴起,仓库的压力比以往任何时候都要大,对企业来说,保持竞争力变得越来越具有挑战性。
仓库运营费用的55%来自订单拣选,但对于希望转向自动化系统的公司来说,情况不容乐观。我们所熟知的以人工智能为先导的 SaaS(软件即服务)中的各种华而不实的应用程序,或者我们在生态系统的其他部分所看到的大量开源产品,都还没有应用到机器人领域。
相反,寻求自动化拣选和包装的企业面临着选择昂贵、不灵活的机器人解决方案。他们必须驾驭大量的专有接口,这些接口需要大量的编程时间和专业知识。这些系统还难以应对不断变化的产品组合,需要定期的人工干预,并且在处理极端情况时表现不佳。
Secret解决了这些难题。它的软件以强大的模拟环境为基础,训练机械臂理解任何潜在实际环境的空间和物理细微差别。部署后,系统将通过不断学习真实世界的数据进行优化。这也意味着它们可以应对抓取电子设备、纺织品、水果、瓷砖和木材等传统高难度物品的挑战。
最令人兴奋的是,他们的机器人堆栈使用大型语言模型来实现对机器人的直观自然语言控制。他们开发了一种名为“PickGPT”的转换器模型,允许用户通过语音或文本向机器人发出指令和反馈。这样,无论技术知识水平如何,任何人都可以要求机器人执行所需的任务。
Secret 结合了其联合创始人的两个专业领域。首席执行官拉尔夫·古尔德(Ralf Gulde)在人工智能和机器人技术的交叉领域进行过研究,而首席技术官马克·图舍(Marc Tusher)则专门研究深度学习。两人在斯图加特大学(University of Stuttgart)开展了这些学科的同行评议研究,斯图加特大学是德国最负盛名的自动化和工业制造大学之一。
尽管是一家年轻的企业,但 Sereact 已经吸引了众多令人印象深刻的合作伙伴,其中包括戴姆勒卡车公司(Daimler Truck)、施迈茨公司(Schmalz)、Zenfulfillment 公司、齐默集团(Zimmer Group)和 Material Bank。这表明在拣选和打包行业有巨大的潜在市场机会。
除了在电子商务仓库中的明显应用场景(无论是拣选订单还是拆箱)之外,还有一系列其他用例。例如,在传统制造业中,有一个耗费时间的过程,即装配,其中包括费力地收集装配所需的精细部件。一直以来,机器人手臂都很难抓取小部件,也很难在杂乱无章的环境中分拣出单个部件。Sereact 的软件可以识别这些部件,并选择正确的抓手将其抓取出来。
Sereact 团队不仅拥有高超的技术,而且对客户的工作环境有着敏锐的理解,并真正希望帮助客户克服劳动力短缺问题,实现高效、持续的运营。作为第一个将大型语言模型和拾取打包的结合,从学术上的可能性转变为现实影响的公司,我对他们执行和扩展真正机器人挑战者的能力充满信心。
——内森·本艾池(Nathan Benaich),Air Street Capital普通合伙人
量身定制的大型语言模型引擎
现在,每个企业都在尝试将人工智能融入到公司的业务中。世界上最大的公司都认识到了人工智能的潜力,标准普尔500指数中有20%的首席执行官在第一季度财报电话会议上提到了人工智能。大型语言模型可以通过加速客户支持、对外销售和编码等核心功能,显著提高业务效率。大型语言模型还可以通过基于人工智能的助手来回答客户问题,从而改善核心产品体验,或创建全新的生成式人工智能工作流程来让客户满意。
鉴于大公司在采用新技术方面往往比较滞后,所以我们对企业开始使用人工智能进行构建的速度之快感到惊讶。不足为奇的是,许多企业希望在内部建立自己的人工智能模型和解决方案。每个企业都有一个专有客户数据宝库,且通常是其核心业务护城河的一部分。这些企业认为,将其最有价值的数据发送给基础模型 API 或可靠性不确定的新创公司存在风险。即使不考虑数据隐私问题,GPT-4 或 Claude 等公共大型语言模型也完全是基于开放数据进行培训的,因此缺乏针对企业特定用例和客户群的定制功能。
一些科技公司,如Shopify和Canva,已经在内部组建了“人工智能老虎队”,利用现成的开源模型,将人工智能融入到业务的各个部分。然而,大多数公司没有资源或经验丰富的人工智能研究人员来基于自己的数据构建和部署专属大型语言模型。他们意识到这波人工智能浪潮可能是业务未来的转型时刻,但到目前为止,还无法利用或控制自己的人工智能开发。
这就是为什么我们对莎伦·周(Sharon Zhou)和格雷格·第阿莫斯(Greg Diamos)及其团队在 Lamini 所做的事情感到非常兴奋。Lamini是一个大型语言模型引擎,可以使开发人员轻松地快速训练、微调、部署和改进自己的模型,并提供人工反馈。这款工具提供了一种令人愉快的开发体验,抽象出了人工智能模型的复杂性,更重要的是,允许企业在自己的数据之上构建人工智能解决方案,而无需雇佣人工智能研究人员或冒着数据泄漏的风险。去年秋天,我们首次与莎伦和格雷格合作。从那时起,我们就有机会为这个技术精湛、客户至上的创始团队提供支持,帮助他们实现雄心勃勃的愿景,改变企业采用人工智能的方式。
具体来说,与使用公共解决方案相比,使用Lamini部署私有大型语言模型提供了广泛优势。内部工程团队处理构建过程可确保数据隐私,并在模型选择以及整个计算和数据堆栈方面具有更好的灵活性。与现成的 API 相比,使用 Lamini 制作的模型还能减少幻觉、降低延迟、确保可靠的运行时间和更低的成本。这些性能增强来自Lamini团队基于数十年的研究,以及围绕AI模型和GPU优化的行业经验,而构建到产品中的核心技术见解。
知名初创公司和大型企业已经开始使用Lamini在内部和客户中部署大型语言模型了,他们对其设置速度、性能和可靠性感到非常兴奋。在未来,我们相信每个企业都会在其业务和产品中使用AI,但只有少数企业会有专门的AI团队。Lamini这家初创公司正在创造公平的竞争环境,帮助所有公司都能有机会利用这一变革性技术。得益于其最近与 Databricks 的合作,企业现在可以比以往任何时候都更容易地在现有的Databricks数据湖和计算集群上直接设置Lamini,从而启动和运行他们的人工智能解决方案。
——詹姆斯·吴(James Wu), First Round Capital投资人;托德·杰克逊(Todd Jackson),First Round Capital合伙人
你的编码“机器人”
当下,如果你想让计算机为你做一些事情,就必须将自己的想法转化为“计算机语言”,一种编译器能够理解的超文字代码。要想成为一名工程师,就必须像机器一样扭曲大脑思维。但是,我们正在到达一个转折点,人工智能可以将人类语言转化为代码。从人类工程师到数字工程师的转变,很有可能成为我们一生中最重要的技术拐点之一。
我们仍处于这种转变的初级阶段。BabyAGI 和 AutoGPT 等人工智能工具激发了公众的想象力。但是,尽管像 Github Copilot 这样的编码助手代表了一种进步,但它们仍然非常有限,其作用主要是为已经在代码中实现的想法进行自动补全。
Factory则是不同的。该公司由前弦理论家马坦·格林伯格(Matan Grinberg)和机器学习工程师埃诺·雷耶斯(Eno Reyes)于2023年创立。当我见到马坦时,立刻被他的愿景所吸引了:在未来,工程师们可以将恼人的任务下放,专注于棘手的难题,从而使构建事物充满乐趣。为此,马坦和埃诺创造了自主编码“机器人”。
机器人是人工智能工程师,可以处理代码审查、调试和重构等日常任务。与现有的产品不同,Factory 的机器人不需要你动手,它们可以独立审查代码、处理错误和回答问题。你也可以像初级开发人员一样使用机器人,利用它们进行头脑风暴并分担功能工作。机器人拥有强大的防护机制,它们的智能是以用户需求为目标的,不易“幻觉”出错误答案。
代码生成将成为人工智能革命中最具变革性的领域之一,而 Factory拥有成功的所有必要工具。
人类发展的故事是一个卸载重复性工作的故事,这让我们能够转向更复杂的任务。当人类发明农业时,实际上是释放了我们建造城市的能力。在工业革命之后,我们制造了能把人类带到月球上的火箭。下一代的任务是将人类从网上的苦差事中解放出来,进一步推动技术前沿。
当唯一的限制是人类的想象力时,我们下一步将建造什么?
——马尔基·瓦格纳(Markie Wagner),德尔福实验室(Delphi Labs)创始人兼首席执行官
译者:Jane
来源:AIGC
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com