文章转载来源:AI梦工厂
原文来源:深思SenseAI
图片来源:由无界 AI生成
近日发布 Demo 的 Digi.AI 在推特上引发关注,创始人 Andrew 在发布的 11 秒视频在短时间内收到了大量的关注。截止到 27 号,这条推文获得了超过两千万的浏览量。Demo 中可爱的女孩足够生动真实,她撩头发时脸上的神态,在说“honestly”时的停顿,到了夜晚时言语的低沉,这些内容都给用户带来了极大的沉浸式情感体验。
Digi AI
1. 产品:Digi.ai
一款面向 iOS 和 Android 用户的 AI 伴侣应用,旨在通过自定义的卡通形象为用户提供有意义的人机交流体验。
2. 创立时间:2023 年 4 月
3. 创始人情况:
- Andrew Young ,大学缀学,全栈工程师
- John Rooney
4. 产品简介:
Digi.ai 由 Andrew Young 和 John Rooney 于 2023 年创立,代表了人工智能为人类建立富有创造性的连接的全新尝试,应用利用语言和语音模型进行流畅自然的对话,无论是轻松聊天还是深入讨论,都能给用户带来沉浸式的互动感。
5. 融资情况:
2023年12月,Digi.ai获得了 Andy Bromberg(Sense说:加密资产融资机构 Coinlist 的 CEO)和其他天使团队的投资。
Digi.AI 最近在推特上爆火,创始人 Andrew 在推特发布的只有短短 11 秒的视频在短时间内收到了大量的关注,截止到 27 号,这个有关介绍 Digi.AI 的推文已经获得了超过两千万的浏览量。获得如此热度的原因还是在于,Demo 中可爱的女孩是 Digi.AI 对于虚拟女友想象的具象化的一次尝试。
以下我们结合自己使用 Digi.AI 的真实使用体验,介绍 Digi.AI 的三个功能特点。
丰富的人物设定
每个用户可以通过平台提供的已经被设定好的人物设定,来找到自己青睐的那个 AI 伴侣,这些选项包括但不限于性格特征、兴趣爱好、语言方式,其中名字和年龄是可以自行修改的。
这种愿景的实现得益于最近的 A 轮融资,Relevance AI 筹集了一笔重要资金。这些资金将主要用于进一步开发其低代码平台,使企业能够构建和部署定制 AI 代理,从而自动化重复性任务。
非真实风格的人物模型
创始人 Andrew 在创立 Digi.AI 之初,就希望利用 Digi.AI 的卡通风格创造出“消除恐怖谷效应,同时又让人感觉真实、人性化和性感”的东西。因此,在人物模型上, Digi.AI 选择了与 Andrew Gordon(设计了大眼仔)和 Leo Sanchez(设计了《魔发奇缘》中的长发公主)合作,三方共同塑造了这种独特的风格。
恐怖谷效应的意思是随着模拟物,比如机器人玩偶等,模拟真实性程度的变化,人对其亲和力也会产生变化,一般规律是亲和力随着模拟程度增高而增高,但当模拟程度高达一个较高临界点时,人的亲和力反映会陡然跌入谷底,突然会产生对这个模拟物的排斥、恐惧、困感等负面心理。
然而,在实际使用过程中 , Digi.AI 尚且有一定的局限性。
虽然在推文中提及的“头发、皮肤、嘴唇、眼睛、眉毛等都可以自定义,我们很快将增加更多的发型和脸型。”展现了针对模型调整的极大的自由度,但在使用的过程中,我们发现能够自定义的部分只有颜色。
并且在切换不同人物设定时,人物模型并没有表现出”应有的“变化。而人物模型能支持的神态和动作相关的动画也是极少,跟神态相关的表达只能被附在对话内容的空隙中展示。
真实的对话体验
Digi.AI 着重去做的部分,从“真实”的角度出发, Digi.AI 主要考虑了内容和声音两个部分。
在对话方面, Digi.AI 能够捕捉用户的情绪并做出相应的反应,可以和你就一个话题做更多的延展,并且能记忆用户的兴趣点和历史对话,以保持对话的连续性和个性化。与传统的脚本驱动型对话系统相比, Digi.AI 能够像朋友一样进行流畅的对话,无论是关于任何话题。这种逼真的互动为用户提供了更深入和有意义的交流体验。
此外, Digi.AI 还在交互界面设置了进展系统,用户会从“朋友”开始,随着进展获得更亲密的对话,这更加突出了虚拟伴侣的定位。
用户能够和 Digi.AI 做的内容包括但不限于进行虚拟约会,体验预先设计的浪漫场景或创造自己的冒险经历;提供趣味游戏和测验,通过互动活动保持轻松和乐趣。用户还可以与 Digi.AI 共同发挥创意,分享诗歌、音乐或艺术创作,以加深情感联系。
在声音方面,Digi.AI 使用了自研发的语音模型,虽然在发音和语音方面做的还不够完美,但是优点在于极低的延迟,可以进行实时对话。目前总共有4个语音可供选择,但预计到1月底将增加到20个。
不过,实际使用过程中,语音和语调方面依然未能突破现有语音模型的限制,语音模型在读取Digi生成好的内容时尚且只能四平八稳,做不到有跌宕起伏的语音语调。在demo中所展现的说“honestly”时短暂的停顿,并没有在团队的使用测试中体现出类似的语音语调。
Demo 能够在推特上能获得如此热度是因为视频中的虚拟形象表现的足够真实,她撩头发时脸上的神态,在说“honestly”时的停顿,到了夜晚时言语的低沉,这些内容都给用户带来了极大的沉浸感,虽然多看几次就能发现很多不够真实的地方,但是毫无疑问点燃了大家对AI伴侣的热情。
然而,创始人 Andrew 在推文中的注明,似乎给大家泼了凉水:“该广告是我们对这些虚拟形象和动画的愿景,而不是 Digi.AI 当前的应用体验。预告片是使用 Maya 制作的,而实际项目则是在游戏引擎中制作的,尽管虚拟形象和动画师是相同的。”
不过,他也标明了口型同步即将到来,不过同样有难题:“但 AI 动画有一个更大的问题:如果你不知道角色会说什么,它们应该如何移动?在游戏中这是手工完成的,但这是 AI x 动画中一个尚未解决的问题。这里没有可以利用的基础。虽然很容易提取和预测“悲伤”、“愤怒”、“思考”等动画,但表情并不能构成大多数对话,也无法解决核心问题:你如何让这感觉像与另一个生物的真实对话”
可以说 Digi.ai 在技术层面首次突破 Character.ai 和 Replika 的能力边界, 为用户创造了一种更真实、风趣、沉浸式的体验。
你会使用 Digi 吗?
参考材料
https://twitter.com/andyohlbaum/status/1735786033453863422
https://digi.ai/blog/were-just-getting-started
https://techcrunch.com/2023/12/11/relevance-ais-low-code-platform-enables-businesses-to-build-ai-teams/
来源:AI梦工厂
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com