486 天前
火讯财经讯,据站长之家1月11日报道,字节跳动昨日发布了MagicVideo-V2多阶段高美学视频生成论文。论文介绍了MagicVideo-V2,将文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块集成到端到端视频生成管道中。得益于这些架构设计,MagicVideo-V2可以具有出色保真度和平滑生成度的美观、高清视频。通过大规模用户评估,其表现增长了Runway、Pika1.0、Morph、MoonValley和StableVideoDiffusion模型等前面文本转视频系统的性能。
486 天前
火讯财经讯,据品玩报道,Meta近日公布了一项名为audio2photoreal的AI框架,该框架能够生成一系列逼真的NPC人物模型,并借助现有配音文件自动为人物模型“对口型”“摆动作”。官方研究报告指出,Audio2photoreal框架在接收到配音文件后,首先会生成一系列NPC模型,之后利用量化技术及扩散算法生成模型用动作,其中量化技术为框架提供动作样本参考、扩散算法用于改善框架生成的人物动作效果。对照实验中有43%的评估者对框架生成的人物对话场景感到“强烈满意”,因此研究人员认为Audio2photoreal框架相对于业界竞品能够生成“更具动态和表现力”的动作。据悉,研究团队目前已经在GitHub公开了相关代码和数据集。
486 天前
火讯财经讯,据36氪1月10日报道,AIGC软件A股上市公司万兴科技(300624.SZ)打造的万兴“天幕”多媒体大模型算法正式通过《互联网信息服务深度合成管理规定》备案,成为湖南省首个通过备案的大模型算法,意味着万兴“天幕”大模型能力将加速进入应用阶段,在AIGC产品中逐步落地。此外,万兴喵影AIGC生成算法、万兴智能文档算法一同通过备案。
486 天前
火讯财经讯,据站长之家1月11日报道,AI公司Rabbit在X上表示,其口袋尺寸设备R1在推出的第一天就售出了1万台,宣告首批设备售罄。R1是Rabbit在周二的CES上推出的一款设备,配备了一个小巧的2.88英寸触摸屏,运行着该公司自家的Rabbit操作系统。该设备采用了一种名为“LargeActionModel”的技术,作为一种“通用的应用控制器”,可以在无需使用手机的情况下播放音乐、购物和发送消息。此外,它还允许用户对设备进行训练,以适应特定应用的交互方式。尽管首批设备已售罄,用户仍可在Rabbit官网上预订R1,并预计在2024年4月至5月之间交付。
486 天前
火讯财经讯,据《科创板日报》1月11日报道,思必驰科技股份有限公司完成新一轮首期两亿元融资,后续思必驰将继续加大在语言大模型与人工智能对话技术上的研发投入,加速软硬件标准化产品在多场景的落地应用。此前报道,思必驰宣布自研大模型DFM-2通过备案。
486 天前
火讯财经讯,据界面新闻报道,1月10日,《博鳌亚洲论坛创新报告2023》在广州发布,指出亚洲已成为AI大模型技术的主要产出区。其中,中国为AI大模型专利最多产出国。华南理工大学法学院知识产权研究所所长关永红解读《报告》提及,截至2023年6月,中国AI大模型专利数量占比高达58%,韩国(占比8%)和日本(占比5%)也是亚洲专利主要产出地区;美国占比为18%。关永红表示,截至2023年10月,国内大模型达到238个,但截至5月只有79个,反映中国大模型快速增长态势。下一步,AI大模型需要提升逻辑推理能力,并考虑如何产生回报。
486 天前
火讯财经讯,据36氪1月11日报道,腾讯广告在2024腾讯智慧营销峰会上正式发布了以腾讯混元大模型为基底的一站式AI广告创意平台“腾讯广告妙思”,助力各行业的广告主及优化师在创意制作、投放流程及广告审核等环节,提升广告生产及投放效率。
486 天前
火讯财经讯,AI新智界讯,1月11日凌晨,OpenAI宣布正式向ChatGPTPlus、开发团队和企业用户推出GPTStore,自发布GPTs两个月以来,用户已经创建了超过300万个ChatGPT自定义版本。GPTStore汇集了用户为各种任务创建的ChatGPT的自定义版本,例如可以教孩子数学的聊天机器人,以及编程导师、读书指南等。此外,OpenAI还为团队规模较小的企业用户推出了新的付费套餐“ChatGPTTeam”:套餐内每位用户按年计费时,为每月25美元;按月计费则为每月30美元。与Enterprise用户一样,Team的套餐也配备数据隐私保护功能。据悉,OpenAI已经为ChatGPT提供了两个付费计划,一个是面向个人用户的ChatGPTPlus,另一个是面向大型企业的ChatGPTEnterprise。
486 天前
火讯财经讯,据AIGC开放社区报道,上海AI实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为Amphion的音频、音乐和语音生成工具包。Amphion可帮助开发人员研究文本生成音频、音乐等与音频相关的领域,可以在一个框架内完成,以解决生成模型黑箱、代码库分散、缺少评估指标等难题。据悉,Amphion包含了数据处理、通用模块、优化算法等基础设施。同时针对文本到语音、歌声转换、文本到音频生成等任务,提供了特定的框架、模型和开发说明,还内置了各类神经语音编解码器和评价指标。
486 天前
火讯财经讯,据财联社1月11日报道,谷歌宣布,由生成式人工智能提供支持的DocumentAI自定义提取器现已正式推出。DocumentAI提供使用生成式AI自动提取发票、收据、护照、合同等文档的项目和内容的功能。
486 天前
火讯财经讯,据IT之家1月10日报道,最近几周在Facebook等平台陆续出现了美国著名歌手泰勒・斯威夫特的“代言广告”:她在这则广告中“宣布”将会为粉丝免费送出LeCreuset品牌的厨具套装,人们只需要点击一个按钮并回答几个问题。不过,这则广告的“当事方”LeCreuset却表示,公司并没有参与任何消费者赠品活动,尽管她平时爱用这个品牌的厨具。在这则案例中,AI技术用来合成了泰勒・斯威夫特的声音,并将声音与LeCreuset广告片段拼凑在一起。骗子还利用合成的声音称呼泰勒・斯威夫特的粉丝为“Swifties”。当受害者被引导至虚假网站后,会被要求支付9.96美元的运费。但号称免费送的厨具不会真的送出去。
486 天前
火讯财经讯,AI新智界讯,1月11日凌晨,OpenAI宣布正式向ChatGPTPlus、开发团队和企业用户推出GPTStore,自发布GPTs两个月以来,用户已经创建了超过300万个ChatGPT自定义版本。GPTStore汇集了用户为各种任务创建的ChatGPT的自定义版本,例如可以教孩子数学的聊天机器人,以及编程导师、读书指南等。此外,OpenAI还为团队规模较小的企业用户推出了新的付费套餐“ChatGPTTeam”:套餐内每位用户按年计费时,为每月25美元;按月计费则为每月30美元。与Enterprise用户一样,Team的套餐也配备数据隐私保护功能。据悉,OpenAI已经为ChatGPT提供了两个付费计划,一个是面向个人用户的ChatGPTPlus,另一个是面向大型企业的ChatGPTEnterprise。
486 天前
火讯财经讯,AI新智界讯,1月11日凌晨,OpenAI宣布推出在线商店“GPTStore”,已创建超过300万个GPT。先前由于人事的动荡,公司延后了这一功能的推出。据新闻稿介绍,GPTStore已于周三开始向付费用户、团队和企业用户推出,商店汇集了用户为各种任务创建的ChatGPT的自定义版本,例如可以教孩子数学的聊天机器人,以及编程导师、读书指南等。与此同时,OpenAI还为团队规模较小的企业用户推出了新的付费套餐“ChatGPTTeam”:套餐内每位用户按年计费时,为每月25美元;按月计费则为每月30美元。与Enterprise用户一样,Team的套餐也配备数据隐私保护功能。
487 天前
火讯财经讯,AI新智界讯,1月10日,微博博主“吴小杰WJie”爆料称,TCL在深圳测试了全新一代的独立画质芯片,拥有全识AI大数据模型,具备很强的AI算力和人脑思维,这款芯片将会在今年的旗舰电视新品上登场。另据IT之家报道,TCL此次测试的全新一代的独立画质芯片,大幅强化了AI能力。经接近TCL的业内人士确认,该消息基本确定。
487 天前
火讯财经讯,据IT之家1月10日消息,ChatGPT开发商OpenAI近日承认,像ChatGPT这样的AI工具的开发离不开受版权保护的素材,并称如果没有这些素材,这些工具根本无法诞生。据报道,OpenAI在提交给英国上议院通信和数字事务特别委员会关于大型语言模型调查的文件中做出了这一表述。ChatGPT和图像生成器DALL-E等AI模型之所以拥有强大的能力,主要是因为它们通过海量的内容进行训练,其中一部分是从网上公开内容抓取而来,并不总是经过版权持有人的许可(OpenAI确实会获得部分训练内容的许可)。这种“自由奔放”的抓取方式在学术机器学习研究中由来已久,但随着深度学习AI模型近期走向商业化,这种做法也受到了愈加严厉的审查。OpenAI在提交给上议院的文件中写道,“由于当前版权涵盖了几乎所有形式的人类表达方式,包括博客文章、照片、论坛帖子、软件代码片段和政府文件,如果不使用受版权保护的内容,就不可能训练当今领先的人工智能模型。”OpenAI进一步表示,如果将训练数据仅限于“一个世纪前”的公共领域书籍和图画,将无法训练出“满足当代公民需求”的AI系统。
487 天前
火讯财经讯,AI新智界讯,统信软件官方宣布UOSAI已在昨日正式上架统信UOS桌面平台,该AI兼容云侧与端侧大模型,支持接入私有化部署的本地模型。官方介绍称,用户在安装UOSAI后,可以通过快捷键“super+C”唤醒UOSAI桌面智能助手,从而进行语音对话或自然语言交互。据介绍,在应用层,桌面智能助手支持多模态输入和输出,并支持自然语言命令调用40余个使用场景,目前接入UOSAI的应用已达10余款,涵盖系统文件管理(全局搜索、看图、相册等)、办公效率工具(浏览器、邮箱、畅写等)、生产力工具(deepin-IDE等);在芯片层,UOSAI支持国内主流CPU芯片和英伟达、摩尔线程等国内外主流GPU芯片;在大模型层,UOSAI覆盖90%主流开源大模型与AI框架,同时支持云端及本地混合模型。
487 天前
火讯财经讯,据站长之家1月10日报道,LumaAI发布Genie1.0版本,这是一个文本到3D模型的转换工具,能够在不到10秒内根据文本描述创建任何想象中的3D对象。生成的3D模型不仅包含形状,还包含了表面材料的细节,比如颜色、纹理或反光性,这使得模型更加逼真和详细。此外,LumaAI还宣布获得了由a16z牵头的4300万美元B轮融资,为Genie的发展提供了有力的支持。
487 天前
火讯财经讯,据IT之家1月10日报道,有玩家发现威世智旗下《龙与地下城》游戏宣传材料中存在“疑似AI绘画痕迹”,威世智发布声明宣称“绝不使用AI进行创作”。相关痕迹出现在《万智牌》X平台官方账号发布的宣传图中,有玩家发现图片背景“表盘数字”、“灯泡灯丝”存在显著AI绘画痕迹。在玩家们提出质疑后,威世智迅速回复称“相关图片完全由人类艺术家创作”,不过评论区所有用户都不买账,声称“要么是威世智在撒谎,要么是创作这张图的‘艺术家’欺骗了威世智”。面对玩家排山倒海的批评,威世智最终删除了上述回复,并承认这张宣传图“由第三方提供”,其中“的确使用了AI生成工具”。
487 天前
火讯财经讯,据《科创板日报》1月10日报道,荣耀自研70亿参数的端侧平台级AI大模型“魔法大模型”发布,可实现智慧成片、图库语义搜索、一拖日程等功能。魔法大模型将在荣耀Magic6系列首发。此外,荣耀MagicOS首次构建大模型服务生态,能实现多个大模型间的安全高效连接,而百度智能云与荣耀大模型成为生态战略合作伙伴,将通过千帆大模型平台实现端云协同。此外,荣耀还发布了其平台级AI最新集成系统MagicOS8.0,实现基于用户意图识别能力的GenAI平台级系统。App应用将被聚合在“任意门”入口,实现一键直达服务调用。
487 天前
火讯财经讯,据金十1月10日报道,淘宝近日宣布基于AI大模型升级店小蜜产品,邀请商家测试,预计在2024年6月上线。淘宝方面测试数据显示,店小蜜基于大模型强化AI问答能力后,答案准确率提升至85%,能够服务于售前导购、售后服务、数据洞察、接待质检等环节。