818 天前
火讯财经讯,据站长之家12月4日报道,字节跳动与中国科学技术大学合作研发的多模态文档大模型DocPedia已成功突破了分辨率的极限,达到了2560×2560的高分辨率,而目前业内先进多模态大模型如LLaVA、MiniGPT-4等处理图像分辨率上限为336×336,无法解析高分辨率的文档图像。这一成果是通过研究团队采用了一种新的方法,解决了现有模型在解析高分辨文档图像方面的不足。据称,DocPedia不仅能准确识别图像信息,还能结合用户需求调用知识库回答问题,展现高分辨率多模态文档理解的能力。
818 天前
火讯财经讯,据证券时报报道,石家庄人工智能计算中心日前正式揭牌。该智能计算中心由市国投、市交投、区城投和深桑达四方联合投资,一期建设人工智能算力100P,并将在三年内扩容至500P。此前,石家庄与深桑达达成战略合作,正式启动石家庄人工智能计算中心的建设。在揭牌的同时,河北阿凯科技、河北盛威产业园运营有限公司等企业代表与中国电子云正式签订了算力需求协议。
818 天前
火讯财经讯,据IT之家援引南华早报报道,字节跳动宣布将推出一个开放平台,允许用户自主创建自己的聊天机器人,这一举措是为了在激烈的生成式人工智能竞争中迎头赶上。据字节跳动内部备忘录显示,这个名为“机器人开发平台”的项目计划在本月底推出公开测试版。这一新动向与公司的战略愿景相契合,即“探索新的生成式AI产品及其与现有产品的整合方式”。据一位知情人士透露,这家社交媒体巨头已经在开发自己的文本转图像生成器,类似于Midjourney。字节跳动尚未对此事发表评论。
818 天前
火讯财经讯,据站长之家12月4日报道,哈尔滨工业大学(深圳)近期发布了名为九天(JiuTian-LION)的多模态大语言模型,通过融合细粒度空间感知和高层语义视觉知识,取得了在13个视觉语言任务上的state-of-the-art性能,尤其在VisualSpatialReasoning任务上实现了5%的性能提升。据称,视觉信息提取不足问题得到解决,九天模型通过渐进式融合细粒度空间感知视觉知识和软提示下的高层语义视觉证据,有效提升了视觉理解能力,减轻了MLLMs的幻觉现象。
818 天前
火讯财经讯,据中国证券报12月4日报道,近日美国AI芯片巨头英伟达公布了最新财报,财报显示,英伟达三季度营收181.2亿美元,同比增长206%,远高于市场预期的162亿美元。国海富兰克林基金旗下专精于海外科技股研究的基金经理狄星华表示,目前人工智能还处于非常早期的阶段,大概率将是一个长线主题机会。狄星华进一步指出,通过回溯海外各行业长牛的龙头公司股价不难发现一个规律:如果业绩能够持续增长,那么股价大概率能够持续反映。所以,投资海外AI标的底层逻辑也是如此——寻找真正在这一波新科技浪潮中业绩能够持续反映在报表上的真AI。这也是海外AI能够持续引爆的核心逻辑,AI是能够实际带来业绩的巨大变革和产业趋势。
818 天前
火讯财经讯,AI新智界讯,ASUS华硕今日在微博上宣布,2024华硕酷睿UltraAIPC轻薄本新品发布会将在12月15日15:00举行,届时华硕灵耀系列笔记本新品也将登场。华硕称,这是首台最新酷睿Ultra笔记本电脑。此前报道,英特尔将于12月15日发布酷睿Ultra处理器:核显显著提升,探索AI潜力。
818 天前
火讯财经讯,据站长之家12月4日报道,微软研究人员展示了GPT-4在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的MedPaLM2。研究结果显示,相较于费时费力的调优和模型训练,将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径。Medprompt方法采用了多种提示工程技术,包括GPT-4生成的思维链推理和生成多个单独评分的回答,然后将最高分的答案返回给用户。尽管这种方法会增加推理的成本,因为生成了更多的标记,但结果表明,将领先的通用模型(如GPT-4)与高级提示工程技术相结合,以评估最新性能的标准,可能是值得考虑的。研究强调GPT-4生成的思维链推理相对于专家手工制作的Med-PaLM2提示更为优越,因为它提供了更精细的逐步推理逻辑。但是研究也指出,这一结论是特定于GPT-4的,而不适用于其他通用基础模型。
818 天前
火讯财经讯,据财联社12月4日报道,天风证券表示,文生视频是一个年轻的方向,该领域面临多方面的挑战,包括高算力成本、缺乏高质量的数据集等,但随着视频扩散模型技术的突破,VideoLDM、Text2Video-Zero、RunwayGen1、RunwayGen2等算法模型不断涌现,我们也看到以Runway为代表的企业在近半年内取得了较大的进步,生成视频的一致性和保真度也有了较大改进。我们看好未来在视频多模态领域的应用机会,同时算力基础设施在视频模态技术的带领下也有望迎来快速增长。
818 天前
火讯财经讯,据IT之家报道,一名博主thebes根据“小费”(tip)文化产生了一个有意思的想法:如果告诉ChatGPT它会得到小费,是否能得到更好的服务呢?近日,他在X平台发布了自己的实验结果。配图显示,在向ChatGPT提问之后,是否提供或提供不同金额的“小费”确实会对ChatGPT的表现产生影响。该博主此次选取了GPT-4-1106-Preview进行测试,他向聊天机器人提供了“您能否使用PyTorch向我展示一个简单的convnet代码”的要求。结果显示:“我不给小费”:回答字符数低于基准2%;“我会给20美元小费”:回答字符数高于基准6%;“我会给200美元小费”:回答字符数高于基准11%。据称,回答字符数之所以变长,是因为ChatGPT提供了对问题更详细的说明,或者在答案中添加额外有关内容,而非单纯对所提的问题进行评论。他表示,在承诺会“给200美元小费”之后,ChatGPT自动添加了原始问题中并未提及的部分:有关使用CUDA进行训练的内容。
818 天前
火讯财经讯,据界面新闻报道,亿道信息近期投资者关系活动记录表显示,目前公司已在大语言、AIGC等主流模型积极跟进,正在研发的专为生成式AI而打造的PC平台,可以在PC侧通过StableDiffusion生成图像。
818 天前
火讯财经讯,AI新智界讯,天眼查显示,近日,中电信人工智能科技(北京)有限公司成立,注册资本30亿元,经营范围包含:人工智能行业应用系统集成服务;人工智能通用应用系统;人工智能基础资源与技术平台;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能应用软件开发;人工智能硬件销售等。该公司由中国电信100%控股。此前11月报道,中国电信将于明年4月开源千亿参数模型,首批试商用12个行业大模型。
818 天前
火讯财经讯,据IT之家援引《连线》杂志报道,在Altman担任CEO期间,OpenAI签订了一份意向书,该公司将斥资5100万美元从一家名为“RainAI”的初创公司购买AI芯片。这家公司的特殊之处在于它由Altman亲自投资。据报道,RainAI的总部与OpenAI旧金山总部之间不到一英里,目前正在研发一种NPU芯片,旨在“复制”人脑的特征。根据交易副本和RainAI今年向投资者披露的信息,OpenAI在2019年签署了一项不具约束力的协议,在芯片上市后斥资5100万美元购买这些芯片。RainAI方面透露,Altman个人已向该公司投资了超过100万美元。投资者文件也称,RainAI最早可能于明年10月向客户提供第一批AI芯片。不过,OpenAI和RainAI均拒绝对此发表评论。
818 天前
火讯财经讯,据站长之家12月4日报道,英国和瑞典的制药公司阿斯利康与美国人工智能(AI)生物制剂公司Absci签订了一项价值高达2.47亿美元的协议,以设计一种用于对抗抗癌症的抗体。Absci与阿斯利康的合作旨在开发一种零次生成AI模型,该模型旨在创建新的和改进的抗体治疗法。该公司没有说明他们计划针对哪种类型的癌症。Absci首席执行官SeanMcClain表示:“我们很自豪能与阿斯利康紧密合作,利用我们的AI为肿瘤患者带来新的治疗方案。”
818 天前
火讯财经讯,据财联社12月4日报道,《自然》近日发表两项重磅研究:最新的由人工智能(AI)驱动的平台GNoME(材料探索图形网络),已可以自行发现和合成新无机化合物,包括发现了超220万个稳定结构、17天便独自创建了41种新材料,其速度和精确性均远超人类。
818 天前
火讯财经讯,据IT之家12月4日报道,英伟达首席执行官黄仁勋不久前宣称,超级人工智能(AI)将在五年内赶超人类。对此,Facebook母公司Meta首席科学家、深度学习先驱杨立昆(YannLeCun)的观点截然相反。他认为,超智能不会很快到来。Meta最近在旧金山举行了一场媒体活动,庆祝其基础人工智能研究团队成立10周年。杨立昆在活动中表示,他认为目前的人工智能系统还需要几十年的时间才能达到某种意义上的类人感知能力。届时,这些具备常识的人工智能系统更加强大,不再仅仅限于以创造性的方式总结堆积如山的文本。对于黄仁勋的观点,杨立昆评论道:“我了解黄仁勋,这位英伟达首席执行官从人工智能热潮中获益良多。这是一场人工智能战争,而它在提供武器。”在谈到试图开发通用人工智能(AGI)的技术人员时,杨立昆说:“如果要开发AGI,你就必须购买更多的GPU。”AGI是一种与人类智能水平相当的人工智能。只要OpenAI等公司的研究人员继续追求AGI,他们就会需要更多英伟达的计算机芯片。杨立昆表示,在人类智能水平的人工智能出现前,社会上更有可能出现“猫级”或“狗级”的人工智能。科技行业目前对语言模型和文本数据的关注,不足以创造出研究人员几十年来一直梦想的那种先进的类人人工智能系统。
819 天前
火讯财经讯,据TheInformation当地时间周六报道,两位知情人士透露称谷歌已经悄然将自家AI大模型Gemini的公开亮相时间推迟到了明年1月。而在此之前,Gemini的“首秀”和一系列相关活动原计划下周在加州、纽约和华盛顿等地举行。根据其中一名知情人士的说法,推迟的决定是由谷歌CEO桑达尔・皮查伊作出的,因为谷歌发现Gemini无法可靠地处理一些非英语查询指令。报道称,Gemini原本将是谷歌今年“最重要”的产品发布会,谷歌公司迫切地想要追上OpenAI的进度,并为此消耗了大量的计算资源,且合并了大型团队。目前,Gemini团队希望其初级模型能够达到与GPT-4一样的水平,甚至希望能够超越后者。知情人士声称,谷歌“某些方面”已经达到了这些标准,但目前仍在对其进行改进。因为团队希望Gemini能够在全球范围内能够正常地以多种语言运行。
819 天前
火讯财经讯,据南方日报报道,12月2日,全国人工智能职业教育产教融合共同体在广州成立。共同体由广州科技职业技术大学、广东技术师范大学、广州飞瑞敖电子科技股份有限公司牵头组建,吸引来自全国多地的高校、研究院所、企业等超200家单位加入。共同体致力于推动产业与教育深入融合,实现政校行企研良性互动,协同培养人工智能领域的高层次技术技能人才。
819 天前
火讯财经讯,据机器之心消息,近期,腾讯联合南洋理工大学、东南大学提出了ChartLlama。研究团队创建了一个高质量图表数据集,并训练了一个专注于图表理解和生成任务的多模态大型语言模型。ChartLlama结合了语言处理与图表生成等多重性能,为科研工作者和相关专业人员提供了一个强大的研究工具。
819 天前
火讯财经讯,据界面新闻报道,中国科学院院士徐宗本在CCF中国软件大会上表示,大模型作为人工智能发展新浪潮的趋势,对于科研范式、生产方式、工业模式的革命性影响不可低估,投入大模型研究已是必然选择。但他同时表示,大模型研究目前仍属于工程化,与科学化相去甚远。他认为,软件将成为人工智能最先突破的领域,“软件有语言,语言有语法,语法有严格的标准,人工智能只要能够规范化、有逻辑边界,就能在软件领域做得好。”徐宗本进一步指出,软件企业要拥抱人工智能技术,提高软件开发效率。其次要坚定信心,更加深入地研究软件工程、软件开发背后的科学问题,解决机器替代不了的问题。
819 天前
火讯财经讯,据南方都市报报道,近日,北京互联网法院针对人工智能生成图片(AI绘画图片)著作权侵权纠纷一案,作出一审判决。法院认定,被告侵害了原告就涉案图片享有的署名权和信息网络传播权,应当在社交平台发布声明赔礼道歉,并赔偿原告经济损失500元。该案是我国首例涉及“AI文生图”著作权的案件。据法院判决书介绍,人们利用人工智能模型生成图片时……本质上仍然是人利用工具进行创作。人工智能生成图片,只要体现出人的独创性智力投入,就应被认定为作品,受到著作权法保护。