07月20日,星期四 10:45
火讯财经讯,据IT之家7月20日消息,人工智能公司Cohere首席执行官AidenGomez近日透露,由于Reddit、Twitter等公司的数据采集要价太高,包括微软、OpenAI和Cohere在内的AI公司,已使用合成数据来训练AI模型。Gomez表示合成数据可以适用于很多训练场景,只是目前尚未全面推广。Gomez举例称:如果某个企业想在高等数学中训练一个模型,可以创建两个人工智能模型,分别扮演老师和学生的角色,并让它们讨论三角学之类的话题。人工主要负责观察,如果看到有什么错误,可以进行纠正。据悉,合成数据(syntheticdata)是通过计算机技术人工生成的数据,而不是由真实事件产生的数据。但合成数据具备“可用性”,能够在数学上或统计学上反映原始数据的属性,因此可以作为原始数据的替代品来训练、测试并验证大模型。