10月26日,星期四 11:45
火讯财经讯,据站长之家10月26日报道,来自麻省理工学院(MIT)、CohereforAI以及其他11个机构的研究人员,共同发布了DataProvenancePlatform,旨在应对AI领域的数据透明危机。该平台旨在解决AI模型训练数据集的来源和使用透明度不足的问题。这个跨机构合作的倡议审计和追踪了近2000个广泛使用的微调数据集。这些数据集已被下载数千万次,是许多自然语言处理(NLP)突破的基础。此外,研究人员发布的报告指出,数据集的溯源和透明度问题可能导致数据泄漏、暴露个人身份信息、出现意外偏见或行为,从而降低了模型的质量,同时也带来了法律和伦理风险。