12月22日,星期五 11:00
火讯财经讯,据站长之家12月22日报道,Meta最新发布了一系列AI翻译大模型,实现实时语音转换延迟不超过2秒,支持多种语言翻译,并具备模仿语气、语速、情感等特征的能力。这一系列模型名为SeamlessCommunication,包括SeamlessExpressive、SeamlessStreaming、SeamlessM4Tv2和Seamless,其中前三个已经在GitHub上开源。为确保翻译准确性和避免滥用,Meta采用了毒性缓解技术,在训练前过滤“有毒内容”并在翻译生成过程中自动检测和调整生成的有毒单词,同时为音频添加了水印以追踪来源。为了防止滥用风险,Meta还为音频添加了水印,通过在音频中嵌入不可察觉的信号,可以准确追踪音频的来源,并对抗各种攻击手段。