7月24日,字节跳动Seed团队正式发布端到端同声传译模型Seed LiveInterpret 2.0。据官方介绍,Seed LiveInterpret 2.0是首个延迟&准确率接近人类水平的产品级中英语音同传系统,在中英同传翻译质量达到业界SOTA的同时,实现了极低的语音延迟水平。
Seed LiveInterpret 2.0基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样以极低的延迟 “边听边说”,一边接收源语言语音输入,一边直接输出目标语言的翻译语音。同时,Seed LiveInterpret 2.0还支持0样本声音复刻,让沟通更加流畅自然。
目前,Seed LiveInterpret 2.0技术报告已公布配资网上,模型基于火山引擎对外开放。此外,Ola Friend耳机也将在8月底接入Seed LiveInterpret 2.0,成为首个支持该模型的智能硬件设备。
上阳网提示:文章来自网络,不代表本站观点。