昨日,OpenAI宣布推出语音引擎,输入文本和一个15秒的音频样本,即可生成与原始说话者非常相似的自然人声。这项工具尚未公开。OpenAI认为该技术可用于有声读物、翻译视频和播客内容、改善偏远地区的咨询服务、为有语言障碍的人士提供辅助甚至是帮助恢复声音。
去年年底,OpenAI开始与一小群值得信赖的合作伙伴私下测试这项技术。OpenAI于2022年底首次开发语音引擎,并已将其用于支持文本转语音API以及ChatGPT Voice和Read Aloud中可用的预设语音。基于这些对话和这些小规模测试的结果,OpenAI将就是否以及如何大规模部署这项技术做出更明智的决定。
暂无讨论,说说你的看法吧


