OpenAI 公布 Voice Engine 声音克隆新技术:仅需15秒音频样本即可模仿任何说话者

昨日,OpenAI宣布推出语音引擎,输入文本和一个15秒的音频样本,即可生成与原始说话者非常相似的自然人声。这项工具尚未公开。OpenAI认为该技术可用于有声读物、翻译视频和播客内容、改善偏远地区的咨询服务、为有语言障碍的人士提供辅助甚至是帮助恢复声音。
去年年底,OpenAI开始与一小群值得信赖的合作伙伴私下测试这项技术。OpenAI于2022年底首次开发语音引擎,并已将其用于支持文本转语音API以及ChatGPT Voice和Read Aloud中可用的预设语音。基于这些对话和这些小规模测试的结果,OpenAI将就是否以及如何大规模部署这项技术做出更明智的决定。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
error: 您点击的内容受到保护~