免费discuz论坛–OpenAI公开语音合成引擎Voice Engine:支持语音克隆,未开放使用

OpenAI 近日共享了一个名为 Voice Engine语音组成模型的初步成果。Voice Engine支撑语音克隆,可是未开放运用,供给给了HeyGen等公司运用。
image.png
Voice Engine 模型运用文本输入和15秒的音频样本生成挨近原始说话者的天然语音,令人形象深刻的是,即使只运用了一个短短的音频样本,Voice Engine 生成的语音仍然可以传达情感,听起来非常逼真。(免费discuz论坛).这个小规模测试展示了 Voice Engine 的潜力,虽然 OpenAI 仍在慎重地评估是否以及如安在更广泛的范围内发布这项技能。
前期运用标明 Voice Engine 在多个范畴具有宽广的运用远景,如为非阅读者和儿童供给朗读协助、翻译内容、改善偏远地区的服务交付、支撑无法言语的人群以及协助患有言语妨碍的患者康复。
虽然组成语音技能的潜在危险引起人们的忧虑,OpenAI 已经采取了一系列安全措施和预防措施,以保证技能的安全运用,如制止未经答应模仿他人的声响、要求原始发言者明确同意运用其音频样本等。
在未来,OpenAI 希望通过与各方协作,加强社会对组成语音技能带来的挑战的防备,促进对组成语音技能的了解和运用。