趣丸科技开源语音大模型MaskGCT

4个月前发布

03457

10月24日，趣丸科技宣布与香港中文大学（深圳）联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源，面向全球用户开放使用。区别于传统TTS模型，该模型采用掩码生成模型与语音表征解耦编码的技术范式，在声音克隆、跨语种合成、语音控制等任务中性能表现突出。据介绍，MaskGCT在三个TTS基准数据集上都达到了SOTA效果。

免责声明: 本文来自梵星网创作者，不代表梵星网的观点和立场。本网页内容均来自网络采集，如果侵犯了您的权益请与我司联系。

THE END