下载客户端

MiniMax发布新一代语音大模型

澎湃新闻记者喻琰

2025-05-20 07:37

来源：澎湃新闻

听全文

近日，AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02，宣布该模型在国际最权威的两项语音评测榜单Artificial Analysis（全球知名AI基准测试机构）和Hugging Face TTS Arena （抱抱脸文本转语音竞技场）上，超越OpenAI、ElevenLabs等国际巨头，登上双榜榜首。

国际权威语音评测榜单Artificial Analysis 来源：以下图片均由Minimax方提供

据介绍，Speech-02在语音模型核心技术指标：字错率WER和相似度SIM等客观指标上取得了SOTA结果，用户盲听主观评价反馈也显示其更自然、真实。

与Seed-TTS、CosyVoice 2和真实音频相比，Speech-02在中英文的零样本语音克隆中均实现了更低的字错率（Word Error Rate, WER），表明其发音错误率更低且更清晰稳定。在SIM方面，Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型，前者生成的语音更逼近真人输出。