• +1

MiniMax发布新一代语音大模型

澎湃新闻记者 喻琰
2025-05-20 07:37
来源:澎湃新闻
未来2% >
听全文
字号

近日,AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02,宣布该模型在国际最权威的两项语音评测榜单Artificial Analysis(全球知名AI基准测试机构)和Hugging Face TTS Arena (抱抱脸文本转语音竞技场)上,超越OpenAI、ElevenLabs等国际巨头,登上双榜榜首。

国际权威语音评测榜单Artificial Analysis 来源:以下图片均由Minimax方提供

据介绍,Speech-02在语音模型核心技术指标:字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也显示其更自然、真实。

与Seed-TTS、CosyVoice 2和真实音频相比,Speech-02在中英文的零样本语音克隆中均实现了更低的字错率(Word Error Rate, WER),表明其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输出。

Hugging Face TTS Arena 评测榜单

值得关注的是,Speech-02性能登顶的同时,其商用定价仅为全球头部语音模型ElevenLabs的四分之一,具有高性能和性价比双重优势。目前,MiniMax已在文旅导览、金融服务、语音助手、AI教育等领域应用其大模型服务。

    责任编辑:宦艳红
    图片编辑:蒋立冬
    校对:施鋆
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司