• +1

DeepSeek引发资本市场对算力增长展望的担忧

2025-01-29 16:08
澎湃财讯 >
字号

华泰证券研报称,DeepSeek发布R1模型及相关应用,以较低的训练成本达到与现有前沿模型相当的效果,引发市场对算力投资的担忧。华泰证券认为:1)DeepSeek主要创新是通过在预训练阶段加入强化学习,DeepSeek V3训练成本相当于Llama3系列的7%,对当前世代AI大模型的降本做出了重要贡献,有望降低现有模型的训练和推理成本;2)目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型,DeepSeek的方式是否在下一代模型研发中有效还有待观察。3)DeepSeek这次的成功显示,在Scaling Law放缓的大背景下,中美在大模型技术上的差距有望缩小。

    责任编辑:徐宏文
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2025 上海东方报业有限公司