下载客户端

2020年深度学习最佳GPU一览，看看哪一款最适合你！

2020-03-04 18:41

来源：澎湃新闻·澎湃号·湃客

大数据文摘

大数据文摘出品

来源：lambdalabs

编译：张秋玥

深度学习模型越来越强大的同时，也占用了更多的内存空间，但是许多GPU却并没有足够的VRAM来训练它们。

那么如果你准备进入深度学习，什么样的GPU才是最合适的呢？下面列出了一些适合进行深度学习模型训练的GPU，并将它们进行了横向比较，一起来看看吧！

太长不看版

截至2020年2月，以下GPU可以训练所有当今语言和图像模型：

RTX 8000：48GB VRAM，约5500美元

RTX 6000：24GB VRAM，约4000美元

Titan RTX：24GB VRAM，约2500美元

以下GPU可以训练大多数（但不是全部）模型：

RTX 2080 Ti：11GB VRAM，约1150美元

GTX 1080 Ti：11GB VRAM，返厂翻新机约800美元

RTX 2080：8GB VRAM，约720美元

RTX 2070：8GB VRAM，约500美元

以下GPU不适合用于训练现在模型：

RTX 2060：6GB VRAM，约359美元。

在这个GPU上进行训练需要相对较小的batch size，模型的分布近似会受到影响，从而模型精度可能会较低。

图像模型

内存不足之前的最大批处理大小：

*表示GPU没有足够的内存来运行模型。

性能（以每秒处理的图像为单位）：

*表示GPU没有足够的内存来运行模型。

语言模型

内存不足之前的最大批处理大小：

*表示GPU没有足够的内存来运行模型。

性能：

* GPU没有足够的内存来运行模型。

使用Quadro RTX 8000结果进行标准化后的表现

图像模型

语言模型

结论

语言模型比图像模型受益于更大的GPU内存。注意右图的曲线比左图更陡。这表明语言模型受内存大小限制更大，而图像模型受计算力限制更大。

具有较大VRAM的GPU具有更好的性能，因为使用较大的批处理大小有助于使CUDA内核饱和。

具有更高VRAM的GPU可按比例实现更大的批处理大小。只懂小学数学的人都知道这很合理：拥有24 GB VRAM的GPU可以比具有8 GB VRAM的GPU容纳3倍大的批次。

比起其他模型来说，长序列语言模型不成比例地占用大量的内存，因为注意力（attention）是序列长度的二次项。

GPU购买建议

RTX 2060（6 GB）：你想在业余时间探索深度学习。

RTX 2070或2080（8 GB）：你在认真研究深度学习，但GPU预算只有600-800美元。8 GB的VRAM适用于大多数模型。

RTX 2080 Ti（11 GB）：你在认真研究深度学习并且您的GPU预算约为1,200美元。RTX 2080 Ti比RTX 2080快大约40％。

Titan RTX和Quadro RTX 6000（24 GB）：你正在广泛使用现代模型，但却没有足够买下RTX 8000的预算。

Quadro RTX 8000（48 GB）：你要么是想投资未来，要么是在研究2020年最新最酷炫的模型。

附注

图像模型：

语言模型：

相关报道：

https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/

实习/全职编辑记者招聘ing

加入我们，亲身体验一家专业科技媒体采写的每个细节，在最有前景的行业，和一群遍布全球最优秀的人一起成长。坐标北京·清华东门，在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn

志愿者介绍

后台回复“志愿者”加入我们

点「在看」的人都变好看了哦！

原标题：《2020年深度学习最佳GPU一览，看看哪一款最适合你！》

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报

扫码下载澎湃新闻客户端

澎湃矩阵

新闻报料

报料热线: 021-962866
报料邮箱: news@thepaper.cn

沪ICP备14003370号

沪公网安备31010602000299号

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈