深度学习工作站推荐一下

Posted python_boy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习工作站推荐一下相关的知识,希望对你有一定的参考价值。

之前自己DIY了一台服务器,大家都问了我不少问题,后来给朋友采购一台GPU服务器,辗转于各大厂商。甚是心累。自己DIY想的问题少一些,正式采购GPU服务器还是要考虑很多问题的。比如说性价比就有几个方面:

1、一台服务器多张卡(8张 or 10张)好,还是一台服务器搞两张卡多台服务器好,这个问题后来咨询了多个厂家,以前GPU卡都是通过SLI建立P2p access的,最大只能并行4张卡,现在有些厂家自己琢磨了一个小黑科技,通过增加一块扩展主板,8张或者10张卡全部放扩展板上,这样达到了8张卡同时建立p2p access,而不通过SLI了。从而1颗CPU可以控制8张显卡了。加速比大概是7.3倍左右。比多台服务器要好不少。

2、多台服务器建立GPU集群是一个什么模样:一台主控master节点(不需要GPU),一台数据节点(不需要GPU),然后根据需要配备GPU服务器做计算节点,整个集群要配一个千M还是万M的交换机(这个交换机的我记不清楚,反正是要一个专用的数据交换设备的),适合于大厂,就是说你一台8卡的GPU或者10卡的GPU都不能满足需求了才配集群。集群的加速比一般般,大概是3个计算节点可以达到2.1倍的样子,因为深度学习并行化本来就比较麻烦,他的模型参数交换量大,训练过程也较复杂。这一块我当时毕业论文还专门研究了。如果想要直接上集群,然后自己家的运维团队还没建起来,那必须找个专业厂家好好规划一下的。否则自己瞎折腾会得不偿失。

3、一般的小厂我觉得搞个8块的 gtx1080TI的服务器比较合适,便宜。贵一点的推荐搞个8卡的pascal的titan x。其它卡也有其它卡的功效,我个人认为这两个卡比较合算。搞个一台服务器也要考虑不少问题的,比如说GPU卡的散热,光靠nvidia的那个风扇散热是不够的,需要搞一个专业的服务器机箱来散热的,八张卡搞在一块你散热没搞好几个月就会烧坏卡。其次需要好的主板,主板是数据流动各种支撑,很重要,然后就是CPU,这些东西网上京东买不合适,还是需要专业厂家给你配的。还有就是之前说的几张卡如何建立P2p access的问题。七七八八的,要搞明白还是要些精力的,不然心里不踏实。

4、 可以省钱的地方我觉得就是不需要厂家给我装深度学习编程框架,我自己搞个tensorflow 或者caffe 分分钟的事情。这个我没有要厂家的服务。 

好了,我知道的基本讲完了。上一个推荐的服务器列表,这个是我跟厂家软磨硬泡拿到的价格,厂家说给我50个团购的名额,转发给大家。我也不知道是不是厂家促销的心机,反正觉得还算合适吧。需要的记得报上樱园玻尔兹曼机的名字。

技术分享

LTHPC深度学习静音工作站 LT-7048A

系统规格参数 

单精度22TFLOPS
GPUs 2颗公版NVIDIA Titan X PASCAL  
GPU内存 每颗GPU 12GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

NVIDIA CUDA核心数量7168
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 648x 宽 452 x 高 178 (mm)
电源最高要求 1200W
工作温度范围 10 - 35°C

含税人民币63999元

技术分享

LTHPC深度学习一体机 LT-7048GR
系统规格参数 

单精度43.2TFLOPS
GPUs 4 颗 公版GTX 1080Ti 
GPU 内存 每颗 GPU 11 GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

NVIDIA CUDA核心数量14336
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C

含税人民币76999元

技术分享

LTHPC深度学习一体机 LT-7048GR
系统规格参数 

单精度44TFLOPS
GPUs 4 NVIDIA Titan X PASCAL 
GPU 内存 每颗 GPU 12 GB
CPU 双路 8核英特尔至强E5-2620 v4 2.1GHz

NVIDIA CUDA核心数量14336
系统内存 128 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C

含税人民币102999元

技术分享

LTHPC深度学习一体机 LT-7048GR
系统规格参数 

双精度18.8TFLOPS/单精度37.2TFLOPS/半精度74.8TFLOPS
GPUs 4 NVIDIA Tesla P100  
GPU 内存 每颗 GPU 16 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 1块800GB固态硬盘 一块10TB企业级氦气硬盘 最大支持130TB
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 673x 宽 438 x 高 176 (mm)
电源最高要求 2000W
工作温度范围 10 - 35°C

含税人民币299900元

技术分享

LTHPC深度学习一体机 LT-4028GR
系统规格参数 

单精度88TFLOPS
GPUs 8 NVIDIA Titan X PASCAL 
GPU 内存 每颗 GPU 12 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 4块800GB固态硬盘 
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 737x 宽 437 x 高 178 (mm)
电源最高要求 3200W
工作温度范围 10 - 35°C

含税人民币201900元

技术分享技术分享

LTHPC深度学习一体机 LT-4028GR2
系统规格参数 

单精度110TFLOPS
GPUs 10 NVIDIA Titan X PASCAL 
GPU 内存 每颗 GPU 12 GB
CPU 双路 12核英特尔至强E5-2650 v4 2.2GHz

NVIDIA CUDA核心数量14336
系统内存 256 GB 2400 MHz DDR4
存储空间 4块800GB固态硬盘 
网络 双千兆以太网 可选万兆 高速IB
软件 Ubuntu 16.04 操作系统、专用的 GPU 驱动程序(用于测试工作站是否安装正确)
最大系统重量 28KG
系统尺寸 深 737x 宽 437 x 高 178 (mm)
电源最高要求 4000W
工作温度范围 10 - 35°C

含税人民币229900元

关注公众号 “樱园的玻尔兹曼机” 留言回复

‘’服务器‘’

三个字。

获取商谈密钥。








































































以上是关于深度学习工作站推荐一下的主要内容,如果未能解决你的问题,请参考以下文章

深度学习入门:线性回归模型

深度学习入门Softmax回归模型

深度学习主机配置推荐

TDM: 基于树的深度学习模型在阿里推荐系统中的应用

干货|深度学习在推荐算法上的应用进展

谁有深度学习书单和学习路线?