深度学习工作站配置要求都有哪些?
深度学习任务需要非常高的计算机性能。通过深度神经网络计算,分析了理想的关键硬件配置要求。
硬件性能要求
1、CPU:
图形卡主要用于Cuda计算,因此需要较少的CPU。频率越高,线程数越好。通常,CPU内核的最小数量大于图形卡的数量。限制之一是CPU的PCI-E通道的最大数量。每个图形卡不使用16个pcie通道来实现最大性能。只有一个CPU可以支持多达40 pcie。也就是说,即使有四个cie x16接口,最多也只能使用两个x16+1个x8。插入的图形卡无法发挥其全部性能。然而,主板芯片组也可以扩展PCB通道的一部分。(x99主板可扩展至2.0 8通道,z170可扩展至3.0 20通道)。
2、图形卡:
深度学习需要强大的图形卡来完成复杂的单精度任务。通常,神经网络需要大量的视频存储器和存储资源。因此,运行大规模深度缩减网络和执行计算机视觉任务需要8GB或更高的视频存储。通常GTX1070选择以上选项。你应该买一个有大图形内存的图形卡。以下是2080ti、208020701080ti、10701060、Titan X和Titan V的比较。
TFLOPS(每秒太浮点运算)单精度
这意味着计算能力决定了计算速度。1080 ti、2080 ti和泰坦V是首选,但最强大的泰坦V的价格是2080 ti的三倍。
单精度计算功能
VRAM(视频存储器):根据视频存储器的大小,网络模型可以工作。大型神经网络需要8G以上的视频存储器。因此,如果你买了一个具有大视频存储器的视频卡,大多数神经网络模型都可以顺利工作。
3、内存大小
其中有1080ti 11G视频内存,可以承受大型网络型号,性能强劲,价格在5000韩元左右,性价比最高。
2080ti是最新的图形卡。虽然它有11G视频内存,但它的速度是1080TI的1.5倍,价格在9000元左右。
Titan V具有12G视频存储。它可以运行大多数网络,而且速度最快。因为它是商业性的,所以它的价格也非常令人兴奋,大约每件2.5万元。
这三个模型更适合于深度学习图像处理任务。他们可以完成大部分网络,并根据预算自由选择。它们可以看作是8G视频存储器和6G视频存储器的1080和1060度性价比的选择。然而,考虑到视频存储器的限制,图形卡的存储器超过11G。
4、主板:
如果您使用多个图形卡,主板必须具有额外的PCB通道。通常,扩展PCB通道(如x99、x299等)仅在服务器主板上可用。但是,这些主板必须与具有此接口的服务器级CPU(Xeon系列、i7 7900x或更高版本、i9系列等)一起使用。请使用CPU提供的40通道PCie。
5、内存:
深度学习需要大量数据,中间过程也会暂时存储大量数据。通常,它需要2到3倍的视频存储器,32G或更大。记忆频率越高越好。
建议至少32G DDR4 3200MHz内存(16G.2)约为2000韩元,预算可升级至64G(约4000韩元)。
6、硬盘:
深度学习需要大量数据和快速访问速度。通常,大型固态磁盘是系统磁盘和训练数据仓库的存储磁盘,而机械硬盘hdd是存储磁盘。
建议使用超过512G NVME固态硬盘(800韩元)和数TB(2TB约300韩元)作为存储空间
7、电源和机箱:
事实上,我们“没完没了”地确保长期稳定运行。由于培训,我们需要购买相对稳定的电源。通常,电源使用主要品牌的80PLUS黄金或白金认证。只能使用一个700w图形卡,每增加一个卡就增加400w。钛V使用约1600w电源。