Сервер Dell EMC DSS 8440 на базе графических процессоров NVIDIA RTX для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта
Сервер Dell EMC DSS8440 — это двухпроцессорный сервер высотой 4U, предназначенный для рабочих нагрузок высокопроизводительных вычислений, машинного обучения (ML) и глубокого обучения. В этой статье сравнивается производительность различных графических процессоров, таких как графические процессоры NVIDIA Volta V100S и NVIDIA Tesla T4 с тензорными ядрами, а также графические процессоры NVIDIA Quadro RTX в этой системе.
В этом блоге мы оцениваем производительность экономичных графических процессоров NVIDIA Quadro RTX 6000 и NVIDIA Quadro RTX 8000 по сравнению с графическим процессором-ускорителем высшего уровня V100S, используя различные стандартные инструменты сравнительного анализа. Сюда входит тестирование рабочих нагрузок с одинарной и двойной точностью. Хотя серия Quadro существует уже давно, графические процессоры RTX с архитектурой NVIDIA Turing были выпущены в конце 2018 года. Характеристики в таблице 1 показывают, что графический процессор RTX 8000 превосходит RTX 6000 с точки зрения конфигурации с более высоким объемом памяти. Однако графические процессоры RTX 8000 и RTX 6000 требуют более высокой мощности по сравнению с графическим процессором V100S. Для рабочих нагрузок, требующих большего объема памяти, RTX 8000 — лучший выбор.
Табл.1 Технические характеристики графического процессора
Сервер |
DellEMC PowerEdge DSS8440 |
Процессор |
2 x Intel Xeon 6248, 20 C @ 2,5 ГГц |
Память |
24 x 32 ГБ @ 2933 МТ/с (всего 768 ГБ) |
графический процессор |
8 x Quadro RTX 6000 8 x Quadro RTX 8000 8 x Volta V100S - PCIe
|
Хранилище |
1 флэш-память Dell Express NVMe 1 ТБ, 2,5 дюйма U.2 (P4500) |
Источники питания |
4 х 2400 Вт |
Table.2 Server configuration details
БИОС |
2.5.4 |
|
Операционные системы |
РЭЛ 7.6 |
|
Ядро |
3.10.0-957,ek7.x86_64 |
|
Профиль системы |
Оптимизированная производительность |
|
Инструментарий CUDA |
10.1 | |
CUDA-драйвер |
440.33.01 |
Табл.3 Подробности встроенного ПО системы
Приложение |
Версия |
HPL |
hpl_cuda_10.1_ompi-3.1_volta_pascal_kepler_3-14-19_ext Intel MKL 2018, обновление 4 |