Глубокое сравнение RTX 4090, RTX 5090, RTX PRO 6000 Blackwell SE, H100 PCIe и H200 SXM — технические характеристики, бенчмарки производительности и мульти-GPU эквиваленты
| Параметр | RTX 4090 | RTX 5090 | PRO 6000 SE | H100 PCIe | H200 SXM |
|---|---|---|---|---|---|
| Архитектура | |||||
| Чип / Архитектура | AD102 / Ada Lovelace | GB202 / Blackwell | GB202 / Blackwell | GH100 / Hopper | GH100 / Hopper |
| Техпроцесс | TSMC 4N (5 нм) | TSMC 4N (4 нм) | TSMC 4N (4 нм) | TSMC N4 (4 нм) | TSMC N4 (4 нм) |
| CUDA-ядра | 16 384 | 21 760 | 24 064 | 14 592 | 16 896 |
| Тензорные ядра | 512 (4-е пок.) | 680 (5-е пок.) | 752 (5-е пок.) | 456 (4-е пок.) | 528 (4-е пок.) |
| Память (главный фактор для LLM) | |||||
| Объём VRAM | 24 ГБ GDDR6X | 32 ГБ GDDR7 | 96 ГБ GDDR7 ECC | 80 ГБ HBM2e | 141 ГБ HBM3e |
| Шина памяти | 384-бит | 512-бит | 512-бит | 5 120-бит | 5 120-бит |
| Пропускная способность | 1 008 ГБ/с | 1 792 ГБ/с | 1 597 ГБ/с | 2 000 ГБ/с | 4 800 ГБ/с |
| Производительность | |||||
| FP32 TFLOPS | 82,6 | 105 | 117 | 51 | 67 |
| FP16 Tensor (dense) | 330 TFLOPS | ~419 TFLOPS | ~460 TFLOPS | 756 TFLOPS | 989 TFLOPS |
| FP8 Tensor (dense) | 661 TFLOPS | ~838 TFLOPS | ~920 TFLOPS | 1 513 TFLOPS | 1 979 TFLOPS |
| FP4 Tensor (sparse) | — | 3 352 TFLOPS | 3 700 TFLOPS | — | — |
| Платформа и стоимость | |||||
| TDP | 450W | 575W | 600W | 300–350W | 700W |
| PCIe | 4.0 x16 | 5.0 x16 | 5.0 x16 | 5.0 x16 | SXM5 |
| NVLink | Нет | Нет | Нет | Да (600 ГБ/с) | Да (900 ГБ/с) |
| MIG | Нет | Нет | Да (4×24 ГБ) | Да (7×10 ГБ) | Да (7×18 ГБ) |
| Цена (новая) | $1 600–1 800 | $2 000–2 500 | $8 000–10 000 | $25 000–35 000 | $30 000–40 000 |
| Аренда (облако) | $0,17–0,59/ч | $0,30–0,89/ч | $1,39–2,40/ч | $2,00–3,93/ч | $2,50–10,60/ч |
| Модель | RTX 4090 | RTX 5090 | PRO 6000 SE | H100 PCIe | H200 SXM |
|---|---|---|---|---|---|
| DeepSeek-R1:14B | 250 / 50 | 450 / 90 | 420 / 84 | 380 / 76 | 850 / 170 |
| GPT-OSS ~20B MoE | 680 / 136 | 1 050 / 210 | 1 000 / 200 | 870 / 174 | 1 700 / 340 |
| QWEN3:32B | ⚠️ 90 / 30 | 200 / 40 | 195 / 39 | 210 / 42 | 430 / 86 |
| DeepSeek-R1:70B | 2×: 48 / 10 | 2×: 80 / 16 | 105 / 21 | 95 / 19 | 240 / 48 |
| GPT-OSS ~120B MoE | ❌ OOM | ❌ OOM | 700 / 140 | 580 / 116 | 1 500 / 300 |
Замена одной карты за $8 000–10 000
Замена одной карты за $25 000–35 000
Замена одной карты за $30 000–40 000
| Контекст | 1 юзер | 5 юзеров | 10 юзеров |
|---|---|---|---|
| 2 048 токенов | 0,6 ГБ | 3,2 ГБ | 6,4 ГБ |
| 4 096 токенов | 1,3 ГБ | 6,4 ГБ | 12,8 ГБ |
| 8 192 токена | 2,5 ГБ | 12,8 ГБ | 25,6 ГБ |
| 32 768 токенов | 10,2 ГБ | 51 ГБ | 102 ГБ |