Nếu bạn theo dõi lĩnh vực AI trong 2 năm qua, bạn chắc chắn đã nghe đến NVIDIA H100 — con chip được mệnh danh là “vua GPU AI”, là phần cứng đứng sau ChatGPT, Llama, Stable Diffusion và hầu hết mọi mô hình LLM lớn trên thế giới.
Nhưng H100 thực sự có gì đặc biệt? Nó khác A100 thế hệ trước ra sao? Giá bao nhiêu và khi nào bạn thực sự cần H100 thay vì một GPU rẻ hơn? Bài viết này sẽ giải đáp toàn bộ.
NVIDIA H100 là GPU datacenter thế hệ Hopper, sản xuất trên tiến trình TSMC 4nm, trang bị 80 GB HBM3 VRAM với băng thông 3,35 TB/s. H100 có 16.896 CUDA cores, 528 Tensor cores thế hệ 4 hỗ trợ FP8, và Transformer Engine chuyên tối ưu cho training LLM. Hiệu năng AI (FP8) gấp khoảng 6 lần so với A100 thế hệ trước.
NVIDIA H100 — tổng quan và kiến trúc Hopper
NVIDIA H100 ra mắt ngày 21/03/2023, dựa trên kiến trúc Hopper — đặt theo tên nhà khoa học máy tính Grace Hopper. Đây là GPU datacenter kế nhiệm A100 (kiến trúc Ampere), được thiết kế từ đầu để tối ưu cho AI generative, training LLM và inference quy mô lớn.

H100 được sản xuất trên tiến trình TSMC 4nm (N4) với hơn 80 tỷ transistor, gấp đôi số transistor trên A100 (54 tỷ). Chip die có diện tích 814 mm² — gần bằng giới hạn sản xuất lithography hiện tại.
H100 có hai phiên bản phần cứng chính:
- H100 SXM5: Phiên bản hiệu năng cao nhất, dùng trong hệ thống DGX H100 và HGX H100. Hỗ trợ NVLink 4.0 (900 GB/s), TDP 700W, cần hệ thống làm mát chuyên dụng.
- H100 PCIe: Phiên bản lắp vào server tiêu chuẩn qua khe PCIe Gen5. TDP 350W, băng thông NVLink thấp hơn, nhưng dễ triển khai và rẻ hơn.
Bảng thông số kỹ thuật chi tiết NVIDIA H100
| Thông số | H100 SXM5 | H100 PCIe |
|---|---|---|
| Kiến trúc | Hopper (GH100) | |
| Tiến trình | TSMC 4nm (N4) | |
| Transistor | 80 tỷ | |
| CUDA Cores | 16.896 | 14.592 |
| Tensor Cores | 528 (Gen 4) | 456 (Gen 4) |
| VRAM | 80 GB HBM3 | 80 GB HBM3 |
| Băng thông bộ nhớ | 3,35 TB/s | 2,0 TB/s |
| FP8 Tensor | 3.958 TFLOPS | 2.000 TFLOPS |
| FP16 Tensor | 1.979 TFLOPS | 1.000 TFLOPS |
| FP32 | 67 TFLOPS | 51 TFLOPS |
| NVLink | Gen 4 — 900 GB/s | Gen 4 — 600 GB/s |
| PCIe | Gen 5 x16 | Gen 5 x16 |
| TDP | 700W | 350W |
| MIG | 7 instances (lên tới 7 GPU ảo) | |
| Transformer Engine | Có — tự động chuyển FP8/FP16 | |
| Giá mua tham khảo | ~30.000–40.000 USD | ~25.000–33.000 USD |
5 tính năng đột phá của H100
1. Transformer Engine — tăng tốc LLM
Transformer Engine là tính năng độc quyền trên Hopper, tự động chuyển đổi giữa FP8 và FP16 trong quá trình training. Điều này giúp tăng tốc training các mô hình Transformer (GPT, Llama, BERT) lên gấp 6 lần so với A100 mà không ảnh hưởng đến accuracy. Đây là lý do H100 trở thành “GPU mặc định” cho training LLM.
2. HBM3 — bộ nhớ nhanh nhất thế giới
H100 SXM5 trang bị 80 GB HBM3 với băng thông 3,35 TB/s — nhanh gấp 2 lần so với HBM2e trên A100 (2,0 TB/s). Băng thông bộ nhớ cao giúp giảm bottleneck khi load model LLM lớn (30B–70B parameters) và tăng throughput inference đáng kể.
3. FP8 Precision — tốc độ gấp đôi
H100 là GPU đầu tiên hỗ trợ tính toán FP8 (8-bit floating point) trên Tensor cores. So với FP16, FP8 tăng gấp đôi throughput tính toán với mức giảm accuracy không đáng kể cho hầu hết workload AI. Kết hợp với Transformer Engine, FP8 giúp H100 đạt gần 4 Petaflops (3.958 TFLOPS) hiệu năng AI.
4. NVLink 4.0 — kết nối multi-GPU siêu tốc
NVLink thế hệ 4 trên H100 SXM5 đạt 900 GB/s — nhanh gấp 1,5 lần NVLink 3 trên A100. Kết hợp NVSwitch, có thể kết nối 8 GPU H100 trong một node DGX H100 với tổng băng thông 7,2 TB/s. Đây là nền tảng cho training phân tán các model hàng trăm tỷ tham số.
5. MIG — chia nhỏ GPU cho nhiều workload
Multi-Instance GPU (MIG) cho phép chia 1 H100 thành tối đa 7 GPU ảo độc lập, mỗi instance có compute, memory và bandwidth riêng. Tính năng này giúp tối ưu utilization trong môi trường inference đa người dùng hoặc cloud — bạn không cần chiếm trọn GPU chỉ để chạy 1 model nhỏ.
H100 vs A100 — khác nhau những gì?
A100 ra mắt năm 2020 (kiến trúc Ampere), H100 năm 2023 (Hopper). Dưới đây là bảng so sánh chi tiết giúp bạn quyết định khi nào nên chọn GPU nào:

| Tiêu chí | H100 SXM5 | A100 SXM4 | H100 hơn bao nhiêu? |
|---|---|---|---|
| Kiến trúc | Hopper (4nm) | Ampere (7nm) | Mới hơn 1 thế hệ |
| CUDA Cores | 16.896 | 6.912 | 2,4x |
| Tensor Cores | 528 (Gen 4) | 432 (Gen 3) | 1,2x (nhưng nhanh hơn/core) |
| VRAM | 80 GB HBM3 | 40/80 GB HBM2e | HBM3 nhanh hơn 2x |
| Băng thông bộ nhớ | 3,35 TB/s | 2,0 TB/s | 1,7x |
| FP8 Tensor | 3.958 TFLOPS | Không hỗ trợ | — |
| FP16 Tensor | 1.979 TFLOPS | 312 TFLOPS | ~6x |
| NVLink | Gen 4 (900 GB/s) | Gen 3 (600 GB/s) | 1,5x |
| Transformer Engine | Có | Không | — |
| MIG | Tối đa 7 instances | Tối đa 7 instances | Tương đương |
| TDP | 700W | 400W | H100 tốn điện hơn |
| Giá thuê (VN, tham khảo) | 100.000–200.000 VNĐ/giờ | 50.000–100.000 VNĐ/giờ | A100 rẻ hơn ~50% |
H100 nhanh hơn A100 khoảng 3–6 lần cho training LLM nhờ Transformer Engine + FP8. Nhưng A100 vẫn đủ mạnh cho training CNN, model vừa, và nhiều tác vụ inference — với chi phí thuê rẻ hơn khoảng 50%. Chọn H100 khi cần LLM lớn, chọn A100 khi cần tiết kiệm.
Giá NVIDIA H100: mua và thuê tại Việt Nam 2026
Giá mua
Năm 2026, giá mua NVIDIA H100 80GB dao động từ 25.000–40.000 USD (khoảng 620–990 triệu VNĐ), tuỳ phiên bản PCIe hay SXM5 và tình trạng nguồn cung. Phiên bản SXM5 đắt hơn do cần lắp vào hệ thống DGX/HGX chuyên dụng. Thế hệ Blackwell (B200) ra mắt đã khiến giá H100 giảm 10–20% so với đỉnh, nhưng vẫn ở mức rất cao.

Giá thuê tại Việt Nam
| Hình thức | Giá tham khảo | Ghi chú |
|---|---|---|
| Thuê theo giờ (1 GPU H100) | 100.000–200.000 VNĐ/giờ | Pay-as-you-go, linh hoạt |
| Thuê theo tháng (1 GPU H100) | 15–50 triệu VNĐ/tháng | Rẻ hơn 30–50% so với theo giờ |
| Thuê server 8x H100 (DGX) | Liên hệ báo giá | Cho training LLM lớn, multi-GPU |
Với chi phí mua gần 1 tỷ VNĐ cho 1 card, thuê GPU Cloud là lựa chọn hợp lý cho hầu hết developer, startup và doanh nghiệp vừa. Đọc thêm: Thuê GPU theo giờ — tính chi phí & chọn cấu hình.

Khi nào cần H100? Khi nào A100 hoặc RTX là đủ?
| Tác vụ | GPU khuyến nghị | Lý do |
|---|---|---|
| Training LLM 7B+ parameters | H100 | Transformer Engine + FP8 + VRAM 80GB |
| Training LLM 70B+ (multi-GPU) | 8x H100 (DGX) | NVLink 4 + NVSwitch tối ưu |
| Inference LLM production (cao tải) | H100 | Throughput cao, MIG chia instance |
| Fine-tune LoRA model 7B | A100 40GB | Đủ VRAM, tiết kiệm chi phí |
| Training CNN (ResNet, YOLO) | A100 / RTX 4090 | Không cần Transformer Engine |
| Stable Diffusion, GenAI | RTX 4060–5090 | VRAM 8–32GB đủ, giá rẻ hơn nhiều |
| Sinh viên làm đồ án AI | RTX 4060 / T4 | Chi phí thấp, đủ cho model nhỏ |
Tham khảo: Thuê GPU train AI: T4, A100 hay H100?
Câu hỏi thường gặp về NVIDIA H100
NVIDIA H100 là gì?
NVIDIA H100 là GPU datacenter thế hệ Hopper, sản xuất trên tiến trình 4nm, trang bị 80 GB HBM3 VRAM với băng thông 3,35 TB/s. H100 có 16.896 CUDA cores, 528 Tensor cores thế hệ 4 hỗ trợ FP8, và Transformer Engine tối ưu cho training LLM. Đây là GPU AI phổ biến nhất trong datacenter toàn cầu tính đến 2026.
NVIDIA H100 giá bao nhiêu?
Giá mua H100 80GB dao động từ 25.000–40.000 USD (620–990 triệu VNĐ). Thuê tại Việt Nam khoảng 100.000–200.000 VNĐ/giờ hoặc 15–50 triệu VNĐ/tháng. Do giá mua rất cao, phần lớn developer và doanh nghiệp chọn thuê GPU Cloud.
H100 khác A100 như thế nào?
H100 (Hopper, 4nm) nhanh hơn A100 (Ampere, 7nm) từ 3–6 lần cho training LLM nhờ Transformer Engine, FP8 và HBM3 (băng thông gấp đôi). H100 cũng có NVLink 4 (900 GB/s vs 600 GB/s). Tuy nhiên A100 vẫn tốt cho CNN, model vừa, và rẻ hơn ~50%.
Khi nào nên thuê H100 thay vì A100?
Chọn H100 khi training LLM lớn (7B+), cần Transformer Engine, inference production cao tải, hoặc cần NVLink 4 cho multi-GPU. Chọn A100 khi workload AI vừa phải, cần tiết kiệm, hoặc training CNN/NLP cỡ trung.
Thuê NVIDIA H100 ở đâu tại Việt Nam?
Các nhà cung cấp: Sunteco Cloud, VNG Cloud, VNSO, Viettel Cloud. Sunteco hỗ trợ thanh toán VNĐ, pre-installed CUDA + PyTorch, hỗ trợ 24/7 tiếng Việt.
Thuê NVIDIA H100 tại Sunteco Cloud
Hạ tầng Việt Nam, thanh toán VNĐ, pre-installed CUDA + PyTorch, dùng thử miễn phí.
- ✅ NVIDIA H100 80GB — đầy đủ phiên bản
- ✅ Pay-as-you-go hoặc gói tháng
- ✅ Hỗ trợ kỹ thuật AI 24/7 tiếng Việt
- ✅ Không cần thẻ quốc tế
Kết luận
NVIDIA H100 là GPU datacenter mạnh nhất phổ biến trong các datacenter AI toàn cầu năm 2026, với kiến trúc Hopper, 80 GB HBM3, Transformer Engine và hiệu năng FP8 gấp 6 lần A100. H100 là lựa chọn tối ưu cho training LLM lớn, inference production cao tải và multi-GPU quy mô. Tuy nhiên, không phải mọi workload đều cần H100 — A100 và RTX vẫn là lựa chọn hợp lý cho nhiều tác vụ AI.
Nếu bạn cần sức mạnh H100 mà không muốn đầu tư gần 1 tỷ VNĐ, hãy thuê H100 tại Sunteco Cloud — trả theo giờ, hạ tầng Việt Nam, hỗ trợ 24/7.






