NVIDIA H100 là gì? Thông số kỹ thuật, giá thuê & so sánh A100

Q: NVIDIA H100 giá bao nhiêu?

Giá mua NVIDIA H100 80GB dao động từ 25.000–40.000 USD (khoảng 620–990 triệu VNĐ) tuỳ phiên bản PCIe hay SXM5 và nguồn cung. Thuê tại Việt Nam khoảng 50.000–200.000 VNĐ/giờ tuỳ nhà cung cấp, hoặc 15–50 triệu VNĐ/tháng cho gói dài hạn.

Q: H100 khác A100 như thế nào?

H100 dựa trên kiến trúc Hopper (4nm), A100 dựa trên Ampere (7nm). H100 có VRAM HBM3 nhanh gấp 2 lần A100 (HBM2e), hỗ trợ FP8 và Transformer Engine — giúp training LLM nhanh hơn A100 từ 3–6 lần. H100 cũng hỗ trợ NVLink thế hệ 4 (900 GB/s), nhanh gấp 1,5 lần NVLink 3 trên A100.

Q: Khi nào nên thuê H100 thay vì A100?

Chọn H100 khi: training LLM lớn (7B+ parameters), cần Transformer Engine tăng tốc, inference throughput cao phục vụ nhiều user, hoặc cần NVLink 4 cho multi-GPU. Chọn A100 khi: workload AI vừa phải, cần tiết kiệm chi phí (A100 rẻ hơn 30–50%), hoặc training model CNN/NLP cỡ trung.

Q: Thuê NVIDIA H100 ở đâu tại Việt Nam?

Tại Việt Nam, bạn có thể thuê H100 tại Sunteco Cloud, VNG Cloud, VNSO và Viettel Cloud. Sunteco Cloud hỗ trợ thanh toán VNĐ, pre-installed CUDA + PyTorch, và hỗ trợ kỹ thuật 24/7 bằng tiếng Việt.

Nếu bạn theo dõi lĩnh vực AI trong 2 năm qua, bạn chắc chắn đã nghe đến NVIDIA H100 — con chip được mệnh danh là “vua GPU AI”, là phần cứng đứng sau ChatGPT, Llama, Stable Diffusion và hầu hết mọi mô hình LLM lớn trên thế giới.

Nhưng H100 thực sự có gì đặc biệt? Nó khác A100 thế hệ trước ra sao? Giá bao nhiêu và khi nào bạn thực sự cần H100 thay vì một GPU rẻ hơn? Bài viết này sẽ giải đáp toàn bộ.

NVIDIA H100 là GPU datacenter thế hệ Hopper, sản xuất trên tiến trình TSMC 4nm, trang bị 80 GB HBM3 VRAM với băng thông 3,35 TB/s. H100 có 16.896 CUDA cores, 528 Tensor cores thế hệ 4 hỗ trợ FP8, và Transformer Engine chuyên tối ưu cho training LLM. Hiệu năng AI (FP8) gấp khoảng 6 lần so với A100 thế hệ trước.

NVIDIA H100 — tổng quan và kiến trúc Hopper

NVIDIA H100 ra mắt ngày 21/03/2023, dựa trên kiến trúc Hopper — đặt theo tên nhà khoa học máy tính Grace Hopper. Đây là GPU datacenter kế nhiệm A100 (kiến trúc Ampere), được thiết kế từ đầu để tối ưu cho AI generative, training LLM và inference quy mô lớn.

nvidia h100 kien truc hopper tinh nang sunteco

H100 được sản xuất trên tiến trình TSMC 4nm (N4) với hơn 80 tỷ transistor, gấp đôi số transistor trên A100 (54 tỷ). Chip die có diện tích 814 mm² — gần bằng giới hạn sản xuất lithography hiện tại.

H100 có hai phiên bản phần cứng chính:

H100 SXM5: Phiên bản hiệu năng cao nhất, dùng trong hệ thống DGX H100 và HGX H100. Hỗ trợ NVLink 4.0 (900 GB/s), TDP 700W, cần hệ thống làm mát chuyên dụng.
H100 PCIe: Phiên bản lắp vào server tiêu chuẩn qua khe PCIe Gen5. TDP 350W, băng thông NVLink thấp hơn, nhưng dễ triển khai và rẻ hơn.

Bảng thông số kỹ thuật chi tiết NVIDIA H100

Thông số kỹ thuật NVIDIA H100 SXM5 và PCIe
Thông số	H100 SXM5	H100 PCIe
Kiến trúc	Hopper (GH100)
Tiến trình	TSMC 4nm (N4)
Transistor	80 tỷ
CUDA Cores	16.896	14.592
Tensor Cores	528 (Gen 4)	456 (Gen 4)
VRAM	80 GB HBM3	80 GB HBM3
Băng thông bộ nhớ	3,35 TB/s	2,0 TB/s
FP8 Tensor	3.958 TFLOPS	2.000 TFLOPS
FP16 Tensor	1.979 TFLOPS	1.000 TFLOPS
FP32	67 TFLOPS	51 TFLOPS
NVLink	Gen 4 — 900 GB/s	Gen 4 — 600 GB/s
PCIe	Gen 5 x16	Gen 5 x16
TDP	700W	350W
MIG	7 instances (lên tới 7 GPU ảo)
Transformer Engine	Có — tự động chuyển FP8/FP16
Giá mua tham khảo	~30.000–40.000 USD	~25.000–33.000 USD

5 tính năng đột phá của H100

1. Transformer Engine — tăng tốc LLM

Transformer Engine là tính năng độc quyền trên Hopper, tự động chuyển đổi giữa FP8 và FP16 trong quá trình training. Điều này giúp tăng tốc training các mô hình Transformer (GPT, Llama, BERT) lên gấp 6 lần so với A100 mà không ảnh hưởng đến accuracy. Đây là lý do H100 trở thành “GPU mặc định” cho training LLM.

2. HBM3 — bộ nhớ nhanh nhất thế giới

H100 SXM5 trang bị 80 GB HBM3 với băng thông 3,35 TB/s — nhanh gấp 2 lần so với HBM2e trên A100 (2,0 TB/s). Băng thông bộ nhớ cao giúp giảm bottleneck khi load model LLM lớn (30B–70B parameters) và tăng throughput inference đáng kể.

3. FP8 Precision — tốc độ gấp đôi

H100 là GPU đầu tiên hỗ trợ tính toán FP8 (8-bit floating point) trên Tensor cores. So với FP16, FP8 tăng gấp đôi throughput tính toán với mức giảm accuracy không đáng kể cho hầu hết workload AI. Kết hợp với Transformer Engine, FP8 giúp H100 đạt gần 4 Petaflops (3.958 TFLOPS) hiệu năng AI.

4. NVLink 4.0 — kết nối multi-GPU siêu tốc

NVLink thế hệ 4 trên H100 SXM5 đạt 900 GB/s — nhanh gấp 1,5 lần NVLink 3 trên A100. Kết hợp NVSwitch, có thể kết nối 8 GPU H100 trong một node DGX H100 với tổng băng thông 7,2 TB/s. Đây là nền tảng cho training phân tán các model hàng trăm tỷ tham số.

5. MIG — chia nhỏ GPU cho nhiều workload

Multi-Instance GPU (MIG) cho phép chia 1 H100 thành tối đa 7 GPU ảo độc lập, mỗi instance có compute, memory và bandwidth riêng. Tính năng này giúp tối ưu utilization trong môi trường inference đa người dùng hoặc cloud — bạn không cần chiếm trọn GPU chỉ để chạy 1 model nhỏ.

H100 vs A100 — khác nhau những gì?

A100 ra mắt năm 2020 (kiến trúc Ampere), H100 năm 2023 (Hopper). Dưới đây là bảng so sánh chi tiết giúp bạn quyết định khi nào nên chọn GPU nào:

So sánh NVIDIA H100 vs A100
Tiêu chí	H100 SXM5	A100 SXM4	H100 hơn bao nhiêu?
Kiến trúc	Hopper (4nm)	Ampere (7nm)	Mới hơn 1 thế hệ
CUDA Cores	16.896	6.912	2,4x
Tensor Cores	528 (Gen 4)	432 (Gen 3)	1,2x (nhưng nhanh hơn/core)
VRAM	80 GB HBM3	40/80 GB HBM2e	HBM3 nhanh hơn 2x
Băng thông bộ nhớ	3,35 TB/s	2,0 TB/s	1,7x
FP8 Tensor	3.958 TFLOPS	Không hỗ trợ	—
FP16 Tensor	1.979 TFLOPS	312 TFLOPS	~6x
NVLink	Gen 4 (900 GB/s)	Gen 3 (600 GB/s)	1,5x
Transformer Engine	Có	Không	—
MIG	Tối đa 7 instances	Tối đa 7 instances	Tương đương
TDP	700W	400W	H100 tốn điện hơn
Giá thuê (VN, tham khảo)	100.000–200.000 VNĐ/giờ	50.000–100.000 VNĐ/giờ	A100 rẻ hơn ~50%

📌 Tóm tắt nhanh

H100 nhanh hơn A100 khoảng 3–6 lần cho training LLM nhờ Transformer Engine + FP8. Nhưng A100 vẫn đủ mạnh cho training CNN, model vừa, và nhiều tác vụ inference — với chi phí thuê rẻ hơn khoảng 50%. Chọn H100 khi cần LLM lớn, chọn A100 khi cần tiết kiệm.

Giá NVIDIA H100: mua và thuê tại Việt Nam 2026

Giá mua

Năm 2026, giá mua NVIDIA H100 80GB dao động từ 25.000–40.000 USD (khoảng 620–990 triệu VNĐ), tuỳ phiên bản PCIe hay SXM5 và tình trạng nguồn cung. Phiên bản SXM5 đắt hơn do cần lắp vào hệ thống DGX/HGX chuyên dụng. Thế hệ Blackwell (B200) ra mắt đã khiến giá H100 giảm 10–20% so với đỉnh, nhưng vẫn ở mức rất cao.

Giá thuê tại Việt Nam

Giá thuê NVIDIA H100 tại Việt Nam — tham khảo 05/2026
Hình thức	Giá tham khảo	Ghi chú
Thuê theo giờ (1 GPU H100)	100.000–200.000 VNĐ/giờ	Pay-as-you-go, linh hoạt
Thuê theo tháng (1 GPU H100)	15–50 triệu VNĐ/tháng	Rẻ hơn 30–50% so với theo giờ
Thuê server 8x H100 (DGX)	Liên hệ báo giá	Cho training LLM lớn, multi-GPU

Với chi phí mua gần 1 tỷ VNĐ cho 1 card, thuê GPU Cloud là lựa chọn hợp lý cho hầu hết developer, startup và doanh nghiệp vừa. Đọc thêm: Thuê GPU theo giờ — tính chi phí & chọn cấu hình.

nvidia h100 khi nao can chon gpu sunteco

Khi nào cần H100? Khi nào A100 hoặc RTX là đủ?

Chọn GPU theo tác vụ
Tác vụ	GPU khuyến nghị	Lý do
Training LLM 7B+ parameters	H100	Transformer Engine + FP8 + VRAM 80GB
Training LLM 70B+ (multi-GPU)	8x H100 (DGX)	NVLink 4 + NVSwitch tối ưu
Inference LLM production (cao tải)	H100	Throughput cao, MIG chia instance
Fine-tune LoRA model 7B	A100 40GB	Đủ VRAM, tiết kiệm chi phí
Training CNN (ResNet, YOLO)	A100 / RTX 4090	Không cần Transformer Engine
Stable Diffusion, GenAI	RTX 4060–5090	VRAM 8–32GB đủ, giá rẻ hơn nhiều
Sinh viên làm đồ án AI	RTX 4060 / T4	Chi phí thấp, đủ cho model nhỏ

Tham khảo: Thuê GPU train AI: T4, A100 hay H100?

Câu hỏi thường gặp về NVIDIA H100

NVIDIA H100 là gì?

NVIDIA H100 là GPU datacenter thế hệ Hopper, sản xuất trên tiến trình 4nm, trang bị 80 GB HBM3 VRAM với băng thông 3,35 TB/s. H100 có 16.896 CUDA cores, 528 Tensor cores thế hệ 4 hỗ trợ FP8, và Transformer Engine tối ưu cho training LLM. Đây là GPU AI phổ biến nhất trong datacenter toàn cầu tính đến 2026.

NVIDIA H100 giá bao nhiêu?

Giá mua H100 80GB dao động từ 25.000–40.000 USD (620–990 triệu VNĐ). Thuê tại Việt Nam khoảng 100.000–200.000 VNĐ/giờ hoặc 15–50 triệu VNĐ/tháng. Do giá mua rất cao, phần lớn developer và doanh nghiệp chọn thuê GPU Cloud.

H100 khác A100 như thế nào?

H100 (Hopper, 4nm) nhanh hơn A100 (Ampere, 7nm) từ 3–6 lần cho training LLM nhờ Transformer Engine, FP8 và HBM3 (băng thông gấp đôi). H100 cũng có NVLink 4 (900 GB/s vs 600 GB/s). Tuy nhiên A100 vẫn tốt cho CNN, model vừa, và rẻ hơn ~50%.

Khi nào nên thuê H100 thay vì A100?

Chọn H100 khi training LLM lớn (7B+), cần Transformer Engine, inference production cao tải, hoặc cần NVLink 4 cho multi-GPU. Chọn A100 khi workload AI vừa phải, cần tiết kiệm, hoặc training CNN/NLP cỡ trung.

Thuê NVIDIA H100 ở đâu tại Việt Nam?

Các nhà cung cấp: Sunteco Cloud, VNG Cloud, VNSO, Viettel Cloud. Sunteco hỗ trợ thanh toán VNĐ, pre-installed CUDA + PyTorch, hỗ trợ 24/7 tiếng Việt.

Thuê NVIDIA H100 tại Sunteco Cloud

Hạ tầng Việt Nam, thanh toán VNĐ, pre-installed CUDA + PyTorch, dùng thử miễn phí.

✅ NVIDIA H100 80GB — đầy đủ phiên bản
✅ Pay-as-you-go hoặc gói tháng
✅ Hỗ trợ kỹ thuật AI 24/7 tiếng Việt
✅ Không cần thẻ quốc tế

🚀 Dùng thử H100 miễn phí
📖 Xem bảng giá GPU Cloud

Kết luận

NVIDIA H100 là GPU datacenter mạnh nhất phổ biến trong các datacenter AI toàn cầu năm 2026, với kiến trúc Hopper, 80 GB HBM3, Transformer Engine và hiệu năng FP8 gấp 6 lần A100. H100 là lựa chọn tối ưu cho training LLM lớn, inference production cao tải và multi-GPU quy mô. Tuy nhiên, không phải mọi workload đều cần H100 — A100 và RTX vẫn là lựa chọn hợp lý cho nhiều tác vụ AI.

Nếu bạn cần sức mạnh H100 mà không muốn đầu tư gần 1 tỷ VNĐ, hãy thuê H100 tại Sunteco Cloud — trả theo giờ, hạ tầng Việt Nam, hỗ trợ 24/7.