Trí tuệ nhân tạo (AI)

Nvidia ra mắt siêu chip AI thế hệ mới

1 năm trước

Yifan Yu

Nvidia vừa ra mắt chip AI thế hệ mới cùng 1 phần mềm suy luận mã nguồn mở. Cả 2 giúp các mô hình như DeepSeek hoặc ChatGPT hoạt động mạnh hơn, nhanh hơn.

Tại hội nghị GTC của Nvidia đang diễn ra ở California, công ty đã giới thiệu chip GPU Blackwell Ultra, hỗ trợ tăng khả năng suy luận của các hệ thống AI, cộng với tăng hiệu quả sử dụng năng lượng, được quảng cáo đóng góp tích cực cho sự phát triển của “thời đại suy luận AI”.

CEO Jensen Huang của Nividia chia sẻ tại sự kiện – Ảnh: Nikkei Asia

Nvidia cũng phác thảo các chip sẽ ra mắt trong thời gian tới, là CPU Vera và GPU Rubin. Hai loại này dự tính bắt đầu thương mại hóa từ cuối 2026, hứa hẹn năng lực còn tốt hơn Blackwell.

CEO Jensen Huang của Nvidia chia sẻ tại sự kiện: “Lượng tính toán chúng ta cần thời điểm này, gấp 100 lần những gì chúng ta nghĩ là cần vào thời điểm năm ngoái.”

AI lý luận (AI reasoning) đề cập tới mô hình trí tuệ nhân tạo có thể phỏng theo quá trình suy luận của con người. Thay vì đơn giản lấy câu trả lời từ cơ sở dữ liệu hoặc rút ra kết luận từ mẫu có sẵn, AI lý luận hướng tới sao chép khả năng nhận thức của con người, hiểu quan hệ nhân quả và đưa ra quyết định dựa trên ngữ cảnh cụ thể.

R1, mô hình mã nguồn mở do DeepSeek phát hành tháng 1.2025, khiến thung lũng Silicon và phố Wall choáng váng, vì có thể mô phỏng khả năng lý luận của con người không thua kém o1 của ChatGPT, nhưng chi phí phát triển thấp hơn rất nhiều.

Cổ phiếu Nvidia giảm mạnh sau thành công của DeepSeek. Nhiều câu hỏi đặt ra xung quanh hàng tỷ USD đổ vào các trung tâm dữ liệu và cơ sở hạ tầng điện toán, để xây dựng những mô hình AI tiên tiến.

Ông Huang cho rằng, sự gia tăng của AI suy luận và nhu cầu ngày càng lớn với điện toán suy luận, sẽ giúp Nvidia bán được nhiều chip hơn.

Dẫu vậy, cổ phiếu Nvidia tiếp tục giảm những ngày gần đây. Hôm 18.3, đã tụt 3% sau khi đóng cửa.

DeepSeek tuyên bố, họ giảm được chi phí đào tạo lẫn suy luận. Tuy nhiên một số người dùng phàn nàn, DeepSeek cần thời gian lâu để suy luận trước khi đưa ra câu trả lời, có thể do hạn chế về điện toán.

Nvidia thông tin, các chipset GB300 mới, gồm CPU Grace và GPU Blackwell Ultra, có thể giảm thời gian phản hồi những câu hỏi khó của R1 xuống còn 10 giây, từ 1 phút rưỡi hiện nay khi chạy bằng chip Hopper 100.

Nvidia cũng giới thiệu thêm phần mềm suy luận AI mã nguồn mở, có tên Dynamo. Phần mềm này giúp tăng hiệu suất và giảm chi phí tính toán cho các mô hình suy luận.

Theo gã khổng lồ công nghệ Hoa Kỳ, Dynamo làm tăng lượng phản hồi do mỗi GPU tạo ra lên 30 lần, khi chạy mô hình DeepSeek R1 trên GB200. R1 có giá trung bình 2,19 USD cho 1 triệu tính toán phản hồi, rẻ hơn khoảng 96% so với o1 của OpenAI.

Tuy nhiên thế khó của DeepSeek hiện giờ, là không thể tiếp cận chip tiên tiến từ Hoa Kỳ như của Nvidia, do lệnh cấm của Nhà Trắng áp dụng với doanh nghiệp Trung Quốc.

(Biên dịch: NVP)