Groq — startup chip AI từng khiến giới công nghệ chao đảo với chip tốc độ inference nhanh nhất thế giới — đang gọi vốn 650 triệu USD từ các nhà đầu tư hiện hữu để đẩy mạnh mảng inference cloud, sau thỏa thuận trị giá 20 tỷ USD với Nvidia hồi tháng 12 năm ngoái.
Thông tin được Axios đưa tin độc quyền và TechCrunch xác nhận. Theo đó, thỏa thuận với Nvidia không phải là một vụ mua lại toàn phần — dù nếu đúng vậy, đây sẽ là thương vụ lớn nhất lịch sử của “gã khổng lồ chip xanh”. Thay vào đó, Nvidia trả 20 tỷ USD để có được giấy phép công nghệ phần cứng của Groq cùng với một số nhân sự cấp cao chuyển sang làm việc. Các nhà đầu tư của Groq đã được thanh toán bằng tiền mặt từ thương vụ này.

Thỏa thuận “không phải mua lại” trị giá 20 tỷ USD
Tháng 12 năm ngoái, Groq đã ký một thỏa thuận đặc biệt với Nvidia — được mô tả là “not-an-acquisition agreement” — theo đó Nvidia thanh toán 20 tỷ USD để cấp phép công nghệ chip của Groq. Đây là một cấu trúc giao dịch hiếm thấy trong ngành: thay vì mua đứt công ty, Nvidia chọn cách trả tiền để sở hữu IP và thu hút nhân tài, trong khi Groq vẫn giữ quyền độc lập vận hành.
Sau thương vụ, một số lãnh đạo cấp cao của Groq đã chuyển sang Nvidia. Ban lãnh đạo hiện tại do Adam Winter (CEO tạm quyền) và Matt Eng (CFO) điều hành. Các nhà đầu tư hiện hữu của Groq — bao gồm Disruptive và Infinitium — được Axios mô tả là đã nhận được khoản thanh toán đáng kể từ thương vụ này, đồng thời cam kết tiếp tục rót vốn cho vòng gọi mới.
Pivot chiến lược: Từ phần cứng sang AI Inference Cloud
Khoản tiền 650 triệu USD mới sẽ được Groq dùng để mở rộng mảng inference cloud — dịch vụ điện toán đám mây cho phép doanh nghiệp và nhà phát triển chạy các mô hình AI đã được huấn luyện. Khác với training (huấn luyện mô hình) vốn tốn kém và tập trung ở vài “ông lớn”, inference — quá trình xử lý sau khi người dùng gửi prompt — đang là nhu cầu bùng nổ khi hàng triệu ứng dụng AI được triển khai mỗi ngày.
Groq nổi tiếng với kiến trúc chip LPU (Language Processing Unit) cho tốc độ inference vượt trội so với GPU truyền thống — từng đạt 500 token/giây trên mô hình Llama 2, nhanh gấp 10 lần các giải pháp thông thường. Với hạ tầng inference cloud riêng, Groq đặt cược rằng các doanh nghiệp sẽ chọn giải pháp “nhanh nhất” thay vì “phổ biến nhất” khi triển khai AI ở quy mô lớn.
Bối cảnh cạnh tranh khốc liệt trên thị trường AI chip
Thương vụ của Groq diễn ra trong bối cảnh cuộc đua AI chip đang nóng hơn bao giờ hết. Nvidia tiếp tục thống trị với dòng GPU H100 và Blackwell, nhưng hàng loạt startup đang nổi lên thách thức vị thế này: Cerebras với chip kích thước wafer, d-Matrix với chip inference chuyên dụng, và chính Groq với LPU. Việc Nvidia chi 20 tỷ USD để mua công nghệ từ một startup non trẻ cho thấy ngay cả “kẻ dẫn đầu” cũng không thể xem nhẹ các đối thủ mới.
Một điểm đáng chú ý: vòng gọi 650 triệu USD của Groq gần như được đảm bảo — Disruptive và Infinitium đã đồng ý “lấp đầy” bất kỳ phần nào mà các nhà đầu tư hiện hữu khác không muốn tham gia theo quyền pro-rata. Điều này cho thấy niềm tin mạnh mẽ từ các backer chính, bất chấp việc công ty vừa mất đi đội ngũ lãnh đạo cấp cao về tay Nvidia.
Ý nghĩa với nhà phát triển và doanh nghiệp Việt
Đối với các developer và doanh nghiệp Việt Nam đang triển khai AI, sự trỗi dậy của các giải pháp inference cloud chuyên dụng như Groq mở ra một lựa chọn mới bên cạnh việc phụ thuộc vào GPU Nvidia. Chi phí inference — thường chiếm phần lớn ngân sách vận hành AI — có thể giảm đáng kể khi có thêm nhiều nhà cung cấp cạnh tranh. Với tốc độ inference 500 token/giây, các ứng dụng real-time như chatbot, trợ lý ảo, và phân tích dữ liệu sẽ có trải nghiệm mượt mà hơn rất nhiều.
Tuy nhiên, hệ sinh thái Groq vẫn còn non trẻ so với CUDA của Nvidia — nền tảng mà hầu hết các framework AI phổ biến như PyTorch và TensorFlow đều hỗ trợ. Các doanh nghiệp Việt nên theo dõi sát diễn biến này, nhưng chưa vội chuyển đổi: thị trường AI chip đang trong giai đoạn “định hình lại”, và người chiến thắng cuối cùng có thể chưa lộ diện.
Nguồn: TechCrunch — After Nvidia’s $20B not-acqui-hire, AI chip startup Groq reportedly raising $650M
