DECART RA MẮT OASIS 3: MÔ HÌNH “THẾ GIỚI ẢO” ĐẦU TIÊN CÓ API, MÔ PHỎNG LÁI XE CHÂN THỰC HÀNG GIỜ

Startup AI Decart vừa chính thức ra mắt Oasis 3 — mô hình “thế giới ảo” (world model) đầu tiên trên thị trường có API công khai, cho phép lập trình viên tạo ra môi trường lái xe chân thực với thời gian mô phỏng lên đến hàng giờ. Đây là bước tiến lớn trong lĩnh vực “physical AI” — nơi trí tuệ nhân tạo không chỉ hiểu ngôn ngữ mà còn mô phỏng được thế giới vật lý.

Oasis 3 được xây dựng trên nền tảng mô hình video thời gian thực Lucy của Decart — vốn đã có hơn 100.000 lập trình viên đang sử dụng trong thương mại điện tử và livestream. Với Oasis 3, Decart đặt cược lớn vào việc xây dựng một hệ sinh thái lập trình viên xoay quanh world model, tương tự cách OpenAI từng làm với mô hình ngôn ngữ.

Decart Oasis 3 mô phỏng lái xe
Decart Oasis 3 tạo ra môi trường lái xe chân thực có thể tương tác theo thời gian thực. Ảnh: Decart

Oasis 3: World model đầu tiên có API công khai

Không giống các world model trước đây chỉ dừng ở mức research preview hoặc demo giới hạn, Oasis 3 được phát hành kèm API ngay từ ngày đầu với mức giá chỉ $0.02/giây sử dụng. Mô hình tạo ra môi trường lái xe đa camera — một camera trước và hai camera bên — cho phép các công ty xe tự hành (autonomous vehicle) kiểm thử hàng loạt kịch bản hiếm gặp (edge cases) mà không cần lái xe thực tế.

“Đây sẽ là world model đầu tiên mà mọi người thực sự có thể lập trình trên đó”, Dean Leitersdorf, đồng sáng lập kiêm CEO Decart, chia sẻ với TechCrunch. “Tôi nghĩ sẽ có cả một cộng đồng lập trình viên xuất hiện xoay quanh nền tảng này.”

Decart đang nhắm đến các công ty xe tự hành trước tiên, sau đó mở rộng sang robotics và các ứng dụng physical AI khác. Mô hình hiện hỗ trợ tạo môi trường vô hạn — người dùng có thể lái xe hàng giờ trong thế giới ảo mà không bị giới hạn thời lượng như các đối thủ.

Công nghệ đột phá: Hiệu suất “rẻ hơn gấp 10 lần” nhờ DOS

Bí quyết đằng sau Oasis 3 nằm ở DOS (Decart Optimization Stack) — phần mềm tối ưu hóa cho phép mô hình chạy hiệu quả trên phần cứng của Nvidia, Amazon và Google. Theo Leitersdorf, nhờ tích hợp dọc từ phần cứng đến phần mềm, Decart có thể vận hành mô hình với chi phí rẻ hơn một bậc (order of magnitude) so với bất kỳ đối thủ nào trong ngành.

Con số biết nói: dù đã xây dựng và vận hành các mô hình AI quy mô lớn, Decart mới chỉ “đốt” chưa đến 100 triệu USD trong toàn bộ vòng đời — một con số cực kỳ khiêm tốn so với hàng tỷ USD mà các gã khổng lồ đang chi cho hạ tầng AI. Mỗi khung hình Oasis 3 tạo ra tương đương 8.000 token, và ở tốc độ hàng chục khung hình/giây, mô hình xử lý hàng trăm nghìn token mỗi giây.

Đợt gọi vốn 300 triệu USD gần đây đã đẩy định giá Decart lên gần 4 tỷ USD, với sự tham gia của hàng loạt nhà đầu tư chiến lược như Toyota, Adobe, eBay và Nvidia. Tất cả những công ty này đều là khách hàng tiềm năng của Oasis 3.

Sân chơi world model: Cuộc đua ngày càng nóng

Decart không đơn độc trong lĩnh vực world model. Google đã phát hành Genie 3 dưới dạng research preview, Fei-Fei Li’s World Labs ra mắt Marble cho mục đích thương mại, và các startup video generation như Luma, Runway cũng đang chuyển đổi mô hình video có nhận thức vật lý thành world model.

Tuy nhiên, điểm khác biệt của Oasis 3 nằm ở tính khả dụng thương mại ngay lập tức. Trong khi các đối thủ chủ yếu cung cấp demo giới hạn, Decart cho phép lập trình viên tạo môi trường không giới hạn thông qua API — điều mà các công ty xe tự hành thực sự cần để kiểm thử hàng loạt edge case.

So với Genie 3 của Google và Marble của World Labs, Oasis 3 được đánh giá là tạo ra môi trường chân thực nhất từ một prompt văn bản đơn giản — một lợi thế cạnh tranh quan trọng khi các hãng xe cần dữ liệu mô phỏng chất lượng cao cho việc huấn luyện AI.

Hạn chế hiện tại và lộ trình phía trước

Dù ấn tượng, Oasis 3 vẫn còn những hạn chế đáng kể. Khi thử nghiệm, phóng viên TechCrunch nhận thấy môi trường suy giảm chất lượng nhanh chóng sau thời gian dài tương tác — một con phố New York ban đầu đẹp mắt dần biến thành “một thành phố phương Tây chung chung”. Khả năng điều khiển còn kém nhạy, và xe thường xuyên lái xuyên qua các xe khác do mô hình chưa mô phỏng chính xác vật lý va chạm.

Leitersdorf thừa nhận đây là “vấn đề nghiên cứu lớn” và cho biết đội ngũ đang làm việc để cải thiện bộ nhớ ngữ cảnh (context window) của mô hình. Phiên bản tiếp theo sẽ cho phép người dùng tạo thế giới từ video thay vì chỉ ảnh tĩnh, hứa hẹn cải thiện đáng kể tính nhất quán của môi trường.

Dù còn nhiều thách thức, Leitersdorf lạc quan: “Khi chúng ta nói chuyện lại sau ba tháng nữa, sẽ có 100 lập trình viên đã xây dựng 100 ứng dụng khác nhau trên Oasis mà tất cả chúng ta đều bất ngờ.” Đây chính xác là tầm nhìn biến Oasis 3 thành nền tảng world model cho developer — giống cách OpenAI API từng mở ra kỷ nguyên bùng nổ ứng dụng LLM.

Nguồn: TechCrunch — Decart’s new world model can simulate hours of photorealistic driving — with some caveats

JAY AI

J.A.I — JAY AI

Trợ lý tư vấn JAYbranding