Google trình làng mô hình Gemini phiên bản mới, hỗ trợ chạy cục bộ trên robot

25/06/2025, 10:59
Google DeepMind vừa công bố một bước tiến quan trọng trong hành trình đưa AI vào robot thực tế: mô hình ngôn ngữ mới Gemini Robotics On-Device, có khả năng chạy trực tiếp trên thiết bị robot mà không cần kết nối internet. Với hiệu suất tiệm cận phiên bản Gemini Robotics trên nền tảng đám mây, mô hình mới hứa hẹn mở ra kỷ nguyên robot thông minh hoạt động độc lập, linh hoạt hơn bao giờ hết.
Google trình làng mô hình Gemini phiên bản mới, hỗ trợ chạy cục bộ trên robot
Ảnh minh hoạ.

Vào ngày 24/06, Google DeepMind chính thức ra mắt Gemini Robotics On-Device. Đây là phiên bản mới của dòng mô hình ngôn ngữ Gemini, được thiết kế để chạy trực tiếp trên robot cục bộ mà không cần kết nối internet.

Theo Google, Gemini On-Device đạt hiệu quả gần tương đương với phiên bản đám mây Gemini Robotics - được công bố vào tháng 3 vừa qua, và còn vượt trội hơn các mô hình AI cục bộ khác trong nhiều tiêu chuẩn đánh giá.

Trong bản demo công bố cùng ngày, Google trình diễn những chú robot được điều khiển bằng mô hình Gemini mới thực hiện thành công các tác vụ như mở khóa túi, gấp quần áo - hoàn toàn dựa vào hiểu biết ngôn ngữ và khả năng điều phối vật lý.

Ban đầu được huấn luyện trên robot ALOHA, Gemini On-Device sau đó đã được điều chỉnh để hoạt động tốt trên robot hai tay Franka FR3robot hình người Apollo do Apptronik phát triển. Một điểm đáng chú ý là người dùng có thể dùng lời nhắc bằng ngôn ngữ tự nhiên (natural language prompts) để tùy biến và điều khiển hành vi của robot trong các tác vụ đa dạng.

Google cũng tuyên bố robot Franka FR3 đã hoàn thành thành công các nhiệm vụ và thao tác với vật thể mà nó chưa từng tiếp xúc trước đó, ví dụ như hoạt động lắp ráp trong môi trường dây chuyền sản xuất - đánh dấu bước tiến trong khả năng “tổng quát hóa” của AI trên robot.

Google gemini.webp

Biểu đồ điểm chuẩn tổng quát hóa các mô hình AI. Nguồn: Google

Song song đó, Google DeepMind cũng phát hành Gemini Robotics SD, cho phép các nhà phát triển huấn luyện robot với 50–100 nhiệm vụ khác nhau trong mô phỏng vật lý MuJoCo, từ đó tạo điều kiện linh hoạt để triển khai các hành vi mới trước khi ứng dụng vào thực tế.

Không chỉ Google, nhiều "ông lớn" công nghệ và startup AI khác cũng đang đẩy mạnh đầu tư vào lĩnh vực robot trí tuệ nhân tạo: Nvidia đang xây dựng một nền tảng mô hình nền tảng (foundation model) cho robot; Hugging Face phát triển bộ mô hình và dữ liệu mở cho robot, đồng thời mở rộng sang nghiên cứu robot học; RLWRLD, một startup Hàn Quốc do Mirae Asset hậu thuẫn, cũng đang phát triển các mô hình nền tảng dành riêng cho người máy.

Gắn thẻ:
Bình luận (0)

Ý kiến của bạn sẽ được xét duyệt trước khi đăng. Xin vui lòng gõ tiếng Việt có dấu.