Vào ngày 24/06, Google DeepMind chính thức ra mắt Gemini Robotics On-Device. Đây là phiên bản mới của dòng mô hình ngôn ngữ Gemini, được thiết kế để chạy trực tiếp trên robot cục bộ mà không cần kết nối internet.
Theo Google, Gemini On-Device đạt hiệu quả gần tương đương với phiên bản đám mây Gemini Robotics - được công bố vào tháng 3 vừa qua, và còn vượt trội hơn các mô hình AI cục bộ khác trong nhiều tiêu chuẩn đánh giá.
Trong bản demo công bố cùng ngày, Google trình diễn những chú robot được điều khiển bằng mô hình Gemini mới thực hiện thành công các tác vụ như mở khóa túi, gấp quần áo - hoàn toàn dựa vào hiểu biết ngôn ngữ và khả năng điều phối vật lý.
Ban đầu được huấn luyện trên robot ALOHA, Gemini On-Device sau đó đã được điều chỉnh để hoạt động tốt trên robot hai tay Franka FR3 và robot hình người Apollo do Apptronik phát triển. Một điểm đáng chú ý là người dùng có thể dùng lời nhắc bằng ngôn ngữ tự nhiên (natural language prompts) để tùy biến và điều khiển hành vi của robot trong các tác vụ đa dạng.
Google cũng tuyên bố robot Franka FR3 đã hoàn thành thành công các nhiệm vụ và thao tác với vật thể mà nó chưa từng tiếp xúc trước đó, ví dụ như hoạt động lắp ráp trong môi trường dây chuyền sản xuất - đánh dấu bước tiến trong khả năng “tổng quát hóa” của AI trên robot.
Biểu đồ điểm chuẩn tổng quát hóa các mô hình AI. Nguồn: Google
Song song đó, Google DeepMind cũng phát hành Gemini Robotics SD, cho phép các nhà phát triển huấn luyện robot với 50–100 nhiệm vụ khác nhau trong mô phỏng vật lý MuJoCo, từ đó tạo điều kiện linh hoạt để triển khai các hành vi mới trước khi ứng dụng vào thực tế.
Không chỉ Google, nhiều "ông lớn" công nghệ và startup AI khác cũng đang đẩy mạnh đầu tư vào lĩnh vực robot trí tuệ nhân tạo: Nvidia đang xây dựng một nền tảng mô hình nền tảng (foundation model) cho robot; Hugging Face phát triển bộ mô hình và dữ liệu mở cho robot, đồng thời mở rộng sang nghiên cứu robot học; RLWRLD, một startup Hàn Quốc do Mirae Asset hậu thuẫn, cũng đang phát triển các mô hình nền tảng dành riêng cho người máy.