Mới đây, Google DeepMind vừa ra mắt mô hình Trí tuệ nhân tạo (AI) mới AlphaGenome với khả năng giải mã những vùng "khó hiểu" nhất của bộ gen người. Thông qua API mở cho nghiên cứu phi thương mại, cùng tài liệu và hỗ trợ cộng đồng trên GitHub, Google đang góp phần đưa khoa học hệ gen ra khỏi phòng lab chuyên biệt, tiến gần hơn đến một nền khoa học mở và dễ tiếp cận.
DNA giống như một cuốn sách hướng dẫn khổng lồ về cách cơ thể vận hành. Trong nhiều năm, giới khoa học chỉ hiểu rõ khoảng 10% DNA – phần mã hóa protein. Phần còn lại, hơn 90%, không tạo ra protein và từng bị xem là “junk DNA”.
Giờ đây, chúng ta biết rằng phần DNA không mã hóa này thực chất đóng vai trò điều khiển: nó kiểm soát gen nào được kích hoạt, vào lúc nào, ở đâu – giống như một bảng điều khiển phức tạp. Vấn đề là, nó cực kỳ khó đọc và hiểu.
Đó là lý do AlphaGenome ra đời - một mô hình AI mạnh mẽ có thể phân tích những đoạn DNA dài tới 1 triệu ký tự, xác định vùng quan trọng và dự đoán ảnh hưởng của các đột biến đến gen. Nói cách khác, nó giống như một “kính hiển vi AI siêu thông minh”, không chỉ đọc sách hướng dẫn mà còn hiểu cách các công tắc sinh học được bật/tắt và điều gì xảy ra khi một phần nào đó bị trục trặc.
Điều đáng nói là DeepMind cung cấp công cụ này qua API, miễn phí cho nghiên cứu phi thương mại. Các nhà khoa học từ khắp nơi trên thế giới có thể truy cập, thử nghiệm, và đưa ra phản hồi để cải thiện mô hình trong tương lai. Việc tiếp cận dễ dàng này hứa hẹn đẩy nhanh nghiên cứu về bệnh di truyền, y học cá nhân hóa và cả các hướng đi mới trong điều trị chống lão hóa.
Khác với các mô hình trước đây chỉ xử lý được các đoạn DNA ngắn, AlphaGenome có thể phân tích trình tự dài tới 1 triệu cặp base (A, T, C, G), giúp phát hiện mối quan hệ điều tiết từ xa vốn bị bỏ sót.
Cấu trúc xoắn của DNA và chuỗi base A-T-C-G. Nguồn: Internet
Điểm nổi bật của AlphaGenome là khả năng dự đoán đa dạng các hoạt động sinh học như: biểu hiện gen (RNA-seq, CAGE), sự cắt ghép RNA (splicing), trạng thái nhiễm sắc thể (DNase, histone modifications) và bản đồ tiếp xúc 3D trong nhân tế bào.
Điều này giúp AlphaGenome không chỉ xác định gen nào được “bật” trong tế bào mà còn hiểu cách bộ gen “gập lại”,, tự chỉnh sửa.
Sơ đồ xử lý dữ liệu và đầu ra của AlphaGenome. Nguồn: X
AlphaGenome đã vượt qua các mô hình hiện đại khác trong 22/24 bài kiểm tra dự đoán trình tự DNA và 24/26 bài đánh giá ảnh hưởng của đột biến gen. Nó có thể so sánh DNA bình thường với DNA bị đột biến trong vài giây từ đó xác định nguy cơ bệnh lý di truyền vì hầu hết đột biến nguy hiểm nằm ở vùng không mã hóa.
AlphaGenome là một phần trong làn sóng AI đang thay đổi ngành sinh học. Mô hình Ankh do Đại học Kỹ thuật Munich và Columbia phát triển có thể “đọc hiểu” protein như ngôn ngữ, tạo ra protein mới và dự đoán cách chúng hoạt động.
Các công nghệ khác như GenSLMs của Nvidia cho thấy AI có thể dự đoán các biến thể virus và nghiên cứu đại dịch. Những tiến bộ này cũng đang thúc đẩy các phương pháp chống lão hóa dựa trên AI, gen và phân tử.
Đóng góp của AlphaGenome là đáng chú ý vì khả năng tiếp cận rộng rãi: bất kỳ nhà nghiên cứu nào cũng có thể sử dụng công cụ này thông qua API để chạy dự đoán, tùy chỉnh theo loại tế bào hoặc loài sinh vật khác nhau. DeepMind cho biết cũng đang hướng đến mở mã nguồn toàn phần trong tương lai.
Tại sự kiện To Catch a Token, Robinhood đã giới thiệu loạt sản phẩm chiến lược, đưa tài sản số đến gần hơn với hàng triệu nhà đầu tư tại EU và Mỹ.