AlphaGenome: Mô hình AI của Google giúp giãi mã vùng DNA bí ẩn

22/07/2025, 00:00
Với khả năng giải mã DNA không mã hóa và API miễn phí trên GitHub, AlphaGenome đang đưa nghiên cứu gen đến gần hơn với cộng đồng khoa học toàn cầu.
AlphaGenome: Mô hình AI của Google giúp giãi mã vùng DNA bí ẩn
Ảnh minh hoạ.

Mới đây, Google DeepMind vừa ra mắt mô hình Trí tuệ nhân tạo (AI) mới AlphaGenome với khả năng giải mã những vùng "khó hiểu" nhất của bộ gen người. Thông qua API mở cho nghiên cứu phi thương mại, cùng tài liệu và hỗ trợ cộng đồng trên GitHub, Google đang góp phần đưa khoa học hệ gen ra khỏi phòng lab chuyên biệt, tiến gần hơn đến một nền khoa học mở và dễ tiếp cận.

Vấn đề lớn từng bị lãng quên: DNA không mã hóa (Non-coding DNA/Junk DNA)

DNA giống như một cuốn sách hướng dẫn khổng lồ về cách cơ thể vận hành. Trong nhiều năm, giới khoa học chỉ hiểu rõ khoảng 10% DNA – phần mã hóa protein. Phần còn lại, hơn 90%, không tạo ra protein và từng bị xem là “junk DNA”.

Giờ đây, chúng ta biết rằng phần DNA không mã hóa này thực chất đóng vai trò điều khiển: nó kiểm soát gen nào được kích hoạt, vào lúc nào, ở đâu – giống như một bảng điều khiển phức tạp. Vấn đề là, nó cực kỳ khó đọc và hiểu.

Đó là lý do AlphaGenome ra đời - một mô hình AI mạnh mẽ có thể phân tích những đoạn DNA dài tới 1 triệu ký tự, xác định vùng quan trọng và dự đoán ảnh hưởng của các đột biến đến gen. Nói cách khác, nó giống như một “kính hiển vi AI siêu thông minh”, không chỉ đọc sách hướng dẫn mà còn hiểu cách các công tắc sinh học được bật/tắt và điều gì xảy ra khi một phần nào đó bị trục trặc.

Điều đáng nói là DeepMind cung cấp công cụ này qua API, miễn phí cho nghiên cứu phi thương mại. Các nhà khoa học từ khắp nơi trên thế giới có thể truy cập, thử nghiệm, và đưa ra phản hồi để cải thiện mô hình trong tương lai. Việc tiếp cận dễ dàng này hứa hẹn đẩy nhanh nghiên cứu về bệnh di truyền, y học cá nhân hóa và cả các hướng đi mới trong điều trị chống lão hóa.

AlphaGenome hoạt động như thế nào?

Khác với các mô hình trước đây chỉ xử lý được các đoạn DNA ngắn, AlphaGenome có thể phân tích trình tự dài tới 1 triệu cặp base (A, T, C, G), giúp phát hiện mối quan hệ điều tiết từ xa vốn bị bỏ sót.

Cấu trúc xoắn của DNA và chuỗi base A-T-C-G.jpg

Cấu trúc xoắn của DNA và chuỗi base A-T-C-G. Nguồn: Internet

Điểm nổi bật của AlphaGenome là khả năng dự đoán đa dạng các hoạt động sinh học như: biểu hiện gen (RNA-seq, CAGE), sự cắt ghép RNA (splicing), trạng thái nhiễm sắc thể (DNase, histone modifications) và bản đồ tiếp xúc 3D trong nhân tế bào.

Điều này giúp AlphaGenome không chỉ xác định gen nào được “bật” trong tế bào mà còn hiểu cách bộ gen “gập lại”,, tự chỉnh sửa.

Sơ đồ xử lý dữ liệu và đầu ra của AlphaGenome.jpg

Sơ đồ xử lý dữ liệu và đầu ra của AlphaGenome. Nguồn: X

AlphaGenome đã vượt qua các mô hình hiện đại khác trong 22/24 bài kiểm tra dự đoán trình tự DNA và 24/26 bài đánh giá ảnh hưởng của đột biến gen. Nó có thể so sánh DNA bình thường với DNA bị đột biến trong vài giây từ đó xác định nguy cơ bệnh lý di truyền vì hầu hết đột biến nguy hiểm nằm ở vùng không mã hóa.

AI đang viết lại cách chúng ta hiểu về sự sống

AlphaGenome là một phần trong làn sóng AI đang thay đổi ngành sinh học. Mô hình Ankh do Đại học Kỹ thuật Munich và Columbia phát triển có thể “đọc hiểu” protein như ngôn ngữ, tạo ra protein mới và dự đoán cách chúng hoạt động.

Các công nghệ khác như GenSLMs của Nvidia cho thấy AI có thể dự đoán các biến thể virus và nghiên cứu đại dịch. Những tiến bộ này cũng đang thúc đẩy các phương pháp chống lão hóa dựa trên AI, gen và phân tử.

Đóng góp của AlphaGenome là đáng chú ý vì khả năng tiếp cận rộng rãi: bất kỳ nhà nghiên cứu nào cũng có thể sử dụng công cụ này thông qua API để chạy dự đoán, tùy chỉnh theo loại tế bào hoặc loài sinh vật khác nhau. DeepMind cho biết cũng đang hướng đến mở mã nguồn toàn phần trong tương lai.

Gắn thẻ:
Bình luận (0)

Ý kiến của bạn sẽ được xét duyệt trước khi đăng. Xin vui lòng gõ tiếng Việt có dấu.