Các nhà khoa học vừa giới thiệu một kiến trúc nền tảng cho thế hệ điện toán quang học mới, nơi ánh sáng thay thế hoàn toàn dòng điện để vận hành chip. Công nghệ này hứa hẹn tạo ra bước đột phá trong cách huấn luyện và triển khai các mô hình trí tuệ nhân tạo hiện nay.
Cốt lõi của các mô hình ngôn ngữ lớn và các hệ thống học sâu là tensor, một cấu trúc trọng số hoạt động như tủ hồ sơ phân loại dữ liệu. Tốc độ xử lý tensor vốn là ranh giới cứng giới hạn khả năng mở rộng của mô hình AI. Trong điện toán quang học truyền thống, việc quét tensor đòi hỏi nhiều lần bắn laser và không thể vận hành song song như GPU. Đây là lý do các mô hình tối tân của OpenAI, Anthropic, Google hay xAI phải dựa vào hàng nghìn GPU chạy đồng thời.
Kiến trúc mới mang tên Parallel Optical Matrix Matrix Multiplication, hay POMMM, giải quyết nút thắt đó bằng cách thực hiện nhiều phép toán tensor chỉ trong một xung laser. Các nhà nghiên cứu cho biết hệ thống có thể đẩy tốc độ xử lý vượt qua phần cứng điện tử hiện đại và giảm đáng kể mức tiêu thụ năng lượng.
Công trình được công bố trên tạp chí Nature Photonics , mô tả một nguyên mẫu điện toán quang học cùng các thử nghiệm so sánh với GPU và hệ quang học tiêu chuẩn. Nhóm nghiên cứu đã mã hóa dữ liệu vào biên độ và pha của sóng ánh sáng, để các phép toán ma trận hình thành một cách thụ động khi ánh sáng lan truyền mà không cần thêm năng lượng điều khiển.
Nhóm kỳ vọng sẽ tích hợp kiến trúc này vào chip quang tử, mở đường cho bộ xử lý dựa trên ánh sáng có thể xử lý các tác vụ AI phức tạp ở mức điện năng cực thấp. Giới nghiên cứu dự đoán công nghệ có thể được đưa vào các nền tảng AI lớn trong ba đến năm năm tới.
Một số đại diện xem đây là bước tiến hướng tới thế hệ trí tuệ nhân tạo tổng quát, dù nhiều nhà khoa học như Yann LeCun không tin rằng mở rộng mô hình LLM sẽ dẫn tới AGI. Dù vậy, POMMM được xem là mảnh ghép phần cứng quan trọng để vượt qua giới hạn của các mô hình hiện nay.