![AI đạt trình độ huy chương vàng Olympic toán quốc tế - Ảnh 1.](https://cdn.tuoitre.vn/thumb_w/730/471584752817336320/2025/2/16/toanquocte0011-read-only-1739667118210861236439.jpg)
Olympic toán quốc tế là cuộc tranh tài hằng năm dành cho những học sinh tài năng - Ảnh: Nature.com
Từ tháng 1-2024, nhóm Google DeepMind công bố trên tờ Nature - tờ báo khoa học uy tín hàng đầu - một công cụ AI giải toán AlphaGeometry khiến cả thế giới kinh ngạc. DeepMind đã thể hiện cấp độ của các học sinh đạt huy chương bạc Olympic toán học quốc tế (IMO).
Nhà khoa học Việt tham gia
Ngày 5-2-2025, nhóm AI của Google DeepMind lại cho công bố kết quả về hệ thống mới của họ là AlphaGeometry 2 đã vượt qua mức trung bình của học sinh đạt huy chương vàng IMO. Các kết quả được mô tả trong bảng tiền công bố và cũng được Nature đưa tin.
Một điều đặc biệt là các thành viên nghiên cứu của nhóm Google DeepMind này có đến ba nhà khoa học người Việt Nam (T.H.Trinh, Y.Wu, Q.V.Le, H.He and T.Luong) trong bài báo năm 2024 và bốn người Việt Nam (Yuri Chervonyi, Trieu H.Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V.Le and Thang Luong) trong bài báo năm nay (2025).
Kevin Buzzard, một nhà toán học tại Imperial College London, nói: "Tôi cho rằng không lâu nữa máy tính sẽ đạt được điểm tối đa trên IMO".
Giải các bài toán hình học Euclide là một trong bốn chủ đề trong các kỳ thi toán IMO. Các chủ đề còn lại bao gồm lý thuyết số, đại số và tổ hợp. Các bài toán hình học đòi hỏi những kỹ năng đặc biệt bởi vì các thí sinh phải đưa ra các chứng minh chặt chẽ liên quan đến các vật thể hình học trên mặt phẳng.
Tháng 7 năm ngoái, AlphaGeometry 2 đã ra mắt công chúng cùng với một hệ thống mới, AlphaProof, được DeepMind phát triển để giải quyết các bài toán không thuộc các bài toán hình học trong bộ bài toán Olympic quốc tế.
Ngôn ngữ toán học
Nhóm Google AI đã đào tạo "mô hình ngôn ngữ" để DeepMind nói một ngôn ngữ toán học thông thường, giúp nó có thể tự động kiểm tra tính chính xác logic đầu ra của nó - và loại bỏ những phát biểu sai hoặc không mạch lạc mà các chatbot AI thường phạm phải.
Đối với AlphaGeometry 2, nhóm đã thực hiện một số cải tiến, bao gồm cả việc tích hợp mô hình ngôn ngữ lớn hiện đại nhất của Google, Gemini. Nhóm nghiên cứu cũng đưa ra khả năng suy luận AI bằng cách di chuyển các vật thể hình học trên một mặt phẳng - chẳng hạn như cho phép nó di chuyển một điểm dọc theo một đường thẳng để thay đổi chiều cao của một hình tam giác - và để nó giải các phương trình tuyến tính.
Hệ thống AlphaGeometry 2 có thể giải được 84% tất cả các bài toán hình học được đặt ra trong các kỳ thi toán IMO trong 25 năm qua, nghĩa là cấp độ huy chương vàng Olympic, so với mức 54% mà AlphaGeometry đạt được.
Năm ngoái, nhóm AI ở Ấn Độ và Trung Quốc đã sử dụng các phương pháp khác cũng đạt được thành tích cấp huy chương vàng về hình học, nhưng trên một tập hợp nhỏ hơn các bài toán hình học IMO.
Các tác giả của bài báo DeepMind viết rằng những cải tiến trong tương lai của AlphaGeometry sẽ bao gồm cả việc giải quyết các vấn đề toán học liên quan đến bất đẳng thức và phương trình phi tuyến tính, nghĩa là có thể giải đầy đủ các bài toán hình học.
Tiến bộ nhanh chóng
Giải thưởng trị giá 5 triệu đô la Mỹ được gọi là Giải Olympic toán học AI dành cho hệ thống AI đầu tiên đạt được thành tích mức độ huy chương vàng cho toàn bộ một bài thi Olympic toán, với yêu cầu các hệ thống đó phải là nguồn mở (open source) là điều mà DeepMind vẫn chưa phải.
Kevin Buzzard cho biết ông không ngạc nhiên trước sự tiến bộ nhanh chóng của cả Google DeepMind lẫn cả các nhóm của Ấn Độ và Trung Quốc. Tuy nhiên, ông nói thêm, mặc dù các bài toán thi như thế rất khó nhưng chúng vẫn đơn giản về mặt khái niệm, và còn rất nhiều thách thức nữa phải vượt qua trước khi AI có thể giải quyết các vấn đề ở cấp độ nghiên cứu toán học.
Háo hức chờ Olympic toán quốc tế sắp tới
Các nhà nghiên cứu AI đang háo hức chờ kỳ thi Olympic toán quốc tế (IMO) sắp tới tại Sunshine Coast, Úc vào tháng 7. Sau khi đề toán của cuộc thi được công bố cho những người tham gia cuộc thi, các hệ thống AI cũng có thể được phép giải các bài toán đó. (Các nhóm AI không được phép tham gia cuộc thi và do đó không đủ điều kiện để giành huy chương.)
Các bài toán mới toanh như thế được coi là bài kiểm tra đáng tin cậy nhất cho các hệ thống AI, vì các bài toán đó là hoàn toàn mới hoặc lời giải của chúng chưa xuất hiện và vì thế tránh được dùng trong các dữ liệu huấn luyện, làm kết quả lời giải AI mất đi tính trung thực.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận