Chuoito011
Trai thôn
AI TIẾN HÓA RẤT NHANH, HƠN CHÚNG TA NGHĨ
--
một nhóm nghiên cứu vừa mới công bố kết quả về bước tiến của AI trong lĩnh vực tư duy logic cao cấp.
Trước đây, AI (như bản AlphaProof của Google DeepMind) đã đạt thành tích ấn tượng tại Kỳ thi Toán quốc tế (IMO). Tuy nhiên, những người hoài nghi cho rằng đó chỉ là giải toán có sẵn, có cấu trúc và đáp án xác định (high school math). Thế nhưng giờ đây, AI giờ đây đã bước vào lãnh địa của toán học nghiên cứu – nơi chưa có lời giải và đòi hỏi sự sáng tạo thực sự.
Nhóm chuyên gia đã đưa ra 10 câu hỏi nảy sinh từ chính các công trình nghiên cứu hiện đại của các nhà toán học. Đây không phải là bài tập trong sách giáo khoa; đây là những bài toán mà "chỉ họ mới biết đáp án", dùng để thử thách khả năng suy luận chưa từng có của AI trong một giới hạn thời gian (1 tuần).
Đại diện nhóm nghiên cứu cho rằng cách chúng ta nghiên cứu Khoa học, Công nghệ, Kỹ thuật và Toán học (STEM) sắp thay đổi tận gốc rễ. AI không còn là công cụ tra cứu, mà trở thành một "cộng sự" có khả năng giải quyết các vấn đề biên giới của tri thức.
VÌ SAO THÔNG TIN NÀY GÂY CHẤN ĐỘNG ?
Hầu hết các mô hình ngôn ngữ lớn (LLM) hiện nay hoạt động dựa trên việc dự đoán từ tiếp theo dựa trên dữ liệu đã có. Việc giải được các bài toán nghiên cứu mới cho thấy AI đang tiến gần hơn tới Artificial General Intelligence (AGI) – trí tuệ nhân tạo tổng quát, nơi nó có thể suy luận logic trong những tình huống hoàn toàn mới mà nó chưa từng được học qua. Đó là chuyển từ "Tái tạo" sang "Sáng tạo".
Việc giải được "vài câu" trong số 10 câu hỏi nghiên cứu khó nhất là một cột mốc không tưởng. Trong toán học cao cấp, một nhà nghiên cứu có thể mất hàng tháng, thậm chí hàng năm để giải quyết một vấn đề. Nếu AI làm được điều đó trong vài ngày, nó sẽ đẩy nhanh tốc độ tiến bộ khoa học của nhân loại lên gấp hàng nghìn lần.
Nhiều khả năng các phòng thí nghiệm AI (có thể là OpenAI với mô hình o3 / o3-pro hoặc Google DeepMind) đã đạt được một đột phá về System 2 thinking (tư duy chậm, có chiều sâu và kiểm chứng lỗi).
Ranh giới giữa "học toán" và "làm toán" sẽ thay đổi. Khả năng đặt câu hỏi và tư duy hệ thống sẽ trở nên quan trọng hơn việc tính toán hay giải các dạng bài có sẵn.
Còn các nhà khoa học sẽ có một "siêu trợ lý" để kiểm chứng các giả thuyết hoặc gợi ý các hướng chứng minh mà bộ não con người chưa nghĩ tới.
arxiv.org
--
một nhóm nghiên cứu vừa mới công bố kết quả về bước tiến của AI trong lĩnh vực tư duy logic cao cấp.
Trước đây, AI (như bản AlphaProof của Google DeepMind) đã đạt thành tích ấn tượng tại Kỳ thi Toán quốc tế (IMO). Tuy nhiên, những người hoài nghi cho rằng đó chỉ là giải toán có sẵn, có cấu trúc và đáp án xác định (high school math). Thế nhưng giờ đây, AI giờ đây đã bước vào lãnh địa của toán học nghiên cứu – nơi chưa có lời giải và đòi hỏi sự sáng tạo thực sự.
Nhóm chuyên gia đã đưa ra 10 câu hỏi nảy sinh từ chính các công trình nghiên cứu hiện đại của các nhà toán học. Đây không phải là bài tập trong sách giáo khoa; đây là những bài toán mà "chỉ họ mới biết đáp án", dùng để thử thách khả năng suy luận chưa từng có của AI trong một giới hạn thời gian (1 tuần).
Đại diện nhóm nghiên cứu cho rằng cách chúng ta nghiên cứu Khoa học, Công nghệ, Kỹ thuật và Toán học (STEM) sắp thay đổi tận gốc rễ. AI không còn là công cụ tra cứu, mà trở thành một "cộng sự" có khả năng giải quyết các vấn đề biên giới của tri thức.
VÌ SAO THÔNG TIN NÀY GÂY CHẤN ĐỘNG ?
Hầu hết các mô hình ngôn ngữ lớn (LLM) hiện nay hoạt động dựa trên việc dự đoán từ tiếp theo dựa trên dữ liệu đã có. Việc giải được các bài toán nghiên cứu mới cho thấy AI đang tiến gần hơn tới Artificial General Intelligence (AGI) – trí tuệ nhân tạo tổng quát, nơi nó có thể suy luận logic trong những tình huống hoàn toàn mới mà nó chưa từng được học qua. Đó là chuyển từ "Tái tạo" sang "Sáng tạo".
Việc giải được "vài câu" trong số 10 câu hỏi nghiên cứu khó nhất là một cột mốc không tưởng. Trong toán học cao cấp, một nhà nghiên cứu có thể mất hàng tháng, thậm chí hàng năm để giải quyết một vấn đề. Nếu AI làm được điều đó trong vài ngày, nó sẽ đẩy nhanh tốc độ tiến bộ khoa học của nhân loại lên gấp hàng nghìn lần.
Nhiều khả năng các phòng thí nghiệm AI (có thể là OpenAI với mô hình o3 / o3-pro hoặc Google DeepMind) đã đạt được một đột phá về System 2 thinking (tư duy chậm, có chiều sâu và kiểm chứng lỗi).
Ranh giới giữa "học toán" và "làm toán" sẽ thay đổi. Khả năng đặt câu hỏi và tư duy hệ thống sẽ trở nên quan trọng hơn việc tính toán hay giải các dạng bài có sẵn.
Còn các nhà khoa học sẽ có một "siêu trợ lý" để kiểm chứng các giả thuyết hoặc gợi ý các hướng chứng minh mà bộ não con người chưa nghĩ tới.
First Proof
To assess the ability of current AI systems to correctly answer research-level mathematics questions, we share a set of ten math questions which have arisen naturally in the research process of the authors. The questions had not been shared publicly until now; the answers are known to the...