Samsung đang khiến giới công nghệ bất ngờ khi công bố một mô hình AI chỉ có 7 triệu tham số nhưng lại vượt qua những “ông lớn” như Gemini và DeepSeek trong các bài kiểm tra logic phức tạp.
Công trình này đến từ Phòng thí nghiệm AI của Viện Nghiên cứu Công nghệ Toàn diện (SAIT) tại Montreal, Canada. Mô hình mới, mang tên Tiny Recursive Model (TRM), dù nhỏ gọn đến mức chỉ bằng “một hạt bụi” so với các mô hình ngôn ngữ khổng lồ (LLM) như GPT hay Gemini (với hàng trăm tỷ đến nghìn tỷ tham số), lại cho thấy hiệu năng vượt trội ở những nhiệm vụ cần khả năng suy luận và tự điều chỉnh.
Điểm đặc biệt của TRM nằm ở cấu trúc tư duy đệ quy – mô hình không chỉ tạo ra câu trả lời, mà còn liên tục tự hỏi lại và chỉnh sửa chính mình: “Liệu câu trả lời này đã đúng chưa? Có thể làm tốt hơn không?”. Cách vận hành này giúp TRM mô phỏng quá trình suy nghĩ lặp lại của con người, thay vì chỉ dự đoán từ kế tiếp như các mô hình AI thông thường.
Trước đây, startup Sapient Intelligence từng giới thiệu mô hình Hierarchical Recursive Model (HRM) với hai “bộ não” – một xử lý nhanh, một tư duy sâu. Tuy nhiên, HRM gặp giới hạn về bộ nhớ và tính toán. Samsung đã giải quyết vấn đề này bằng thiết kế một bộ não duy nhất có khả năng tự phản tư nhiều lần, lên đến 16 vòng lặp cho mỗi lần xử lý. Đặc biệt, TRM có thể tự dừng sớm khi đánh giá rằng kết quả đã đủ chính xác, giúp giảm tiêu thụ năng lượng và thời gian huấn luyện.
Trong bài kiểm tra ARC-AGI – được xem là thước đo cho năng lực “trí tuệ tổng quát” của AI – TRM đạt độ chính xác 45%, vượt Gemini (37%) và o3 (34,5%). Mô hình cũng thể hiện khả năng xuất sắc ở các thử nghiệm như giải Sudoku và tìm đường trong mê cung. Toàn bộ quá trình huấn luyện chỉ diễn ra trong 2 ngày với 4 GPU NVIDIA H100, tiêu tốn chưa đến 500 USD – một con số cực kỳ khiêm tốn so với chi phí hàng triệu đô của các LLM thông thường.
Nhà nghiên cứu chính Alexia Jolicoeur-Martino cho biết: “Mô hình nhỏ vẫn có thể đạt kết quả lớn nếu biết cách học từ chính mình và cải thiện qua từng vòng phản tư.”
Dẫu vậy, TRM vẫn còn điểm yếu – nó chưa đủ mạnh trong hiểu ngôn ngữ tự nhiên, đối thoại và kiến thức đời thường, những lĩnh vực mà GPT hay Gemini đang thống trị. Dù vậy, giới chuyên môn nhận định đây là một hướng đi mới mẻ và đầy hứa hẹn, mở ra kỷ nguyên AI siêu nhẹ có thể hoạt động trực tiếp trên thiết bị – thay vì phải phụ thuộc hoàn toàn vào đám mây.