Samsung đang đẩy mạnh chiến lược đưa trí tuệ nhân tạo chạy trực tiếp trên thiết bị, giúp AI hoạt động nhanh hơn, thông minh hơn và riêng tư hơn mà không phụ thuộc vào máy chủ đám mây. Hãng vừa chia sẻ những thông tin mới về hướng phát triển AI cục bộ, và nhiều người kỳ vọng loạt Galaxy S26 dự kiến ra mắt vào đầu năm 2026 sẽ là thế hệ đầu tiên thừa hưởng trọn vẹn những tối ưu này.
Dù smartphone cao cấp ngày nay sở hữu chip mạnh, RAM lớn và bộ nhớ dồi dào, việc chạy các mô hình AI phức tạp hoàn toàn trên thiết bị vẫn là bài toán khó. Những mô hình lớn cần thực hiện hàng tỷ phép tính trực tiếp trên máy, gây nóng, hao pin và có thể làm giảm hiệu năng.
Để giải quyết vấn đề này, Samsung đang tập trung vào kỹ thuật nén mô hình, giúp giảm kích thước mô hình AI nhưng vẫn giữ độ chính xác cao. Trong đó, quá trình lượng tử hóa cho phép chuyển đổi các phép tính phức tạp sang dạng số nguyên tối ưu hơn, tương tự như việc nén ảnh độ phân giải cao mà vẫn giữ được chất lượng gần như không đổi.

Samsung cho biết mỗi thiết bị có mức bộ nhớ và sức mạnh xử lý khác nhau, nên một giải pháp AI “dùng chung cho tất cả” không thể mang lại hiệu quả như AI đám mây. Vì vậy, hãng tự phát triển các thuật toán nén riêng, tối ưu cho từng mẫu máy. Song song đó, Samsung đang xây dựng AI runtime engine – bộ công cụ quản lý cách mô hình AI chạy trên chip, phân bổ tác vụ cho phần cứng phù hợp và giảm tối đa mức sử dụng bộ nhớ.
Hầu hết mô hình ngôn ngữ lớn hiện nay dựa vào kiến trúc transformer – phân tích cả câu cùng lúc. Tuy nhiên, Samsung đang nghiên cứu các kiến trúc mới để tìm giải pháp hoạt động hiệu quả hơn trong môi trường thực tế của smartphone, nơi tài nguyên luôn bị giới hạn.
“AI sẽ học tốt hơn theo thời gian ngay trên thiết bị và thích ứng với môi trường của từng người dùng,” Tiến sĩ MyungJoo Ham, chuyên gia tại AI Center của Samsung Research cho biết. “Tương lai của chúng ta là những dịch vụ tự nhiên, cá nhân hóa sâu nhưng vẫn đảm bảo quyền riêng tư.”













