Báo cáo AI Index 2025 của Stanford HAI cung cấp hơn 400 trang dữ liệu, đánh giá toàn diện AI về R&D, hiệu suất kỹ thuật, kinh tế, chính sách, giáo dục và dư luận.
Mỹ vẫn dẫn đầu với 40 mô hình AI nổi bật trong năm 2024, so với Trung Quốc (15) và châu Âu (3). Phần lớn mô hình đến từ doanh nghiệp, không phải trường đại học hay chính phủ.
Chi phí huấn luyện AI ngày càng tăng: Mô hình đắt nhất là Gemini 1.0 Ultra (Google), tiêu tốn khoảng 191,9 triệu USD. DeepSeek (Trung Quốc) tuyên bố huấn luyện mô hình tương đương chỉ với 6 triệu USD – gây chấn động giới đầu tư, nhưng bị nghi ngờ về tính xác thực.
Chi phí sử dụng AI lại giảm mạnh: Giá suy luận GPT-4 giảm từ 15 USD xuống 0,12 USD/mỗi triệu token chỉ trong vòng một năm nhờ phần cứng rẻ hơn và hiệu suất cao hơn.
Dấu chân carbon của AI rất lớn: Mặc dù hiệu suất năng lượng tăng, nhưng phát thải CO₂ vẫn tăng vì lượng tiêu thụ năng lượng tổng thể tăng. Ví dụ, Meta’s Llama 3.1 thải ra tới 8.930 tấn CO₂ – tương đương mức sống hàng năm của 496 người Mỹ.
Hiệu suất mô hình Trung Quốc tiến sát Mỹ: Trên benchmark chatbot, khoảng cách giữa mô hình tốt nhất Mỹ và Trung Quốc giảm từ 9,26% xuống chỉ còn 1,70% từ tháng 1/2024 đến tháng 2/2025.
Benchmark cũ đã bị "phá đảo": AI đạt điểm quá cao ở nhiều bài kiểm tra như hình ảnh, kiến thức, toán, mã hóa... khiến giới nghiên cứu phải tạo benchmark mới, như "Humanity’s Last Exam" – mô hình tốt nhất chỉ đạt 8,8% điểm.
Nguy cơ "cạn kiệt dữ liệu": 48% website hàng đầu đã chặn AI thu thập dữ liệu qua robots.txt. Điều này đe dọa nguồn "dầu mỏ dữ liệu" của các mô hình AI thế hệ mới.
Đầu tư doanh nghiệp vào AI bùng nổ: Dù tổng đầu tư năm 2024 chưa bằng năm 2021, đầu tư tư nhân cao kỷ lục: 150 tỉ USD, trong đó 33 tỉ dành riêng cho AI tạo sinh.
Doanh nghiệp chưa thấy lợi nhuận lớn từ AI: Theo khảo sát McKinsey, phần lớn doanh nghiệp tiết kiệm chi phí dưới 10%, doanh thu tăng dưới 5%. Kết quả thực tế vẫn chưa như kỳ vọng.
AI trong y tế đầy hứa hẹn nhưng chưa hiệu quả thực tiễn: GPT-4 đạt điểm cao nhất bài kiểm tra y khoa (96%) nhưng khi kết hợp cùng bác sĩ thật thì không cải thiện chẩn đoán hay tốc độ.
Chính sách AI ở Mỹ dịch chuyển sang cấp bang: 221 dự luật đề xuất cấp liên bang (chỉ 4 thông qua), trong khi 131 luật đã được ban hành ở cấp bang – 56 trong số đó nhắm đến việc cấm deepfake trong bầu cử hoặc nội dung khiêu *** không tự nguyện.
Người dân toàn cầu vẫn lạc quan về AI: 60% cho rằng AI sẽ thay đổi công việc của họ, nhưng chỉ 36% sợ bị thay thế – thể hiện niềm tin rằng con người vẫn có giá trị khi làm việc cùng AI.
Stanford AI Index 2025 cho thấy bức tranh AI vừa rực rỡ vừa đầy thách thức: chi phí huấn luyện tăng chóng mặt (Gemini 1.0 Ultra: 191,9 triệu USD), phát thải CO₂ cao (Meta: 8.930 tấn), nhưng chi phí sử dụng giảm mạnh. Mặc dù AI chưa mang lại lợi nhuận lớn, đầu tư vẫn tăng mạnh và công chúng lạc quan rằng AI sẽ hỗ trợ – chứ không thay thế – họ.