Vì sao khi huấn luyện mô hình ChatGPT cần tới 700.000 lít nước?

linh_449

Linh Linhh
Nghiên cứu mới hé lộ, lượng nước khổng lồ được tiêu thụ trong quá trình huấn luyện GPT-3 đủ để sản xuất 370 xe BMW hay 320 xe điện Tesla.

Các trung tâm dữ liệu đòi hỏi lượng nước khổng lồ để làm mát. Ảnh: iStock


Các trung tâm dữ liệu đòi hỏi lượng nước khổng lồ để làm mát. Ảnh: iStock

Nhóm chuyên gia tại Đại học Colorado Riverside và Đại học Texas Arlington nghiên cứu cách sử dụng nước trong quá trình đào tạo các mô hình AI lớn như ChatGPT của OpenAI và Bard của Google, Interesting Engineering hôm 12/4 đưa tin.

Khi tính toán lượng nước mà AI sử dụng, nhóm nghiên cứu đã phân biệt giữa "rút" và "tiêu thụ". Rút nước là việc lấy nước từ sông, hồ hoặc nguồn khác, còn tiêu thụ đề cập đến lượng nước mất đi do bay hơi khi được sử dụng trong các trung tâm dữ liệu. Nghiên cứu mới tập trung chủ yếu vào lượng nước tiêu thụ. Nhóm chuyên gia cho biết, vấn đề AI tiêu thụ lượng nước khổng lồ cần được chú trọng giải quyết như một phần của nỗ lực tập thể nhằm xử lý những thách thức về nước trên toàn cầu.

Nghiên cứu mới tiết lộ, một trung tâm dữ liệu trung bình sử dụng khoảng 3,8 lít nước mỗi kWh. Không phải bất kỳ loại nước nào cũng có thể sử dụng. Nhằm ngăn chặn sự ăn mòn hoặc vi khuẩn phát triển - điều có thể xảy ra với nước biển - các trung tâm dữ liệu lấy nước từ những nguồn nước ngọt nguyên sơ. Ngoài ra, nước ngọt cũng cần thiết để kiểm soát độ ẩm trong phòng.

Nhóm nhà khoa học cho biết, các trung tâm dữ liệu còn chịu trách nhiệm về "nước tiêu thụ gián tiếp bên ngoài", cụ thể là lượng nước dùng để sản xuất lượng điện năng khổng lồ phục vụ cho trung tâm.

Theo nghiên cứu, các trung tâm dữ liệu lớn được sử dụng cho việc đào tạo AI cần rất nhiều nước để làm mát, trong trường hợp của ChatGPT, lượng nước này có thể lấp đầy tháp giải nhiệt của một nhà máy điện hạt nhân. Chỉ riêng quá trình huấn luyện của GPT-3 đã cần tới 700.000 lít nước, đủ để sản xuất 370 xe BMW hay 320 xe điện Tesla.

Theo nghiên cứu mới, một tương tác điển hình giữa người dùng với ChatGPT tương đương với việc đổ một chai nước ngọt cỡ lớn xuống đất. ChatGPT, ra đời sau GPT-3, sẽ cần "uống" một chai nước 500 ml để hoàn thành một cuộc thảo luận cơ bản với khoảng 25 - 50 câu hỏi của người dùng.

Microsoft - công ty đã hợp tác với OpenAI nhiều năm, tiêu tốn hàng tỷ USD và chế tạo những siêu máy tính để đào tạo AI - cho biết, siêu máy tính mới nhất của mình chứa tới 10.000 card đồ họa và hơn 285.000 lõi xử lý. Siêu máy tính này sẽ đòi hỏi thiết bị làm mát cực lớn và mạnh mẽ.

Nhóm chuyên gia lo ngại, với sự phổ biến của chatbot, lượng nước mà chúng tiêu thụ có thể làm tổn hại đến nguồn cung cấp nước, nhất là khi xét đến những đợt hạn hán trước đây và sự bất ổn môi trường trong tương lai.

Nghiên cứu mới cũng ước tính lượng nước dùng để đào tạo mô hình AI với giả định rằng quá trình đào tạo diễn ra tại trung tâm dữ liệu tiên tiến của Microsoft ở Mỹ. Theo đó, lượng nước sử dụng có thể tăng gấp 3 lần nếu dữ liệu được tạo ra trong một trung tâm dữ liệu kém hiệu quả về năng lượng. Với các mô hình tân tiến hơn, ví dụ như GPT-4 vừa phát hành, và phụ thuộc vào nhiều yếu tố dữ liệu hơn các mô hình cũ, nhóm nghiên cứu dự đoán rằng nhu cầu về nước sẽ tiếp tục tăng.
 
Bên trên