OpenAI ra mắt ChatGPT Agent: AI có thể kiểm soát, trực tiếp điều khiển máy tính thay con người

Hồ Thị Thanh Trà

Well-known member
Công nghệ đằng sau ChatGPT Agent
Sức mạnh của ChatGPT Agent đến từ một mô hình AI hoàn toàn mới, được phát triển chuyên biệt bằng cách hợp nhất hai công nghệ có sẵn là khả năng tương tác web như người thật của công cụ “Operator” và kỹ năng tổng hợp, phân tích sâu của “Deep Research”. Nó được cấp quyền truy cập vào “toàn bộ một chiếc máy tính” thay vì chỉ một trình duyệt, và được trang bị bộ công cụ mạnh mẽ:

  • Trình duyệt trực quan và văn bản: Để tương tác với website một cách linh hoạt.
  • Terminal: Để chạy mã lệnh và xử lý tệp tin.
  • Trình kết nối (Connectors): Cho phép kết nối với các ứng dụng như Gmail, Github để truy xuất và hành động dựa trên dữ liệu của người dùng.
Trong các bài kiểm tra, Agent đã thiết lập nhiều kỷ lục mới về hiệu năng, thậm chí vượt trội đáng kể so với con người trong các tác vụ phức tạp về khoa học dữ liệu (DSBench) và mô hình tài chính.

Visual Portfolio, Posts & Image Gallery for WordPress









Việc ra mắt của ChatGPT Agent là một phần trong xu hướng lớn của toàn ngành. Khái niệm “tác nhân AI” đã trở thành tâm điểm từ năm 2023, với các gã khổng lồ như Amazon, Meta và Google đều công khai mục tiêu này. Thực tế đã chứng minh sức mạnh của công nghệ khi công ty fintech Klarna thông báo tác nhân AI của họ đã xử lý khối lượng công việc tương đương 700 nhân viên chỉ sau một tháng.

OpenAI thừa nhận rằng một công cụ mạnh mẽ cũng đi kèm những rủi ro mới, đặc biệt là nguy cơ “tấn công prompt injection” khi một trang web độc hại có thể lừa AI thực hiện hành động sai trái. Để giải quyết vấn đề này, OpenAI đã thiết lập nhiều lớp bảo vệ, đặt người dùng vào vị trí trung tâm của sự kiểm soát. Cụ thể, Agent phải luôn xin phép trước khi thực hiện bất kỳ hành động không thể đảo ngược nào như gửi email hay mua hàng, và người dùng có toàn quyền can thiệp vào quá trình bất cứ lúc nào. Thêm vào đó, một cơ chế bảo vệ bổ sung là “Chế độ Theo dõi” (Watch Mode) sẽ được kích hoạt khi AI truy cập các trang web nhạy cảm như tài chính, yêu cầu người dùng phải giám sát trực tiếp để tác vụ tiếp tục. Để hạn chế rủi ro ở mức tối đa, các giao dịch tài chính hiện cũng đang bị giới hạn và mô hình được huấn luyện để chủ động từ chối các yêu cầu nguy hiểm như chuyển khoản ngân hàng.

Đáng chú ý, OpenAI đã chủ động áp dụng các biện pháp phòng ngừa ở mức cao nhất cho các rủi ro sinh học và hóa học, thể hiện sự cẩn trọng tối đa.

Mặc dù mạnh mẽ, đội ngũ phát triển cũng cho biết Agent có thể hoạt động hơi chậm, bởi nó được tối ưu cho các tác vụ khó thay vì tốc độ tức thời. “Đây là thứ bạn có thể khởi động để nó chạy ngầm và quay lại sau khi hoàn thành,” đại diện OpenAI giải thích.

Cách sử dụng và lộ trình tương lai
OpenAI đã bắt đầu triển khai ChatGPT Agent cho người dùng các gói Pro, Plus, và Team. Người dùng có thể kích hoạt bằng cách chọn “agent mode” trong menu công cụ hoặc gõ lệnh “/agent”. Các tài khoản Doanh nghiệp và Giáo dục sẽ được tiếp cận vào cuối mùa hè này.

Đây mới chỉ là bước khởi đầu. OpenAI khẳng định sẽ liên tục cải tiến để biến ChatGPT Age
 
Bên trên