đinhlinh11
Bé Tleoo
Hiện tại, Sherwood cho biết anh đôi khi sử dụng một ứng dụng có tên Be My Eyes – một ứng dụng giúp kết nối những người khiếm thị với những tình nguyện viên sáng mắt để trợ giúp, thông qua video trực tiếp, với những việc như kiểm tra xem chiếc áo sơ mi có phù hợp với phần còn lại của trang phục hay không hoặc một hộp sữa đã hết hạn hay chưa. Tuy nhiên, những tiến bộ trong công nghệ AI đã bắt đầu loại bỏ nhu cầu cần những người trợ giúp tình nguyện như vậy ở đầu bên kia.
Be My Eyes đã hợp tác với OpenAI vào năm ngoái để cho phép mô hình AI của họ, chứ không phải một người khác, nhìn thấy và mô tả những gì diễn ra trước mặt người dùng. Trong bản demo sản phẩm mới nhất của OpenAI, công ty đã chiếu đoạn clip quay cảnh một người sử dụng phiên bản Be My Eyes được hỗ trợ bởi AI để gọi taxi – ứng dụng này cho người dùng biết chính xác thời điểm nên giơ tay lên gọi xe. Google vào tháng 5 đã công bố một tính năng tương tự cho ứng dụng “Lookout”, được thiết kế để hỗ trợ người dùng khiếm thị.
Các ứng dụng dành cho người mù chỉ là một lĩnh vực mà AI đang giúp nâng cao cái được gọi là “công nghệ hỗ trợ” - các công cụ được thiết kế để giúp đỡ những người khuyết tật hoặc người già.
Apple, Google và các công ty công nghệ khác đã tung ra một loạt các công cụ hỗ trợ AI để giúp cuộc sống của những người gặp nhiều trở ngại trở nên dễ dàng hơn, từ các công cụ theo dõi bằng mắt cho phép người dùng khuyết tật điều khiển iPhone của họ bằng mắt cho đến hướng dẫn chi tiết bằng giọng nói dành cho người mù dùng Google Maps.
Kể từ sự ra mắt ấn tượng của ChatGPT hơn một năm trước, rõ ràng AI sẽ thay đổi thế giới của chúng ta bằng cách cải tiến cách chúng ta làm việc, cách chúng ta giao tiếp và thậm chí cả những gì chúng ta coi là thực tế. Nhưng đối với người khuyết tật, AI cũng có tiềm năng thay đổi cuộc sống của họ theo một cách hoàn toàn khác.
Sherwood nói: “Trước đây, nếu bạn kinh doanh và bị mù, bạn phải có một trợ lý hành chính đọc cho bạn. Nhưng bây giờ, bạn có sức mạnh mới này… Đối với một số người, đây là công nghệ tuyệt vời. Đối với người mù, đây là cơ hội để có được việc làm và cơ hội cạnh tranh trong kinh doanh, cơ hội để thành công.”
Các công ty công nghệ đã và đang sử dụng các dạng AI ban đầu để làm cho sản phẩm của họ dễ tiếp cận hơn. Nhưng các chuyên gia nói rằng bộ dữ liệu khổng lồ và hệ thống máy tính mạnh mẽ đằng sau các mô hình AI gần đây đang đẩy nhanh những gì có thể làm được trong không gian công nghệ hỗ trợ. Ví dụ: để một công cụ AI có thể giúp người mù gọi taxi một cách đáng tin cậy, nó cần phải có khả năng nhận biết rất tốt một chiếc taxi trông như thế nào hoặc không trông như thế nào, điều này đòi hỏi phải đào tạo mô hình trên một lượng lớn các ví dụ.
Một ví dụ khác: một công cụ của Google thông báo cho người dùng khiếm thị hoặc thị lực kém về nội dung trên màn hình của họ, đã được nâng cấp với tính năng “câu hỏi và trả lời” kết hợp với công nghệ AI tạo sinh của công ty.
“Triển vọng của AI là rõ ràng trong nhiều năm qua nhưng nó phải đạt đến mức chất lượng này trước khi nó có thể trở thành thứ khả thi mà bạn đưa vào sản phẩm,” Eve Andersson, Giám đốc cấp cao của Google phụ trách về tính toàn diện, tính công bằng và khả năng tiếp cận sản phẩm, đã cho biết như vậy.
Các công cụ AI tạo sinh mới đặc biệt hứa hẹn cho các ứng dụng trợ năng vì chúng được thiết kế để hiểu và tạo ra thông tin ở nhiều định dạng khác nhau, bao gồm văn bản, âm thanh, ảnh và video. Điều đó có nghĩa là nếu một người cần sử dụng thông tin trong một phương tiện nhất định, AI có thể đóng vai trò trung gian; ví dụ: chuyển một đoạn âm thanh thành văn bản viết cho người dùng khiếm thính.
Be My Eyes đã hợp tác với OpenAI vào năm ngoái để cho phép mô hình AI của họ, chứ không phải một người khác, nhìn thấy và mô tả những gì diễn ra trước mặt người dùng. Trong bản demo sản phẩm mới nhất của OpenAI, công ty đã chiếu đoạn clip quay cảnh một người sử dụng phiên bản Be My Eyes được hỗ trợ bởi AI để gọi taxi – ứng dụng này cho người dùng biết chính xác thời điểm nên giơ tay lên gọi xe. Google vào tháng 5 đã công bố một tính năng tương tự cho ứng dụng “Lookout”, được thiết kế để hỗ trợ người dùng khiếm thị.
Các ứng dụng dành cho người mù chỉ là một lĩnh vực mà AI đang giúp nâng cao cái được gọi là “công nghệ hỗ trợ” - các công cụ được thiết kế để giúp đỡ những người khuyết tật hoặc người già.
Apple, Google và các công ty công nghệ khác đã tung ra một loạt các công cụ hỗ trợ AI để giúp cuộc sống của những người gặp nhiều trở ngại trở nên dễ dàng hơn, từ các công cụ theo dõi bằng mắt cho phép người dùng khuyết tật điều khiển iPhone của họ bằng mắt cho đến hướng dẫn chi tiết bằng giọng nói dành cho người mù dùng Google Maps.
Kể từ sự ra mắt ấn tượng của ChatGPT hơn một năm trước, rõ ràng AI sẽ thay đổi thế giới của chúng ta bằng cách cải tiến cách chúng ta làm việc, cách chúng ta giao tiếp và thậm chí cả những gì chúng ta coi là thực tế. Nhưng đối với người khuyết tật, AI cũng có tiềm năng thay đổi cuộc sống của họ theo một cách hoàn toàn khác.
Sherwood nói: “Trước đây, nếu bạn kinh doanh và bị mù, bạn phải có một trợ lý hành chính đọc cho bạn. Nhưng bây giờ, bạn có sức mạnh mới này… Đối với một số người, đây là công nghệ tuyệt vời. Đối với người mù, đây là cơ hội để có được việc làm và cơ hội cạnh tranh trong kinh doanh, cơ hội để thành công.”
Các công ty công nghệ đã và đang sử dụng các dạng AI ban đầu để làm cho sản phẩm của họ dễ tiếp cận hơn. Nhưng các chuyên gia nói rằng bộ dữ liệu khổng lồ và hệ thống máy tính mạnh mẽ đằng sau các mô hình AI gần đây đang đẩy nhanh những gì có thể làm được trong không gian công nghệ hỗ trợ. Ví dụ: để một công cụ AI có thể giúp người mù gọi taxi một cách đáng tin cậy, nó cần phải có khả năng nhận biết rất tốt một chiếc taxi trông như thế nào hoặc không trông như thế nào, điều này đòi hỏi phải đào tạo mô hình trên một lượng lớn các ví dụ.
Một ví dụ khác: một công cụ của Google thông báo cho người dùng khiếm thị hoặc thị lực kém về nội dung trên màn hình của họ, đã được nâng cấp với tính năng “câu hỏi và trả lời” kết hợp với công nghệ AI tạo sinh của công ty.
“Triển vọng của AI là rõ ràng trong nhiều năm qua nhưng nó phải đạt đến mức chất lượng này trước khi nó có thể trở thành thứ khả thi mà bạn đưa vào sản phẩm,” Eve Andersson, Giám đốc cấp cao của Google phụ trách về tính toàn diện, tính công bằng và khả năng tiếp cận sản phẩm, đã cho biết như vậy.
Các công cụ AI tạo sinh mới đặc biệt hứa hẹn cho các ứng dụng trợ năng vì chúng được thiết kế để hiểu và tạo ra thông tin ở nhiều định dạng khác nhau, bao gồm văn bản, âm thanh, ảnh và video. Điều đó có nghĩa là nếu một người cần sử dụng thông tin trong một phương tiện nhất định, AI có thể đóng vai trò trung gian; ví dụ: chuyển một đoạn âm thanh thành văn bản viết cho người dùng khiếm thính.