Phần mềm AI mới giúp tạo video như thật chỉ bằng đoạn văn mô tả

VTTH.

Well-known member
OpenAI giới thiệu mô hình AI mới có tên Sora có thể giúp tạo ra các video dài 60 giây đậm chất thực tế và giàu trí tưởng tượng từ lời nhắc văn bản.
OpenAI, công ty sở hữu ChatGPT, đang đưa công nghệtrí tuệ nhân tạo của mình vào hạng mục video. Công ty này vừa giới thiệu Sora, mô hình AI thế hệ mới của mình. Sora hoạt động tương tự như công cụ AI tạo hình ảnh đặc thù của OpenAI đã có trước đó - DALL-E.
Người dùng nhập lời nhắc mô tả theo mong muốn và phần mềm Sora sẽ trả về một video clip có độ phân giải cao, với khả năng cung cấp các cảnh có nhiều nhân vật, các loại chuyển động cụ thể và chi tiết liên quan mạnh mẽ đến lời nhắc đầu vào.
Bài đăng trên blog của công ty nêu rõ: “Mô hình AI này không chỉ hiểu những gì người dùng yêu cầu trong lời nhắc, mà còn hiểu những thứ đó tồn tại như thế nào trong thế giới vật chất”.
Mô hình mới được gọi là Sora, cho phép người dùng biến lời nhắc mô tả theo mong muốn thành video clip có độ phân giải cao. (Ảnh: Trích từ Video mẫu của OpenAI)

Mô hình mới được gọi là Sora, cho phép người dùng biến lời nhắc mô tả theo mong muốn thành video clip có độ phân giải cao. (Ảnh: Trích từ Video mẫu của OpenAI)

Với Sora, OpenAI đang tìm cách cạnh tranh với các công cụ AI tạo video từ các công ty như Meta và Google. Các công cụ AI tương tự cũng có sẵn từ các công ty khởi nghiệp khác, chẳng hạn như Stability AI, có sản phẩm tên là Stable Video Diffusion. Amazon cũng đã phát hành Create with Alexa, một mô hình chuyên tạo nội dung hoạt hình dạng ngắn dành cho trẻ em dựa trên lời nhắc.
Hiện tại, phần mềm Sora bị giới hạn trong việc chỉ tạo các video dài một phút hoặc ít hơn. Cho đến nay, Sora chỉ được cung cấp cho một nhóm nhỏ chuyên kiểm tra mô hình để tìm các lỗ hổng. Công ty chưa phát hành bất kỳ bản trình diễn công khai nào, ngoài 10 clip mẫu giới thiệu có sẵn trên trang web của mình.
Theo Reece Hayden, nhà phân tích cấp cao của công ty nghiên cứu thị trường ABI Research, loại mô hình AI này có thể có tác động lớn đến thị trường giải trí kỹ thuật số. Trước mắt, mô hình này vẫn còn nhiều hạn chế, nhưng nó cho thấy hướng đi của thị trường trong tương lai.
Các chuyên gia nhận định, video có thể là biên giới tiếp theo cho AI tạo sinh, khi các chatbot và trình tạo hình ảnh đã xâm nhập vào thế giới tiêu dùng và kinh doanh. Mặc dù các cơ hội sáng tạo sẽ kích thích những người đam mê AI, nhưng các công nghệ mới như thế này cũng sẽ gây ra mối lo ngại nghiêm trọng về thông tin sai lệch, khi các cuộc bầu cử chính trị lớn đang đến gần trên toàn cầu. Theo dữ liệu từ Clarity, một công ty máy học, vào năm 2023, số lượng video, ảnh deepfake do AI tạo ra đã tăng 900% so với năm trước đó.
 
Bên trên