Thanh Thúy
Well-known member
Google vừa phát hành Veo 3.1, một bản cập nhật cho công cụ tạo video sử dụng AI có tên Veo. Phiên bản này tập trung vào công việc giúp người dùng kiểm soát video tốt hơn, đồng thời cải thiện chất lượng hình ảnh và âm thanh. Veo 3.1 được xây dựng trên nền tảng của Veo 3, với video chất lượng nâng cao mục tiêu và tuân thủ lệnh của người dùng tốt hơn.
Cách truy cập và sử dụng Veo 3.1
Để sử dụng Veo 3.1 và các tính năng mới, người dùng có thể truy cập nền tảng của Google. Người dùng thường có thể sử dụng mô hình miễn phí này trong Flow , công cụ làm phim AI của Google và trong ứng dụng Gemini nhưng sẽ có giới hạn về số lượng tạo video cũng như số lượng tín dụng khi tạo trong Flow. Đối với nhà phát triển và doanh nghiệp, Veo 3.1 và Veo 3.1 Fast đang cung cấp thông tin qua Gemini API và Vertex AI. Các nhà phát triển có thể sử dụng các tính năng mới trong Veo Studio (yêu cầu trả phí API Gemini).
Các cải tiến chính của Veo 3.1
Veo 3.1 mang đến những nâng cấp chung nhằm cải thiện chất lượng hình ảnh, âm thanh và độ chân thực của video. Mô hình này có thể tạo ra nhiều dạng âm thanh gốc hơn, từ hội thoại đến các ứng dụng được đồng bộ chính xác. Veo 3.1 cũng giúp người dùng kiểm soát câu chuyện tốt hơn nhờ khả năng hiểu các phong cách làm phim, từ đó tạo ra âm thanh, tiếng ồn môi trường và lời nói phù hợp.
Một trong những khả năng quan trọng khác của Veo 3.1 được hãng công bố là mô phỏng “vật lý trong thế giới thực”. Điều này giúp mô hình tạo ra các video chân thực, tự nhiên và liền mạch, đặc biệt khi xử lý các yếu tố phức tạp như chuyển động, bóng mờ và sáng. Tuy nhiên, khi so sánh với Sora 2, video do Veo 3.1 tạo ra không có quá nhiều điểm cải tiến khác biệt. Các hành động mạnh như nhào lộn hay các hiệu ứng nước vẫn hiện tượng bị sai và sai lệch so với vật lý thực tế.
Lời nhắc: “Một vận động viên có thể du lợi cụ chuyển động đang thực hiện một cú lộn biểu tượng trên chiếc thuyền thăng bằng bóng bẫy, được viết lại theo phong cách điện ảnh với các góc quay sinh động, ánh sáng kịch tính làm nổi bật trang trí của cô, và hoàn toàn giả phía sau được làm mờ tạo chiều sâu.”
Lời nhắc: “Một người đàn ông cơ bắp bắp chân mặc quần đu xanh xanh sáng thực hiện cú nhảy nhảy “cannonball” mục từ tấm ván nhảy trắng sáng bóng, tạo nên màn tung nước để trong tắm nước hồ bơi trong lòng.
Lời nhắc: “Một người đàn ông cơ bắp đang thực hiện cú nhào lộn ngược (lật ngược) trên một ván chèo màu xanh lam rực rỡ, làm tung tóe những ngọn nước xung quanh, dưới bầu trời nắng hấp chang, với những con sóng biển trong vắt ở phía sau — toàn bộ bộ khắc chuyển động được ghi lại với độ phân giải cao, đầy năng lượng và sống động.
Mới chỉnh sửa các tính năng
Trong bản cập nhật này, Veo 3.1 có thêm các công cụ chỉnh sửa và tính năng mới, cho phép người dùng kiểm soát chi tiết hơn đối với sản phẩm cuối cùng. Âm thanh cũng được tích hợp vào các chỉnh sửa tính năng này.
Nhắc: “Người trong ảnh mặc chiếc áo đỏ trong hình và bước vào giữa phòng, tạo phong cách thời trang và nói: “anh em thấy áo này đẹp không, đẹp thì nhớ cổ vũ vũ mờ u đấy””
Flow bị lỗi mất âm thanh
Lời nhắc: “Chuyển cảnh 2 ảnh sao cho mượt mà và liền mạch từ trái qua phải”
Lời nhắc: “Chuyển cảnh 2 ảnh sao cho mượt mà và liền mạch từ trái qua phải”
Nhắc: “thêm nhiều xe máy và ô tô chuy
Nhắc: “thêm trời mưa rào”
Lời nhắc: “xóa người đi bộ trên đường”
Lời nhắc: “bỏ chữ cái có trong hình và cho người mặc áo trắng thơm chiếc điện thoại và nói bằng tiếng Việt: 'Trên tay mình đây là chiếc iPhone 17 Pro Max phiên bản màu cam vũ trụ, vô cùng nổi bật luôn'”
Veo 3.1 là một bản cập nhật tập trung có khả năng trao đổi cho người dùng nhiều quyền kiểm soát hơn thông qua một loạt tính năng chỉnh sửa mới. Tuy nhiên, qua thực tế sử dụng, có thể thấy mô hình này vẫn đang trong giai đoạn phát triển. Trong khi một số tính năng hoạt động khá tốt, nhiều tính năng quan trọng khác vẫn chưa ổn định, có lỗi hoặc cho kết quả không như mong đợi. Người dùng nào cần chờ các bản cập nhật org trong tương lai để Veo 3.1 có thể hoàn thiện hơn và cạnh tranh với Sora 2 của OpenAI .
Cách truy cập và sử dụng Veo 3.1
Để sử dụng Veo 3.1 và các tính năng mới, người dùng có thể truy cập nền tảng của Google. Người dùng thường có thể sử dụng mô hình miễn phí này trong Flow , công cụ làm phim AI của Google và trong ứng dụng Gemini nhưng sẽ có giới hạn về số lượng tạo video cũng như số lượng tín dụng khi tạo trong Flow. Đối với nhà phát triển và doanh nghiệp, Veo 3.1 và Veo 3.1 Fast đang cung cấp thông tin qua Gemini API và Vertex AI. Các nhà phát triển có thể sử dụng các tính năng mới trong Veo Studio (yêu cầu trả phí API Gemini).
Các cải tiến chính của Veo 3.1
Veo 3.1 mang đến những nâng cấp chung nhằm cải thiện chất lượng hình ảnh, âm thanh và độ chân thực của video. Mô hình này có thể tạo ra nhiều dạng âm thanh gốc hơn, từ hội thoại đến các ứng dụng được đồng bộ chính xác. Veo 3.1 cũng giúp người dùng kiểm soát câu chuyện tốt hơn nhờ khả năng hiểu các phong cách làm phim, từ đó tạo ra âm thanh, tiếng ồn môi trường và lời nói phù hợp.
Một trong những khả năng quan trọng khác của Veo 3.1 được hãng công bố là mô phỏng “vật lý trong thế giới thực”. Điều này giúp mô hình tạo ra các video chân thực, tự nhiên và liền mạch, đặc biệt khi xử lý các yếu tố phức tạp như chuyển động, bóng mờ và sáng. Tuy nhiên, khi so sánh với Sora 2, video do Veo 3.1 tạo ra không có quá nhiều điểm cải tiến khác biệt. Các hành động mạnh như nhào lộn hay các hiệu ứng nước vẫn hiện tượng bị sai và sai lệch so với vật lý thực tế.
Lời nhắc: “Một vận động viên có thể du lợi cụ chuyển động đang thực hiện một cú lộn biểu tượng trên chiếc thuyền thăng bằng bóng bẫy, được viết lại theo phong cách điện ảnh với các góc quay sinh động, ánh sáng kịch tính làm nổi bật trang trí của cô, và hoàn toàn giả phía sau được làm mờ tạo chiều sâu.”
Lời nhắc: “Một người đàn ông cơ bắp bắp chân mặc quần đu xanh xanh sáng thực hiện cú nhảy nhảy “cannonball” mục từ tấm ván nhảy trắng sáng bóng, tạo nên màn tung nước để trong tắm nước hồ bơi trong lòng.
Lời nhắc: “Một người đàn ông cơ bắp đang thực hiện cú nhào lộn ngược (lật ngược) trên một ván chèo màu xanh lam rực rỡ, làm tung tóe những ngọn nước xung quanh, dưới bầu trời nắng hấp chang, với những con sóng biển trong vắt ở phía sau — toàn bộ bộ khắc chuyển động được ghi lại với độ phân giải cao, đầy năng lượng và sống động.
Mới chỉnh sửa các tính năng
Trong bản cập nhật này, Veo 3.1 có thêm các công cụ chỉnh sửa và tính năng mới, cho phép người dùng kiểm soát chi tiết hơn đối với sản phẩm cuối cùng. Âm thanh cũng được tích hợp vào các chỉnh sửa tính năng này.
- Tạo video từ các thành phần: Tính năng này cho phép người dùng sử dụng tối đa 3 hình ảnh tham chiếu để kiểm soát Kiểm soát các yếu tố như nhân vật, đối tượng hoặc phong cách. Điều này hữu ích để duy trì mức độ tối đa của nhân vật hoặc áp dụng một cách cụ thể cho cả video. Khi thử nghiệm, video tạo ra đã kết hợp đầy đủ các thành phần và đạt được yêu cầu, tuy nhiên video được tạo bởi Flow đang bị lỗi mất âm thanh. Ngoài ra, phần mã hóa chỉ dừng ở mức tạm dừng, không thực sự giống với khuôn mặt trong ảnh gốc,.
Nhắc: “Người trong ảnh mặc chiếc áo đỏ trong hình và bước vào giữa phòng, tạo phong cách thời trang và nói: “anh em thấy áo này đẹp không, đẹp thì nhớ cổ vũ vũ mờ u đấy””

- Tạo video từ khung hình đầu và cuối: Với tính năng này, người dùng có thể cung cấp một hình ảnh bắt đầu và một hình ảnh kết thúc, mô hình sẽ tự động tạo ra một video chuyển động mượt mà để kết nối lại hai hình ảnh đó. Mình đã thử 2 ví dụ và nhận thấy khả năng chuyển cảnh của Veo 3.1 rất ấn tượng. Hai bức ảnh đầu và cuối cùng được nối lại liền mạch, tạo cảm giác giác như một video được quay 'one shot'.
Lời nhắc: “Chuyển cảnh 2 ảnh sao cho mượt mà và liền mạch từ trái qua phải”
Lời nhắc: “Chuyển cảnh 2 ảnh sao cho mượt mà và liền mạch từ trái qua phải”
- Chèn thêm yếu tố mới vào video: Với tính năng này, người dùng có thể thêm bất kỳ đối tượng nào vào một cảnh quay có sẵn. AI sẽ tự động xử lý các chi tiết như mờ, sáng để vật thể có thể được thêm vào tự nhiên hơn. Với những yêu cầu như thêm phương tiện giao thông và thêm mưa vào khung cảnh, video tạo ra khá đạt được yêu cầu và nhìn khá chân thực, dù vẫn còn một vài lỗi nhỏ nhưng có thể chấp nhận được. Lưu ý rằng tính năng này chưa được hỗ trợ trong API Gemini.
Nhắc: “thêm nhiều xe máy và ô tô chuy
Nhắc: “thêm trời mưa rào”
- Xóa đối tượng/vật thể không mong muốn: Đây là tính năng sắp xếp mắt, cho phép người dùng xóa những đối tượng không muốn rời khỏi cảnh quay. AI sẽ tự động tái tạo nền và môi trường xung quanh. Khi thử nghiệm các lệnh như xóa người chuyển trên đường hoặc xóa chữ trên hình, Veo 3.1 mới chỉ từ đối tượng được đưa ra khỏi khung hình chứ không xóa hoàn toàn ngay từ đầu. Ngoài ra, khuôn mặt người trong hình cũng có dạng biến đổi và thay đổi liên tục, chưa thực sự được giữ vững tính chất quán như công ty đã công bố.
Lời nhắc: “xóa người đi bộ trên đường”
Lời nhắc: “bỏ chữ cái có trong hình và cho người mặc áo trắng thơm chiếc điện thoại và nói bằng tiếng Việt: 'Trên tay mình đây là chiếc iPhone 17 Pro Max phiên bản màu cam vũ trụ, vô cùng nổi bật luôn'”
Veo 3.1 là một bản cập nhật tập trung có khả năng trao đổi cho người dùng nhiều quyền kiểm soát hơn thông qua một loạt tính năng chỉnh sửa mới. Tuy nhiên, qua thực tế sử dụng, có thể thấy mô hình này vẫn đang trong giai đoạn phát triển. Trong khi một số tính năng hoạt động khá tốt, nhiều tính năng quan trọng khác vẫn chưa ổn định, có lỗi hoặc cho kết quả không như mong đợi. Người dùng nào cần chờ các bản cập nhật org trong tương lai để Veo 3.1 có thể hoàn thiện hơn và cạnh tranh với Sora 2 của OpenAI .