Quang Vũ
Moderator
Nhóm nghiên cứu Audiocraft của Meta vừa phát hành MusicGen, một mô hình ngôn ngữ mã nguồn mở có khả năng học sâu, giúp tạo ra âm nhạc mới dựa trên văn bản hoặc một bài nhạc cụ thể. Chỉ cần mô tả phong cách âm nhạc mà bạn muốn hoặc chèn vào một bài nhạc đã có, sau đó nhấp "Tạo". Sau khoảng 2 đến 3 phút, AI sẽ tạo ra một đoạn nhạc ngắn hoàn toàn mới.
Bản demo trên trang AI Hugging Face của Facebook đã cho phép người dùng thử nghiệm với nhiều thể loại nhạc, hoặc đính kèm một bài nhạc có sẵn với độ dài khoảng 30 giây, kết quả sau vài phút chờ đợi là bản nhạc dài 12 giây chưa từng có.
Audiocraft đã đào tạo AI bằng số nhạc tổng 20.000 giờ, gồm 10.000 bản nhạc chất lượng cao từ dữ liệu nội bộ, cùng với các bản nhạc từ Shutterstock và Pond5. Để làm cho quá trình nhanh hơn, họ đã sử dụng mã thông báo âm thanh EnCodec 32Khz của Meta để tạo ra các phần nhạc nhỏ hơn để có thể được xử lý song song.
Tháng trước, Google đã phát hành một trình tạo nhạc tương tự có tên là MusicLM. Các nhà nghiên cứu đã so sánh MusicGen với MusicLM và hai mô hình khác, Riffusion và Musai, bằng cách cho chạy trên máy tính có cấu hình tương đối cao, với 4 mô hình cùng 4 kích thước, từ nhỏ (300 triệu tham số) đến lớn (3.3 tỷ tham số), mô hình càng lớn thì càng cho phép tạo ra đoạn nhạc phức tạp.