Thanh Thúy
Well-known member
Vào tháng 4, Meta đã hé lộ về việc họ đang phát triển một mô hình AI nguồn mở đầu tiên trong ngành có hiệu suất sánh ngang với các mô hình độc quyền tốt nhất từ các công ty như OpenAI.
Hôm nay, mô hình đó đã chính thức ra mắt. Meta giới thiệu Llama 3.1, mô hình AI nguồn mở lớn nhất từ trước đến nay, mà công ty khẳng định là vượt trội hơn GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic trên một số điểm chuẩn. Meta cũng đang triển khai trợ lý AI dựa trên Llama, Meta AI, tại nhiều quốc gia và ngôn ngữ hơn, đồng thời bổ sung tính năng tạo hình ảnh dựa trên hình ảnh người dùng. Giám đốc điều hành Mark Zuckerberg dự đoán Meta AI sẽ trở thành trợ lý được sử dụng rộng rãi nhất vào cuối năm nay, vượt qua ChatGPT.
Llama 3.1 phức tạp hơn đáng kể so với các mô hình Llama 3 nhỏ hơn được ra mắt cách đây vài tháng. Phiên bản lớn nhất có 405 tỷ tham số và được huấn luyện với hơn 16.000 GPU H100 siêu đắt đỏ của Nvidia. Meta không tiết lộ chi phí phát triển Llama 3.1, nhưng dựa trên chi phí của riêng chip Nvidia, có thể ước tính con số này lên tới hàng trăm triệu đô la.
Vậy tại sao Meta lại tiếp tục cung cấp miễn phí Llama với giấy phép chỉ yêu cầu sự chấp thuận từ các công ty có hàng trăm triệu người dùng, bất chấp chi phí khổng lồ? Trong một bức thư đăng tải trên blog của công ty, Zuckerberg lập luận rằng các mô hình AI nguồn mở sẽ vượt qua – và hiện đang cải thiện nhanh hơn – các mô hình độc quyền, tương tự như cách Linux trở thành hệ điều hành nguồn mở phổ biến trên hầu hết điện thoại, máy chủ và thiết bị ngày nay.
Ông so sánh khoản đầu tư của Meta vào AI nguồn mở với Dự án Tính toán Mở trước đó của họ, dự án mà ông cho biết đã giúp công ty tiết kiệm "hàng tỷ đô la" bằng cách để các công ty bên ngoài như HP giúp cải thiện và tiêu chuẩn hóa thiết kế trung tâm dữ liệu của Meta khi công ty đang xây dựng năng lực của riêng mình. Nhìn về phía trước, ông kỳ vọng AI sẽ diễn ra theo cách tương tự, "Tôi tin rằng việc phát hành Llama 3.1 sẽ là một bước ngoặt trong ngành, nơi hầu hết các nhà phát triển bắt đầu chủ yếu sử dụng mã nguồn mở."
Để đưa Llama 3.1 đến với thế giới, Meta đang hợp tác với hơn hai chục công ty, bao gồm Microsoft, Amazon, Google, Nvidia và Databricks, để giúp các nhà phát triển triển khai phiên bản của riêng họ. Meta tuyên bố rằng chi phí vận hành Llama 3.1 chỉ bằng khoảng một nửa so với GPT-4o của OpenAI. Công ty đang phát hành các trọng số mô hình để các công ty có thể đào tạo nó trên dữ liệu tùy chỉnh và điều chỉnh theo ý muốn.
Không có gì ngạc nhiên khi Meta không tiết lộ nhiều về dữ liệu được sử dụng để đào tạo Llama 3.1. Những người làm việc tại các công ty AI cho biết họ không tiết lộ thông tin này vì đó là bí mật kinh doanh, trong khi các nhà phê bình cho rằng đó là một chiến thuật trì hoãn làn sóng kiện tụng bản quyền sắp xảy ra.
Điều mà Meta chia sẻ là họ đã sử dụng dữ liệu tổng hợp, tức là dữ liệu được tạo bởi mô hình chứ không phải con người, để phiên bản 405 tỷ tham số của Llama 3.1 cải thiện các phiên bản 70 tỷ và 8 tỷ tham số nhỏ hơn. Ahmad Al-Dahle, Phó chủ tịch AI tạo sinh của Meta, dự đoán rằng Llama 3.1 sẽ được các nhà phát triển ưa chuộng như "một người thầy cho các mô hình nhỏ hơn sau đó được triển khai" theo cách "tiết kiệm chi phí hơn".
Khi được hỏi liệu Meta có đồng ý với quan điểm ngày càng phổ biến rằng ngành công nghiệp đang cạn kiệt dữ liệu đào tạo chất lượng cho các mô hình hay không, Al-Dahle cho rằng giới hạn đang đến, mặc dù nó có thể xa hơn một số người nghĩ. "Chúng tôi chắc chắn nghĩ rằng chúng tôi có thêm một vài lần [đào tạo] nữa," ông nói. "Nhưng rất khó để nói trước."
Lần đầu tiên, nhóm Red Team (hoặc kiểm tra đối kháng) của Meta đối với Llama 3.1 bao gồm việc tìm kiếm các trường hợp sử dụng tiềm ẩn về an ninh mạng và hóa sinh. Một lý do khác để kiểm tra mô hình một cách nghiêm ngặt hơn là những gì Meta mô tả là hành vi "tự chủ" mới nổi.
Ví dụ, Al-Dahle cho biết Llama 3.1 có khả năng tích hợp với API của công cụ tìm kiếm để "trích xuất thông tin từ internet dựa trên truy vấn phức tạp và gọi nhiều công cụ liên tiếp để hoàn thành nhiệm vụ của bạn." Một ví dụ khác mà ông đưa ra là yêu cầu mô hình vẽ biểu đồ số lượng nhà bán được ở Hoa Kỳ trong 5 năm qua. "Nó có thể truy xuất [web] tìm kiếm cho bạn và tạo mã Python và thực thi nó."
Ứng dụng Llama của riêng Meta là trợ lý AI của hãng, được định vị là chatbot đa năng như ChatGPT và có thể được tìm thấy trong hầu hết mọi phần của Instagram, Facebook và WhatsApp. Bắt đầu từ tuần này, Llama 3.1 sẽ được truy cập lần đầu tiên thông qua WhatsApp và trang web Meta AI tại Hoa Kỳ, tiếp theo là Instagram và Facebook trong những tuần tới. Nó đang được cập nhật để hỗ trợ các ngôn ngữ mới, bao gồm tiếng Pháp, tiếng Đức, tiếng Hindi, tiếng Ý và tiếng Tây Ban Nha.
Mặc dù mô hình 405 tỷ tham số tiên tiến nhất của Llama 3.1 được sử dụng miễn phí trong Meta AI, trợ lý sẽ chuyển sang mô hình 70 tỷ được thu nhỏ lại sau khi vượt quá số lượng lời nhắc không xác định trong một tuần nhất định. Điều này cho thấy mô hình 405 tỷ quá đắt để Meta chạy ở quy mô đầy đủ. Người phát ngôn Jon Carvill cho biết công ty sẽ cung cấp thêm thông tin về ngưỡng nhắc sau khi đánh giá mức sử dụng ban đầu.
Tính năng "Imagine Me" mới trong Meta AI quét khuôn mặt của bạn thông qua camera điện thoại của bạn để sau đó cho phép bạn chèn hình ảnh của mình vào hình ảnh mà nó tạo ra. Bằng cách chụp ảnh bạn theo cách này và không thông qua ảnh trong hồ sơ của bạn, Meta hy vọng sẽ tránh được việc tạo ra một cỗ máy deepfake. Công ty nhận thấy nhu cầu của mọi người muốn tạo ra nhiều loại phương tiện AI hơn và chia sẻ chúng lên nguồn cấp dữ liệu của họ, ngay cả khi điều đó có nghĩa là làm mờ ranh giới giữa những gì có thể nhận biết là thật và không có thật.
Meta AI cũng sẽ có mặt trên kính VR Quest trong những tuần tới, thay thế giao diện điều khiển bằng giọng nói của nó. Giống như cách triển khai trên kính Meta Ray-Ban, bạn sẽ có thể sử dụng Meta AI trên Quest để xác định và tìm hiểu về những gì bạn đang xem khi ở chế độ truyền qua của kính, chế độ hiển thị thế giới thực thông qua màn hình.
Ngoài dự đoán của Zuckerberg rằng Meta AI sẽ là chatbot được sử dụng nhiều nhất vào cuối năm nay (ChatGPT có hơn 100 triệu người dùng), Meta vẫn chưa chia sẻ bất kỳ số liệu sử dụng nào cho trợ lý của mình. "Tôi nghĩ rằng toàn bộ ngành công nghiệp vẫn đang trong giai đoạn đầu trên con đường hướng tới sự phù hợp với thị trường sản phẩm," Al-Dahle nói. Ngay cả khi AI đã bị thổi phồng quá mức, rõ ràng là Meta và những cái tên khác tin rằng cuộc đua mới chỉ bắt đầu.
Hôm nay, mô hình đó đã chính thức ra mắt. Meta giới thiệu Llama 3.1, mô hình AI nguồn mở lớn nhất từ trước đến nay, mà công ty khẳng định là vượt trội hơn GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic trên một số điểm chuẩn. Meta cũng đang triển khai trợ lý AI dựa trên Llama, Meta AI, tại nhiều quốc gia và ngôn ngữ hơn, đồng thời bổ sung tính năng tạo hình ảnh dựa trên hình ảnh người dùng. Giám đốc điều hành Mark Zuckerberg dự đoán Meta AI sẽ trở thành trợ lý được sử dụng rộng rãi nhất vào cuối năm nay, vượt qua ChatGPT.
Llama 3.1 phức tạp hơn đáng kể so với các mô hình Llama 3 nhỏ hơn được ra mắt cách đây vài tháng. Phiên bản lớn nhất có 405 tỷ tham số và được huấn luyện với hơn 16.000 GPU H100 siêu đắt đỏ của Nvidia. Meta không tiết lộ chi phí phát triển Llama 3.1, nhưng dựa trên chi phí của riêng chip Nvidia, có thể ước tính con số này lên tới hàng trăm triệu đô la.
Vậy tại sao Meta lại tiếp tục cung cấp miễn phí Llama với giấy phép chỉ yêu cầu sự chấp thuận từ các công ty có hàng trăm triệu người dùng, bất chấp chi phí khổng lồ? Trong một bức thư đăng tải trên blog của công ty, Zuckerberg lập luận rằng các mô hình AI nguồn mở sẽ vượt qua – và hiện đang cải thiện nhanh hơn – các mô hình độc quyền, tương tự như cách Linux trở thành hệ điều hành nguồn mở phổ biến trên hầu hết điện thoại, máy chủ và thiết bị ngày nay.
Ông so sánh khoản đầu tư của Meta vào AI nguồn mở với Dự án Tính toán Mở trước đó của họ, dự án mà ông cho biết đã giúp công ty tiết kiệm "hàng tỷ đô la" bằng cách để các công ty bên ngoài như HP giúp cải thiện và tiêu chuẩn hóa thiết kế trung tâm dữ liệu của Meta khi công ty đang xây dựng năng lực của riêng mình. Nhìn về phía trước, ông kỳ vọng AI sẽ diễn ra theo cách tương tự, "Tôi tin rằng việc phát hành Llama 3.1 sẽ là một bước ngoặt trong ngành, nơi hầu hết các nhà phát triển bắt đầu chủ yếu sử dụng mã nguồn mở."
Để đưa Llama 3.1 đến với thế giới, Meta đang hợp tác với hơn hai chục công ty, bao gồm Microsoft, Amazon, Google, Nvidia và Databricks, để giúp các nhà phát triển triển khai phiên bản của riêng họ. Meta tuyên bố rằng chi phí vận hành Llama 3.1 chỉ bằng khoảng một nửa so với GPT-4o của OpenAI. Công ty đang phát hành các trọng số mô hình để các công ty có thể đào tạo nó trên dữ liệu tùy chỉnh và điều chỉnh theo ý muốn.
Không có gì ngạc nhiên khi Meta không tiết lộ nhiều về dữ liệu được sử dụng để đào tạo Llama 3.1. Những người làm việc tại các công ty AI cho biết họ không tiết lộ thông tin này vì đó là bí mật kinh doanh, trong khi các nhà phê bình cho rằng đó là một chiến thuật trì hoãn làn sóng kiện tụng bản quyền sắp xảy ra.
Điều mà Meta chia sẻ là họ đã sử dụng dữ liệu tổng hợp, tức là dữ liệu được tạo bởi mô hình chứ không phải con người, để phiên bản 405 tỷ tham số của Llama 3.1 cải thiện các phiên bản 70 tỷ và 8 tỷ tham số nhỏ hơn. Ahmad Al-Dahle, Phó chủ tịch AI tạo sinh của Meta, dự đoán rằng Llama 3.1 sẽ được các nhà phát triển ưa chuộng như "một người thầy cho các mô hình nhỏ hơn sau đó được triển khai" theo cách "tiết kiệm chi phí hơn".
Khi được hỏi liệu Meta có đồng ý với quan điểm ngày càng phổ biến rằng ngành công nghiệp đang cạn kiệt dữ liệu đào tạo chất lượng cho các mô hình hay không, Al-Dahle cho rằng giới hạn đang đến, mặc dù nó có thể xa hơn một số người nghĩ. "Chúng tôi chắc chắn nghĩ rằng chúng tôi có thêm một vài lần [đào tạo] nữa," ông nói. "Nhưng rất khó để nói trước."
Lần đầu tiên, nhóm Red Team (hoặc kiểm tra đối kháng) của Meta đối với Llama 3.1 bao gồm việc tìm kiếm các trường hợp sử dụng tiềm ẩn về an ninh mạng và hóa sinh. Một lý do khác để kiểm tra mô hình một cách nghiêm ngặt hơn là những gì Meta mô tả là hành vi "tự chủ" mới nổi.
Ví dụ, Al-Dahle cho biết Llama 3.1 có khả năng tích hợp với API của công cụ tìm kiếm để "trích xuất thông tin từ internet dựa trên truy vấn phức tạp và gọi nhiều công cụ liên tiếp để hoàn thành nhiệm vụ của bạn." Một ví dụ khác mà ông đưa ra là yêu cầu mô hình vẽ biểu đồ số lượng nhà bán được ở Hoa Kỳ trong 5 năm qua. "Nó có thể truy xuất [web] tìm kiếm cho bạn và tạo mã Python và thực thi nó."
Ứng dụng Llama của riêng Meta là trợ lý AI của hãng, được định vị là chatbot đa năng như ChatGPT và có thể được tìm thấy trong hầu hết mọi phần của Instagram, Facebook và WhatsApp. Bắt đầu từ tuần này, Llama 3.1 sẽ được truy cập lần đầu tiên thông qua WhatsApp và trang web Meta AI tại Hoa Kỳ, tiếp theo là Instagram và Facebook trong những tuần tới. Nó đang được cập nhật để hỗ trợ các ngôn ngữ mới, bao gồm tiếng Pháp, tiếng Đức, tiếng Hindi, tiếng Ý và tiếng Tây Ban Nha.
Mặc dù mô hình 405 tỷ tham số tiên tiến nhất của Llama 3.1 được sử dụng miễn phí trong Meta AI, trợ lý sẽ chuyển sang mô hình 70 tỷ được thu nhỏ lại sau khi vượt quá số lượng lời nhắc không xác định trong một tuần nhất định. Điều này cho thấy mô hình 405 tỷ quá đắt để Meta chạy ở quy mô đầy đủ. Người phát ngôn Jon Carvill cho biết công ty sẽ cung cấp thêm thông tin về ngưỡng nhắc sau khi đánh giá mức sử dụng ban đầu.
Tính năng "Imagine Me" mới trong Meta AI quét khuôn mặt của bạn thông qua camera điện thoại của bạn để sau đó cho phép bạn chèn hình ảnh của mình vào hình ảnh mà nó tạo ra. Bằng cách chụp ảnh bạn theo cách này và không thông qua ảnh trong hồ sơ của bạn, Meta hy vọng sẽ tránh được việc tạo ra một cỗ máy deepfake. Công ty nhận thấy nhu cầu của mọi người muốn tạo ra nhiều loại phương tiện AI hơn và chia sẻ chúng lên nguồn cấp dữ liệu của họ, ngay cả khi điều đó có nghĩa là làm mờ ranh giới giữa những gì có thể nhận biết là thật và không có thật.
Meta AI cũng sẽ có mặt trên kính VR Quest trong những tuần tới, thay thế giao diện điều khiển bằng giọng nói của nó. Giống như cách triển khai trên kính Meta Ray-Ban, bạn sẽ có thể sử dụng Meta AI trên Quest để xác định và tìm hiểu về những gì bạn đang xem khi ở chế độ truyền qua của kính, chế độ hiển thị thế giới thực thông qua màn hình.
Ngoài dự đoán của Zuckerberg rằng Meta AI sẽ là chatbot được sử dụng nhiều nhất vào cuối năm nay (ChatGPT có hơn 100 triệu người dùng), Meta vẫn chưa chia sẻ bất kỳ số liệu sử dụng nào cho trợ lý của mình. "Tôi nghĩ rằng toàn bộ ngành công nghiệp vẫn đang trong giai đoạn đầu trên con đường hướng tới sự phù hợp với thị trường sản phẩm," Al-Dahle nói. Ngay cả khi AI đã bị thổi phồng quá mức, rõ ràng là Meta và những cái tên khác tin rằng cuộc đua mới chỉ bắt đầu.