Chiếc hộp đen bí ẩn của TikTok

Minh Thư

Well-known member
Số liệu của Statista cho thấy mỗi phút có hơn 500 giờ video được tải lên YouTube, 167 triệu giờ video được xem trên TikTok và 44 triệu giờ xem livestream trên Facebook. Trước lượng nội dung khổng lồ, các mạng xã hội lớn đối diện bài toán khó trong việc kiểm duyệt và loại bỏ nội dung độc hại.

Thuật toán phân phối của TikTok được coi là bí mật giúp nền tảng này "gây nghiện" cho người dùng. Cũng chính sự bí ẩn khiến cho những nhà quản lý gặp khó khi muốn hạn chế những nội dung độc hại dưới dạng video ngắn.

"TikTok được tải xuống và cài đặt dưới dạng ứng dụng trên smartphone. Như vậy nội dung được truy cập trực tiếp từ máy chủ TikTok bằng thiết bị của người dùng. Điều này đồng nghĩa cơ quan quản lý khó có thể theo dõi, lọc và kiểm duyệt nội dung do giao thức HTTPS và thuật toán bảo mật SHA-256 (thuật toán băm bảo mật 256-bit) được áp dụng", Tiến sĩ Sam Gounder, giảng viên cấp cao ngành Công nghệ thông tin, khoa Khoa học, Kỹ thuật & Công nghệ, Đại học RMIT Việt Nam, nhận định.

Khó kiểm duyệt video hiệu quả
Dù tăng cường hệ thống quản lý, những vấn đề mà TikTok đang gặp cho thấy biện pháp kiểm duyệt nội dung trên nền tảng chưa thể đáp ứng số lượng video quá lớn. Ngoài ra, thuật toán phân phối nội dung gây nghiện trên TikTok cũng là câu hỏi lớn của chính phủ các nước.

Theo báo cáo thực thi tiêu chuẩn cộng đồng quý IV/2022 được TikTok công bố ngày 31/3, hơn 1,7 triệu video đã bị xóa, với tỷ lệ xóa chủ động chiếm 94,9%. Các biện pháp của TikTok gồm thuật toán tự động, nhân viên kiểm duyệt và đánh giá báo cáo từ cộng đồng.

Theo Cục PTTH&TTĐT, các biện pháp kỹ thuật để kiểm soát, rà quét nội dung xấu độc khó áp dụng trên nền tảng video như TikTok. Thuật toán được coi như cách "lách" công cụ rà quét, khiến việc xử lý lâu hơn.

TS Sam Goundar cho biết nhiều mạng xã hội đang áp dụng trí tuệ nhân tạo (AI), máy học và khoa học dữ liệu để tự động hóa khâu kiểm duyệt nội dung.

Tuy nhiên, hiệu quả khi áp dụng thuật toán cho nội dung đa phương tiện (như video) là vấn đề chung của nhiều nền tảng. Đó là lý do những công ty tuyển dụng rất nhiều người thanh lọc video. Dù vậy, tốc độ kiểm duyệt của con người không thể bắt kịp sự xuất hiện nhanh chóng của các nội dung mới.

"Chi phí sẽ rất cao nếu phải tuyển hàng nghìn, thậm chí hàng triệu người để kiểm duyệt nội dung. Do đó, chúng ta cần trông cậy và tin tưởng vào công nghệ", ông Goundar cho biết.


Theo nhận định của chuyên gia, AI, máy học, mạng neuron sâu và khoa học dữ liệu có thể được đào tạo để phát hiện nội dung gây hại trong video. Những chi tiết liên quan đến nội dung độc hại được trích xuất để đào tạo mô hình máy học, giúp chúng nhận biết khi phân tích các video tiếp theo.

"Mô hình xử lý ngôn ngữ tự nhiên có thể được sử dụng để phân loại video dựa trên sự hiện diện của phát ngôn thù hận hay âm thanh có hại. Ngoài ra, chúng ta có thể sử dụng mô hình thị giác máy tính để phát hiện hình ảnh thể hiện hành vi bạo lực, tự ngược đãi bản thân hay các video có hại khác", ông Goundar nói thêm.

Tuy công nghệ có thể giúp ích, tiến sĩ cho rằng vẫn cần kết hợp đánh giá thủ công từ nhân viên kiểm duyệt, tham vấn chuyên gia tâm lý, đọc báo cáo từ người dùng và tham khảo hệ thống xếp hạng nội dung.

Yếu tố tác động thuật toán của TikTok
Bên cạnh hiệu quả kiểm duyệt video, chuyên gia và chính phủ các nước còn đặt câu hỏi về thuật toán phân phối nội dung của TikTok. Ngay tại Việt Nam, việc sử dụng thuật toán tạo xu hướng bất chấp nội dung độc hại, phản cảm là một trong những sai phạm của nền tảng.

Theo TS Sam Goundar, thuật toán phân phối nội dung trên TikTok độc quyền và không được công khai. Dựa trên thông tin được chia sẻ bởi TikTok và các chuyên gia trong ngành, có một số yếu tố chung ảnh hưởng đến thuật toán phân phối nội dung của TikTok.

Các yếu tố gồm mức độ tương tác của người dùng (lượt thích, chia sẻ, nhận xét và theo dõi), thông tin video (phụ đề, âm thanh, hashtag), cài đặt của người dùng (vị trí, ngôn ngữ), tỷ lệ xem hết video và thời gian đăng tải. Song, thuật toán phân phối nội dung của TikTok liên tục phát triển và thay đổi dựa trên hành vi, phản hồi của người dùng.

“Hầu hết mạng xã hội khác cũng sử dụng thuật toán tương tự nhằm tiếp cận lượng người xem tối đa và gia tăng quảng cáo, bởi quảng cáo là cách kiếm tiền của các nền tảng này”, ông Goundar nói thêm.

Các chỉ trích liên quan đến thuật toán của TikTok chủ yếu liên quan đến tính minh bạch và công bằng. Ví dụ, việc thiếu minh bạch đến từ thuật toán độc quyền và không công khai, chưa công bằng do một số nội dung được đề xuất có nội dung thiên kiến.

Ngoài ra, thuật toán trên TikTok còn có “bong bóng lọc” (filter bubble), khiến nội dung được đề xuất phù hợp với sở thích và quan điểm tín ngưỡng của người dùng, dẫn đến sự thiếu đa dạng về quan điểm.

“Có trường hợp thuật toán TikTok thậm chí đẩy cao nội dung độc hại hoặc không phù hợp, chẳng hạn như video quảng bá chứng rối loạn ăn uống hoặc tự ngược đãi bản thân. Điều này làm dấy lên lo ngại về tính hiệu quả của thuật toán trong việc xác định và xóa nội dung độc hại.

TikTok đã có động thái giải quyết những vấn đề này, nhưng vẫn còn nhiều việc phải làm để đảm bảo thuật toán công bằng và hiệu quả trong việc thúc đẩy môi trường an toàn, thân thiện”, ông Goundar nhận định.
 
Bên trên