[ ChatGPT thực sự là gì ? Giải thích dễ hiểu cho người không biết IT ]

toringuyen0509

Well-known member

cuhiep

+ Theo dõi
10 giờBình luận: 44

Thông báo
Xem nhanh
Ẩn
Giải thích dễ hiểu:
ChatGPT được tạo nên như thế nào ?
Vậy năm 2017 có gì ?
Rồi bây giờ là tới đoạn bóc phốt OpenAI :))
A.I không thể hiểu được đâu là "Đúng" hay "Sai"
Họ thương mại hóa một con A.I không thể kiểm soát về tính "Đúng - Sai".
Chỉ một thay đổi nhỏ về UI/UX nhưng A.I trở nên dễ giao tiếp hơn nhiều :)))
[ ChatGPT thực sự là gì ? Giải thích dễ hiểu cho người không biết IT ]


[ Tút 01 ]

[ ChatGPT thực sự là gì ? Giải thích dễ hiểu cho người không biết IT ]

(Nội dung dưới đây được viết cho người thường hiểu, nên các kiến thức cao siêu được bình dân hóa nên độ chính xác học thuật không được bảo đảm)

Giải thích dễ hiểu:

Dễ hiểu về phía người dùng bình thường thì nó đơn giản là một trang web để chat nói chuyện được đủ thứ chủ đề với một con bot ảo 😆) rất dễ hiểu hen.

Con bot này do công ty OpenAI được co-found bởi thánh lái Elon Musk từ 2015, ban đầu với một sứ mệnh rất kêu là "ngăn chặn sự nguy hiểm của A.I" (nhớ đoạn này, mình sẽ lôi lên lại để troll sau)
Nhiều năm trước chúng ta cũng rất hào hứng với một con bot chat kiểu như vầy là con gà Simsimi của mấy ông Hàn Quốc làm, đây cũng là một con bot trí thông minh nhân tạo (A.I), nó cũng liên tục học những thứ mà người dùng dạy cho nó nên con bot Simsimi tiếng Việt hiện là con bot chat mắc dại và chửi thề tiếng Việt tốt nhất hiện nay 😃))

Con bot ChatGPT cũng vậy nó đang liên tục được dạy lại bằng nội dung chat mới của người dùng, nên sau 1 tháng mọi người bắt đầu quan tâm ChatGPT bằng tiếng Việt thì nó bắt đầu trả lời bằng tiếng Việt ảo lòi hơn rồi 😃))

Trước ChatGPT chúng ta có 2 con chat bot rất quen thuộc nhưng hầu như chúng ta quên mất chúng vì chúng nói chuyện quá chán là Siri của Apple và Assistant của Google 😃)) tụi này đúng kiểu là chat bot command (hiểu câu lệnh rồi thực hiện) thôi chứ nói chuyện chán lắm, hồi đầu Siri còn nói chuyện khá khá nhưng sau này Apple bỏ quên nên nó dần ngu vcc 😃))

ChatGPT được tạo nên như thế nào ?

(Phần này sẽ nặng thông tin kỹ thuật, nhưng mình thích thì mình viết thôi vì mình đã nhiều năm nghiên cứu, triển khai A.I trong cô đơn và ko có ai để kể cả 😃)))

ChatGPT là một chương trình máy tính trí thông minh nhân tạo. Chuyên môn thì người ta hay gọi là Model A.I tiếng Việt là "mô hình dữ liệu trí thông minh nhân tạo", nhưng thực chất nó vẫn là dữ liệu dạng số chạy trên máy tính nên gọi là chương trình cũng không sai.

Chữ Model A.I gồm 2 phần: Model (Mô hình dữ liệu) và A.I (Trí thông minh nhân tạo - artificial intelligence). chiết tự nghĩa là Trí thông minh đến từ dữ liệu (dịch chuẩn hông 😃))) suy ra là có nhiều dữ liệu thì nó sẽ phát sinh sự thông minh 😃))

Yes, quá trình tạo nên Model A.I là một quá trình gồm những bước: thu thập dữ liệu, chọn lọc dữ liệu, gắn nhãn dữ liệu để huấn luyện, huấn luyện.

Về căn bản thì việc dạy A.I nó dễ lắm, cần tạo 1 tập dữ liệu kiểu kiểu vầy

Câu hỏi: Bạn tên gì ?
Trả lời: Tôi tên ChatGPT
Câu hỏi: Việt Nam là nước nào
Trả lời: là nước phía đông nước Lào
...
Xong dạy cho con A.I nó ghi nhớ cái thông tin này (training), rồi lưu cái não đã ghi nhớ của con A.I lại là thành Model A.I (model checkpoint)

Sau này khi sử dụng thì load cái não với trí nhớ chứa các thông tin trên (inference) vào máy tính, bạn chỉ việc hỏi câu hỏi tương ứng, thì con A.I sẽ nhớ lại kiến thức đã được dạy và trả lời "y chang những gì nó được dạy"

Đấy, căn bản vỡ lòng về A.I là như trên, ai làm A.I cũng biết vụ này vì nó dễ lắm. Cái phương pháp tạo A.I căn bản này đã được nghiên cứu và hình thành từ 1950 lận. Vậy tại sao hơn 70 năm mà bọn A.I vẫn ngu mãi cho tới gần đây và cụ thể là con ChatGPT thì nó mới "khôn ngạc nhiên" vậy ?


Thực ra là hàng chục năm qua A.I bị chuyên biệt hóa vô nhiều công việc cụ thể như A.I hỗ trợ làm máy bay, A.I mô phỏng chiến đấu, A.I trong game... nhưng hầu như không có công ty lớn nào đầu tư cho A.I mảng ngôn ngữ, mãi cho tới 2017 thì mới có một sự đột phá về công nghệ khiến cho việc huấn luyện A.I hiệu quả hơn đột biến, nhất là A.I ngôn ngữ.

Ngôn ngữ cụ thể là chữ viết là thành tựu kiến tạo nên văn minh loài người, loài người chứa kiến thức của mình trong chữ viết, hiểu ngôn ngữ (chữ viết) là hiểu được kiến thức của loài người, đây chính là điểm cốt lõi tạo nên A.I ngôn ngữ, mà trước 2017 con người rất khó khăn để khiến máy tính hiểu được ý nghĩa của một câu có nghĩa.

Vậy năm 2017 có gì ?

Tháng 8 năm 2017 các nhà khoa học tại Google, cụ thể là đơn vị Google Brain, đơn vị nghiên cứu chuyên sâu về A.I của Google từ 2011, đã phát minh ra một thuật toán gọi là Transformer (tên thuật toán rất giống phim robot đấm nhau của anh Mai Cồ Bảy 😃))

Thuật toán Transformer rất đột phá, cụ thể là đột phá về huấn luyện A.I ngôn ngữ. Trước khi có thuật toán này, loài người muốn dạy A.I thì phải làm chuyện tạo tập dữ liệu huấn luyện sẵn theo cặp câu hỏi-trả lời (labeling data) như ở trên đã đề cập, và máy móc thực ra chỉ ghi nhớ cặp câu hỏi-trả lời chứ không "hiểu" được ý nghĩa của câu văn đó, khác nhau rất lớn giữa học vẹt và học hiểu 😃))))

Dễ hiểu hơn nữa là sau năm 2017 chúng ta chỉ việc đổ dữ liệu chữ vào càng nhiều càng tốt, máy tính sẽ tự tìm hiểu cái thứ mình đổ vào nó nghĩa là gì thay vì mình phải chỉ cho chúng nó ý nghĩa.

Trích nguyên văn trong tài liệu công bố về transformer của google: "with transformers, computers can see the same patterns humans see". đoạn này dịch mất hay 😃))

Google rất nhân văn khi công bố tài liệu chi tiết về thuật toán Transformer công khai cho tất cả mọi người truy cập được. Đồng thời cung cấp quyền sử dụng mở (Open-Source) đối với thuật toán này
Đột nhiên toàn bộ giới khoa học làm A.I được hưởng lợi từ phát minh của Google. Trong đó có OpenAI 😃))))) một công ty thành lập năm 2015 và không có thành tựu gì nổi bật cho tới sau 2017 😃)))
Sau khi Google công bố Transformer, thì sau đó vài tháng những con A.I ngôn ngữ đầu tiên dựa trên thuật toán mới này ồ ạt ra đời.

Tháng 1.2018 thì OpenAI cho ra đời con A.I đầu tiên dựa trên Transformer là GPT-1, họ ứng dụng rất nhanh, nhanh hơn cả chính Google luôn 😃)))

GPT viết tắt của Generative Pre-trained Transformer nghĩa là "chương trình Sinh Chữ đã được huấn luyện theo phương pháp Transformer"

Con A.I GPT này được tạo ra với mục đích chính là để "Sinh Chữ". Cụ thể là bạn sẽ chơi trò nối từ với nó 😃) , bạn viết 1 câu, nó sẽ đọc câu đó rồi dựa trên kiến thức nó đang lưu trữ trong bộ nhớ của nó mà "sinh ra chữ" nối tiếp cái câu mà bạn viết.

Ví dụ:
Bạn nhập: Việt Nam là
ChatGPT: Việt Nam là một nước nằm trên đại dương Á Đông, tại khu vực Đông Nam Á...
Đây chính là cái thứ trông có vẻ "vi diệu" của việc: bạn chat 1 câu với ChatGPT và nó nói lại được một câu.

Thực chất không phải là nó đang trả lời bạn mà là nó đang chơi nối từ bằng cách "Sinh Chữ" để nối tiếp ý nghĩa của câu mà bạn nhập vô chat với nó.

GPT-1 chính là đời đầu của ChatGPT. GPT-1 này là một con A.I khá là bé, bé đúng nghĩa về kích thước cũng như độ phức tạp
 
Bên trên