Các nhà khoa học máy tính tại Columbia Engineering đã phát triển một phương pháp biến đổi để phát hiện văn bản do AI tạo ra. Phát hiện của họ hứa hẹn sẽ cách mạng hóa cách chúng ta xác thực nội dung số, giải quyết các mối lo ngại ngày càng tăng xung quanh các mô hình ngôn ngữ lớn (LLM), tính toàn vẹn kỹ thuật số, thông tin sai lệch và độ tin cậy.
Các nhà khoa học máy tính tại Columbia Engineering đã phát triển một phương pháp biến đổi để phát hiện văn bản do AI tạo ra.
Phát hiện của họ hứa hẹn sẽ cách mạng hóa cách chúng ta xác thực nội dung số, giải quyết các mối lo ngại ngày càng tăng xung quanh các mô hình ngôn ngữ lớn (LLM), tính toàn vẹn kỹ thuật số, thông tin sai lệch và độ tin cậy.
GS Junfeng Yang và GS Carl Vondrick giới thiệu cách tiếp cận sáng tạo để xác định văn bản được viết bởi con người hay được tạo bởi AI hoặc LLM như ChatGPT mà không cần quyền truy cập vào hoạt động bên trong của mô hình.
Bài viết, bao gồm mã nguồn mở và bộ dữ liệu, sẽ được trình bày tại Hội nghị Quốc tế về Trình bày Học tập (ICLR) ở Vienna (Áo), từ ngày 7- 11/5/2024.
Phương pháp mới, Raidar, sử dụng mô hình ngôn ngữ để diễn đạt lại hoặc thay đổi một văn bản nhất định và sau đó đo lường số lần chỉnh sửa mà hệ thống thực hiện đối với văn bản đó. Khi Raidar nhận một đoạn văn bản, chẳng hạn như một bài đăng trên mạng xã hội, đánh giá sản phẩm hoặc bài đăng trên blog, sau đó nhắc LLM viết lại nó.
LLM trả lời bằng văn bản viết lại và Raidar so sánh văn bản gốc với văn bản viết lại để đo lường các sửa đổi. Nhiều chỉnh sửa có nghĩa là văn bản có thể được viết bởi con người, trong khi ít sửa đổi hơn có nghĩa là văn bản có thể được tạo bằng máy.
CHIÊU HÂN (nguồn: TechXplore)