“Cha đẻ” ChatGPT ra mắt công cụ phát hiện văn bản tạo ra bởi AI
Mới đây, OpenAI, công ty tạo ra chatbot AI ChatGPT, đã cho ra mắt công cụ AI Text Classifier (Trình phân loại văn bản AI) để xác định đoạn văn bản viết bởi AI hay con người.
Sau nhiều lần úp mở về công cụ này, OpenAI đã chính thức ra mắt công cụ mới phân biệt văn bản do con người hay trí tuệ nhân tạo viết ra với độ chính xác 26%. Công ty cho biết, khi được sử dụng song song với các phương pháp khác, công cụ này có thể hữu ích trong việc giúp ngăn chặn việc lạm dụng trình tạo văn bản AI.
Theo đại diện của OpenAI, công cụ này sẽ giúp phân biệt sự khác nhau giữa nội dung do con người viết ra và nội dung do AI tạo ra. Tuy nhiên, công cụ này nên được dùng như một phương pháp bổ sung cho các phương pháp xác định nguồn văn bản khác thay vì là công cụ ra quyết định chính do còn nhiều hạn chế.
Giống như ChatGPT, AI Text Classifier (Trình phân loại văn bản AI) cũng là một mô hình ngôn ngữ AI có sẵn trên trang web của OpenAI. Công cụ này được huấn luyện bởi các ngôn ngữ từ 34 hệ thống tạo văn bản của 5 công ty, tổ chức, bao gồm cả OpenAI. Những ngôn ngữ này được so sánh với các văn bản do con người viết trên Wikipedia, Reddit hay chính các yêu cầu từ người dùng đã nhập vào hệ thống ChatGPT.
Tuy nhiên, OpenAI cũng lưu ý rằng công cụ này có thể vô tình phân loại sai do “sự phổ biến về nội dung do AI tạo ra trên Internet”. AI Text Classifier cũng có thể hiểu sai văn bản do trẻ em viết hoặc các ngôn ngữ khác ngoài tiếng Anh do bộ dữ liệu chuyển tiếp tiếng Anh chưa cập nhật đầy đủ.
Công ty cho biết, có 9% văn bản được thử nghiệm công cụ này đã nhầm lẫn văn bản người viết thành AI viết.
“Chúng tôi ra mắt sản phẩm này để tiếp nhận phản hồi từ người dùng về việc liệu công cụ này có hữu ích không. Hy vọng chúng tôi có thể đưa ra những cải tiến mới trong tương lai”, đại diện của OpenAI chia sẻ thêm.
Nhiều chuyên gia đã kêu gọi tạo ra những công cụ mang tính kiểm định, phân biệt văn bản do AI tạo ra nhằm giảm thiểu các tác hại tiềm tàng. Một số trường học tại Mỹ đã cấm sử dụng ChatGPT trong hệ thống vì lo ngại tính chính xác của nội dung chatbot này đưa ra cũng như gian lận trong thi cử.
Trước OpenAI đã có các đơn vị khác cũng phát triển công cụ tương tự. Theo TechCrunch, đây giống như một ngành tiểu thủ công nghiệp khi AI ngày càng phát triển. Edward Tian (22 tuổi), sinh viên trường Đại học Princeton đã viết ra GPTZero, ứng dụng phát hiện nội dung văn bản được viết bằng chatbot ChatGPT.
“Có nhiều sự cường điệu và hào hứng xung quanh ChatGPT. Nhưng cũng như bất kỳ công nghệ mới nào, cần áp dụng nó một cách có trách nhiệm”, Tian trả lời SCMP về động lực cho sự ra đời của GPTZero. Ứng dụng này sử dụng nhiều thuật toán để xác định xem đoạn văn có được viết bởi AI hay không. Nếu văn bản quen thuộc và đã có trong cơ sở dữ liệu, hệ thống sẽ xác định nó được tạo bởi AI.
Ngoài ra, Tian cho biết: “Con người có xu hướng viết với nhiều biến thể trong câu, chẳng hạn câu dài, câu ngắn, giọng chủ động bên cạnh câu bị động. Trong khi đó, văn bản do AI viết có xu hướng đồng nhất”.
Bên cạnh đó, Turnitin, công cụ phát hiện đạo văn nổi tiếng cũng đang phát triển công cụ riêng để phát hiện văn bản do AI tạo ra.
TechCrunch cho rằng, khi trí tuệ nhân tạo tạo văn bản càng được cải thiện, thì các trình phát hiện cũng vậy. Điều này giống như vòng lặp không hồi kết giữa tội phạm mạng và các nhà nghiên cứu bảo mật. Và có thể sẽ không có phương án tối ưu nào giải quyết các vấn đề về văn bản do AI tạo ra. Chính OpenAI đã thừa nhận, kết quả có thể hữu ích nhưng không phải là bằng chứng duy nhất khi quyết định liệu một văn bản có phải được tạo bằng AI hay không.