Đối mặt với sự xuất hiện ồ ạt của nội dung AI, các tình nguyện viên của Wikipedia phải xem xét lại cách duy trì sự uy tín cho trang web bách khoa toàn thư này.

Cảnh giác trước những dấu hiệu của AI

Wikipedia vốn được duy trì bởi một cộng đồng toàn cầu, hợp tác tự nguyện giữa những người đóng góp và biên tập viên. Với sự gia tăng của các công cụ hỗ trợ viết bằng AI, cộng đồng tình nguyện viên và biên tập viên của Wikipedia phải đối mặt với một lượng lớn nội dung “rác” do AI tạo ra – những nội dung chứa thông tin sai lệch và trích dẫn giả mạo, còn được gọi mỉa mai là “AI slop” (rác AI).

Hiện tại, các tình nguyện viên của trang web đã khẩn trương hành động để chống lại lượng lớn nội dung AI kém chất lượng này. Và Giám đốc Sản phẩm của Wikimedia Foundation, ông Marshall Miller, ví hành động này như một phản ứng của “hệ miễn dịch”.

Họ nâng cao cảnh giác để đảm bảo nội dung giữ được tính trung lập và đáng tin cậy”, Miller nói, “Khi Internet thay đổi và khi những thứ như AI xuất hiện, hệ miễn dịch của chúng tôi phải thích nghi với một thách thức mới và tìm cách xử lý nó”.

Cộng đồng Wikipedia đang khẩn trương hành động để chống lại lượng lớn nội dung AI kém chất lượng. Nguồn: SWAPD

Một trong những cách mà cộng đồng bách khoa toàn thư trực tuyến này đang áp dụng là xoá nhanh các bài viết viết lôm côm mà không cần thông qua quy trình thảo luận.

Thông thường, các bài viết bị đánh dấu loại bỏ trên Wikipedia sẽ trải qua một kỳ thảo luận 7 ngày, trong đó các thành viên cộng đồng sẽ cùng nhau quyết định xem có nên xoá bài viết đó hay không. Quy định mới cho phép quản trị viên Wikipedia bỏ qua quá trình thảo luận này nếu một bài viết có những dấu hiệu AI quá rõ ràng.

Về cơ bản, họ sẽ dựa trên ba dấu hiệu chính:

  1. Cách viết hướng trực tiếp đến người dùng, như “Đây là bài viết Wikipedia dành cho bạn…” hoặc “Mình hy vọng điều này có ích!”.
  2. Các trích dẫn vô nghĩa, bao gồm những trích dẫn sai lệch về tác giả hoặc ấn phẩm.
  3. Các nguồn không tồn tại, như: liên kết chết, ISBN với mã kiểm tra không hợp lệ, hoặc DOI không thể giải quyết.

Các tiêu chí để xoá nhanh một bài viết của Wikipedia. Nguồn: Wikipedia

Chính sách xoá nhanh không chỉ áp dụng cho nội dung “rác AI” mà còn cho phép xoá nhanh các trang có nội dung quấy rối, chứa trò lừa bịp hoặc phá hoại, hay thể hiện văn bản vô nghĩa hoặc thất thường, cùng những trường hợp khác.

Một biên tập viên của Wikipedia, người ủng hộ quy định này, chia sẻ rằng họ từng “liên tục ngập trong những bản thảo kinh khủng”. Do đó, việc xoá nhanh “rất hữu ích và tiết kiệm vô số thời gian khỏi việc nhặt nhạnh lại đống rác do AI để lại”. Một người khác cho biết “những lời nói dối và trích dẫn giả” trong sản phẩm AI từng khiến các biên tập viên dày dặn kinh nghiệm phải tốn hàng giờ đồng hồ chỉ để “dọn dẹp”.

Một đoạn hướng dẫn, bàn về ngôn từ mang tính quảng cáo của AI, liệt kê rõ các cụm từ mà cộng đồng Wikipedia cần chú ý. Nguồn: Wikipedia

Ba dấu hiệu nêu trên không phải là những dấu hiệu duy nhất mà các biên tập viên AI của Wikipedia theo dõi. Trong khuôn khổ dự án “WikiProject AI Cleanup”, nhằm giải quyết “vấn đề ngày càng tăng về nội dung không có nguồn, chất lượng kém do AI tạo ra”, các biên tập viên đã lập ra một trang hướng dẫn, tổng hợp các cụm từ và đặc điểm định dạng thường xuất hiện trong các bài do AI viết.

Danh sách này chỉ ra việc lạm dụng dấu gạch ngang dài (“—”), kèm theo việc sử dụng quá nhiều liên từ như “hơn nữa”, hoặc dùng ngôn từ mang tính quảng cáo như mô tả điều gì đó là “tuyệt đẹp”. Bên cạnh đó là những vấn đề định dạng khác mà biên tập viên cần chú ý, chẳng hạn như dấu nháy kép và dấu nháy đơn kiểu cong thay vì kiểu thẳng(*).

Tuy vậy, trang hướng dẫn xoá nhanh của Wikipedia cũng lưu ý những đặc điểm này “không nên là cơ sở duy nhất” để quyết định rằng một đoạn văn được viết bởi AI và cần bị xoá.

(*) Trong hầu hết các bài viết của Wikipedia, biên tập viên thường dùng dấu nháy thẳng (" ", '), thay vì dấu nháy cong (“ ”, ’) để đảm bảo tính thống nhất về định dạng và để dễ xử lý dữ liệu. Nhiều công cụ AI mặc định tạo dấu nháy cong, nên khi thấy bài viết dùng loại dấu này, biên tập viên Wikipedia sẽ nghi ngờ bài đó có thể được tạo ra hoặc xử lý qua AI.

Hướng đi của Wikipedia trong thời đại AI

Wikimedia Foundation là tổ chức chủ quản của trang bách khoa toàn thư Wikipedia nhưng không trực tiếp quyết định chính sách nội dung. Trước đây, họ từng bất đồng quan điểm với cộng đồng tình nguyện viên về việc sử dụng AI .

Mâu thuẫn cao trào nhất là vào tháng 6 vừa qua, Wikimedia Foundation đã phải tạm dừng thử nghiệm tính năng hiển thị bản tóm tắt do AI tạo ra trên đầu mỗi bài viết, do cộng đồng tình nguyện viên phản đối quá dữ dội.

Tính năng hiển thị bản tóm tắt do AI tạo ra trên đầu mỗi bài viết bị cộng đồng tình nguyện viên Wikipedia phản đối. Nguồn: Engadget

Nhìn chung, Wikimedia Foundation không phản đối việc sử dụng AI, miễn kết quả sau cùng mà họ có được là nội dung chính xác và chất lượng cao. “Nó giống như con dao hai lưỡi”, Miller nói, “AI giúp người ta dễ dàng tạo ra hàng loạt nội dung chất lượng thấp, nhưng cũng có thể trở thành một công cụ hỗ trợ các tình nguyện viên, nếu chúng ta làm đúng và hợp tác cùng họ để tìm cách áp dụng phù hợp”.

Gần đây, Wikimedia Foundation đã sử dụng AI để xác định các chỉnh sửa bài viết chứa hành động phá hoại. Và trong chiến lược AI mới công bố, họ đã giới thiệu cho đội ngũ biên tập các công cụ AI hỗ trợ công tác dịch thuật và tự động hoá “các tác vụ lặp đi lặp lại”.

Tổ chức phi lợi nhuận này cũng đang phát triển một công cụ không dùng AI, gọi là “Edit Check”, nhằm giúp những người đóng góp mới tuân thủ chính sách và hướng dẫn viết của Wikipedia. Hiện tại, “Edit Check” có thể nhắc người viết thêm trích dẫn nếu họ viết nhiều nội dung mà không dẫn nguồn, cũng như kiểm tra lại giọng văn để đảm bảo tính trung lập. Sắp tới, công cụ này sẽ được bổ sung một tính năng mới, gọi là “Paste Check”. Tính năng sẽ hỏi người dùng vừa dán một đoạn văn dài vào bài viết rằng liệu họ có thực sự viết nó không.

Wikimedia Foundation kỳ vọng “Edit Check” cùng các tính năng mới có thể giảm bớt gánh nặng cho đội ngũ biên tập.

Công cụ “Edit Check” nhắc nhở người đóng góp nội dung về nguồn trích dẫn không đáng tin cậy và không được phép sử dụng. Nguồn: Wikipedia

Mặt khác, bản thân những người đóng góp nội dung cũng đã đề xuất cho tổ chức nhiều ý tưởng để phát triển công cụ hơn nữa, như yêu cầu các tác giả chủ động chỉ rõ phần nào trong bài được tạo bởi chatbot AI...

Chúng tôi đang theo sát cộng đồng tình nguyện viên để hiểu những gì họ làm và xác định xem điều gì là hiệu quả”, Miller nói, “Hiện tại, trọng tâm của chúng tôi khi sử dụng máy học trong công tác biên tập là giúp mọi người thực hiện các chỉnh sửa có ý nghĩa, đồng thời giúp đội ngũ kiểm duyệt tập trung xử lý những phần cần thiết nhất”.

AI đặt ra một thách thức mới cho Wikimedia Foundation và cộng đồng Wikipedia trong việc duy trì sự uy tín. Nguồn: The Independent

Wikimedia Foundation và đội ngũ quản trị viên không chỉ phòng thủ trước “rác AI” mà còn sẵn sàng khai thác AI để nâng cao chất lượng nội dung. Trong tương lai, khi AI ngày càng được ứng dụng sâu rộng hơn, cách Wikipedia kết hợp sức mạnh cộng đồng và công nghệ sẽ đóng vai trò then chốt, quyết định xem nền tảng này có duy trì vị thế là một trong những nguồn bách khoa đáng tin cậy trên Internet hay không.

Nguồn: The Verge