Banner bài viết về hợp tác giữa AI và Wikipedia.

Các công ty AI và Wikipedia có thể hợp tác không? Dân chủ hóa là điểm chung [18 tháng 11 năm 2025]


Tác giả: MikeTurkey, trong cuộc trò chuyện với ChatGPT
Ngày: 18 tháng 11 năm 2025

Giới thiệu

Vào tháng 11 năm 2025, Quỹ Wikimedia đã đưa ra tuyên bố phản đối việc sử dụng dữ liệu trái phép của các công ty AI. Theo báo cáo của Asahi Shimbun, lượng truy cập vào Wikipedia từ các công ty AI đã tăng vọt, làm tăng tải máy chủ, trong khi số lượng độc giả là con người giảm 8% so với năm trước. Sự sụt giảm số lượng độc giả này cũng có thể dẫn đến giảm quyên góp, đe dọa nền tảng hoạt động của Wikipedia.
Cá nhân tôi sử dụng cả Wikipedia và AI hàng ngày. Cả hai đều không thể thiếu như một hạ tầng tri thức hiện đại. Chính vì vậy mà tôi muốn tránh tình huống mà cả hai xung đột và cùng chịu thiệt hại. Tại Việt Nam, nơi hàng triệu người phụ thuộc vào Wikipedia tiếng Việt và các công cụ AI khác nhau, vấn đề này vô cùng quan trọng.
Bài viết này khám phá các con đường để Wikipedia và các công ty AI hợp tác.

Thực ra là đồng minh? Tìm kiếm điểm chung


Thoạt nhìn, Wikipedia và các công ty AI dường như có lợi ích xung đột.
Tuy nhiên, khi xem xét kỹ hơn, họ chia sẻ những điểm chung quan trọng.

Hạn chế tài chính

Như đã biết, Quỹ Wikimedia là một tổ chức phi lợi nhuận đang chịu tình trạng thiếu hụt kinh phí mãn tính. Do đó, Quỹ Wikimedia đang tìm kiếm việc sử dụng bộ dữ liệu có trả phí, nhưng xét đến thực tế của các công ty AI, giải pháp này có lẽ khó thực hiện. Các công ty AI bao gồm Anthropic và OpenAI đã cần số lượng tài chính khổng lồ trong bối cảnh chi phí tính toán lớn, chi phí nghiên cứu và phát triển, và áp lực cạnh tranh khốc liệt. Các startup AI Việt Nam đang phát triển tại Hà Nội, TP. Hồ Chí Minh và Đà Nẵng cũng đang đối mặt với những thách thức tương tự.
Nhiều công ty không có khả năng chi trả phí cấp phép dữ liệu bổ sung.

Tuy nhiên, nếu chúng ta để vấn đề này không được giải quyết, chúng ta sẽ đối mặt với tình huống "tiền xấu đuổi tiền tốt". Nếu các nguồn thông tin chất lượng cao như Wikipedia xuống cấp, các công ty AI sẽ mất dữ liệu chất lượng cao cần thiết cho việc huấn luyện, cuối cùng làm giảm chất lượng đầu ra của AI.
Đây là một "bi kịch của tài nguyên chung" cổ điển—tương tự như những gì xảy ra với các tài nguyên chung ở Việt Nam như rừng, nguồn nước hoặc tài nguyên biển.
Mọi người đều sử dụng tài nguyên chung vì lợi ích riêng, không ai chịu chi phí bảo trì, và cuối cùng tài nguyên cạn kiệt.

Lý tưởng chung về "dân chủ hóa"

Điều thú vị là cả Wikipedia và các công ty AI đều chia sẻ lý tưởng "dân chủ hóa". Wikipedia ủng hộ "dân chủ hóa quyền tiếp cận tri thức", trong khi các công ty như Anthropic, OpenAI, Amazon và Microsoft ủng hộ "dân chủ hóa AI". Tại Việt Nam, nơi chuyển đổi số đang được đẩy mạnh với Chương trình Chuyển đổi số Quốc gia và các sáng kiến như Make in Vietnam, triết lý này đặc biệt phù hợp. Cả hai đều dựa trên triết lý rằng "tất cả mọi người, không chỉ những người nắm quyền lực hay người giàu, đều nên được hưởng lợi".

Lý tưởng chung này có thể là chìa khóa cho giải pháp. Nếu chúng ta có thể chuyển từ khung xung đột hiện tại "các công ty AI đối đầu Wikipedia" sang khung mà "kẻ thù chung là sự độc quyền và rào chắn thông tin, và cả hai bên đều ở cùng một phía", con đường hợp tác sẽ mở ra.

Phép lịch sự quan trọng: Trả lại lưu lượng truy cập thông qua hiển thị liên kết


Ngay cả khi hỗ trợ tài chính khó khăn, có một phép lịch sự tối thiểu mà các công ty AI có thể cung cấp. Đó là chỉ rõ khi nào thông tin Wikipedia được sử dụng và hiển thị liên kết đến nó.

Khi người dùng hỏi AI và câu trả lời dựa trên thông tin Wikipedia, hãy hiển thị liên kết đến trang Wikipedia liên quan. Điều này về mặt kỹ thuật rất dễ dàng và đã được triển khai trong một số dịch vụ AI như Perplexity AI và Microsoft Copilot.

Biện pháp này có nhiều lợi ích:
  • Đảm bảo tính minh bạch: Làm rõ AI đang sử dụng nguồn thông tin nào

  • Trả lại lưu lượng truy cập: Khôi phục số lượng độc giả con người đang giảm

  • Trả lời chỉ trích "đánh cắp tri thức": Giải quyết vấn đề đạo đức bằng cách trích dẫn nguồn


Vấn đề của Wikipedia là truy cập tự động từ các công ty AI làm tăng tải máy chủ trong khi số lượng độc giả con người giảm.
Hiển thị liên kết trực tiếp giải quyết vấn đề này. Chúng ta nên phân biệt giữa việc thu thập dữ liệu hàng loạt trong quá trình huấn luyện và truy cập tự nhiên thông qua người dùng. Cái sau có nghĩa là "độc giả con người" mà Wikipedia ban đầu mong đợi đang quay lại.

Hơn nữa, nếu các nhà lãnh đạo hạ tầng đám mây như Amazon cung cấp hỗ trợ hạ tầng như CDN (Mạng phân phối nội dung), vấn đề tải máy chủ có thể được giảm đáng kể. Amazon đã có các chương trình hỗ trợ cho các tổ chức phi lợi nhuận, và Quỹ Wikimedia hoàn toàn có thể đủ điều kiện. Với sự phát triển của các trung tâm dữ liệu AWS tại Đông Nam Á bao gồm Singapore và các địa điểm gần Việt Nam, sự hợp tác như vậy ngày càng trở nên khả thi.

AI có thể trở thành thành viên của Wikipedia không? Khả năng hỗ trợ biên tập


Một hình thức hợp tác chủ động hơn sẽ là các công ty AI hỗ trợ việc biên tập Wikipedia. Tuy nhiên, điều này đòi hỏi sự cân nhắc cẩn thận.

Cộng đồng biên tập viên Wikipedia bao gồm những người đã dành nhiều năm tập trung vào việc viết và tham gia thảo luận cũng như xây dựng đồng thuận. Đối với họ, việc AI bắt đầu viết bài có thể khiến họ cảm thấy giá trị của mình bị phủ nhận. Hơn nữa, vì họ có khả năng phát hiện văn bản "có vẻ hợp lý nhưng không chính xác" của AI, sự hoài nghi đối với AI rất sâu sắc.

Do đó, tôi đề xuất một cách tiếp cận trong đó AI chỉ "đưa ra ý kiến", trong khi tất cả việc biên tập và quyết định được thực hiện bởi con người.

Cụ thể, AI sẽ phân tích các bài viết Wikipedia và đưa ra "ý kiến" như:

  • "Phát biểu này dường như mâu thuẫn với nguồn A"

  • "Đoạn văn này có thể có vấn đề về tính trung lập"

  • "Các quan điểm sau đây có thể đang thiếu trong chủ đề này"

  • "So với các bài viết tương tự, cấu trúc này có chỗ để cải thiện"

Đây chỉ là thông tin để hỗ trợ phán đoán của biên tập viên, không phải mệnh lệnh. Việc biên tập cuối cùng, quyết định và xây dựng đồng thuận đều được thực hiện bởi con người. AI chỉ đưa ra ý kiến như "một người tham gia", và quyền tự chủ của biên tập viên được tôn trọng hoàn toàn.

Cách tiếp cận này phù hợp với văn hóa Wikipedia. Wikipedia luôn chào đón "nhiều quan điểm" và nhấn mạnh thảo luận trên các trang Thảo luận. Nếu AI chỉ là "một người tham gia đưa ra ý kiến", nó có thể hòa nhập tự nhiên vào văn hóa này.

Điều quan trọng là làm cho nó tùy chọn tham gia (opt-in).
Ý kiến và đề xuất của AI sẽ bị tắt theo mặc định, chỉ được kích hoạt bởi những biên tập viên muốn sử dụng chúng.
Nếu các chức năng có thể được chọn dần dần (chỉ dịch thuật, chỉ đánh giá, v.v.), quyền tự chủ của biên tập viên có thể được tôn trọng hoàn toàn.

Để các ngôn ngữ thiểu số cho AI: Khả năng tạo bài viết bằng AI

Tách biệt khỏi hỗ trợ biên tập, có một khả năng khác: AI tạo bài viết trong các phiên bản ngôn ngữ có rất ít biên tập viên.

Có nhiều bài viết tồn tại trên Wikipedia tiếng Anh nhưng không có trong các phiên bản ngôn ngữ khác.
Đặc biệt trong các phiên bản ngôn ngữ thiểu số với ít hơn 10 biên tập viên, nguồn nhân lực rất khan hiếm, và thiếu nhân sự là vấn đề nghiêm trọng. Tại Việt Nam và khu vực Đông Nam Á, nhiều phiên bản Wikipedia ngôn ngữ dân tộc thiểu số—như Wikipedia tiếng Chăm, tiếng Khmer, tiếng Tày hoặc tiếng Mường—đang đối mặt với thách thức này. Trong những tình huống như vậy, lựa chọn là giữa "AI viết" hoặc "không có gì tồn tại". Ngay cả khi không hoàn hảo, việc có một số thông tin vẫn có giá trị.

Một số điều kiện sẽ làm cho việc tạo bài viết bằng AI có thể chấp nhận được:

  • Ghi nhãn rõ ràng: Chỉ rõ "Bài viết này được tạo bởi AI"

  • Ưu tiên con người: Biên tập viên có quyền sửa đổi hoặc xóa

  • Giới thiệu dần dần: Bắt đầu với các phiên bản ngôn ngữ có ít biên tập viên nhất

  • Giới hạn loại bài viết: Địa lý, sinh học, thiên văn học, v.v.; tránh các chủ đề gây tranh cãi như chính trị, lịch sử, tôn giáo

  • Đối thoại cộng đồng: Đạt được đồng thuận từ mỗi phiên bản ngôn ngữ

Sự kết hợp "phiên bản ngôn ngữ với ít biên tập viên" × "bài viết không tồn tại" là điểm ngọt ngào với ít kháng cự nhất. Bắt đầu từ đây và mở rộng dần nếu thành công—đây là con đường thực tế.

Kết luận


Xung đột giữa Wikipedia và các công ty AI về cơ bản là "bi kịch của tài nguyên chung". Tuy nhiên, nếu chúng ta nhận ra rằng cả hai đều chia sẻ lý tưởng "dân chủ hóa", con đường hợp tác thay vì xung đột sẽ trở nên rõ ràng.

Tôi đề xuất các giải pháp cụ thể sau:
  • Hiển thị liên kết: Khi AI sử dụng thông tin Wikipedia, luôn hiển thị liên kết để trả lại lưu lượng truy cập

  • Hỗ trợ hạ tầng: Các công ty như Amazon cung cấp CDN để giảm tải máy chủ

  • AI hỗ trợ biên tập: AI chỉ "đưa ra ý kiến", trong khi tất cả việc biên tập và quyết định được thực hiện bởi con người (cách tiếp cận opt-in)

  • Tạo bài viết bằng AI: Giới hạn ở các phiên bản ngôn ngữ có rất ít biên tập viên và các bài viết không tồn tại

Tất cả những điều này đều có thể đạt được mà không gây gánh nặng tài chính và tôn trọng quyền tự chủ của cộng đồng biên tập viên.

Tôi tin rằng cả Wikipedia và AI đều không thể thiếu đối với xã hội hiện đại. Không bên nào được lợi từ xung đột và hủy diệt lẫn nhau.

Là một người cũng điều hành một trang web nhỏ, những thách thức của Wikipedia không phải là vấn đề của người khác. Khó khăn trong việc tiếp tục tạo nội dung chất lượng và câu hỏi về cách đối phó với AI là những chủ đề mà tất cả những người tạo nội dung, bất kể quy mô, nên cân nhắc. Tại Việt Nam, nơi nền kinh tế số và việc tạo nội dung đang phát triển nhanh chóng với hàng triệu nhà sáng tạo trên các nền tảng như YouTube, TikTok, Facebook và các blog cá nhân, cuộc thảo luận này vô cùng quan trọng. Tôi hy vọng bài viết này sẽ trở thành chất xúc tác cho một cuộc đối thoại mang tính xây dựng.

Giấy phép

2023-2025 Copyright Mike Turkey All rights reserved.
Scope: This license applies to all non-code text content on miketurkey.com.
- Unauthorized copying and republication of this document is prohibited.
- Direct linking to this URL is permitted.
- If cited, summarized, or transformed, this copyright notice must be retained.
Banner illustration: Generated by MikeTurkey using DALL-E 3 (ChatGPT)

Back to the English version