OpenAI phải giao nộp 20 triệu nhật ký ChatGPT trong cuộc chiến bản quyền căng thẳng với các hãng tin tức
OpenAI đang phải đối mặt với một thử thách pháp lý lớn khi một thẩm phán liên bang ở Manhattan đã ra lệnh cho công ty này giao nộp 20 triệu nhật ký trò chuyện ChatGPT ẩn danh cho The New York Times, Chicago Tribune và các tổ chức truyền thông khác.
Các cuộc trò chuyện, được trích xuất từ tương tác của người dùng với AI, được coi là bằng chứng quan trọng trong vụ kiện cáo buộc rằng các mô hình ngôn ngữ của OpenAI đã sao chép nội dung tin tức có bản quyền mà không được phép.
Thẩm phán bác bỏ phản đối về quyền riêng tư và ra lệnh ẩn danh dữ liệu
Tòa án Hoa Kỳ Thẩm phán Ona Wang đã ra phán quyết bác bỏ những phản đối liên quan đến quyền riêng tư của OpenAI, lưu ý rằng công ty phải xóa tên, địa chỉ email, số điện thoại và các thông tin nhận dạng khác trước khi giao nhật ký.
Wang tuyên bố,
“Có nhiều lớp bảo vệ trong trường hợp này chính xác là do tính chất nhạy cảm và riêng tư cao của phần lớn khám phá này.”
Sau khi hoàn tất việc ẩn danh, OpenAI có bảy ngày để nộp hồ sơ.
OpenAI đã bày tỏ lo ngại về tiền lệ mà phán quyết này có thể thiết lập, nhấn mạnh rằng phần lớn các cuộc trò chuyện của người dùng—ước tính lên tới hàng chục tỷ—không có kết nối đối với các khiếu nại về bản quyền.
Dane Stuckey, Giám đốc An ninh Thông tin của OpenAI, cảnh báo rằng những yêu cầu như vậy "bỏ qua các biện pháp bảo vệ quyền riêng tư lâu đời" và có thể làm suy yếu lòng tin của người dùng.
Các Cơ quan Truyền thông Đưa ra Bằng chứng về Việc Sử dụng Nội dung Sai mục đích
Tờ New York Times và các tờ báo thuộc sở hữu của MediaNews Group lập luận rằng các bản ghi sẽ tiết lộ liệu ChatGPT có tạo ra các đoạn văn gần giống với các bài báo của họ hay không.
Frank Pine, tổng biên tập của MediaNews Group, đã chỉ trích sự phản kháng của OpenAI:
"Ban lãnh đạo của OpenAI đã ảo tưởng khi họ nghĩ rằng họ có thể thoát tội khi che giấu bằng chứng về cách mô hình kinh doanh của họ dựa vào việc ăn cắp từ các nhà báo chăm chỉ."
Các nguyên đơn khẳng định rằng vụ kiện không nhằm mục đích ngăn chặn sự phát triển của AI mà nhằm đảm bảo sự công bằng và thù lao cho công việc báo chí.
Họ cũng cho rằng AI có thể tạo ra nội dung có bản quyền mà không cần bất kỳ lời nhắc nào từ người dùng, nhấn mạnh sự cần thiết phải xem xét kỹ lưỡng các kết quả đầu ra của mô hình.
Phạm vi vụ kiện và các hàm ý rộng hơn
Vụ kiện, được đệ trình lần đầu tiên vào năm 2023, là một phần của làn sóng khiếu nại bản quyền nhắm vào các công ty công nghệ bao gồm Microsoft, Meta và Google.
Các nguyên đơn cho rằng các nhà phát triển AI đã sử dụng tài liệu có bản quyền mà không được phép để đào tạo mô hình của họ, dẫn đến các kết quả đầu ra sao chép hoặc tóm tắt nội dung có tường phí.
Thẩm phán Wang đã nhấn mạnh tính tương xứng của 20 triệu nhật ký, lưu ý rằng chúng chỉ chiếm chưa đến 0,05% tổng số nhật ký ChatGPT được OpenAI lưu giữ.
Bà nhấn mạnh rằng các cuộc trò chuyện có liên quan đến cả khiếu nại về việc sao chép nội dung và biện hộ của OpenAI liên quan đến các hoạt động khác của người dùng.
Các chuyên gia pháp lý cho rằng phán quyết này cho thấy tòa án sẵn sàng buộc các công ty AI phải chịu trách nhiệm trong khi vẫn cân bằng quyền riêng tư của người dùng.
Quyết định này cũng đặt ra những câu hỏi rộng hơn về tính minh bạch của các quy trình đào tạo AI, quyền sở hữu trí tuệ và nhu cầu tiềm ẩn về các thỏa thuận cấp phép giữa nhà xuất bản và nhà phát triển AI.
Liệu mối lo ngại về quyền riêng tư có thể tiếp diễn bất chấp việc ẩn danh không
Mặc dù Wang xác nhận rằng các biện pháp bảo vệ quyền riêng tư đã được áp dụng, các chuyên gia cảnh báo rằng dữ liệu ẩn danh có khả năng bị được thiết kế ngược để tiết lộ thông tin nhạy cảm.
OpenAI và các công ty AI khác đã tuyên bố rằng dữ liệu người dùng không được lưu trữ vĩnh viễn, nhưng trường hợp này nhấn mạnh sự căng thẳng giữa tính bảo mật của người dùng và trách nhiệm giải trình của công ty.
Tác động của ngành có thể định hình lại các hoạt động dữ liệu AI
Đối với các nhà xuất bản, trường hợp này là cơ hội để đảm bảo sự công nhận—và có khả năng là được bồi thường—cho việc sử dụng nội dung của họ.
Các đối thủ cạnh tranh như Microsoft và Meta cũng đang chịu sự giám sát tương tự, và các thỏa thuận cấp phép có thể trở thành một chuẩn mực mới cho các công ty AI dựa vào tài liệu báo chí.
Đồng thời, các nhà phát triển AI có thể khám phá các kỹ thuật ẩn danh tiên tiến hoặc các mô hình quy mô nhỏ hơn để giảm thiểu rủi ro vi phạm.
Phán quyết này thách thức vai trò của AI trong quyền truyền thông và dữ liệu
Coinlive coi phán quyết này là một bước ngoặt đối với ngành công nghiệp AI.
Quyết định này buộc các công ty AI phải đối mặt với cách họ thu thập, lưu trữ và sử dụng nội dung trong khi giải quyết các mối lo ngại về quyền riêng tư của người dùng.
Nó cũng đặt ra những câu hỏi về tính bền vững của các mô hình AI được xây dựng trên dữ liệu trái phép và liệu những đổi mới trong tương lai có đòi hỏi khuôn khổ đạo đức và pháp lý rõ ràng hơn hay không.
Sự cân bằng giữa tính minh bạch, sở hữu trí tuệ và niềm tin của người dùng hiện đang bị giám sát chặt chẽ chưa từng có, và cách các công ty AI phản ứng có thể định hình chương tiếp theo của phương tiện truyền thông kỹ thuật số và quy định về AI.