Làm sao bảo vệ sáng tạo nghệ thuật giữa thời AI?

MAI MAI HƯƠNG 22/12/2024 07:18 GMT+7

TTCT - Từ khi AI xuất hiện trên đời, giới sáng tạo ngày càng lo ngại tác phẩm của họ bị thu thập để làm cơ sở dữ liệu huấn luyện các mô hình AI mà không có sự đồng ý hay trả công nào cho tác giả.

Làm sao bảo vệ sáng tạo nghệ thuật giữa thời AI? - Ảnh 1.

Bức ảnh Théâtre D’opéra Spatial.

Các công ty công nghệ Mỹ thì khăng khăng viện dẫn rằng những thứ gì đăng công khai trên Internet đều thuộc diện mà luật quy định là "fair use", tức là có thể sử dụng mà không cần hỏi han gì tác giả.

Tháng 8- 2022, nhà thiết kế đồ họa video game Jason M. Allen đưa một số bức ảnh in trên toan đi tham dự cuộc thi Mỹ thuật hội chợ bang Colorado. Một bức trong số đó đã giành giải nhất ở hạng mục tác phẩm nhiếp ảnh có xử lý kỹ thuật số. 

Sẽ chẳng có gì ngoài niềm vui của "tác giả" với giải thưởng 300 USD và sự tán thưởng của người xem trước tác phẩm đẹp ngất, nếu sau đó ông Allen không khoe thành tích với cộng đồng người dùng của Midjourney - mô hình AI tạo sinh hình ảnh. Việc một tác phẩm do AI chiến thắng trong một cuộc thi lập tức khiến giới sáng tạo toàn thế giới nổi sóng tranh cãi.

Cuộc tranh đấu khét lẹt

Để có được bức ảnh có tên Théâtre D'opéra Spatial (Nhà hát opera không gian) với sự giao thoa đầy siêu thực giữa phong cách nghệ thuật Phục hưng và Steampunk (phong cách khoa học giả tưởng thời máy hơi nước) không đơn giản là gõ vài từ rồi bấm nút một cái là có.

Jason M. Alle phải nạp vào Midjourney các yêu cầu kiểu: tạo hình ảnh ba người phụ nữ đội nón phi hành gia, mặc trang phục có váy dún phồng kiểu Victoria… 

Rồi phải mất khoảng 900 lần thêm vào yêu cầu trên các từ ngữ khác để điều chỉnh chi tiết, ánh sáng, màu sắc, mới thu được ba tấm hình khá ưng. Sau đó còn phải dùng Photoshop để tinh chỉnh, chẳng hạn làm một cái đầu có mái tóc đen gợn sóng cho một trong ba nhân vật nữ, vì Midjourney không chịu tạo ra cái đầu cho nàng.

Allen nói ông không định lừa đảo gì ai, vì đã nêu rõ việc sử dụng Midjourney để làm ảnh trong phần giới thiệu bài dự thi. "Bức ảnh này mê hoặc tôi. Tôi rất thích nó. Tôi nghĩ mọi người nên xem nó", ông giải thích với CNN Business về lý do đem tác phẩm do AI tạo ra đi dự thi. 

Nhưng họa sĩ Cal Duran, thành viên ban giám khảo, cho biết khi chấm ảnh, ông không nhận ra bức Théâtre D'opéra Spatial có nguồn gốc từ AI. Dầu vậy, khi biết rõ việc này, họ vẫn giữ quyết định trao giải, đơn giản là vì "bức ảnh đó đẹp", và toàn bộ quá trình tốn đến 80 giờ, tức là tới 10 ngày làm việc.

Vấn đề là nếu không có hàng triệu hình ảnh, trong đó có những tác phẩm có tác quyền, được thu thập từ đủ mọi nguồn và lưu sẵn trong kho dữ liệu, mô hình AI như Midjourney đâu thể nào tạo ra, nói đúng hơn là tổng hợp ra hình ảnh theo yêu cầu của Allen đẹp đến vậy?

Trước nguy cơ vừa bị AI tranh mất kế sinh nhai, vừa bị xâm phạm tác quyền, bị đạo nhái... không ít văn nghệ sĩ đâm đơn kiện chống lại các công ty đứng đằng sau các mô hình AI tạo sinh. 

Nhưng trong khi cuộc chiến pháp lý vẫn chưa ngã ngũ và chưa thể làm được gì nhiều với các mô hình AI vốn vẫn đang ngày ngày thu thập các tác phẩm về làm dữ liệu, giới sáng tạo nghệ thuật và các nhà khoa học đã bắt đầu triển khai những biện pháp chống AI.

Thì hãy thử làm AI "ngu" đi

Để chống lại việc phiên bản số của các tác phẩm nghệ thuật bị thu thập để làm dữ liệu huấn luyện các mô hình AI, công nghệ đang hướng đến một số biện pháp, trong đó có cả việc làm các "con" AI bị… ngu đi.

Cách phổ biến để chống lại việc thu thập dữ liệu cho AI là gắn thêm "mặt nạ" (watermark) lên tác phẩm nhiếp ảnh hay hình chụp của tác phẩm hội họa để ngăn chặn việc phong cách riêng của tác giả bị sao chép. 

Các công cụ cung cấp tính năng này như Mist, Anti-DreamBooth và Glaze thêm vào trong các pixel trên hình ảnh vài thay đổi có tính gây nhiễu mà mắt người không thể nhìn thấy, nhưng nếu bị thu thập làm dữ liệu thì có thể khiến AI không đọc được pixel đúng cách.

Cần chút kỹ năng code để chạy Mist và Anti-DreamBooth, nhưng với Glaze - do các nhà khoa học của Phòng nghiên cứu SAND ở Đại học Chicago phát triển - thì chỉ vài thao tác là mặt nạ được trùm lên, khiến hình ảnh không còn bị các thuật toán AI dò tìm được để mà sao chép phong cách sáng tác. Miễn phí, có thể dùng dưới dạng app, hay trực tiếp trên mạng, Glaze đang là công cụ được nhiều họa sĩ biết đến nhất và đã được tải về đến hơn 6 triệu lần.

Các nhà nghiên cứu của SAND sau này tạo ra ứng dụng Nightshade "phủ độc" lên hình ảnh. Nightshade cũng can thiệp vào phần phi hiển thị trong các pixel, nhưng thay vì chỉ bảo vệ hình ảnh trước các bộ thu thập dữ liệu, các phần chèn trên pixel hoạt động có tính tấn công hơn, vì nó có thể thao túng mô hình machine learning, làm cho chúng hiểu hình ảnh thu thập được khác với những gì hình ảnh đó thực sự hiển thị, nói cách khác là nhìn gà hóa cuốc. Các pixel đã được can thiệp có thể khiến AI hiểu hình ảnh con chó thành con mèo, cái túi xách thành cái máy nướng bánh.

Cách thức này có khả năng làm cho các mô hình AI "ngu dần" trong những lần xử lý hình ảnh tiếp sau. Các nhà nghiên cứu của SAND nói rằng một số lượng tương đối hình ảnh phủ độc của Nightshade có thể phá hủy vĩnh viễn cách thức một mô hình AI nào đó tạo ra hình ảnh.

Làm sao bảo vệ sáng tạo nghệ thuật giữa thời AI? - Ảnh 2.

"Phủ độc" bằng Nightshade

Nhưng thêm các lớp bảo vệ vô hình vào ngay trong các hình ảnh số cũng không đảm bảo là tác phẩm sẽ kháng AI được mãi mãi. Cây bút công nghệ Melissa Heikkiläarchive của tạp chí MIT Technology Review nhận xét: "Thứ hôm nay công hiệu chưa chắc ngày mai còn tác dụng, vì giới nghiên cứu máy tính luôn tìm cách phá vỡ các phương thức bảo vệ hiện có, một phần là để phát hiện các điểm yếu của phương thức và đưa ra các phương án củng cố hệ thống".

Sử dụng những công cụ can thiệp pixel cũng có nghĩa là đánh liều với một rủi ro: khi đăng một phiên bản số của tác phẩm lên mạng, tác giả mất quyền kiểm soát với phiên bản đó và không thể bổ sung tiếp các biện pháp bảo vệ mới để chống lại việc các mô hình AI nâng cấp sau này có thể có khả năng thu thập, gỡ bỏ các lớp bảo vệ của Glaze hay Nightshade, hay còn gọi là hoàn nguyên tác phẩm. Và đó là lý do cần cân nhắc tiếp những cách thức dưới đây.

Những giải pháp có lý, có tình

Các nền tảng chia sẻ hình ảnh nổi tiếng như DeviantArt và Flickr đang là mỏ vàng để các công ty tìm đến thu thập dữ liệu cho việc huấn luyện AI. Trên Instagram cũng vậy, nếu bạn đăng hình ảnh gì lên đó ở chế độ công khai, công ty mẹ của Instagram là Meta cũng có thể thoải mái sử dụng hình ảnh đó để nuôi dạy mô hình AI của họ.

Chống lại việc này chỉ có một cách là đừng chia sẻ gì lên mạng ở chế độ công khai. Nhưng với nhiều họa sĩ và nhiếp ảnh gia, đó không phải là một lựa chọn hay, vì tác phẩm đăng lên mạng là để thu hút nhiều người vào xem và mua tác phẩm.

Vì vậy, nền tảng chia sẻ hình ảnh Cara đang hợp tác với các nhà khoa học của Đại học Chicago tạo ra các tính năng bảo vệ tác phẩm cho cả nền tảng. Đó là những thẻ "NoAI" được tự động chèn vào file hình ảnh đăng trên nền tảng này, có tác dụng cảnh báo các bộ thu thập dữ liệu không được đụng đến hình ảnh ở tên miền cara.app. Nhưng cách này chỉ có tác dụng thông báo để máy thu gom dữ liệu tránh các file hình ảnh có gắn thẻ "NoAI" ra, có thu gom hay không thì tùy tâm các nhà phát triển mô hình AI.

Với những nhà sáng tạo ở Anh và châu Âu, những thẻ cảnh báo này có tác dụng vì hai nơi này có luật bảo vệ dữ liệu cho phép tác giả thông báo cho các công ty công nghệ không được thu thập tác phẩm của họ làm dữ liệu cho AI.

Làm sao bảo vệ sáng tạo nghệ thuật giữa thời AI? - Ảnh 3.

Trong tương lai, thay vì cứ kình chống nhau, sẽ vui vẻ cả làng nếu cách thức sau đây của công ty Spawning Ai được phổ biến rộng rãi. Được một nhóm văn nghệ sĩ điều hành, công ty này cung cấp tại HaveIBeenTrained.com một công cụ để ta kiểm tra xem hình ảnh hay tác phẩm của mình có bị thu thập để huấn luyện cho các mô hình AI của hai đối tác là Stable Diffusion và Hugging Face hay không.

Nếu không muốn dữ liệu của mình bị thu thập cho việc huấn luyện AI, người dùng chỉ cần bấm vào các hình ảnh đã được bộ rà quét tìm thấy và bấm vào nút Do not train (không được huấn luyện) để thông báo cho Spawning Ai. Hình ảnh sau đó sẽ được gỡ khỏi kho dữ liệu của đối tác. 

Đây hẳn là một cách ứng xử văn minh giữa giới sáng tạo nghệ thuật và công nghệ AI, nhưng nó hiện chưa phải là một chuẩn chung của cả ngành. Cuộc chiến này rõ ràng còn rất cam go và dằng dai.

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận