Nhãn AI cần trở thành tiêu chuẩn mới vào năm 2025

Tôi là một phóng viên AI, và năm tới, tôi muốn phát chán. Tôi không muốn nghe về tỷ lệ lừa đảo do AI hỗ trợ ngày càng tăng, các cuộc tranh giành quyền lực lộn xộn trong phòng họp hoặc những người lạm dụng các chương trình AI để tạo ra những bức ảnh và video có hại, gây hiểu lầm hoặc có chủ ý gây kích động.

Đó là một yêu cầu cao và tôi biết có lẽ tôi sẽ không đạt được mong muốn của mình. Đơn giản là có quá nhiều công ty phát triển AI và có quá ít hướng dẫn và quy định. Nhưng nếu tôi phải yêu cầu một điều trong mùa nghỉ lễ này thì đó là: Năm 2025 cần phải là năm chúng ta có được nhãn nội dung AI có ý nghĩa, đặc biệt là cho hình ảnh và video.

Thẻ AI Atlas

Zooey Liao / CNET

Hình ảnh và video do AI tạo ra đã đi được một chặng đường dài, đặc biệt là trong năm qua. Nhưng sự phát triển của công cụ tạo hình ảnh AI là con dao hai lưỡi. Những cải tiến đối với mô hình có nghĩa là hình ảnh xuất hiện ít ảo giác hoặc sai sót hơn. Nhưng những thứ kỳ lạ đó, những con người có 12 ngón tay và những vật thể biến mất, là một trong số ít những thứ mà mọi người có thể gắn cờ và đoán lần thứ hai xem hình ảnh đó được tạo ra bởi con người hay AI. Khi các trình tạo AI được cải thiện và những dấu hiệu nhận biết đó biến mất, đó sẽ là một vấn đề lớn đối với tất cả chúng ta.

Các cuộc tranh giành quyền lực pháp lý và tranh luận về đạo đức về hình ảnh AI chắc chắn sẽ tiếp tục vào năm tới. Nhưng hiện tại, các dịch vụ tạo và chỉnh sửa hình ảnh AI đều hợp pháp và dễ sử dụng. Điều đó có nghĩa là nội dung AI sẽ tiếp tục tràn ngập trải nghiệm trực tuyến của chúng ta và việc xác định nguồn gốc của hình ảnh sẽ trở nên khó khăn hơn và quan trọng hơn bao giờ hết. Không có viên đạn bạc nào, giải pháp chung cho tất cả. Nhưng tôi tin tưởng rằng việc áp dụng rộng rãi nhãn nội dung AI sẽ giúp ích rất nhiều.

Lịch sử phức tạp của nghệ thuật AI

Từ những chiếc tủ lạnh biết nói cho đến iPhone, các chuyên gia của chúng tôi luôn sẵn sàng giúp thế giới bớt phức tạp hơn một chút.

Nếu có một nút mà bạn có thể nhấn để khiến bất kỳ nghệ sĩ nào nổi cơn thịnh nộ, thì đó sẽ là trình tạo hình ảnh AI. Công nghệ, được hỗ trợ bởi AI tổng quát, có thể tạo ra toàn bộ hình ảnh từ một vài từ đơn giản trong lời nhắc của bạn. Tôi đã sử dụng và đánh giá một vài trong số chúng cho CNET và tôi vẫn có thể ngạc nhiên về mức độ chi tiết và rõ ràng của hình ảnh. (Không phải tất cả họ đều là người chiến thắng, nhưng họ có thể khá giỏi.)

Như đồng nghiệp cũ của tôi tại CNET, Stephen Shankland đã nói ngắn gọn: “AI có thể cho phép bạn nói dối với những bức ảnh. Nhưng bạn không muốn một bức ảnh không bị xử lý kỹ thuật số.” Tạo sự cân bằng giữa việc chỉnh sửa và chỉnh sửa sự thật là điều mà các phóng viên ảnh, biên tập viên và người sáng tạo đã phải giải quyết trong nhiều năm. AI sáng tạo và chỉnh sửa do AI cung cấp chỉ làm cho nó phức tạp hơn.

Lấy Adobe làm ví dụ. Mùa thu này, Adobe đã giới thiệu rất nhiều tính năng mới, nhiều tính năng trong số đó được hỗ trợ bởi AI. Photoshop hiện có thể loại bỏ các dây và cáp gây mất tập trung khỏi hình ảnh và người dùng Premiere Pro có thể kéo dài các đoạn phim hiện có bằng gen AI. Generative fill là một trong những công cụ Photoshop phổ biến nhất, ngang bằng với công cụ crop, Deepa Subramaniam của Adobe nói với tôi. Adobe đã nói rõ rằng việc chỉnh sửa tổng thể của nó sẽ trở thành chuẩn mực và tương lai mới. Và vì Adobe là tiêu chuẩn của ngành nên điều này khiến người sáng tạo bị ràng buộc: Bắt kịp AI hoặc bị tụt lại phía sau.

Mặc dù Adobe hứa hẹn không bao giờ đào tạo về công việc của người dùng – một trong những mối quan tâm lớn nhất với AI tổng hợp – nhưng không phải công ty nào cũng thực hiện hoặc thậm chí tiết lộ cách xây dựng các mô hình AI của mình. Nghệ sĩ kỹ thuật số René Ramos đã nói với tôi vào đầu năm nay rằng những người sáng tạo chia sẻ tác phẩm của họ trực tuyến đã phải đối mặt với “hành vi trộm cắp tác phẩm nghệ thuật và đạo văn”, đồng thời lưu ý cách các công cụ tạo hình ảnh cấp quyền truy cập vào các phong cách mà các nghệ sĩ đã dành cả đời để mài giũa.

Từ những chiếc tủ lạnh biết nói cho đến iPhone, các chuyên gia của chúng tôi luôn sẵn sàng giúp thế giới bớt phức tạp hơn một chút.

Nhãn AI có thể làm gì

Nhãn AI là bất kỳ loại thông báo kỹ thuật số nào gắn cờ khi hình ảnh có thể được AI tạo hoặc thay đổi đáng kể. Một số công ty tự động thêm hình mờ kỹ thuật số cho các thế hệ của họ (như Imagine của Meta AI), nhưng nhiều công ty cung cấp khả năng loại bỏ chúng bằng cách nâng cấp lên các cấp trả phí (như Dall-E 3 của OpenAI). Hoặc người dùng có thể chỉ cần cắt ảnh để cắt bỏ dấu nhận dạng.

Đã có rất nhiều công việc tốt được thực hiện trong năm qua để hỗ trợ cho nỗ lực này. Sáng kiến ​​xác thực nội dung của Adobe trong năm nay đã ra mắt một ứng dụng mới có tên là Thông tin xác thực nội dung cho phép mọi người đính kèm chữ ký số, vô hình vào tác phẩm của họ. Người sáng tạo cũng có thể sử dụng những thông tin xác thực này để tiết lộ và theo dõi việc sử dụng AI trong công việc của họ. Adobe cũng có tiện ích mở rộng Google Chrome giúp xác định các thông tin xác thực này trong nội dung trên web.

Google đã áp dụng tiêu chuẩn mới về thông tin xác thực nội dung cho hình ảnh và quảng cáo trong Google Tìm kiếm với tư cách là một phần của Liên minh Chứng minh và Xác thực Nội dung, do Adobe đồng sáng lập. Nó cũng đã thêm một phần mới vào thông tin hình ảnh trên Google Tìm kiếm nhằm nêu bật mọi chỉnh sửa AI để “minh bạch hơn”. Chương trình beta của Google dành cho hình mờ và xác định nội dung AI, được gọi là SynthID, đã tiến một bước và được triển khai nguồn mở cho các nhà phát triển trong năm nay.

Các công ty truyền thông xã hội cũng đang nghiên cứu việc dán nhãn nội dung AI. Theo báo cáo từ sáng kiến ​​MediaWise của Poynter, mọi người có khả năng gặp phải những hình ảnh trực tuyến sai lệch hoặc gây hiểu lầm trên mạng xã hội cao gấp đôi so với bất kỳ kênh nào khác. Công ty mẹ của Instagram và Facebook là Meta đã triển khai nhãn tự động “Được tạo bằng AI” cho các bài đăng trên mạng xã hội và nhãn này nhanh chóng gắn cờ nhầm các bức ảnh do con người chụp là do AI tạo ra. Meta sau đó đã làm rõ rằng các nhãn được áp dụng khi nó “phát hiện (các) chỉ báo hình ảnh AI tiêu chuẩn ngành” và thay đổi nhãn thành “thông tin AI” để tránh ngụ ý rằng hình ảnh hoàn toàn được tạo ra bởi một chương trình máy tính. Các nền tảng truyền thông xã hội khác, như Pinterest và TikTok, đều có nhãn AI với mức độ thành công khác nhau — theo kinh nghiệm của tôi, Pinterest đã tràn ngập AI và nhãn AI của TikTok có mặt khắp nơi nhưng dễ bị bỏ qua.

Adam Mosseri, người đứng đầu Instagram, gần đây đã chia sẻ một loạt bài đăng về chủ đề này, cho biết: “Vai trò của chúng tôi với tư cách là nền tảng internet là gắn nhãn nội dung được tạo ra là AI tốt nhất có thể. Nhưng một số nội dung chắc chắn sẽ lọt vào kẽ hở, và không phải tất cả.” thông tin sai lệch sẽ được tạo ra bằng AI, vì vậy chúng tôi cũng phải cung cấp bối cảnh về người đang chia sẻ để bạn có thể tự đánh giá xem bạn muốn tin tưởng vào nội dung của họ đến mức nào.”

Nếu Mosseri có lời khuyên hữu ích nào khác ngoài việc “xem xét nguồn” — điều mà hầu hết chúng ta được dạy trong lớp tiếng Anh ở trường trung học — thì tôi rất muốn nghe. Nhưng lạc quan hơn, nó có thể gợi ý về những phát triển sản phẩm trong tương lai để cung cấp cho mọi người nhiều bối cảnh hơn, như ghi chú cộng đồng của Twitter/X. Những thứ như nhãn AI sẽ còn quan trọng hơn nếu Meta quyết định thực hiện thử nghiệm thêm các bài đăng được đề xuất do AI tạo vào nguồn cấp dữ liệu của chúng tôi.

Những gì chúng ta cần vào năm 2025

Tất cả điều này là tuyệt vời, nhưng chúng tôi cần nhiều hơn nữa. Chúng ta cần các nhãn nhất quán, rõ ràng trên mọi ngóc ngách của Internet. Không bị chôn vùi trong siêu dữ liệu của một bức ảnh mà được đặt ngang qua nó (hoặc bên trên/bên dưới nó). Càng rõ ràng thì càng tốt.

Không có một giải pháp dễ dàng cho việc này. Loại cơ sở hạ tầng trực tuyến đó sẽ đòi hỏi rất nhiều công sức và sự hợp tác giữa các nhóm công nghệ, xã hội và có thể cả chính phủ và xã hội dân sự. Nhưng việc đầu tư vào việc phân biệt hình ảnh thô với những hình ảnh hoàn toàn do AI tạo ra cho đến mọi thứ ở giữa là điều cần thiết. Dạy mọi người xác định nội dung AI là điều tuyệt vời, nhưng khi AI được cải thiện, ngay cả những chuyên gia như tôi cũng sẽ khó đánh giá chính xác hình ảnh hơn. Vậy tại sao không làm cho nó trở nên cực kỳ rõ ràng và cung cấp cho mọi người thông tin họ cần biết về nguồn gốc của hình ảnh — hoặc ít nhất là giúp họ suy đoán lần thứ hai khi họ nhìn thấy điều gì đó kỳ lạ?

Mối quan tâm của tôi là vấn đề này hiện nằm ở cuối danh sách việc cần làm của nhiều công ty AI, đặc biệt là khi làn sóng dường như đang chuyển sang phát triển video AI. Nhưng vì sự tỉnh táo của tôi và của mọi người, năm 2025 phải là năm chúng ta tạo ra một hệ thống tốt hơn để xác định và gắn nhãn hình ảnh AI.