Firewall Anti DDoS
SSL
5
5

Cách ngăn Facebook lấy dữ liệu để đào tạo AI

762
Lượt xem
Home Chuyển Đổi Số Cách ngăn Facebook lấy dữ liệu để đào tạo AI

Giờ đây, người dùng Facebook đã có thể xóa thông tin cá nhân được cho là bị Meta thu thập nhằm sử dụng trong việc đào tạo các mô hình AI tạo sinh.  

Hiện nay, các mô hình AI đều đang cần nguồn dữ liệu đầu vào khổng lồ để  phục vụ cho việc học máy. Trong đó, dữ liệu cần thu thập sẽ bao gồm nhiều nguồn như hình ảnh, bình luận, bài viết,… hay thậm chí cả thông tin cá nhân người dùng mạng xã hội.

Chính vì đảm bảo an toàn thông tin cá nhân cho người dùng mạng xã hội của mình, Meta đã cung cấp các tùy chọn để người dùng có thể thay đổi hoặc xóa bất kỳ dữ liệu cá nhân mà họ không muốn để công ty sử dụng cho việc đào tạo ngôn ngữ lớn, cũng như mô hình AI liên quan. 

Theo cập nhật mới đây nhất, người dùng Facebook có thể vào Trung tâm trợ giúp của trang mạng xã hội này. Sau đó, truy cập vào mục “Quyền của chủ thể dữ liệu đối với AI tạo sinh”. 

Tại đây, Facebook sẽ cung cấp một biểu mẫu cho phép người dùng gửi các yêu cầu liên quan đến thông tin đang được Meta sử dụng nhằm đào tạo mô hình AI tổng hợp. Cụ thể, mục cung cấp 3 tùy chọn, gồm: “Tôi muốn truy cập, tải về hoặc điều chỉnh thông tin cá nhân bất kỳ mà bên thứ ba cung cấp sử dụng cho AI tạo sinh”; “Tôi muốn xóa mọi thông tin cá nhân mà bên thứ ba cung cấp nhằm sử dụng cho AI tạo sinh” và “Tôi có một vấn đề khác”. 

Giải pháp ngăn Facebook lấy dữ liệu để đào tạo AI
Giải pháp ngăn Facebook lấy dữ liệu để đào tạo AI

Ở tùy chọn đầu tiên, người dùng có thể tải xuống dữ liệu bị “bên thứ ba” thu thập và xem xét trước chấp nhận đồng ý cho Meta sử dụng để đào tạo AI. Còn nếu không muốn Meta sử dụng dữ liệu cá nhân để đào tạo AI, người dùng có thể nhấn tùy chọn thứ hai. 

Nếu có yêu cầu khác, người dùng nhấn chọn tùy chọn ba và cung cấp thông tin gồm họ tên, quốc gia cư trú, cũng như email và ý kiến của mình. Sau đó, nhấn gửi đi. 

Sau khi hoàn thành tùy chọn, người dùng cũng cần thông qua bài kiểm tra bảo mật của hệ thống. Tuy nhiên, theo thông tin chia sẻ từ CNBC, đã có một số người dùng phản ánh không thể gửi biểu mẫu vì “dường như bị lỗi phần mềm”. 

Meta thu thập những dữ liệu nào của người dùng?

Theo định nghĩa của Meta, thông tin của bên thứ ba chính là những dữ liệu “được cung cấp công khai trên môi trường internet hoặc những nguồn được cấp phép”. Meta cũng cho biết, loại thông tin này “có thể được dùng cho việc đào tạo AI bằng cách sử dụng những gì thu thập được cho mục đích tổng hợp, dự đoán hoặc tạo ra nội dung mới. 

Trong bài viết đăng tải trên blog vào 30.8, Meta cho biết, họ đã lấy những thông tin công khai này cùng với dữ liệu được cấp phép từ đối tác. “Để đạt hiệu quả trong quá trình “giảng dạy” mô hình, chúng tôi cần nguồn dữ liệu lớn. Vì vậy, chúng tôi đã kết hợp sử dụng các nguồn khác nhau để đào tạo. Những nguồn này bao gồm thông tin công khai trên internet, thông tin được cấp phép và thông tin từ những sản phẩm, dịch vụ của Meta”. 

Như vậy, trong quá trình thu thập, hãng có thể lấy cả thông tin cá nhân của người dùng, chẳng hạn như một bài viết đăng tải công khai có thể chứa thông tin tác giả. Theo những gì Meta nói trong quá trình thu thập dữ liệu, quyền riêng tư người dùng được bảo đảm và có đội ngũ chuyên trách thực hiện điều này. 

Theo công bố vào đầu năm, hiện tại, Meta đang vận hành mô hình ngôn ngữ lớn LLaMA. Mô hình này hoạt động dưới dạng mã nguồn mở, cho phép tổ chức chính phủ, nhà nghiên cứu, xã hội và học viên sử dụng miễn phí.

Đại diện phát ngôn của Meta cho biết, phiên bản LLaMA thế hệ mới – LLaMA 2 hiện chưa sử dụng dữ liệu người dùng trên những nền tảng của Meta như Facebook hay Instagram để huấn luyện AI

“Tùy vào khu vực sinh sống mà người dùng có thể thực hiện quyền làm chủ dữ liệu, cũng như phản đối chúng tôi khai thác một số dữ liệu trong đào tạo AI”. Đồng thời, đại diện Meta cũng chia sẻ thêm “Người dùng có quyền biết thông tin dữ liệu của mình đang được chúng tôi sử dụng như thế nào”. 

cach ngan ngua meta lay du lieu de dao tao ai 3
Hiện chưa có dữ liệu nào của người dùng được Meta sử dụng để huấn luyện AI

Đến thời điểm hiện tại, hầu hết các công ty công nghệ như Microsoft, Meta, Google hay OpenAI vẫn tiến hành thu thập dữ liệu công khai trên internet nhằm phục vụ cho quá trình huấn luyện AI. Tuy nhiên, điều này cũng khiến giới chuyên môn nhiều lần đưa ra thắc mắc về số lượng thông tin khổng lồ mà những công ty này có được đang sử dụng như thế nào. 

Tuần trước, một liên minh bao gồm những cơ quan bảo vệ dữ liệu đến từ Anh, Thụy Sĩ, Canada và các quốc gia khác đã đưa ra một tuyên bố chung rằng Meta, ByteDance, X, Alphabet và Microsoft cần tuân thủ thực hiện theo luật bảo vệ dữ liệu và quyền riêng tư của người dùng ở những nơi mà họ đang hoạt động.

Trong tuyên bố, liên minh này cho biết “Các cá nhân cũng có thể bảo vệ thông tin cá nhân không bị thu thập và các công ty truyền thông xã hội giữ vai trò quan trọng trong việc cho phép người dùng tương tác với dịch vụ theo cách bảo vệ quyền riêng tư”. 

Nguồn: Tổng hợp.

Chia sẻ lên
Theo dõi trên
Đánh giá
5/5 - (179 bình chọn)
Kết nối với mình qua
Vietnix thành lập vào năm 2012, là công ty chuyên nghiệp tại Việt Nam trong lĩnh vực cung cấp dịch vụ Hosting, VPS, máy chủ vật lý, dịch vụ Firewall Anti DDoS, SSL… Với 10 năm xây dựng và phát triển, ứng dụng nhiều công nghệ hiện đại, Vietnix đã giúp hàng ngàn khách hàng tin tưởng lựa chọn, mang lại sự ổn định tuyệt đối cho website của khách hàng để thúc đẩy việc kinh doanh đạt được hiệu quả và thành công.
Đăng ký nhận tin
Để không bỏ sót bất kỳ tin tức hoặc chương trình khuyến mãi từ Vietnix
Bài viết liên quan
Bình luận