Facebook đã tận dụng ảnh Instagram để đào tạo AI

Facebook đã sử dụng kho cơ sở dữ liệu hình ảnh khổng lồ của Instagram để xây dựng thành công một trí tuệ nhân tạo có thể “nhìn thấy” những gì nó nhìn thấy. Theo bộ phận nghiên cứu trí tuệ nhân tạo của Facebook, biệt danh cho chương trình thị giác máy tính mới là Seer (Self-SupERvised). Trong bài kiểm tra nhận dạng đối tượng do ImageNet đảm nhiệm- một cơ sở dữ liệu hình ảnh lớn được thiết kế chỉnh chu để nghiên cứu phần mềm nhận dạng đối tượng trực quan – “điểm phân loại chính xác” của Seer cao tới 84,2%, điểm cao nhất từ ​​trước đến nay.

Facebook đang tận dụng dữ liệu hình ảnh của Instagram để đào tạo AI

Facebook đã cải thiện khả năng AI của mình trong việc phân loại. Các đối tượng trong ảnh nhờ dữ liệu từ 3,5 tỷ bức ảnh Instagram.

Facebook đang tận dụng dữ liệu hình ảnh của Instagram để đào tạo AI
Facebook đang tận dụng dữ liệu hình ảnh của Instagram để đào tạo AI

Gã khổng lồ mạng xã hội đã tiết lộ dự án thu thập dữ liệu hình ảnh mới nhất. Cho AI tại sự kiện Hội nghị các nhà phát triển hàng năm F8 ở San Jose. Giám đốc công nghệ Mike Schroepfer giải thích. Về những thách thức của việc cải thiện độ chính xác của máy tính. Để nó hiểu các đối tượng trong ảnh. Một trong những vấn đề lớn nhất của công ty. Là không có đủ hình ảnh được gắn đúng cách để đào tạo AI hiểu những gì có trong đó.

Ví dụ, trước khi AI có thể hiểu một quả táo trong một bức ảnh thực sự là một quả táo. Nó cần được “đào tạo” trên các bức ảnh trước đó về quả táo mà con người; gắn chính xác với đúng loại trái cây.

Facebook chia sẻ ảnh Instagram phổ biến để cải thiện khả năng nhận dạng hình ảnh tổng thể

Bằng việc sở hữu dịch vụ chia sẻ ảnh Instagram phổ biến. Facebook sẽ muốn sử dụng tất cả dữ liệu hình ảnh của Instagram. Được chụp từ những bức ảnh mà mọi người tải lên. Sau đó, nó có thể sử dụng những ảnh đó để cải thiện khả năng nhận dạng; hình ảnh tổng thể.

Hiện tại, hầu hết chương trình AI ở lĩnh vực thị giác máy tính. Đều được huấn luyện dựa trên các bức ảnh đã phân loại kỹ; và dán nhãn nội dung cẩn thận. Tuy nhiên, Facebook cho biết Seer đã có thể tự “học” thông qua việc phân tích hình ảnh Instagram ngẫu nhiên. Không cần dựa trên nhãn gắn và chưa được xác định nội dung. Kỹ thuật này được gọi là học tập tự giám sát (self-supervised learning).

Học tập tự giám sát là kỹ thuật về AI được giới khoa học chú ý gần đây. Mô hình này có ưu điểm là cần ít dữ liệu. Cũng như không cần phân loại và quản lý dữ liệu, qua đó có thể hoạt động; với các tập dữ liệu lớn hơn và đa dạng hơn.

Công nghệ AI ngàng càng phát triển

“Tương lai của AI là tạo ra các hệ thống có thể tự học trực tiếp từ bất kỳ thông tin nào. Chúng được cung cấp, kể cả đó là văn bản, hình ảnh hay một loại dữ liệu nào khác. Chúng sẽ tự học cách nhận ra các đối tượng trong một bức ảnh. Diễn giải một khối văn bản hoặc thực hiện bất kỳ tác vụ nào được yêu cầu”, đại diện Facebook viết trên blog. “Hiệu suất của Seer đang chứng minh việc học tập tự giám sát của AI có thể thực hiện được. Có thể xem đây là bước đột phá cuối cùng, mở ra con đường cho các mô hình thị giác máy tính linh hoạt, chính xác và thích ứng hơn trong tương lai”.

Cũng theo đại diện Facebook, dù chỉ là một dự án nghiên cứu, tiềm năng ứng dụng của Seer là rất lớn. Chẳng hạn, AI này có thể tối ưu hóa văn bản mô tả hình ảnh trên Facebook cho những người bị khiếm thị. Phân loại tự động chính xác các mặt hàng được bán trên Facebook Marketplace. Cũng như xác định và loại bỏ các hình ảnh có nội dung độc hại trên Facebook.

Công nghệ AI ngàng càng phát triển
Công nghệ AI ngàng càng phát triển

Việc sử dụng hình ảnh công khai trên Instagram để đào tạo AI của Facebook đang gặp phải những ý kiến trái chiều

Tuy nhiên, việc sử dụng hình ảnh công khai trên Instagram. Để đào tạo AI của Facebook đang vấp phải chỉ trích rất lớn. Theo CNBC, nhiều người dùng mạng xã hội này ngạc nhiên. Khi biết rằng hình ảnh của họ đang được sử dụng để dạy AI.

“Chúng tôi đã thông báo cho các chủ tài khoản Instagram trong chính sách dữ liệu. Rằng Facebook có quyền sử dụng thông tin trên nền tảng để hỗ trợ nghiên cứu và đổi mới. Bao gồm cả những công nghệ như thế này”; Priya Goyal, kỹ sư phần mềm tại Facebook AI Research, nói với CNBC.

Đại diện Facebook cũng cho biết sẽ mở mã nguồn Seer để các nhà nghiên cứu có thể thử nghiệm. Tuy nhiên, công ty khẳng định sẽ không chia sẻ hình ảnh của người dùng ra bên ngoài.

Bên cạnh Facebook, một số “ông lớn” công nghệ khác cũng đang quan tâm đến lĩnh vực thị giác máy tính. Năm ngoái, Google công bố chương trình thị giác máy tính có tên SimCLRv2, trong khi OpenAI cũng giới thiệu iGPT 2.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

error: Content is protected !!