Vào ngày 16 tháng 11, gã khổng lồ truyền thông xã hội Meta đã giới thiệu các mô hình trí tuệ nhân tạo (AI) mới nhất của mình trong một sự kiệnbài viết chính thức.
Trên thực tế, trong hội nghị Meta Connect vào ngày 28 tháng 9, Meta đã tiết lộ mô hình Emu (Expressive Media Universe).Bây giờ họ có một bản cập nhật về nó.
Đầu tiên, "Video Emu" có khả năng tạo các chỉnh sửa video dựa trên đầu vào văn bản và hình ảnh. Thứ hai, "Emu Chỉnh sửa" chuyên về xử lý hình ảnh, nâng cao đáng kể độ chính xác trong chỉnh sửa hình ảnh.
Tạo video dễ dàng
Meta chia quy trình thành hai giai đoạn: ban đầu, tạo hình ảnh dựa trên lời nhắc văn bản, sau đó là tạo video dựa trên cả văn bản và hình ảnh được tạo. Điều này "được tính toán" hoặc phương pháp riêng biệt để tạo video cho phép đào tạo hiệu quả các mô hình tạo video.
Sự khác biệt
Ngược lại với các phương pháp trước đây dựa vào một loạt mô hình phức tạp (chẳng hạn như năm mô hình choLàm một đoạn phim), kỹ thuật tiên tiến của chúng tôi rất dễ thực hiện. Nó chỉ sử dụng hai mô hình khuếch tán, cho phép tạo video 4 giây 512x512 với tốc độ 16 khung hình mỗi giây.
(Nguồn: Meta)
Sản phẩm được nâng cấp-Emu Chỉnh sửa
Ngoài ra, mặc dù các mô hình tạo hình ảnh có thể hướng dẫn đã tiến bộ đáng kể trong những năm gần đây nhưng chúng vẫn gặp phải những hạn chế trong việc cung cấp khả năng kiểm soát chính xác.
Do đó, chúng tôi đang giới thiệu Emu Edit, một phương pháp cải tiến được thiết kế để hợp lý hóa các tác vụ xử lý hình ảnh đa dạng và nâng cao khả năng cũng như độ chính xác trong chỉnh sửa hình ảnh.
Ngược lại với nhiều mô hình AI tổng hợp hiện tại, Emu Edit tuân thủ tỉ mỉ các hướng dẫn, giữ nguyên các pixel gốc trong hình ảnh đầu vào không liên quan đến các hướng dẫn nhất định.
Ví dụ: khi kết hợp văn bản "Aloha!" trên mũ bóng chày, hình dáng của mũ sẽ không bị thay đổi.
Cơ sở dữ liệu lớn nhất
Để tạo điều kiện thuận lợi cho việc đào tạo mô hình, Meta đã tuyển chọn một tập dữ liệu bao gồm 10 triệu mẫu tổng hợp. Mỗi mẫu bao gồm một hình ảnh đầu vào, một mô tả nhiệm vụ và hình ảnh đầu ra được nhắm mục tiêu tương ứng.
Họ bày tỏ,
"Chúng tôi tin rằng đây là tập dữ liệu lớn nhất thuộc loại này cho đến nay."
Kết hợp với FB và IG theo chiều sâu
Meta cũng bày tỏý tưởng củatăng cường các bài đăng trên Instagram của bạn bằng ảnh tĩnh hoạt hình hoặc tạo nội dung hoàn toàn mới. Điều này dự kiến sẽ được tích hợp sâu với các công ty con của nó, Facebook và Instagram, trong tương lai. Tuy nhiên, thời gian cụ thể vẫn chưa được cơ quan chức năng công bố chính thức.