Meta đặt cược lớn vào Mango và Avocado khi cuộc chiến hình ảnh AI nóng lên
Cuộc đua giành quyền sở hữu những hình ảnh và video AI được sử dụng nhiều nhất đang kéo Meta trở lại trung tâm cuộc chiến.
Sau nhiều tháng đặt câu hỏi về định hướng AI của mình, Mark Zuckerberg hiện đang dẫn dắt công ty theo một con đường khép kín và cạnh tranh hơn, dựa trên hai mô hình mới được thiết kế để đối đầu trực tiếp với Google và OpenAI.
Trọng tâm của kế hoạch là Mango, một mô hình hình ảnh và video, và Avocado, mô hình văn bản thế hệ tiếp theo của Meta.
Cả hai dự kiến sẽ ra mắt trong nửa đầu năm 2026, theo thông tin được Giám đốc AI Alexandr Wang chia sẻ nội bộ trong buổi hỏi đáp toàn công ty với Giám đốc Sản phẩm Chris Cox.
Một sự thiết lập lại sau Llama và sự chuyển dịch khỏi các mô hình mở
Chiến lược của Meta đánh dấu một sự đoạn tuyệt rõ ràng với dòng mã nguồn mở Llama của nó.
Về nội bộ, Llama 4 đã được xem Điều này gây thất vọng, khiến ban lãnh đạo phải xem xét lại liệu tính cởi mở có còn mang lại lợi thế hay không khi các đối thủ đang đẩy mạnh việc đưa các hệ thống nhanh hơn và hoàn thiện hơn vào các ứng dụng dành cho người tiêu dùng.
Mango và Avocado được định vị là các mô hình độc quyền, được xây dựng để cạnh tranh trực tiếp với dòng Gemini của Google và các công cụ xử lý hình ảnh đang mở rộng của OpenAI.
Mango dự kiến sẽ tập trung vào việc tạo ra hình ảnh và video chất lượng cao, trong khi Avocado được thiết kế như một mô hình xử lý văn bản tiên tiến với khả năng suy luận và lập trình mạnh mẽ hơn, những lĩnh vực mà Meta đã tụt hậu trong quá khứ.
Bên trong Phòng thí nghiệm Siêu trí tuệ Meta
Các mô hình mới là những sản phẩm đầu tiên quan trọng từ Meta Superintelligence Labs, một bộ phận được thành lập trong quá trình tái cấu trúc lớn vào mùa hè.
Zuckerberg đích thân tuyển dụng Alexandr Wang, người sáng lập Scale AI, để lãnh đạo đơn vị này, sau khoản đầu tư 14 tỷ đô la của Meta vào Scale, giúp đưa dữ liệu và nhân tài quan trọng vào nội bộ công ty.
Alexandr Wang là người sáng lập Scale AI và hiện là Giám đốc AI tại Meta, được công nhận là tỷ phú tự thân trẻ nhất thế giới nhờ xây dựng cơ sở hạ tầng dữ liệu hỗ trợ trí tuệ nhân tạo hiện đại.
Kể từ đó, Meta đã tuyển dụng hơn 20 nhà nghiên cứu từ OpenAI và tập hợp một đội ngũ hơn 50 chuyên gia với kinh nghiệm sâu rộng trong các mô hình lớn và phương tiện tạo sinh.
Sự tập trung này là có chủ đích: việc tạo hình ảnh và video đã trở thành một trong những chiến trường cạnh tranh khốc liệt nhất trong lĩnh vực AI.
Trong phiên họp nội bộ, Wang cũng tiết lộ rằng Meta đã bắt đầu nghiên cứu ban đầu về các mô hình thế giới, các hệ thống AI học hỏi bằng cách quan sát và hiểu môi trường trực quan thay vì chỉ dự đoán văn bản.
Nỗ lực này báo hiệu một tham vọng dài hạn hơn là vượt ra ngoài các hệ thống dựa trên trò chuyện để tiến tới các mô hình có thể suy luận về thế giới vật lý.
Tạo hình ảnh trở thành tính năng hấp dẫn nhất
Động thái của Meta diễn ra khi các đối thủ đang tập trung mạnh vào AI hình ảnh.
Vào tháng 9, Meta đã phát hành Vibes, một trình tạo video ngắn được xây dựng bằng Midjourney.
Vài ngày sau, OpenAI ra mắt Sora, cho thấy mỗi người chơi giờ đây phản ứng nhanh chóng với nhau như thế nào.
Google đã gia tăng áp lực vào đầu năm với Nano Banana, một động thái giúp tăng số người dùng hàng tháng của Gemini từ 450 triệu vào tháng 7 lên hơn 650 triệu vào cuối tháng 10.
Cuộc cạnh tranh lại càng gay gắt hơn vào tháng 11 khi Google tung ra thế hệ thứ ba của Gemini.
Bên trong OpenAI, các giám đốc điều hành được cho là đã phản ứng bằng cách báo động đỏ để giành lại điểm chuẩn cao nhất.
Ngay sau đó, công ty đã phát hành phiên bản cập nhật của ChatGPT Images.
Sau đó, khi nói chuyện với các nhà báo, Sam Altman cho biết việc tạo hình ảnh hiện là một trong những lý do chính khiến người dùng tiếp tục quay lại, gọi đó là một tính năng thu hút.
Google thúc đẩy AI Đưa vào thị trường đại chúng
Google không hề chậm lại.
Hôm thứ Tư, hãng đã công bố Gemini 3 Flash, một mô hình nhanh hơn và rẻ hơn được thiết kế để sử dụng rộng rãi.
Mặc dù nhỏ hơn Gemini 3 Pro, nhưng nó sở hữu nhiều khả năng suy luận tương tự và nhắm thẳng vào các ứng dụng hàng ngày hơn là các gói cao cấp.
Giám đốc điều hành Alphabet, Sundar Pichai, cho biết,
“Với bản phát hành này, trí tuệ thế hệ tiếp theo của Gemini 3 hiện đang được triển khai cho tất cả mọi người trên các sản phẩm của chúng tôi, bao gồm ứng dụng Gemini + Chế độ AI trong Tìm kiếm. Các nhà phát triển có thể xây dựng với nó trong Gemini API, Google AI Studio, Gemini CLI và Google Antigravity, còn các doanh nghiệp có thể sử dụng nó trong Vertex AI và Gemini Với quy mô ngày càng trở nên thiết yếu, chiến lược giữ các công cụ mạnh mẽ đằng sau các bức tường phí dành cho doanh nghiệp có thể không còn thành công nữa.Căng thẳng nội bộ và rủi ro cao tại Meta
Việc chuyển sang mô hình đóng không diễn ra suôn sẻ.
Đã xuất hiện các báo cáo về mâu thuẫn nội bộ khi các nhóm chuyển từ Llama sang Avocado.
Một số kỹ sư coi sự chuyển hướng này là cần thiết để duy trì khả năng cạnh tranh, trong khi những người khác lo lắng về việc mất đi thiện chí và động lực được xây dựng thông qua phát triển mở.
Chi tiêu của Meta phản ánh cổ phần.
Hàng tỷ đô la đang được đổ vào điện toán, dữ liệu và tuyển dụng, với sự lãnh đạo của Wang hiện đang được theo dõi sát sao.
Đặc biệt, Avocado được nhiều người trong công ty coi là một bài kiểm tra sống còn để xem liệu Meta có thực sự sánh được với các mô hình tốt nhất trên thị trường hay không.
Liệu Meta có thể thắng trong cuộc đua vũ trang hình ảnh?
Việc Meta quay trở lại với AI độc quyền là một rủi ro được tính toán, chứ không phải là một sự trở lại được đảm bảo.
Mango gia nhập một thị trường nơi Google và OpenAI đã di chuyển với tốc độ chóng mặt, với lượng người dùng khổng lồ và các sản phẩm được tích hợp chặt chẽ.
Avocado phải đối mặt với những khó khăn thậm chí còn lớn hơn trong xử lý văn bản và lý luận, nơi các tiêu chuẩn thay đổi nhanh chóng và lòng trung thành mỏng manh.
Theo quan điểm của Coinlive, thách thức lớn nhất của Meta có thể không phải là nhân tài hay vốn đầu tư, mà là thời điểm.
Đến năm 2026, AI xử lý hình ảnh và video có thể đã trở thành hàng hóa thông dụng, với thành công ít phụ thuộc vào chất lượng thô mà phụ thuộc nhiều hơn vào phân phối, chi phí và sự tin tưởng.
Mango và Avocado có thể mạnh mẽ, nhưng sự tồn tại trong thị trường này sẽ phụ thuộc vào việc Meta có thể biến sức mạnh kỹ thuật thành thói quen hàng ngày, chứ không chỉ là những tiêu đề giật gân hay không.