Meta đã phát hành mô hình AI tạo giọng nói "Hộp thoại", hỗ trợ tạo giọng nói từ văn bản, có thể khớp các kiểu âm thanh dựa trên các mẫu chỉ dài hai giây và chuyển đổi các mẫu văn bản sang ngôn ngữ khác, dựa trên các mẫu giọng nói riêng lẻ và có thể đọc bản dịch nội dung văn bản bằng giọng nói gốc của người nói, hiện hỗ trợ sáu ngôn ngữ: Anh, Pháp, Đức, Tây Ban Nha, Ba Lan và Bồ Đào Nha. Meta cho biết Voicebox cũng có thể làm cho trợ lý ảo và nhân vật không phải người chơi trong metaverse tạo ra giọng nói tự nhiên và có thể cho phép người khiếm thị nghe tin nhắn bằng văn bản từ bạn bè do AI đọc bằng giọng nói của họ, cung cấp cho người sáng tạo các công cụ mới để dễ dàng tạo và chỉnh sửa bản âm thanh của video, v.v.