Đăng nhập/ Đăng ký

DeepSeek không chỉ là một công cụ thay đổi cuộc chơi cho AI

2025/02/05 21:40

Theo dõi

Nguồn: FT Chinese

Vào kỳ nghỉ Tết Nguyên đán của Trung Quốc một năm trước, OpenAI đã phát hành mô hình video Vincent Sora vào ngày 15 tháng 2 năm 2024 theo giờ địa phương. Trong một số video do Sora tạo ra, chuyển động camera mượt mà và hiệu ứng trình bày giống như thật đã gây ra cú sốc và sự bi quan lớn trong ngành mô hình lớn trong nước, vốn vẫn đang trong giai đoạn bắt chước và theo dõi vào thời điểm đó. Trong một thời gian, "thuyết đầu hàng" đã lan tràn, và các nhà đầu tư cùng các công ty lớn đã ra sức thuyết phục các doanh nhân từ bỏ những tưởng tượng và chuyển sang ứng dụng, nói rằng tinh thần kinh doanh theo mô hình lớn là "ngõ cụt".

Ai có thể ngờ rằng chỉ một năm sau vào dịp Tết Nguyên đán, mọi người lại bàn tán về một mô hình trong nước lớn có tên là DeepSeek. Ngoài các cuộc thảo luận và lan truyền trong giới công nghệ, ứng dụng này đã bắt đầu thâm nhập vào hàng nghìn hộ gia đình và ngày càng nhiều người dân bình thường bắt đầu sử dụng DeepSeek để tùy chỉnh công thức giảm cân, chỉnh sửa lời chúc mừng ngày lễ, viết thơ chữ đầu và thậm chí là xem bói.

Cho đến nay, DeepSeek đã ra mắt ba thế hệ mô hình. Vào tháng 5 năm ngoái, DeepSeek, một công ty con của Huanfang Quantitative, đã phát hành DeepSeek-V2, được cho là có khả năng tương đương với GPT-4, nhưng giá chỉ bằng gần 1% GPT-4. Mức giá thấp đã gây ra cuộc chiến giá cả kéo dài một năm đối với các mô hình lớn trong nước. Vào tháng 12, DeepSeek đã phát hành một mô hình lớn mới, DeepSeek-V3, giúp giảm chi phí đào tạo xuống còn vài triệu đô la Mỹ và được ca ngợi là "kẻ giết người giá rẻ". DeepSeek-R1 được phát hành lần này nhắm trực tiếp vào OpenAI o1. Việc ra mắt các chức năng "suy nghĩ sâu sắc" và "tìm kiếm trực tuyến" đã giúp DeepSeek thành công đứng đầu danh sách miễn phí ở cả Trung Quốc và Hoa Kỳ.

Có thể thấy tốc độ tiến hóa công nghệ của ba thế hệ mô hình do DeepSeek ra mắt là rất rõ ràng. V2 đã hạ giá, nhưng lợi thế về hiệu suất dường như không quá rõ ràng; V3 đã dần bắt kịp về hiệu suất dưới tiền đề chi phí cực thấp; cho đến R1, hiệu suất đã ngang bằng với các mô hình lớn tiên tiến nhất trên thế giới trong khi vẫn ở mức giá thấp, thực sự đạt được hiệu ứng phá vỡ vòng tròn. Mặc dù nhịp điệu rõ ràng, thời gian dành cho các bản cập nhật công nghệ ngày càng ngắn lại. Phải mất hơn nửa năm từ khi phát hành V2 đến V3, nhưng chỉ mất một tháng ngắn từ V3 đến R1.

Tôi đã nhắc đến DeepSeek, một công ty khởi nghiệp mới chỉ xuất hiện vào tháng 5 năm ngoái, trong triển vọng của tôi vào đầu năm nay. Vào thời điểm đó, tôi đã dự đoán rằng DeepSeek sẽ trở thành một công nghệ đột phá trong thị trường mô hình lớn vào năm mới. Chi phí thấp và giá thành thấp chứng tỏ các mẫu máy lớn trong nước không phải là không có giải pháp do hạn chế về công suất tính toán và chip. Khả năng "một mình" thách thức một số công ty lớn giàu có với tư cách là một công ty khởi nghiệp đã bác bỏ "thuyết đầu hàng" AI trước đây và mang lại cho các doanh nhân khác sự tự tin để tiếp tục đào sâu hơn vào lĩnh vực mô hình lớn.

Nhưng quan trọng hơn, DeepSeek không chỉ rẻ mà còn hoàn toàn là mã nguồn mở, phá vỡ hiệu ứng Matthew của các gã khổng lồ về công nghệ và vốn trong đào tạo mô hình. Đây là một trong những mối quan tâm sâu sắc xung quanh trí tuệ nhân tạo trong hai năm qua: chip ngày càng đắt hơn, chi phí đào tạo tăng cao, một số mô hình lớn trên thế giới đang dần trở nên khép kín hoặc thậm chí là "độc quyền", sức mạnh tính toán và dữ liệu ngày càng nằm trong tay một số ít công ty và tấm vé vào AI ngày càng đắt hơn. Phần lớn mọi người có thể chỉ là người ngoài cuộc trong cuộc cách mạng công nghệ AI này.

Việc thực hiện kế hoạch Stargate được Trump công bố không lâu sau khi nhậm chức sẽ càng làm tăng thêm hiệu ứng này. Kế hoạch cơ sở hạ tầng AI đầy tham vọng này có giá trị 500 tỷ đô la và được SoftBank, Oracle và OpenAI dẫn đầu. Với sự hậu thuẫn của chính phủ Hoa Kỳ, các công ty lớn dẫn đầu và lượng vốn khổng lồ đổ vào thị trường... rõ ràng mục tiêu cuối cùng của dự án này là dựa vào cuộc chạy đua về vốn, chip và sức mạnh tính toán để đảm bảo rằng Hoa Kỳ sẽ luôn thống trị cuộc cách mạng công nghệ AI này.

Sự xuất hiện của DeepSeek ít nhất đã làm giảm bớt nỗi lo lắng mà dự án Stargate mang lại cho cộng đồng AI của Trung Quốc. Khi sự kết hợp giữa vốn và sức mạnh tính toán không còn là cách duy nhất để tiến bộ công nghệ, mọi người trong lĩnh vực công nghệ đều có thể thấy trước được điều này có ý nghĩa gì đối với các doanh nhân và nhà phát triển.

Chính vì vậy mà DeepSeek hiện được dư luận ca ngợi là "sáng kiến cấp quốc gia". Bỏ qua việc việc gắn kết "vận mệnh quốc gia" với một công ty khởi nghiệp có phải là lời tâng bốc hay không, sau khi chứng kiến quá khứ của Huawei và TikTok, việc nâng một công ty lên tầm chính trị và đưa nó lên vị trí hàng đầu trong cuộc chơi giữa các cường quốc sẽ không mang lại lợi ích gì cho ngành công nghệ Trung Quốc, nơi mà sự bi quan vừa đảo ngược.

Vì DeepSeek đã khiến việc nhập AI trở nên “phổ biến” thông qua mã nguồn mở, nên việc ứng dụng và đổi mới AI trong nhiều ngành công nghiệp khác nhau sẽ bùng nổ hơn nữa trong tương lai dựa trên việc giảm nhanh chi phí AI. Các cuộc thảo luận và suy nghĩ hiện tại nên quay trở lại ý nghĩa của thị trường và công nghệ: làm thế nào để tạo ra một môi trường thị trường tốt để đổi mới công nghệ có thể nhận được phản hồi tích cực; và làm thế nào để các doanh nhân và người dân bình thường có thể sử dụng AI để thay đổi thế giới xung quanh họ.

Có được sự hiểu biết rộng hơn về ngành công nghiệp tiền điện tử thông qua các báo cáo thông tin và tham gia vào các cuộc thảo luận chuyên sâu với các tác giả và độc giả cùng chí hướng khác. Chúng tôi hoan nghênh bạn tham gia vào cộng đồng Coinlive đang phát triển của chúng tôi:https://t.me/CoinliveSG

Thêm bình luận

Đăng nhậpđể lại nhận xét tuyệt vời của bạn…

0 Bình luận

Sớm nhất

Tải thêm bình luận