Đăng nhập/ Đăng ký

Tại sao DeepSeek khiến những người thực hành AI phương Tây gặp nguy hiểm?

2025/01/27 17:32

Theo dõi

Tác giả: Carl Franzen; Người biên dịch: Shenchao TechFlow

Chỉ cách đây vài ngày, chỉ có những chuyên viên máy tính chuyên nghiệp nhất (và tôi nói rằng, với tư cách là một trong số họ) chỉ nghe nói về DeepSeek, một công ty AI của Trung Quốc là một công ty con của High-Flyer Capital Management, một công ty phân tích định lượng được thành lập vào năm 2015. Tuy nhiên, trong vài ngày qua, có lẽ nó đã trở thành công ty được nhắc đến nhiều nhất ở Thung lũng Silicon.

Điều này chủ yếu là do việc phát hành DeepSeek-R1, một mô hình ngôn ngữ lớn (LLM) mới có khả năng thực hiện các tác vụ tương tự như mô hình o1 tốt nhất hiện tại của OpenAI “Lý luận” - Khi trả lời những câu hỏi khó và giải quyết những vấn đề phức tạp, phải mất vài giây hoặc vài phút để suy ngẫm về sự phân tích của chính mình thông qua phương pháp từng bước hoặc “chuỗi suy nghĩ”.

Không chỉ vậy, DeepSeek-R1 còn đạt điểm trên nhiều điểm chuẩn khác nhau của bên thứ ba (các bài kiểm tra dùng để đo lường hiệu suất của AI trong việc trả lời các câu hỏi về nhiều chủ đề khác nhau) Nó được bật ngang bằng hoặc cao hơn o1 của OpenAI và chi phí đào tạo của nó được cho là chỉ khoảng 5 triệu USD, sử dụng ít bộ xử lý đồ họa (GPU) hơn nhiều so với mức bị cấm vận nghiêm ngặt ở Hoa Kỳ (cơ sở chính của OpenAI).

Nhưng không giống như o1, o1 chỉ cung cấp những người đăng ký cấp ChatGPT Plus trả phí ($20 mỗi tháng) và những người đăng ký cấp cao hơn (chẳng hạn như cấp Pro ($200 mỗi tháng) là mở , trong khi DeepSeek-R1 được phát hành dưới dạng mô hình mã nguồn mở hoàn toàn, điều này giải thích vì sao nó nhanh chóng leo lên vị trí dẫn đầu danh sách các mô hình phổ biến và tích cực nhất trên cộng đồng chia sẻ mã AI Hugging Face.

Ngoài ra, vì nó hoàn toàn là nguồn mở nên mọi người đã tinh chỉnh và đào tạo mô hình theo nhiều cách khác nhau để thích ứng với các nhiệm vụ cụ thể khác nhau, chẳng hạn như làm cho nó nhỏ gọn để chạy trên thiết bị di động hoặc được kết hợp với các mô hình nguồn mở khác. Ngay cả khi bạn muốn sử dụng nó cho mục đích phát triển, chi phí API của DeepSeek vẫn thấp hơn 90% so với mô hình o1 tương đương của OpenAI.

Điều ấn tượng nhất là bạn thậm chí không cần phải là kỹ sư phần mềm để sử dụng nó: DeepSeek cung cấp trang web và ứng dụng di động miễn phí cho người dùng Hoa Kỳ, Giao diện chatbot hỗ trợ R1 của nó rất giống với ChatGPT của OpenAI. Tuy nhiên, DeepSeek một lần nữa vượt qua OpenAI khi kết nối mô hình suy luận mạnh mẽ này với tìm kiếm trên web - điều mà OpenAI chưa triển khai (tìm kiếm trên web hiện chỉ có trên loạt mô hình GPT kém mạnh mẽ hơn).

Thật trớ trêu

Khi xét đến việc OpenAI ban đầu được dành riêng cho việc dân chủ hóa AI cho đại chúng. Có một sự trớ trêu thú vị, có lẽ đáng lo ngại ở đây. Như giám đốc nghiên cứu cấp cao của Nvidia, Jim Fan đã nói trên Điều đó không có ý nghĩa gì, nhưng những kết quả thú vị nhất thường là những kết quả có nhiều khả năng xảy ra nhất.”

Như người dùng X @SuspendsRobot đã nói (trích dẫn về DeepSeek dường như có trên ChatGPT. đã tạo đầu ra Hỏi & Đáp và các báo cáo khác được đào tạo về dữ liệu): “OpenAI đánh cắp dữ liệu từ toàn bộ internet để làm cho nó trở nên phong phú hơn và DeepSeek đánh cắp chúng và trả lại miễn phí cho đại chúng, điều này làm tôi nhớ đến một câu chuyện dân gian của Anh ”

Meta đang khủng hoảng vì nguồn mở Llama bị tụt lại phía sau?

Nhưng không chỉ người hâm mộ mới nhận thấy thành công của DeepSeek. Dựa trên các cuộc trò chuyện và bài đọc của tôi với nhiều kỹ sư, nhà tư tưởng và nhà lãnh đạo khác nhau, tính khả dụng của nguồn mở DeepSeek-R1, hiệu suất hiệu suất cao của nó và thực tế là nó dường như “không biết từ đâu” đã thách thức các nhà lãnh đạo trước đây trong lĩnh vực AI tổng hợp, trong Nó đã gây ra làn sóng chấn động khắp Thung lũng Silicon và hơn thế nữa. Nếu không phải là "mọi người" đang phát điên vì nó như tiêu đề cường điệu của tôi gợi ý, thì ít nhất nó cũng là một chủ đề nóng trong giới công nghệ và kinh doanh.

Một thông báo được đăng trên Blind, một ứng dụng chia sẻ tin đồn ẩn danh ở Thung lũng Silicon, đang được lan truyền rộng rãi, cho thấy Meta đang gặp khủng hoảng do sự thành công của DeepSeek vì nó nhanh chóng Vượt xa nỗ lực của chính Meta để trở thành vua AI nguồn mở thông qua mô hình Llama.

"Đây là một yếu tố thay đổi hoàn toàn cuộc chơi"

Người dùng X @tphuang đã đưa ra quan điểm thuyết phục: "DeepSeek đã được triển khai bên ngoài AI cấp cao nhất Bức ảnh đầu tiên khiến tôi nhận ra rằng chi phí nhân công của R1 thấp hơn nhiều so với Hoa Kỳ, điều đó có nghĩa là nhiều công việc sẽ được thay thế bằng tự động hóa trong 5 năm tới.” Anh ấy cũng chỉ ra tại sao R1 của DeepSeek lại tốt hơn OpenAI. o1. Hấp dẫn hơn với người dùng:

"o1 có 3 vấn đề lớn:

1 ) quá chậm

2) Quá đắt

3) Người dùng cuối thiếu quyền kiểm soát/quá phụ thuộc vào OpenAI

R1 giải quyết tất cả những vấn đề này. Các công ty có thể mua GPU Nvidia của riêng mình để chạy các mô hình này mà không phải lo lắng về chi phí bổ sung hoặc máy chủ OpenAI chậm/không phản hồi."

@tphaung Một sự so sánh đáng suy nghĩ cũng được nêu ra: "Liệu DeepSeek có trở thành Android của LLM không?"

Doanh nhân web Arnaud Bertrand đã thẳng thắn nói về X Tác động đáng kinh ngạc của sự thành công của DeepSeek : “Thật khó để nói quá rằng điều này đã thay đổi toàn bộ trò chơi đến mức nào. Nó không chỉ liên quan đến AI, mà còn là một sự mỉa mai to lớn về nỗ lực sai lầm của Mỹ nhằm ngăn chặn sự phát triển của công nghệ Trung Quốc và không có những hạn chế như vậy, DeepSeek. Có lẽ điều đó sẽ không xảy ra (như người ta thường nói, sự cần thiết là mẹ của phát minh) ”

Câu hỏi ôn tập

Tuy nhiên, một số người đã cảnh báo về sự phát triển nhanh chóng của DeepSeek, cho rằng với tư cách là một công ty khởi nghiệp hoạt động ở Trung Quốc, nó phải tuân thủ luật pháp nước này và các yêu cầu xem xét nội dung. Trên thực tế, khi tôi sử dụng DeepSeek cho iOS ở Mỹ, tôi phát hiện ra rằng nó không trả lời một số câu hỏi nhất định.

Là một thành viên của giới truyền thông, tôi chắc chắn rất coi trọng quyền tự do ngôn luận và biểu đạt. Đây là một trong những khái niệm cơ bản nhất mà tôi kiên quyết ủng hộ.

Tuy nhiên, tôi cũng phải chỉ ra rằng các mô hình và sản phẩm của OpenAI (bao gồm cả ChatGPT) cũng từ chối trả lời một loạt câu hỏi - đặc biệt liên quan đến tình dục con người và các câu hỏi về nội dung người lớn/NSFW, ngay cả khi chúng là nội dung chung.

Tất nhiên, đây không phải là sự so sánh hoàn toàn ngang bằng. Đối với một số người, việc không dựa vào công nghệ nước ngoài có thể khiến họ hoài nghi về giá trị và tiện ích cuối cùng của DeepSeek. Nhưng hiệu quả và chi phí thấp là không thể phủ nhận.

Trong thời đại mà 16,5% hàng hóa ở Hoa Kỳ được nhập khẩu từ Trung Quốc, tôi khó có thể cảnh báo về việc sử dụng DeepSeek-R1 chỉ dựa trên về những lo ngại về kiểm duyệt hoặc rủi ro bảo mật - đặc biệt Đây là khi mã mô hình có thể được tải xuống miễn phí, sử dụng ngoại tuyến, chạy trên các thiết bị trong môi trường an toàn và tinh chỉnh theo ý muốn.

Tôi thực sự phát hiện ra một số cuộc khủng hoảng hiện hữu khi nghĩ về "sự suy tàn của phương Tây" và "sự trỗi dậy của Trung Quốc" trong cuộc thảo luận sôi nổi xung quanh DeepSeek. Một số người cho rằng điều này có liên quan đến việc người dùng Hoa Kỳ tham gia ứng dụng Xiaohongshu vào khoảng thời gian TikTok bị cấm trong thời gian ngắn, khi họ ngạc nhiên trước chất lượng cuộc sống ở Trung Quốc được thể hiện trong các video được chia sẻ ở đó. DeepSeek-R1 nổi lên trong bối cảnh một câu chuyện trong đó Trung Quốc có vẻ (và theo nhiều số liệu) đang tăng trưởng, trong khi Hoa Kỳ có vẻ (và theo nhiều số liệu thì có) suy giảm.

Mô hình AI đầu tiên nhưng chắc chắn không phải là cuối cùng của Trung Quốc gây chấn động thế giới

Đây là Ngoài ra, đây sẽ không phải là mô hình AI cuối cùng của Trung Quốc đe dọa sự thống trị của những gã khổng lồ ở Thung lũng Silicon - ngay cả khi những gã khổng lồ đó, như OpenAI, đang huy động hơn 10% để phát triển trí tuệ nhân tạo chung (AGI, hoặc các chương trình vượt qua con người về mặt kinh tế nhất). nhiệm vụ có giá trị). Nhiều nguồn tài trợ hơn bao giờ hết.

Mới hôm qua, một mẫu máy Trung Quốc khác của ByteDance, công ty mẹ TikTok, Doubao-1.5-pro, đã được ra mắt và hiệu suất của nó trong các tiêu chuẩn của bên thứ ba. Hiệu suất tương đương sang mô hình GPT-4o không suy luận của OpenAI, nhưng chi phí chỉ bằng 1/50 so với mô hình sau.

Mô hình Trung Quốc đang phát triển nhanh và tốt đến mức ngay cả những người ngoài ngành công nghệ cũng phải chú ý: Tạp chí The Economist vừa xuất bản Trong một bài báo về sự thành công và phát triển của DeepSeek những nỗ lực AI khác của Trung Quốc, nhà bình luận chính trị Matt Bruenig đăng trên Phiên bản chatbot của nó tốt hơn tất cả về mặt này. Phiên bản chatbot của nó miễn phí và giá sử dụng API của nó thấp hơn 99,5% so với API của OpenAI."

OpenAI phản hồi như thế nào; ?

Không có gì ngạc nhiên khi Sam Altman, đồng sáng lập và Giám đốc điều hành OpenAI, hôm nay cho biết công ty sẽ giới thiệu loạt mô hình suy luận thế hệ thứ hai o3 chưa được phát hành cho ChatGPT, ngay cả đối với người dùng miễn phí sử dụng. OpenAI dường như vẫn đang đi theo con đường riêng của mình với các mô hình tiên tiến và độc quyền hơn – thiết lập các tiêu chuẩn ngành.

Nhưng vấn đề là: Với DeepSeek, ByteDance và các công ty AI khác của Trung Quốc theo sau, OpenAI cũng có thể tạo và phát hành các mô hình AI tiên tiến mới trong bao lâu. nó sẽ ở phía trước? Nếu tụt lại phía sau thì sự suy giảm của nó sẽ nhanh và nghiêm trọng đến mức nào?

Tuy nhiên, OpenAI có một tiền lệ lịch sử khác để rút ra. Nếu DeepSeek và các mô hình AI của Trung Quốc thực sự phù hợp với thế giới di động thì Android nguồn mở của Google đã làm gì với thế giới di động - chiếm phần lớn thị trường trong một thời gian - bạn chỉ cần nhìn vào cách iPhone của Apple đã làm được điều đó khi đóng cửa, độc quyền, toàn bộ. Cách tiếp cận của công ty đã chiếm được phân khúc cao cấp của thị trường và liên tục mở rộng xuống dưới từ đó, đặc biệt là ở Hoa Kỳ, đến mức hiện chiếm gần 60% thị phần điện thoại thông minh trong nước.

Tuy nhiên, đối với tất cả những người đang trả nhiều tiền để sử dụng các mô hình AI từ các phòng thí nghiệm hàng đầu, DeepSeek cho thấy rằng chức năng tương tự có thể được cung cấp với giá rẻ hơn và đạt được lợi ích cao hơn điều khiển. Trong môi trường doanh nghiệp, điều này có thể đủ để giành chiến thắng.

Có được sự hiểu biết rộng hơn về ngành công nghiệp tiền điện tử thông qua các báo cáo thông tin và tham gia vào các cuộc thảo luận chuyên sâu với các tác giả và độc giả cùng chí hướng khác. Chúng tôi hoan nghênh bạn tham gia vào cộng đồng Coinlive đang phát triển của chúng tôi:https://t.me/CoinliveSG

Thêm bình luận

Đăng nhậpđể lại nhận xét tuyệt vời của bạn…

0 Bình luận

Sớm nhất

Tải thêm bình luận