المصدر: Quantum
في سباق الذكاء الاصطناعي العالمي، تتبنى شركات الذكاء الاصطناعي الرائدة مثل OpenAI وMicrosoft وMeta عملية تطوير تسمى "التقطير" لبناء نماذج ذكاء اصطناعي أرخص للمستهلكين والشركات لتبنيها. لقد جذب نموذج الذكاء الاصطناعي القوي والفعال الذي بنته شركة DeepSeek باستخدام هذه التقنية، والذي يعتمد على أنظمة مفتوحة المصدر أصدرتها الشركات المنافسة Meta وAlibaba، اهتمامًا واسع النطاق في الصناعة. وأدى هذا الاختراق إلى اهتزاز ثقة الناس في زعامة وادي السيليكون في مجال الذكاء الاصطناعي، وتسبب في انخفاض حاد في أسهم شركات التكنولوجيا الكبرى في الولايات المتحدة.
باستخدام التقطير، تستخدم الشركات نموذجًا لغويًا كبيرًا (يُسمى نموذج "المعلم") لتوليد الكلمة التالية المحتملة في الجملة. يتم إنشاء البيانات بواسطة نموذج المعلم، ثم يتم تدريب نموذج "طالب" أصغر، مما يساعد على نقل المعرفة والتنبؤات الخاصة بالنموذج الأكبر إلى النموذج الأصغر بسرعة.
على الرغم من أن تقنية التقطير كانت مستخدمة على نطاق واسع لسنوات، إلا أن التطورات الأخيرة جعلت خبراء الصناعة يعتقدون أنها ستكون بمثابة نعمة متزايدة للشركات الناشئة التي تبحث عن طريقة رخيصة وفعالة لبناء تطبيقات تعتمد على هذه التكنولوجيا. قال أوليفييه جودمينت، رئيس منتجات المنصة في OpenAI: "التقطير أمر مذهل". "تأخذ العملية بشكل أساسي نموذجًا ذكيًا كبيرًا ومتطورًا وتستخدمه لتدريب نموذج أصغر... هذا النموذج الأصغر قوي جدًا في مهمة محددة، وهو رخيص ويتم تنفيذه بسرعة كبيرة." تتطلب نماذج اللغة الكبيرة مثل GPT-4 من OpenAI، وGemini من Google، وLlama من Meta كميات هائلة من البيانات وقوة الحوسبة لتطويرها وصيانتها. وفي حين لم تكشف الشركات عن التكلفة الدقيقة لتدريب النماذج الكبيرة، فمن المرجح أن تصل إلى مئات الملايين من الدولارات. تجعل تقنية التقطير قوة هذه النماذج متاحة للمطورين والشركات بسعر منخفض للغاية، مما يسمح لمطوري التطبيقات بتشغيل نماذج الذكاء الاصطناعي بسرعة على أجهزة مثل أجهزة الكمبيوتر المحمولة والهواتف الذكية.
يمكن للمطورين استخدام منصة OpenAI للتقطير، والتعلم من نماذج اللغة الكبيرة التي تدعم منتجات مثل ChatGPT. بعد استثمار ما يقرب من 14 مليار دولار في OpenAI، استخدمت Microsoft، الداعم الأكبر للشركة، GPT-4 لتطوير عائلة نماذج اللغة الصغيرة الخاصة بها، Phi، كجزء من شراكة تجارية. ومع ذلك، قالت شركة OpenAI إنها تعتقد أن شركة DeepSeek قامت بتقطير نماذجها لتدريب منتجاتها المنافسة، وهي خطوة تنتهك شروط الخدمة الخاصة بها. ولم ترد شركة DeepSeek علنًا على هذا الادعاء حتى الآن.
في حين أنه من الممكن استخدام تقنيات التقطير لبناء نماذج عالية الأداء، إلا أن الخبراء يضيفون أن هذه التقنيات لها حدود أيضاً. وقال أحمد عوض الله من قسم الأبحاث في مايكروسوفت: "إن تقنيات التقطير تقدم مقايضة مثيرة للاهتمام للغاية؛ فإذا قمت بتصغير النماذج، فإنك تقلل حتماً من قوتها". وقال إن النموذج المقطر يمكن استخدامه لتلخيص رسائل البريد الإلكتروني، "لكنه في الحقيقة ليس جيدًا جدًا في أشياء أخرى". وقال ديفيد كوكس، نائب رئيس نماذج الذكاء الاصطناعي في IBM Research، إن معظم الشركات لا تحتاج إلى نماذج ضخمة لتشغيل منتجاتها، وأن النماذج المبسطة قوية بما يكفي لسيناريوهات مثل برامج الدردشة لخدمة العملاء أو للتشغيل على أجهزة صغيرة مثل الهواتف المحمولة. وأضاف "طالما أنه بإمكانك خفض التكلفة والحصول على الإمكانات التي تريدها، فلماذا لا تفعل ذلك؟". ويشكل هذا تحديًا لنماذج الأعمال الخاصة بالعديد من شركات الذكاء الاصطناعي الرائدة. حتى لو استخدم المطورون نماذج مبسطة من شركات مثل OpenAI، فإن تكلفة تشغيلها وبنائها أقل بكثير، وبالتالي فإنها تولد إيرادات أقل. عادةً ما يتقاضى مطورو النماذج مثل OpenAI رسومًا أقل مقابل استخدام النماذج المبسطة لأنها تتطلب قدرًا أقل من الحساب. ومع ذلك، يعتقد جولدمنت من شركة OpenAI أن نماذج اللغة الكبيرة ستظل تُستخدم في "المهام عالية الذكاء وعالية المخاطر" لأن "الشركات على استعداد لدفع المزيد مقابل مستويات عالية من الدقة والموثوقية". وأضاف أن النماذج الكبيرة ستكون مطلوبة أيضًا لاكتشاف قدرات جديدة ثم تقطيرها إلى قدرات أصغر. ومع ذلك، تعمل الشركة على منع استخراج نماذجها الكبيرة واستخدامها لتدريب المنتجات المنافسة. لدى OpenAI فرق تراقب الاستخدام، وإذا اشتبهت في أن المستخدم يقوم بتوليد كميات كبيرة من البيانات لتصديرها وتدريب المنافسين، فيمكنها إزالة وصول هذا المستخدم، كما فعلت بالفعل مع الحسابات التي تعتقد أنها مرتبطة بـ DeepSeek. لكن معظم هذه الإجراءات تم تنفيذها بعد وقوعها. قال دوف كيرا، الرئيس التنفيذي لشركة Contextual AI، وهي شركة ناشئة تعمل على بناء أدوات استرجاع المعلومات للشركات: "تعمل OpenAI على منع تقطير البيانات لفترة طويلة، ولكن من الصعب للغاية تجنبه تمامًا".
ويعتبر التقطير أيضًا انتصارًا لمناصري النماذج المفتوحة، التي توفر تكنولوجيتها مجانًا للمطورين. كما فتحت شركة DeepSeek أيضًا أحدث نماذجها للمطورين. وقال كبير علماء الذكاء الاصطناعي في شركة ميتا، ليكون يانج: "سنستخدم على الفور تقنية التقطير وندمجها في منتجاتنا". "هذه هي فكرة المصدر المفتوح. طالما أن هذه العمليات مفتوحة، يمكنك الاستفادة من تطورات الآخرين".
يعني التقطير أيضًا أن مطوري النماذج يمكنهم إنفاق مليارات الدولارات لتحسين قدرات أنظمة الذكاء الاصطناعي الخاصة بهم ولا يزالون يواجهون منافسين يلحقون بهم، كما يتضح من البيانات التي أصدرتها شركة DeepSeek مؤخرًا. وهذا يثير تساؤلات حول ميزة المبادرة الأولى المتمثلة في بناء نماذج لغوية كبيرة، والتي يمكن الآن تكرار قدراتها في غضون أشهر. وقال كوكس من شركة آي بي إم: "في هذا العالم الذي يتغير بسرعة كبيرة... يمكنك في الواقع إنفاق الكثير من المال للقيام بذلك بالطريقة الصعبة، وسرعان ما سوف يتبعك الجميع في هذا المجال". "لذا فهي بيئة عمل مثيرة للاهتمام ولكنها صعبة."