المؤلف: هاوتيان
عندما استيقظت، طلب مني العديد من الأصدقاء قراءة مانوس، الذي يدعي أنه وكيل ذكاء اصطناعي عالمي حقيقي في العالم، وقادر على التفكير المستقل والتخطيط وتنفيذ المهام المعقدة، وتقديم نتائج كاملة. يبدو الأمر رائعًا جدًا، ولكن بعيدًا عن الأصوات القلقة التي يرفعها العديد من الأصدقاء في دائرة الأصدقاء بشأن فقدان وظائفهم، ما الذي سيضيفه هذا إلى انفجار مشهد Web3 DeFai؟ فيما يلي، أود أن أشارككم أفكاري: 1) منذ حوالي شهر، أطلقت شركة OpenAI منتجًا مشابهًا، وهو Operator. يمكن للذكاء الاصطناعي إكمال المهام بشكل مستقل بما في ذلك حجوزات المطاعم والتسوق وحجز التذاكر وطلب الوجبات الجاهزة وما إلى ذلك في المتصفح. يمكن للمستخدمين الإشراف بصريًا وتولي السيطرة في أي وقت. لا يناقش الكثير من الناس ظهور هذا العامل لأنه مدفوع بنموذج واحد وهو إطار عمل يسمى الأداة. بمجرد أن يعتقد المستخدمون أن القرارات الرئيسية لا تزال بحاجة إلى التدخل، فإنهم يفقدون فكرة الاعتماد عليه لأداء المهام. 2) يبدو أن Manus لا يختلف كثيرًا في الظاهر، باستثناء أنه يحتوي على العديد من سيناريوهات التطبيق، بما في ذلك فحص السير الذاتية، والبحث في الأسهم، وشراء العقارات، وما إلى ذلك، ولكن في الواقع يكمن الاختلاف في الإطار ونظام التنفيذ وراءه. يتم تشغيل Manus بواسطة نموذج كبير متعدد الوسائط ويتبنى بشكل مبتكر نظامًا متعدد التوقيعات. باختصار، تحتاج الذكاء الاصطناعي إلى تقليد دورة عمل PDCA (التخطيط والتنفيذ والتحقق والتصرف) التي يقوم بها البشر، والتي سيتم إكمالها من خلال عمل نماذج كبيرة متعددة معًا. يركز كل نموذج على رابط محدد، مما لا يقلل فقط من مخاطر اتخاذ القرار لنموذج واحد في تنفيذ المهام، بل يحسن أيضًا من كفاءة التنفيذ. إن ما يسمى "نظام التوقيع المتعدد" هو في الواقع آلية للتحقق من اتخاذ القرار للتعاون بين النماذج المتعددة، مما يضمن موثوقية اتخاذ القرار وتنفيذه من خلال طلب التأكيد المشترك من نماذج مهنية متعددة. 3) من خلال المقارنة بهذه الطريقة، يتم إبراز مزايا manus بوضوح. إلى جانب سلسلة تجارب التشغيل المعروضة في عرض الفيديو التوضيحي، يتمتع الأشخاص حقًا بتجربة غير عادية. ولكن من الناحية الموضوعية، فإن الابتكار التكراري الذي قدمته مانوس لبرنامج Operator هو مجرد البداية ولم يصل بعد إلى مستوى الثورة الخلاقة.
تكمن النقطة الأساسية في مدى تعقيد المهمة التي يؤديها، فضلاً عن تحديد معدل التسامح مع الخطأ ومعدل نجاح نتائج التسليم للنموذج الكبير بعد دخول مطالبة إدخال المستخدم القياسية غير الموحدة. وإلا، فبعد هذه المجموعة من الابتكارات، هل يمكن تطبيق سيناريو DeFai الخاص بـ web3 بشكل ناضج على الفور؟ من الواضح أن هذا غير ممكن: على سبيل المثال: في سيناريو DeFai، لكي ينفذ العميل قرارات التداول، يجب أن يكون هناك عميل من طبقة Oracle مسؤول عن جمع البيانات والتحقق منها على السلسلة، ودمج البيانات وتحليلها، والمراقبة في الوقت الفعلي لأسعار السلسلة لالتقاط فرص التداول. تشكل هذه العملية تحديات كبيرة للتحليل في الوقت الفعلي. من الممكن أن فرصة التداول التي كانت مفيدة قبل ثانية لن تكون موجودة بعد نقل نموذج Oracle الكبير إلى وكيل تنفيذ المعاملات (نافذة التحكيم)؛ هذا في الواقع يكشف عن واحدة من أكبر نقاط الضعف في هذا النوع من النماذج الكبيرة متعددة الوسائط في اتخاذ قرارات التنفيذ، وهي كيفية الاتصال بالإنترنت، ولمس السلسلة لاسترداد وتحليل البيانات على مستوى الوقت الفعلي، وتحليل فرص التداول منها، ثم التقاط المعاملات. إن بيئة الإنترنت ليست سيئة في الواقع. لا تتغير أسعار الطلبات في العديد من مواقع التجارة الإلكترونية في الوقت الفعلي، لذا ليس من السهل التسبب في مشاكل ضخمة في التوازن الديناميكي للتعاون المتعدد الوسائط بأكمله. إذا كان الأمر يتعلق بالسلسلة، فإن مثل هذه التحديات موجودة طوال الوقت تقريبًا. 4) لذلك، بشكل عام، فإن ظهور الإنسان الآلي سوف يثير موجة من القلق في مجال الويب 2. ففي نهاية المطاف، قد تواجه العديد من الوظائف الإدارية ومعالجة المعلومات المتكررة خطر الاستبدال بالذكاء الاصطناعي. ولكن دعهم يقلقون بشأن أنفسهم.
يتعين علينا أن نتوصل إلى فهم موضوعي لدور web3 في تعزيز سيناريوهات تطبيق DeFai:
يتعين علينا أن نعترف بأن هذا الأمر له أهمية كبيرة. ففي نهاية المطاف، فإن مفاهيم LLM OS وLess Structure الأكثر ذكاءً التي اقترحتها، وخاصة نظام التوقيع المتعدد، ستوفر إلهامًا كبيرًا لـ web3 لتوسيع نطاق الجمع بين DeFi والذكاء الاصطناعي.
هذا في الواقع يصحح سوء فهم كبير في أغلب مشاريع DeFai. لا تعتمد على نموذج كبير لتحقيق أهداف معقدة مثل التفكير المستقل واتخاذ القرار من قبل وكلاء الذكاء الاصطناعي. هذا ببساطة غير عملي في السيناريوهات المالية. يتطلب تحقيق رؤية ديفاي الحقيقية حل مشاكل معقدة مثل الحد الأعلى لقدرات نماذج الذكاء الاصطناعي الفردية، وضمان الذرية للتعاون التفاعلي المتعدد الوسائط، والجدولة الموحدة للموارد والتحكم في الأنظمة المتعددة الوسائط، وتحمل أخطاء النظام وآليات معالجة الأخطاء، وما إلى ذلك.
على سبيل المثال: وكيل طبقة Oracle، المسؤول عن جمع وتحليل البيانات الموجودة على السلسلة، ومراقبة الأسعار، وتشكيل مصدر بيانات فعال؛
وكيل طبقة صنع القرار، يحلل ويقيم المخاطر بناءً على البيانات التي تغذيها Oracle، ويصوغ مجموعة من القرارات وخطط العمل؛
وكيل طبقة التنفيذ، بناءً على الخطط المختلفة التي قدمتها طبقة صنع القرار، مع مراعاة الوضع الفعلي، ينفذها، بما في ذلك تحسين رسوم الغاز، وحالة السلسلة المتقاطعة، وصراعات فرز المعاملات، وما إلى ذلك.
فقط عندما تصبح هذه السلسلة من العملاء قوية في نفس الوقت ويتم إنشاء إطار عمل نظام ضخم، سيتم إطلاق ثورة DeFai الحقيقية.