تخيل نموذج ذكاء اصطناعي يعمل على حاسوب AMD صغير يصحح خطأً برمجيًا معقدًا. هذا ما حدث بالفعل عندما قام نموذج 27B بإصلاح خطأ مهلة زمني حرج في مشغل LLMKube، كل ذلك دون الحاجة لمركز بيانات ضخم أو وحدة معالجة رسوميات سحابية.
استعدوا، لأن نموذجًا للذكاء الاصطناعي يعمل على جهاز كمبيوتر مصغر استهلاكي قام للتو بإصلاح خطأ حقيقي في برنامج معقد، مما يثبت أنك لا تحتاج دائمًا إلى قوة سحابية هائلة لتشغيل أحدث تقنيات الذكاء الاصطناعي. ما يعنيه هذا بالنسبة لك هو أن تطوير الذكاء الاصطناعي القوي يمكن أن يصبح أكثر سهولة، حيث يعمل على الأجهزة التي تمتلكها بالفعل، مباشرة من على مكتبك. مؤخرًا، واجه فريقنا في LLMKube مشكلة عنيدة: مهلة زمنية مخفية مدتها 60 ثانية في مشغلنا كانت تقطع الطلبات بصمت، بغض النظر عن المدة التي يحددها المستخدمون. كان هذا الخطأ خفيًا، ولم يظهر إلا عندما دفعنا إعدادات الترميز التفاعلي لدينا (Foreman باستخدام Claude Code) لاستخدام أحد نماذجنا المحلية على أجهزتنا بدلاً من الاعتماد على الخدمات الخارجية. عندما فشلت مهمة حقيقية وأطول بشكل غامض بعد اثنتي عشرة دقيقة بالضبط، أدركنا أنه يجب علينا التعمق أكثر. لذا، سلمنا المشكلة إلى Foreman، مدعومًا بنموذج ذكاء اصطناعي يحتوي على 27 مليار معلمة يسمى Qwopus. الجزء المدهش؟ هذا النموذج لم يكن يعمل على مزرعة خوادم عملاقة أو وحدة معالجة رسوميات سحابية باهظة الثمن. بل كان يعمل بكفاءة على جهاز AMD Strix Halo مصغر عادي بسعة 128 جيجابايت من الذاكرة الموحدة، يجلس مباشرة على مكتب أحدهم. باستخدام Vulkan للتسريع، أدى هذا الإعداد المدمج عمله بشكل لا تشوبه شائبة. أنتج نموذج الذكاء الاصطناعي بسرعة الكود الصحيح لإصلاح المهلة الزمنية المبرمجة. وأكدت فحوصاتنا أن الإصلاح تم تجميعه واجتاز جميع الاختبارات واستوفى معايير الجودة لدينا. الطلب الذي كان يتعطل عند 60 ثانية أصبح الآن يكتمل بشكل مريح في 128 ثانية. يظهر هذا الإصلاح، وهو الآن جزء من إصدار LLMKube 0.8.16، مدى قوة الذكاء الاصطناعي المحلي. لكن هنا يكمن الجزء الأكثر إثارة للاهتمام: بعد إصلاح الخطأ، انحرف النموذج قليلاً عن مساره. فقد كتب بهدوء اختبارين لا علاقة لهما تمامًا بأجزاء أخرى من الكود. وبينما تم تقليص هذه الاختبارات الإضافية أثناء المراجعة، يسلط هذا «التجاوز» الضوء على جانب حاسم في أنظمة الذكاء الاصطناعي التفاعلية هذه. إنها لا تتبع التعليمات فحسب؛ بل يمكنها التفسير والاستنتاج، وأحيانًا حتى الاستكشاف خارج المهمة المباشرة. هذه العملية برمتها، من اكتشاف الخطأ إلى التحقق من الإصلاح، سارت بالكامل على الأجهزة التي نمتلكها - مزيج من أجهزة NVIDIA و Apple Silicon و AMD. لقد عرضت بشكل مثالي هدف LLMKube: خدمة نماذج الذكاء الاصطناعي المتنوعة عبر أجهزة مختلفة من إعداد واحد. إنها إشارة واضحة إلى أن مستقبل الذكاء الاصطناعي القوي يقترب أكثر إلى منازلنا.