في الشهر الماضي، نشر موقع GOV.UK بهدوء نتائج التجربة التي أجراها على مساعد البرمجة المدعوم بالذكاء الاصطناعي. لم تكن هناك ضجة إعلامية، ولا مؤتمر صحفي وزاري. بل مجرد بيانات موثوقة تُظهر أن أكثر من 1000 مطور في 50 وزارة قد وفروا ما يقرب من ساعة يوميًا بفضل استخدام أدوات الذكاء الاصطناعي.
بعد أن كتبتُ عن فشل مشروع «مايكروسوفت كوبيلوت» الذي كلف 54 ألف جنيه إسترليني ولم يحقق سوى مكاسب «ضئيلة للغاية» في الإنتاجية، بدا الأمر مختلفًا بعض الشيء هذه المرة. فالحكومة نفسها التي أفسدت عملية تطبيق الذكاء الاصطناعي في مجال ما، نجحت في الوقت نفسه في تنفيذ مشروع آخر بنجاح.
إذن، ما الذي فعلوه بشكل مختلف؟
استمرت التجربة التجريبية لـ«مساعد البرمجة بالذكاء الاصطناعي» (AICA) من نوفمبر 2024 إلى فبراير 2025. وعلى عكس نهج «كوبيلوت» العشوائي، اتسمت هذه التجربة بالتركيز: فقد تم تقديم 2500 ترخيص للمطورين الذين يعملون فعليًا في مجال البرمجة. وكانت النتائج ملموسة.
بلغ متوسط الوقت الموفر 56 دقيقة في كل يوم عمل. وهذا يعني توفير 28 يوم عمل لكل مطور سنويًا. وليس 2.2 ساعة أسبوعيًا كما في التجارب الأخرى — بل ما يقرب من ساعة كاملة كل يوم.
والأهم من ذلك، أن مؤشرات الرضا أظهرت صورة مختلفة:
- قال 72% إن هذه الأدوات تقدم قيمة جيدة لمنظماتهم
- 58% لا يرغبون في العودة إلى العمل دون مساعدة الذكاء الاصطناعي
- أنجز 65% المهام بسرعة أكبر، وحل 56% المشكلات بكفاءة أكبر
قارن ذلك بالتجربة العامة لـ «كوبيلوت»، حيث لم يستخدمه يومياً سوى 30٪ من المشاركين، ولم يتمكن معظمهم من تحديد متى كانت الذكاء الاصطناعي تختلق المعلومات.
ما أصابوا فيه: الأساسيات
لقد اختاروا الأشخاص المناسبين. فبدلاً من اختيار موظفي الخدمة المدنية عشوائياً والتمني بأن تسير الأمور على ما يرام، استهدفوا المطورين — أي الأشخاص الذين لديهم بالفعل خبرة في مراجعة الأكواد البرمجية وتصحيح الأخطاء ومراقبة الجودة. وكان لدى هؤلاء المستخدمين المهارات اللازمة لتقييم مخرجات الذكاء الاصطناعي تقييماً نقدياً.
اختاروا الأدوات المناسبة. صحيح أن GitHub وCopilot وGoogle Gemini Code Assist ليست مثالية، لكنها مصممة خصيصًا لمهام البرمجة. كانت هذه الأدوات ملائمة للمهمة، على عكس روبوتات الدردشة العامة التي يُطلب منها إحداث ثورة في كل شيء.
لقد قاموا بقياس ما يهم. فبدلاً من الوعود الغامضة المتعلقة بالإنتاجية، قاموا بتتبع مؤشرات محددة: الوقت الذي تم توفيره في كتابة الأكواد البرمجية والتحليل والمراجعة. وتُظهر البيانات أن المطورين وفروا 24 دقيقة يومياً في عمليات البرمجة والتحليل وحدها.
وقد حافظوا على معايير الجودة. فلم يتم قبول سوى 15.8% من الكود الذي اقترحته الذكاء الاصطناعي دون تعديل. وهذا دليل على أن المطورين كانوا يؤدون عملهم على النحو الصحيح، حيث كانوا يراجعون ويحسنون مخرجات الذكاء الاصطناعي بدلاً من قبولها دون تمحيص.
الحفاظ على العنصر البشري
أحد أبرز الاختلافات في هذه التجربة هو أنها لم تسعَ إلى استبدال المطورين. بل ركزت بدلاً من ذلك على تعزيز مهاراتهم الحالية.
كان 39% من المستخدمين الذين أفادوا بأنهم استخدموا كودًا اقترحته الذكاء الاصطناعي لا يزالون يتخذون قرارات واعية بشأن ما يقبلونه أو يعدلونه أو يرفضونه. وأصبح الذكاء الاصطناعي بمثابة أداة متطورة للإكمال التلقائي، وليس بديلاً عن المبرمج.
وكما قال خبراء أكاديمية «جين آي»:
"أفضل تطبيقات الذكاء الاصطناعي لا تلغي دور الحكم البشري، بل تزود البشر بمواد أولية أفضل للعمل عليها." إريك شوارتز
"إن معظم النجاحات التي رأيتها لدى الشركات في هذه الرحلة تنبع من البدء بالمستخدمين، وما يواجهونه من صعوبات أو ما ينقصهم، ومن تمكينهم من خلال التدريب والتوجيه لاستخدام الأدوات المناسبة. وبوجود قواعد أساسية وأهداف واضحة، يمكنهم المساهمة في تحقيقها وقياس أدائهم وفقًا لها" هوغو إم سي بينتو
وقد نجحت هذه التجربة على وجه التحديد لأنها حافظت على العنصر البشري الذي يجعل تطوير البرمجيات الجيدة أمراً ممكناً: التفكير النقدي، ومراجعة الجودة، وفهم السياق.
لماذا يهم هذا الأمر خارج نطاق الحكومة
تقدم تجربة البرمجة نموذجًا للتطبيق الناجح للذكاء الاصطناعي في أي مكان:
ابدأ بالمستخدمين المتمرسين. لا تتوقع أن يحول الذكاء الاصطناعي الأشخاص غير المتمرسين إلى متمرسين بطريقة سحرية. استخدمه مع الأشخاص الذين يفهمون المجال بالفعل ويستطيعون تقييم النتائج.
اختر الأدوات المناسبة للمهام. توقف عن محاولة استخدام الذكاء الاصطناعي العام في كل شيء. فالأدوات المتخصصة تؤدي المهام المتخصصة بشكل أفضل.
قم بقياس النتائج المحددة. فعبارة «زيادة الإنتاجية» لا معنى لها. أما «توفير 24 دقيقة في عملية كتابة الكود» فهي بيانات قابلة للتطبيق.
توقع تدخلًا بشريًا. إذا كانت 85% من مخرجات الذكاء الاصطناعي تحتاج إلى تعديل، فهذا ليس خطأً — بل إنها تعمل كما هو مخطط لها.
الحقيقة المزعجة حول نجاح الذكاء الاصطناعي
نجحت تجربة البرمجة التي أجرتها الحكومة لأنها كانت بسيطة. لم تكن هناك وعود كبيرة بشأن إحداث تحول جذري. ولم تُدّعى استبدال إدارات بأكملها. بل كان السؤال بسيطًا ومباشرًا: هل يمكن للذكاء الاصطناعي أن يساعد المطورين على كتابة الأكواد بسرعة أكبر؟
كان الجواب نعم، شريطة التنفيذ السليم والتدريب والتوقعات الواقعية.
تفشل معظم المؤسسات في استخدام الذكاء الاصطناعي لأنها تحاول حل المشكلة الخطأ. فهي تريد من الذكاء الاصطناعي أن يعالج أوجه القصور لديها، أو يلغي احتياجاتها التدريبية، أو يغير ثقافتها. وقد نجحت تجربة الحكومة في مجال البرمجة لأنها كانت تهدف إلى شيء بسيط: جعل المبرمجين المتميزين أكثر كفاءةً بقليل.
ماذا بعد؟
لا تؤثر نتائج التجربة على عمليات الشراء المستقبلية – ويبدو أن هذا القرار يقع ضمن اختصاص جهة أخرى في الحكومة. لكن هذا النجاح يوفر نموذجًا ينبغي على الوزارات (والمؤسسات) الأخرى دراسته بعناية.
يتمحور التباين بين هذه التجربة وفشل «كوبيلوت» حول التنفيذ واختيار المستخدمين، فضلاً عن وجود توقعات واقعية وقابلة للاختبار بشأن ما يمكن للذكاء الاصطناعي فعله فعليًّا.
عندما كتبت عن تجربة «كوبيلوت»، سألني العديد من الأشخاص عما إذا كنت أعتقد أن استخدام الذكاء الاصطناعي في القطاع الحكومي محكوم عليه بالفشل. وتشير تجربة البرمجة هذه إلى أن الأمر ليس كذلك – لكن النجاح يتطلب القيام بالعمل على النحو الصحيح، بدلاً من التعلق بأمل أن تحل التكنولوجيا وحدها المشاكل التنظيمية.
لقد أصابت الحكومة في تعاملها مع الذكاء الاصطناعي، حيث اعتبرته أداة متطورة تتطلب مستخدمين ماهرين، وليس سحرًا يحول أي شخص إلى خبير. وهذا درس يستحق أن يتذكره كل من يطبق تقنيات الذكاء الاصطناعي، سواء في دوائر الحكم البريطانية أو في شركتك الناشئة المحلية.
هيلينا ماكليلر هي المؤسسة المشاركة لموقع thegenAIacademy.com . وهي تربط بين المؤسسات التي تطبق الذكاء الاصطناعي والخبراء في العالم الواقعي الذين يعرفون كيفية تحقيق النتائج بالطريقة الصحيحة – ونعم، ما زالت تستخدم شرطة التوصيل الطويلة!