هل يمكن للذكاء الاصطناعي أن يضاهي الخبرة البشرية في أهم المهام الاقتصادية؟ سؤال لم يعد افتراضيًا، بل صار محور أبحاث مكثفة في عصر تتسارع فيه التقنية وتتصاعد فيه رهانات الكفاءة والجدوى.
هذه الإشكالية تتجسد بوضوح في معيار جديد يحمل اسم "جي دي بي فال – GDPval" أطلقته شركة "أوبن إيه آي"، ليكون أول اختبار واقعي شامـل لمدى قدرة النماذج الذكية على إنجاز الأعمال التي لطالما احتكرتها العقول الإنسانية المحترفة لعقود.
مهام واقعية
- يستند معيار "جي دي بي فال" إلى اختيار 1320 مهمة رقمية تمثل جوهر العمل المهني في 44 وظيفة رئيسية موزّعة على 9 قطاعات تمثل نحو 75% من الناتج المحلي الأمريكي، وتم تطوير المهام بالتعاون مع خبراء يمارسون تلك الوظائف فعليًا، حيث يبلغ متوسط خبرتهم 14 عامًا، لإعطاء المعيار قيمة عملية فعلية وليست نظرية محضة.
البيئة المهنية
- يركز المعيار على محاكاة التعقيد الواقعي لوظائف اليوم، فيتطلب من الذكاء الاصطناعي التعامل مع جداول بيانات، وعروض تقديمية، ومستندات نصية، وصور، ومقاطع فيديو وملفات تصميم هندسي، تعكس كافة الأنشطة الرقمية الفعلية بالكثير من المهن المعرفية المؤثرة اقتصادياً، حيث يتجاوز مجمل الأجور السنوية للمهن المغطاة 3 تريليونات دولار.
اختيار وتصنيف
- ظهر في اختيار القطاعات والمهن الجانب العلمي الصارم؛ فكل قطاع مشمول يساهم بأكثر من 5% من الناتج المحلي، وتم اختيار أكثر المهن الرقمية أجرًا فيه وفق شبكة معلومات الوظائف التابعة لوزارة العمل الأمريكية، شريطة أن تكون 60% على الأقل من مهامها رقمية قابلة للأتمتة.
مراجعات الخبراء
- تُعرض نتائج الذكاء الاصطناعي والبشر على المحكِّمين دون معرفة مصدر كل نتيجة، بحيث يُقيّم كل أداء بشكل موضوعي وحيادي تمامًا، ويتم التقييم وفق جودة التسليم النهائي، والدقة، والاتساق، والكفاءة.
كفاءة اقتصادية
- أظهرت الدراسة أن دمج النماذج الذكية مع إشراف الخبراء البشريين حقق وفورات واضحة في الوقت والتكلفة، فمثلا، سجل "جي بي تي-5" زيادة في السرعة بنسبة 1.39 ضعف، وتراجعًا في التكاليف بنسبة 1.63 ضعف تقريبًا، بالمقارنة مع العمل البشري التقليدي، وإن كانت التكاليف النهائية تتأثر بتكلفة الأخطاء الجسيمة المحتملة.
أبرز القطاعات والمهن التي يغطيها مقياس "جي دي بي فال" لتقييم الذكاء الاصطناعي |
||||
القطاع |
|
نسبة من الناتج المحلي (%) |
|
أمثلة على المهن المشمولة وإجمالي التعويض السنوي للعاملين بالمهنة |
العقارات والتأجير |
|
13.80% |
|
مديرو الممتلكات (أي المتخصصين في إدارة وتشغيل العقارات سواء كانت سكنية أو تجارية بالنيابة عن مالكيها) — 24.54 مليار دولار
|
التصنيع |
|
10.00% |
|
مشرفو الخطوط الأمامية للإنتاج والعمال التشغيليون — 51.07 مليار دولار موظفو الشراء — 39.79 مليار دولار الشحن والاستلام والمخزون — 38.50 مليار دولار المهندسون الميكانيكيون — 31.57 مليار دولار
|
الخدمات المهنية والعلمية والتقنية |
|
8.10% |
|
مطورو البرمجيات — 239.18 مليار دولار المحامون — 136.66 مليار دولار المحاسبون والمدققون — 135.44 مليار دولار مديرو نظم المعلومات والحواسيب — 121.44 مليار دولار أخصائيو إدارة المشاريع — 108.77 مليار دولار
|
الحكومة |
|
11.30% |
|
مسؤولو الامتثال — 33.80 مليار دولار مديرو الخدمات الإدارية — 32.03 مليار دولار عمال الخدمة الاجتماعية للأسرة والطفل— 24.10 مليار دولار عمال الترفيه — 11.51 مليار دولار
|
الرعاية الصحية والمساعدة الاجتماعية |
|
7.60% |
|
الممرضون — 323.05 مليار دولار مشرفو دعم الإدارة — 107.02 مليار دولار مدير الخدمات الطبية — 77.93 مليار دولار ممارسو التمريض — 40.58 مليار دولار الأمناء الطبيون والمساعدون الإداريون — 37.87 مليار دولار
|
التمويل والتأمين |
|
7.40% |
|
المديرون الماليون — 147.74 مليار دولار ممثلو خدمة العملاء — 123.70 مليار دولار مبيعات الأوراق المالية والسلع والخدمات— 52.14 مليار دولار المحللون الماليون الشخصيون — 43.33 مليار دولار محللو الاستثمار والمالية — 39.67 مليار دولار
|
تجارة التجزئة |
|
6.30% |
|
مديرو التشغيل والعمليات — 47.16 مليار دولار مشرفو موظفي المبيعات بالتجزئة — 58.27 مليار دولار الصيادلة — 45.12 مليار دولار
|
تجارة الجملة |
|
5.80% |
|
مندوبو المبيعات بالجملة والتصنيع (باستثناء التقني/العلمي) — 103.21 مليار دولار مديرو المبيعات — 97.16 مليار دولار مندوبو المبيعات بالجملة والتصنيع (تقني/علمي) — 33.66 مليار دولار مشرفو عمال غير التجزئة — 21.43 مليار دولار مكاتب الطلب — 3.86 مليار دولار
|
المعلومات |
|
5.40% |
|
المنتجون والمخرجون — 16.60 مليار دولار المحررون — 8.18 مليار دولار محللو الأخبار والصحفيون — 4.41 مليار دولار تقنيو الصوت والفيديو — 4.30 مليار دولار محررو الأفلام والفيديو — 2.41 مليار دولار
|
السياق والهيكلة
- وجد فريق "جي دي بي فال" أن تزويد نماذج الذكاء الاصطناعي بمعلومات دقيقة وسياق كافٍ حول المهمة، إلى جانب تقديم خطوات تحليلية منظَّمة (إرشادات مرحلية – scaffolding)، يؤدي إلى تحسين ملحوظ في جودة النتائج ودقتها، يساعد هذا النهج النماذج الذكية على معالجة المسائل المركبة بشكل منهجي، ويزيد من قدرتها على تقديم حلول تتوافق مع معايير المحترفين ومتطلبات العمل الواقعي.
الجمال والمعرفة
- أظهر "كلود أوبس 4.1" أفضل أداء إجمالي (47.6% من مهامه مساوية أو متفوقة على البشر)، مع تفوق جمالي واضح في تنسيق الوثائق وتصميم الشرائح، فيما برز "جي بي تي -5" في الدقة واستخراج المعرفة المتخصصة واتباع التعليمات، محققًا معدل تفوق (39%) ويتميز بجودة التنفيذ في المهام المعرفية المركبة.
النماذج الأخرى
- عكس تحليل النتائج تفوّق "كلود" جماليًا و"جي بي تي" معرفيًا، مع بقاء سبب تفضيل البشر للمخرجات البشرية في أغلب الأحيان هو إخفاق النماذج في الالتزام الكامل بالتعليمات أو تقديم إخراج أقل جودة، وتراوح أداء معظم النماذج الأخرى بين 12.5% و35% مقارنة بالبشر.
تحديات وتطور
- رغم التقدم الملحوظ لنماذج الذكاء الاصطناعي، لا تزال هناك مجالات تتطلب حساً نوعياً وخبرة إنسانية دقيقة تشكّل تحدياً لهذه النماذج، خاصة في المهام المعقدة التي تعتمد على اجتهاد أو تقدير شخصي عالٍ، ومع ذلك، يكشف معيار "جي دي بي فال" عن وتيرة سريعة في تضييق الفجوة بين أداء الذكاء الاصطناعي والخبراء، ويؤكد أن تحسين الإمكانيات التقنية والتدريب المستمر قد يدفع هذه النماذج قريباً لتخطي كثير من العقبات المتبقية.
مستقبل تكاملي
- تظهر نتائج "جي دي بي فال" أن الانتقال نحو مساواة حقيقية بين أداء الذكاء الاصطناعي والخبراء البشريين بات أكثر قربًا من أي وقت مضى، لكن السيناريو الأكثر واقعية في الأمد القريب يظل تكامليًا: نماذج هجينة يعمل فيها الذكاء الاصطناعي تحت إشراف وتدقيق البشر، فيعزز الإنتاجية ويختصر الوقت، دون أن يكون بديلاً كاملاً عن الخبرة الإنسانية الجوهرية في المهام شديدة التعقيد أو الحُكم السياقي المتغير.
المصادر: أرقام – أوبن إيه آي
كن أول من يعلق على الخبر
تحليل التعليقات: