نموذج جِمني .. تحد لـ”شات جي بي تي” أم مصدر إحراج لـ”غوغل”؟
اَفاق نيوز – أفرجت شركة غوغل قبل عدة أيام عن نموذجها الجديد في الذكاء الاصطناعي التوليدي المسمى “جِمني” (Gemini). وأشار الرئيس التنفيذي للشركة ساندر بيتشاي إلى أن العالم مع هذا النموذج على موعد مع الولوج إلى عصر جديد من الذكاء الاصطناعي فائق القدرات.
ويأتي هذا الإعلان في الوقت الذي تتعرض فيه شركة غوغل للعديد من الانتقادات نظراً لتخلفها وراء شركة “أوبن إيه آي” (Open AI) التي أصبحت رائدة الذكاء الاصطناعي التوليدي منذ أن أطلقت قبل ما يقرب من العام نموذجها ذائع الصيت “شات جي بي تي” (ChatGPT).
ويعتقد النقاد أن شركة غوغل من خلال هذا الطرح الذي ترافق مع حملة ترويجية كبيرة، تسعى إلى ترميم سمعتها في مجال الذكاء الاصطناعي واستعادة شيئاً من كبريائها الذي تضاءل مع الانتكاسات التي رافقت نموذجها السابق “بارد” (Bard) الذي بات يوصف على نطاق واسع بأنه نموذج للرتابة والملل وليس للذكاء الاصطناعي.
جمني.. نموذج عائلي
وتخطط شركة غوغل فيما يخص جمني أن يكون بعيدا عن النماذج أحادية الإصدار، بل نموذجا عائليا ينتمي إليه العديد من الإصدارات التي تتمتع بقدرات متفاوتة بناء على الاستخدام والحاجة.
ومبدئيا، يقع في المرتبة الأدنى من هذه العائلة نموذج “جمني نانو” المخصص للتشغيل على أجهزة أندرويد. أما الإصدار الأعلى منه فيسمى “جمني برو” الذي سيدخل الخدمة قريبا، ومن المرجح أن يعمل على تشغيل الكثير من خدمات غوغل للذكاء الاصطناعي، كما سيكون العمود الفقري لنموذج “بارد”.
أما “جمني ألترا” فسوف يكون أقوى إصدارات هذه العائلة، ويتوقع أن يكون أقوى برنامج ذكاء اصطناعي للغات الكبيرة “إل إل إم” (LLM) تنشئه غوغل، وسيخصص بدرجة كبيرة لمراكز البيانات والتطبيقات المعقدة التابعة للمؤسسات والشركات الكبرى.
وفي الوقت الحالي، يقتصر نموذج جمني الأساسي على الأوامر النصية في عمليات المدخلات والمخرجات، ولذلك سيكون من المبكر جداً الحكم على نجاعة وكفاءة النموذج مقارنة بالنماذج الأكثر تقدماً مثل شات جي بي تي 4. غير أن الرؤساء التنفيذيين في غوغل يأملون في الوقت القريب أن تتمكن النماذج الأكثر تقدماً في جمني من التعامل بكفاءة مع الصور والفيديوهات والصوت أيضا.
ورغم تأكيدات شركة غوغل بأنها لا تسعى لمجرد المنافسة على أكثر نماذج متقدمة من الذكاء الاصطناعي التوليدي وحسب، فإنها تؤكد في الوقت نفسه على مسعاها نحو الوصول إلى الذكاء الاصطناعي العام، وهو النموذج الأكثر قرباً من محاكاة الإنسان بقدراته على الفهم والاستيعاب والإحساس، وهو هدف ترى غوغل أنها بدأت خطواته الأولى مع إطلاق أولى النماذج من عائلة جمني التي سوف “تكتسب المزيد من الحواس” وتصبح واعية، على حد قول ديميس هاسابيس الرئيس التنفيذي لتكنولوجيا التفكير العميق (DeepMind Technologies) في غوغل.
وكالعادة رافق طرح غوغل الجديد لعائلة جمني العديد من الشكوك والتساؤلات عن حقيقة الكفاءة التي قد يتمتع بها النموذج، خصوصاً وأن إعلانها الترويجي للمنتج على منصة يوتيوب والذي حظي بأكثر من مليون و600 ألف مشاهدة لم يتمتع بالشفافية المطلوبة. ففي مقالة افتتاحية على بلومبيرغ زعمت كاتبة المقال بارمي أولسون أن غوغل أساءت تمثيل قوة جمني في مقطع الفيديو الترويجي، فقد عرض الفيديو قدرات مثيرة للإعجاب لنموذج جمني، ولكن في الحقيقة يبدو أن هذه القدرات مشكوك فيها.
ويظهر الفيديو الذي تبلغ مدته ست دقائق قدرات جمني المتعددة الوسائط، من قبيل التعرف على الصور واقتراح ألعاب والبحث عن كرات مخبأة تحت الكأس وأسئلة منطقية مثل اختيار الطريق الأكثر أمانا. وقد كان من الملاحظ السرعة الفائقة في عملية الاستجابة، وهو الأمر الذي كان مدعاة للدهشة من قبل المشاهدين.
ولكن بالنقر على الوصف المرفق مع الفيديو، ومن باب إخلاء المسؤولية من طرف غوغل، كانت هناك جملة تشير إلى أنه و”لأغراض هذا العرض التوضيحي، فقد تم تقليل زمن الوصول واختصار استجابة جمني للإيجاز”. وأثارت هذه الملاحظة الاعتراضية حفيظة العديد من المراقبين والنقاد منهم أولسون التي أشارت في مقالها الافتتاحي إلى أن غوغل اعترفت بأن فيديو العرض التوضيحي لم يحدث في الوقت الفعلي باستخدام أوامر منطوقة، بل من خلال استخدام صور ثابتة وأوامر نصية قام نموذج جمني بالرد عليها لاحقا. وترى أولسون أن هذا مخالف تماما لما حاولت غوغل الإيحاء إليه بأن أي شخص يستطيع القيام بمحادثة سلسلة مع جمني والحصول على المخرجات المرجوة في وقت قياسي.
وتؤكد أولسون بأن غوغل إنما قامت عبر عملية تحرير المقطع المصور بعملية تلاعب لإقناع المشاهدين بأن نموذجها جمني يمتلك ذات الإمكانيات التي يتمتع بها نموذج شات جي بي تي، في حين أن الحقيقية هي أن جمني مازال في أفضل الأحوال يشبه الإصدار الأول من شات جي بي تي الذي صدر قبل أكثر من عام.
ومن جانبها حاولت غوغل وعلى لسان أوريول فينيالس -وهو نائب رئيس الأبحاث والتعلم في “التفكير العميق” (DeepMind) ومطور مشارك في نموذج جمني- إلى التخفيف من حدة هذه الانتقادات والتخوفات على حد سواء، وذلك عبر التأكيد على أن جميع “أوامر المستخدِم ومخرجاته التي وردت في الفيديو حقيقية، وهي مختصرة فقط من أجل الايجاز”. ويضيف بأن الهدف من الفيديو هو توضيح الكيفية التي قد تبدو من خلالها تجارب المستخدمين المتعددة التي تم إنشاؤها باستخدام جمني، مؤكدا في الوقت ذاته أن غوغل قامت بذلك من أجل “إلهام المطورين”.
يشير النقاد إلى أن عمليات التحرير على الفيديوهات قد تكون مفهومة ومقبولة إلى حد ما، ولكنها تثير العديد من التساؤلات عن حقيقية المنتج، خصوصاً وأن شركات التكنولوجيا لديها باع طويل في عمليات التلاعب التي تهدف من خلالها إلى تضخيم مدى جدوى وفاعلية منتجاتها. ويرون أن شركة غوغل كان من الممكن لها أن تسلك طريقا أكثر شفافية ومصداقية من خلال إتاحة النموذج على الجمهور للاستخدام المباشر والفعلي والحصول على ردود فعل حقيقية.
ويدل تصرف غوغل هذا على أن الشركة ما زالت تعاني من عقدة النقص أمام النجاحات الباهرة التي حققها نموذج شات جي بي تي، وهذا مفهوم. فقد كانت شركة غوغل من أولى الشركات التي أطلقت سباق الذكاء الاصطناعي، لتخسره على حين غرة أمام شركة “أوبن إيه آي” الناشئة. وأصابتها هذه الخسارة بنوع من فقدان اليقين لتحاول بعدها اللحاق بالركب.
ورغم حالة الطوارئ التي أعلنها الرؤساء التنفيذيون داخل الشركة، فإن غوغل حتى الساعة لم تقدم نموذجا للذكاء الاصطناعي مقنعا وجذاباً للجمهور. وبطبيعة الحال هذا لا يعني أن غوغل أصبحت خارج السباق، فنموذجها من الذكاء الاصطناعي “ألفا كود 2” من المرجح أن يُحدث ثورة في عالم التشفير على المستوى العالمي.
إننا في عصر سباق الذكاء الاصطناعي، وبالرغم من محاولات التضليل هنا وهناك، فإن الحقيقية الثابتة هي أن البشرية تقترب بخطوات ثابتة من تحقيق الذكاء الاصطناعي العام الذي يضاهي قدرات الإنسان بل ويتفوق عليها في كافة المجالات.