شاهد قدرات الذكاء الاصطناعي "جيميني" من غوغل

أطلقت غوغل أمس الأربعاء برنامج "جيميني" (Gemini) والذي تعتبره نموذج الذكاء الاصطناعي ذا القدرة الأكبر من بين منتجاتها والذي أظهر العديد من القدرات في فيديو نشرته غوغل على موقعها على يوتيوب.

وبحسب تقرير لموقع "سي إن بي سي" يشمل جيميني عدة فئات من الذكاء الاصطناعي منها "جيميني إلترا" (Gemini Ultra)، هي الفئة الأكبر والأكثر قدرة؛ و"جيميني برو" (Gemini Pro)، الذي ينجز مجموعة واسعة من المهام، و"جيميني نانو" (Gemini Nano) الذي سيتم استخدامه لمهام وأجهزة محمولة محددة.

وتخطط الشركة في الوقت الحالي، لإتاحة جيميني للعملاء من خلال "غوغل كلود" (Google Cloud) ليتمكنوا من استخدامه في تطبيقاتهم الخاصة.

وبحسب التقرير يمكن للمطورين وعملاء المؤسسات بدءا من 13 ديسمبر/كانون الأول الحالي الوصول إلى جيميني برو عبر "جيميني إيه بي آي" (Gemini API) المتاحة في غوغل "إيه آي ستوديو" (Google AI Studio) أو من خلال أدوات "غوغل كلود فيرتيكس إيه آي" (Google Cloud Vertex AI)؛ وهي أدوات يستخدمها المطورون لبناء تطبيقات تعتمد على تكنولوجيا الذكاء الاصطناعي من غوغل.

وسيتم استخدام جيميني أيضا لتشغيل منتجات غوغل مثل برنامج "بارد شات بوت" (Bard chatbot) و"سيرش جينيتيف إكسبيرينس" (Search Geneative Experience) والمعروف اختصارا بـ"إس جي إيه" (SGE)، والذي يحاول الإجابة عن استفسارات البحث بنص على شكل محادثة، وهو غير متاح على نطاق واسع حتى الآن.

 

ونشرت غوغل مقطع فيديو توضيحي يظهر قدرات جيميني، حيث اختبر مقدم الفيديو الذكاء الاصطناعي جيميني في عدة تحديات لطيفة منها على سبيل المثال:

تعرف على البطة

في التحدي الأول طلب من البرنامج التعرف على الرسمة من عدة خطوط رسمها بشكل عشوائي على ورقة لتشبه البطة، وقد استطاع البرنامج أن يتعرف على الرسمة من خلال الخطوط.

بعدها أظهر مقدم الفيديو لعبة بطة مطاطية وسأل جيميني هل يمكن أن تطفو هذه البطة؟ وقد استطاع البرنامج تحليل الصورة ومعرفة أن البطة عبارة عن لعبة مطاطية وأنها ستطفو بسبب أنها مصنوعة من مادة أقل كثافة من الماء.

تعرف على اللقطة

في إحدى لقطات الفيديو التي عرضها المقدم لبرنامج جيميني ظهر أحد الممثلين الهواة وهو يقلد حركات معينة وقد سأل المقدم جيميني هل يمكنك أن تخبرني في أي فيلم ظهرت هذه اللقطة، وقد أجاب الذكاء الاصطناعي بأنها اللقطة الشهيرة لتجنب الرصاصة في فيلم "ماتركس".

اربط الخطوط

في تحدٍ آخر تظهر ورقة بها مجموعة من النقاط المتفرقة وطلب المقدم من جيميني قبل أن يوصل النقاط ببعضها البعض أن يخمن ما الرسمة، وقد استطاع معرفة الرسمة قبل أن يصل النقاط ببعضها.

لعبة خفة اليد

أحد التحديات المثيرة كانت بوضع كرة ورقية تحت كوب والطلب من جيميني أن يخبره تحت أي كوب توجد الكرة الورقية بعد أن يحرّك المقدم الأكواب ويغيّر أماكنها بشكل عشوائي، وقد استطاع جيميني أن يعرف تحت أي كوب توجد الكرة.

أنواع وقدرات مجموعة جيميني

جيميني آلترا

هو النموذج الأول الذي يتفوق على الخبراء البشريين في فهم "اللغة متعددة المهام الضخمة" والمعروفة اختصارا بـ "إم إم إل يو" (MMLU)، ويستخدم جيميني آلترا مجموعة من 57 موضوعا مثل الرياضيات والفيزياء والتاريخ والقانون والطب والأخلاق لاختبار المعرفة بشكل عالمي وقدرات حل المشكلات المستعصية.

وقالت الشركة في تدوينة أمس الأربعاء، من المفترض أن يفهم جيميني آلترا الفروق الدقيقة والمنطق في المواضيع المعقدة.

وكتب الرئيس التنفيذي ساندر بيتشاي في منشور بالمدونة أمس: "إن جيميني هو نتيجة لجهود تعاونية واسعة النطاق بذلتها فرق عبر غوغل، بما في ذلك زملاؤنا في "غوغل ريسيرش" (Google Research)".

وأضاف: "لقد تم تصميمه من الألف إلى الياء ليكون متعدد الوسائط، وهو ما يعني أنه يمكنه الفهم والعمل عبر دمج أنواع مختلفة من المعلومات بما في ذلك النص والتعليمات البرمجية والصوت والصورة والفيديو".

جيميني برو

بدءا من اليوم، سيستخدم برنامج "شات بوت بارد" (chatbot Bard) من غوغل برنامج جيميني برو للمساعدة في التفكير المتقدم والتخطيط والفهم وإمكانات أخرى معقدة.

وفي أوائل العام المقبل، ستطلق "غوغل بارد آدفانسيد" (Bard Advanced)، والتي ستستخدم جيميني آلترا، وفق ما قال مسؤولون تنفيذيون في اتصال مع الصحفيين الثلاثاء. ووفق الشركة فإنه يمثل أكبر تحديث لبرنامج "بارد"، وهو برنامج الدردشة الآلي الشبيه ببرنامج "شات جي بي تي" (ChatGPT).

جيميني نانو

يستخدم جيميني نانو لتطوير برامج وتطبيقات يمكنها إنجاز مهام أكثر تعقيدا على الأجهزة المحمولة سواء الهواتف الذكية أو الحواسيب اللوحية.

المقارنة مع برامج الذكاء الاصطناعي الأخرى

ويأتي التحديث بعد 8 أشهر من إطلاق عملاق البحث "بارد" أول مرة وبعد عام واحد من إطلاق شركة "أوبن إيه آي" (OpenAI) شات جي بي تي.

وقال المسؤولون التنفيذيون الثلاثاء إن جيميني برو تفوق على نسخة 3.5 من شات جي بي تي، لكنهم تجنبوا مقارنته بالنسخة 4 المطورة من شات جي بي تي.

وعندما سئل عما إذا كانت غوغل لديها خطط لفرض رسوم مقابل الوصول إلى "بارد أدافنسيد"، قال سيسي هسايو المدير العام لشركة بارد غوغل، إنها تركز على إنشاء تجربة جيدة وليس لديه أي تفاصيل حول تحقيق الربح من البرنامج حتى الآن.

ويقال إن غوغل أجّلت إطلاق جيميني لأنها لم تكن جاهزة، وهو ما يذكّر المتابعين بعملية الإطلاق الصعبة لأدوات الذكاء الاصطناعي الخاصة بالشركة التي واجهتها في بداية العام.

وسأل العديد من المراسلين عن التأخير، فأجاب كولينز بأن اختبار النماذج الأكثر تقدما يستغرق وقتا أطول. وقال كولينز إن جيميني هو نموذج الذكاء الاصطناعي الأكثر اختبارا الذي بنته الشركة وإنه يتمتع "بتقييمات السلامة الأكثر شمولا" لأي نموذج من نماذج غوغل.

وأضاف: "إنها ليست أكثر قدرة فحسب، بل أكثر كفاءة". وتابع "ما زلنا بحاجة إلى قدرات حوسبة كبيرة لتدريب جيميني، ولكننا أصبحنا أكثر كفاءة من حيث قدرتنا على تدريب هذه النماذج".

وقال بيتشاي في تدوينة أمس الأربعاء: "يمثل هذا العصر الجديد من النماذج أحد أكبر الجهود العلمية والهندسية التي قمنا بها كشركة… أنا متحمس حقا لما هو قادم، وللفرص التي سيفتحها جيميني للناس في كل مكان".

المصدر : الجزيرة + سي إن بي سي