أعلنت مجموعة "غوغل ديب مايند" (Google DeepMind) رسميا عن إطلاق الجيل الثاني من طرازها الرائد لتوليد الصور، والمعروف تجاريا باسم" نانو بانانا 2″ (Nano Banana 2)، وهو التحديث الذي يرتكز تقنيا على بنية "جيميناي 3.1 فلاش إيمج" (Gemini 3.1 Flash Image).

ويأتي هذا الإعلان في وقت يشهد فيه سوق الذكاء الاصطناعي تنافسا محموما على دقة التفاصيل وسرعة التنفيذ، حيث قدمت غوغل ما وصفته الصحافة التقنية بـ"النموذج المتكامل" الذي ينهي الفجوة بين النماذج الخفيفة السريعة والنماذج الثقيلة عالية الجودة.

وبحسب ما ورد في المدونة الرسمية لشركة غوغل، فإن الطراز الجديد لا يكتفي بمجرد تحسين جودة البكسلات، بل يعتمد على فلسفة "الذكاء السياقي الحقيقي".

وصرح الرئيس التنفيذي لشركة ألفابت، الشركة الأم لغوغل، سوندار بيتشاي عبر حساباته الرسمية بأن "نانو بانانا 2" صمم ليكون أداة إنتاجية للمحترفين وليس مجرد وسيلة للترفيه، مؤكدا أن الكفاءة البرمجية لهذا الطراز تسمح له بالعمل بسرعة تفوق الجيل السابق بنسبة 300%، مع استهلاك طاقة أقل بكثير، مما يمهد الطريق لدمجه بشكل أعمق في الأجهزة المحمولة والمتصفحات.

وفي تحليل معمق نشره موقع "تيك رادار" (TechRadar) التقني الأمريكي، تبرز ميزة "الربط الحي ببحث غوغل" كأهم إضافة ثورية في هذا الإصدار، حيث أن هذه الميزة تسمح للنموذج، لأول مرة، بالخروج من دائرة بيانات التدريب المغلقة والتحقق من المعلومات في الوقت الفعلي عبر محرك البحث.

وهذا يعني أنه عند طلب صورة لمنتج تجاري حديث أو معلم أثري، يقوم الذكاء الاصطناعي بمطابقة المواصفات الواقعية قبل البدء في عملية التوليد، مما يقضي تماما على مشكلة "الهلوسة البصرية" التي كانت تؤرق المصممين.

وعلى صعيد القدرات الإبداعية المتخصصة، كشفت وثائق المطورين في "غوغل إيه آي ستوديو" (Google AI Studio) عن مجموعة من الخصائص التقنية التي تمنح المصممين سيطرة غير مسبوقة، وهي:

ثبات العناصر والشخصيات : القدرة على الحفاظ على ملامح دقيقة لـ 5 شخصيات وتفاصيل 14 جسما ثابتا عبر سلسلة لا نهائية من الصور، مما يجعله قادر على إنتاج قصص مصورة (Comics) كاملة دون تغير في هوية الأبطال.

: القدرة على الحفاظ على ملامح دقيقة لـ 5 شخصيات وتفاصيل 14 جسما ثابتا عبر سلسلة لا نهائية من الصور، مما يجعله قادر على إنتاج قصص مصورة (Comics) كاملة دون تغير في هوية الأبطال. ثورة النصوص "تايبوغرافيا 2.0" (Typography 2.0) : معالجة النصوص داخل الصور بدقة مذهلة، مع دعم كامل للغة العربية بخطوطها المعقدة، وضمان عدم تداخل الحروف أو تشوه الكلمات مهما كان طول النص المطلوب.

: معالجة النصوص داخل الصور بدقة مذهلة، مع دعم كامل للغة العربية بخطوطها المعقدة، وضمان عدم تداخل الحروف أو تشوه الكلمات مهما كان طول النص المطلوب. المرونة الهندسية : دعم أبعاد صور تبدأ من المربع التقليدي وتصل إلى الأبعاد البانورامية السينمائية بنسبة 8:1، مع إمكانية التوليد المباشر بدقة "فور كيه" (4K).

: دعم أبعاد صور تبدأ من المربع التقليدي وتصل إلى الأبعاد البانورامية السينمائية بنسبة 8:1، مع إمكانية التوليد المباشر بدقة "فور كيه" (4K). التعديل التحاوري: ميزة "سيمانتك إيديتينغ" (Semantic Editing) التي تتيح للمستخدم تعديل أجزاء دقيقة من الصورة عبر أوامر صوتية أو نصية بسيطة مثل "غير الإضاءة لتصبح وقت الغروب" دون الحاجة لإعادة توليد الصورة من الصفر.

من ناحية أخرى، ركزت تقارير من بلومبرغ على الجانب الأخلاقي والأمني في الطراز الجديد، فقد قامت غوغل بدمج تقنية "سينث آي دي" (SynthID) المتطورة، وهي علامة مائية رقمية غير مرئية يتم حفرها في نسيج الصورة لمنع التزييف العميق وتسهيل كشف المحتوى المولد اصطناعيا.

كما يمتثل الطراز لمعايير "سي 2 بي إيه" (C2PA) العالمية لضمان شفافية مصدر المحتوى، وهو ما تعتبره غوغل خطوة ضرورية لتعزيز الثقة في استخدام الذكاء الاصطناعي ضمن قطاعات الإعلام والإعلان.

ويرى خبراء التقنية أن إطلاق "نانو بانانا 2" يمثل "لحظة نضوج" للذكاء الاصطناعي التوليدي، حيث انتقلت التكنولوجيا من مرحلة الإبهار البصري إلى مرحلة الأدوات المهنية الرصينة التي يمكن الاعتماد عليها في سلاسل التوريد الإبداعية العالمية.