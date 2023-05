بتلك الكلمات بدأ المهندس لوك سيرناو، كبير مهندسي البرمجيات في غوغل، تقريرا داخليا ينتقد فيه صراع شركته مع شركة "أوبن إيه آي" في حرب الذكاء الاصطناعي التوليدي الأخيرة، مؤكدا أن الصراع هذا الصراع أدى بهم إلى التغافل عن منافس شرس آخر وهو مجتمع البرمجيات مفتوحة المصدر.

نشر سيرناو هذا التقرير على منصة داخلية في غوغل في أوائل شهر أبريل/نيسان الماضي، ثم على مدار الأسابيع القليلة الماضية، انتشر التقرير وشاركه آلاف الموظفين داخل الشركة، وفقا لما ذكرته صحيفة "بلومبيرغ". (1) ثم في الرابع من مايو/أيار، تسرّب التقرير على شبكة الإنترنت، ونشرته شركة الاستشارات "SemiAnalysis" على مدونتها، ليشعل النقاش الدائر في أوساط وادي السيليكون حول إتاحة نماذج الذكاء الاصطناعي التأسيسية وجعلها مفتوحة المصدر، ومَن يجب أن يملك ويتحكم في تلك النماذج القوية الجديدة! والسؤال الأهم في ذلك السياق: هل حقا ظهر جيش جديد خطير انضم إلى حرب الذكاء الاصطناعي القائمة منذ سنوات؟

جاء التقرير الداخلي لمهندس غوغل بعنوان "غوغل: لا نملك خندقا حول قلعتنا، وكذلك أوبن إيه آي". (2) قديما كان يُحفر الخندق المائي (Moat) ليحيط بالقلاع أو الحصون أو المدن، وكان بمنزلة خط الدفاع الأول لها، بينما يشير المصطلح في سياق الأعمال والشركات التقنية إلى الميزة التنافسية التي تملكها الشركة الرائدة في مجالها، مما يصعّب مهمة المنافسين في اللحاق بها.

قد يتمثَّل هذا الخندق في قوة مالية أو لوجستية أو تقنية فريدة من نوعها. مثلا، تمتلك الشركات الكبيرة المصنعة للهواتف الذكية، مثل أبل وسامسونغ، ميزة تنافسية لوجستية ومالية تصعّب مهمة اللاعبين الجدد في هذا المجال على خلق منافسة كبيرة وحقيقية معها. لكن عندما يتعلق الأمر بمجال الذكاء الاصطناعي التوليدي، وخاصة نماذج اللغة الكبيرة، يدّعي التقرير أن شركة غوغل لم تعد تملك هذا الخندق المائي الذي سيحمي قلعتها الحصينة.

كان إصدار النموذج اللغوي "GPT-3″، الذي أطلقته شركة "أوبن إيه آي" عام 2020، بمثابة وعد بالحجم والتطور الهائليْن لهذا المجال، إذ امتلك النموذج 175 مليار معامل (parameters)، (3) وهي وحدة يمكن بها قياس مدى ضخامة وحجم النموذج وقدرته على التعلم، كما تشير إلى إمكانية تنفيذه الكثير من المهام التي لم يتدرب عليها مسبقا.

التطور اللاحق في نماذج "GPT" أشار إلى أن الشركات إذا واصلت إنشاء نماذج لغوية أكبر وأضخم في الحجم، ودرَّبتها على مجموعات بيانات أكبر، فستتمكن في النهاية من إنتاج نموذج أقوى ويملك قدرات أكثر. نتيجة لذلك، وتسابقت مختبرات أبحاث الذكاء الاصطناعي لإنشاء هذا النوع من النماذج، ومن أشهرها "غوفر" (Gopher) بـ280 مليار معامل، و"لامدا" (LaMDA) بـ137 مليار معامل، و"بالم" (PaLM) بـ540 مليار معامل، و"ميجاترون-تورينج" (Megatron-Turing) بـ530 مليار معامل.

المشكلة الأساسية في تلك النماذج الهائلة هي ارتفاع تكاليف تطويرها وتدريبها، فضلا عن احتياجها إلى إمكانيات وأجهزة قوية لتشغيلها، كل هذا يكلف ملايين الدولارات. لهذا احتاجت مختبرات مثل "أوبن إيه آي" إلى مصدر تمويل هائل، ولذا تحولت إلى منظمة هادفة للربح، ووقعت تحت ضغط متزايد لاستثمار تقنياتها، وإنشاء منتجات يمكن بيعها والكسب منها. ولكن في الوقت نفسه، كانت بحاجة إلى بناء خندق حول تلك المنتجات، لكي تتمكن من الصمود أمام منافس قوي بحجم غوغل.

في حالة النماذج اللغوية الكبيرة، يوجد ثلاثة خنادق أساسية يمكنها أن تحمي الشركة، وهي بيانات تدريب النموذج، وحجم النموذج أو المعاملات، وأخيرا تكاليف التدريب. تتمتع شركات التقنية العملاقة بالفعل بالميزة الثالثة، لأنها الوحيدة القادرة على تحمل تكاليف تدريب وتشغيل نموذج لغوي تأسيسي بهذه الأحجام الهائلة. هناك بدائل سابقة مفتوحة المصدر لنموذج "GPT-3″، مثل نموذج "بلوم" (BLOOM)، (4) لكن لا يمكن الوصول إليها عمليا للمنظمات والشركات الناشئة التي لا تملك أموالا طائلة، ولا تستطيع شراء أو استئجار الآلاف من وحدات معالجة الرسوميات القوية باهظة الثمن.

ومع ذلك، لكي تبني الشركات الخندقين الأول والثاني حول قلاعها، دفعت هذا المجال باتجاه السرية ومزيد من الغموض ومشاركة أقل قدر من المعلومات حول ما تملكه من تقنيات، لكن هذه الخنادق لا يبدو أنها قادرة على الصمود لفترة طويلة.

مع التطور السريع جدا في قدرات نماذج الذكاء الاصطناعي التوليدي مؤخرا، ظهر مصطلح "النموذج التأسيسي" (foundation model)، وهو مصطلح جديد نسبيا يُطرح في المجال، ولا يزال غامضا إلى حدٍّ ما. لكن يعرّفه البعض من خلال عدد المعاملات (parameters)، وبالتالي حجم الشبكة العصبية نفسها، بينما يعرّفه آخرون من خلال عدد المهام المميزة أو المتفردة والصعبة التي يمكن أن يؤديها هذا النموذج اللغوي.

بختصار، يمكننا تعريف النموذج التأسيسي بأنه نموذج لغوي مُجهز مسبقا، يتدرب على الكثير من البيانات النصية المختلفة، ويُشكِّل الأساس الذي تعتمد عليه النماذج اللغوية الأصغر التي تُصمم وتُدرب لأداء مهام محددة، كالرد على الأسئلة مثلا. بهذه الطريقة يمكن بناء نماذج لغوية بدقة دون الحاجة إلى البدء من نقطة الصفر في كل مرة باستخدام النماذج التأسيسية الحالية، ومن أشهر أمثلتها نموذج "GPT-4″، الذي يعتمد عليه روبوت المحادثة "شات جي بي تي". (5)

بدأ الجميع في الانتباه لمسألة النماذج التأسيسية تلك نهاية شهر فبراير/شباط الماضي، مع إصدار شركة "ميتا" نموذجها اللغوي الكبير "LLaMA"، وهو واحد من تلك النماذج التأسيسية الضخمة (65 مليار معامل)، وأتاحته الشركة بوصفه حزمة مفتوحة المصدر للجامعات ومختبرات أبحاث الذكاء الاصطناعي، وليس للأهداف التجارية. (6) يمكن اعتباره مثل مادة خام؛ لم يُضبط أو يتدرب على تأدية مهام محددة، مثل الإجابة عن الأسئلة، وهي خطوة ضرورية وغالبا ما تكون صعبة لإنشاء منتج يسهل استخدامه فيما بعد. ورغم أنه يملك خصائص النماذج اللغوية الكبيرة نفسها، فإنه يحتاج إلى إمكانيات وعتاد قوي للغاية وباهظ الثمن من أجل اختباره والتعديل عليه وتشغيله.

ثم في الثالث من مارس/آذار، تسرّب النموذج بالكامل على الإنترنت، وانتشر في أوساط المجال بكل تفاصيله التقنية، وهنا بدأت عمليات التعديل والتطوير السريعة للغاية. الأهم أن الباحثين تمكَّنوا من تخطي مشكلة الحجم الهائل، عبر تقنيات تُمكِّنهم من تشغيل النموذج على أجهزة بعتاد أقل، تصل إلى أجهزة حاسوب محمولة "ماك بوك" من أبل دون بطاقة رسومية، حتى إن البعض تمكَّن من تشغيله، بأقل إمكانيات للنموذج، على هاتف بكسل 6. الخلاصة، أصبح بإمكان أي شخص يملك جهاز حاسوب بعتاد قوي أن يدرب نموذجا لغويا شخصيا في غضون ساعات قليلة، وبتكلفة بسيطة، وهو أمر لم يكن متاحا إلا للمؤسسات البحثية الكبرى سابقا.

@ggerganov's LLaMA works on a Pixel 6!

LLaMAs been waiting for this, and so have I pic.twitter.com/JjEhdzJ2B9

— anishmaxxing 🏴‍☠️ (@thiteanish) March 13, 2023