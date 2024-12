تحت شعار "اللغة العربية والذكاء الاصطناعي: تعزيز الابتكار مع الحفاظ على التراث الثقافي"، تحتفي اليونسكو بنسخة اليوم العالمي للغة العربية، الذي يصادف 18 ديسمبر/كانون الأول، داعية إلى تشجيع الابتكار والحفاظ على الثقافة ورسم ملامح العصر الرقمي. وترى المنظمة الأممية في هذه المناسبة سانحة لاستكشاف مستقبل اللغة العربية في الذكاء الاصطناعي، وسُبل سد الفجوة الرقمية عن طريقه، وتعزيز حضور اللغة العربية على الإنترنت، خاصة أن المحتوى بالعربية على الشابكة لا يتجاوز نسبة 3% وفقا لليونسكو.

وفي هذا الصدد، يرى الدكتور نور الدين هواري -وهو باحث جزائري مقيم بفرنسا حيث يدير شركته في مجال المعلوماتية- أن التطور الملموس في الترجمة الذكية والفهم العميق للسياقات الثقافية عوامل تنبئ بمستقبل واعد لتطبيقات الذكاء الاصطناعي باللغة العربية، سواء في مجالات التعليم الإلكتروني المتطور، أو البحث العلمي والأكاديمي، أو الترجمة الآلية عالية الجودة، أو حتى صناعة المحتوى الرقمي الموجّه للمتحدثين بالعربية. كما يشيد بالمبادرات على الصعيد العربي، التي تهدف إلى تطوير نماذج لغوية خاصة بالعربية.

وضيفنا شاب جزائري في الثلاثينيات، حاصل على درجة الدكتوراه في أنظمة الحاسوب (مع التركيز على الذكاء الاصطناعي التوليدي) من جامعة "هواري بومدين" للعلوم والتكنولوجيا بباب الزوار (الجزائر العاصمة)، وهو أول دفعته في شهادة الماستر بنفس الجامعة، وقبل ذلك، أول دفعة شهادة الليسانس في الإعلام الآلي بجامعة "زيان عاشور" بالجلفة (حوالي 300 كلم جنوب الجزائر العاصمة).

كما أن نور الدين هواري صانع محتوى في مجال الذكاء الاصطناعي التوليدي وتنظيم الملاحظات، ومطور إضافة Text Generator لبرنامج Obsidian، التي حققت أكثر من 1400 نجمة على GitHub وأزيد من 300 ألف تحميل.

ولابن منطقة "حاسي بحبح" بالجزائر خبرة في مجال التعليم والتدريب خاصة على منصته "جي بي تي 4 إيه آر" (GPT4AR) التي تضع اللغة العربية، شكلا ومضمونا، في الواجهة.. وقد أشرف على تدريب ما يفوق 1800 متدرب في برنامج تدريبي حول "شات جي بي تي" (ChatGPT)، وأكثر من 400 متدرب في مجال إدارة وتنظيم الملاحظات الشخصية "بي كيه إم" (PKM). وإلى جانب اهتمامه بالذكاء الاصطناعي خاصة التوليدي، يهتم الدكتور هواري بإدارة المعرفة الشخصية (PKM)، والبرمجة، مع خبرة في بيئة "جافا سكريبت" (JavaScript)، وبالكتابة والنشر، والاستثمار والشركات الناشئة، وبتربية النشء.

وانطلاقا من تجربته التعليمية والتدريبية، يؤكد نور الدين هواري أن اللغة العربية قادرة على استيعاب المفاهيم المعقدة ونقل العلوم الحديثة بكفاءة، وأن تعريب التخصصات التقنية ليس أمرا مستحيلا، بل يمكن للتعليم باللغة العربية أن يكون رافدا معرفيا أصيلا، يربطنا بتراثنا اللغوي ويشكل جسرا للتواصل مع العلوم العصرية.

في ظل التطورات السريعة في تقنيات الذكاء الاصطناعي، أصبحت العديد من اللغات تتنافس على مكانتها في هذا المجال. على سبيل المثال، نرى كيف أن الإنجليزية قد استحوذت على نصيب الأسد من التطبيقات المتاحة. كيف ترى مكانة العربية في التطور الحاصل في الذكاء الاصطناعي؟

لا شك أن تطور تقنيات الذكاء الاصطناعي يعتمد إلى حدّ بعيد على جودة ووفرة البيانات المتاحة للتدريب (Training Data). وبما أن اللغة الإنجليزية تحتل موقعا رياديا في العلوم والتكنولوجيا، فقد استفادت مبكرا من التراكم المعرفي والبيانات الضخمة (Big Data). غير أن السنوات الأخيرة شهدت قفزات نوعية في معالجة اللغة العربية بفضل نماذج متقدمة مثل "جيميناي 2″ (Gemini 2) و"جي بي تي-4 أو" (GPT-4O)، والتي أثبتت قدرتها على فهم وإنتاج محتوى عربي بدقة عالية، فضلا عن التحسّن الملحوظ في الترجمة الذكية والفهم العميق للسياقات الثقافية.

هذه القفزات تفتح آفاقا واعدة لتطبيقات الذكاء الاصطناعي باللغة العربية، سواء في مجالات التعليم الإلكتروني المتطور، أو البحث العلمي والأكاديمي، أو الترجمة الآلية عالية الجودة، أو حتى صناعة المحتوى الرقمي الموجّه للمتحدثين بالعربية.

تواجه اللغة العربية تحديات فريدة تتعلق بتنوعها اللغوي وغناها بالمصطلحات. في نظرك، ما التحديات الرئيسية التي تواجه اللغة العربية في مجال معالجة اللغة الطبيعية؟

تمثّل التحديات التي تواجه اللغة العربية في مجال الذكاء الاصطناعي منظومة متداخلة من الصعوبات، أولها ندرة البيانات المصنفة والمنظّمة عالية الجودة (Labeled and Structured Data). ثم يأتي تعقيد البنية اللغوية من حيث التشكيل والاشتقاق وتعدد الصيغ، مما يجعل فهم السياق واستنباط المعنى عملية بالغة الدقة.

إلى جانب ذلك، تكمن مشكلة تنوّع اللهجات العربية واختلاف التعابير بين البلدان والمناطق، وهو ما يصعّب توحيد المعايير وبناء حلول شاملة. كما نواجه تحديات تقنية مرتبطة بضرورة ابتكار خوارزميات وأساليب معالجة متلائمة مع الخصائص الفريدة للغة العربية، مثل قواعدها، وأساليبها، وتركيب الجمل، والتشكيل الذي يُعد عنصرًا أساسيًا لضمان النطق الصحيح والفهم الدقيق للنصوص.

هذه الخصائص تجعل اللغة العربية تختلف عن اللغات الأخرى، يتطلب التعامل مع هذه التحديات جهودا بحثية مكثفة وتعاوناً مؤسسيا وأكاديميا على نطاق واسع، فضلًا عن بناء موارد لغوية وتنظيمها بأسلوب يسهم في دفع عجلة الابتكار اللغوي نحو الأمام.

تتاح للعربية فرصة غير مسبوقة لبناء نماذج تفهم تعقيداتها، وهو ما يستلزم تعاونا بين الباحثين والمؤسسات العربية لخلق مستقبل رقمي قوي للغتنا

تعتبر النماذج اللغوية مثل GPT-3 وBERT أساسية للتعامل مع اللغات الطبيعية والتفاعل معها، ولكنها غالبًا ما تركز على اللغات الأكثر شيوعًا. كيف يمكن تحسين هذه النماذج لتكون أكثر دقة وفاعلية في فهم العربية، خاصة مع وجود تركيبات لغوية معقدة؟

المعادلة الأساسية في نجاح النماذج اللغوية الضخمة (Large Language Models) تكمن في توافر بيانات ضخمة ومتنوعة وعالية الجودة. ومع ظهور نماذج عالمية مفتوحة المصدر مثل LLaMA وغيرها، يمكن لهذه النماذج أن تتكيّف مع أي لغة شريطة توفير المحتوى التدريبي الملائم. وهنا يبرز دور المؤسسات الأكاديمية والبحثية العربية في بناء قواعد بيانات نصية غنية، وتطوير خوارزميات خصّيصا للتعامل مع طبيعة اللغة العربية.

من جهة أخرى، يمكن للنماذج المتقدّمة المساعدة في توليد بيانات اصطناعية عالية الجودة لتعويض نقص المحتوى المهيأ، شريطة مراقبة هذه العملية بدقة من قِبَل خبراء لغويين. ومع اتساع الاهتمام العالمي بتطوير نماذج متعددة اللغات، تتاح للعربية فرصة غير مسبوقة لبناء نماذج تفهم تعقيداتها، وهو ما يستلزم تعاونا بين الباحثين والمؤسسات العربية لخلق مستقبل رقمي قوي للغتنا.

يتحدث العرب العديد من اللهجات، مما يضيف طبقة من التعقيد لتطوير تقنيات الذكاء الاصطناعي. كيف يمكن أن يؤثر هذا التنوع على فعالية أدوات مثل المساعدات الصوتية أو برامج الترجمة؟ وبشكل أشمل، ما تأثير اللهجات العربية المختلفة على تطوير تقنيات الذكاء الاصطناعي؟

يعدّ التنوع اللهجي في العالم العربي ثراءً ثقافيا، لكنه في الوقت ذاته يشكل تحديا تقنيا أمام مطوّري الذكاء الاصطناعي. يتطلّب فهم كل لهجة بيانات ضخمة وممثِّلة لخصوصياتها اللغوية، مما يزيد من تكلفة ووقت بناء النماذج.

وبسبب غياب التشكيل في معظم النصوص العربية، تضطر النماذج إلى تخمين المعنى من السياق، وهو ما يعادل محاولة قراءة نص إنجليزي مجرّد من الحروف المتحركة. ورغم إحراز تقدّم في التعرف الصوتي والفهم النصي، ما تزال الفجوة قائمة بين أداء هذه التقنيات بالعربية مقارنة بالإنجليزية أو الفرنسية. مع ذلك، فإن التطوّر المستمر في خوارزميات المعالجة اللغوية وبناء مجموعات بيانات متنوّعة يمكن أن يقرّبنا تدريجيا من حلول تتكيّف مع مختلف اللهجات، بما سيعزّز حضور العربية في تطبيقات الصوت والترجمة.

قبل حوالي 10 سنوات، قمت بتطوير تطبيق "يورايت"، وسمح لك حينها باحتلال المرتبة الأولى وطنيا في المسابقة الوطنية "أحسن ابتكار في مجال تكنولوجيات الإعلام والاتصال". في السياق نفسه، نشهد مؤخرًا إطلاق بعض المشاريع التي تهدف إلى تعزيز استخدام اللغة العربية في التقنيات الحديثة، مثل تطوير أدوات ترجمة ذكية أو برامج تعليمية. انطلاقا من تجربتك، ما الذي يمكن أن يقدمه هذا النوع من المشاريع للغة العربية؟ وهل المبادرات الحالية كافية في رأيك؟

بدأ اهتمامي بتوظيف التكنولوجيا في عالم الكتابة خلال فترة دراستي للدكتوراه، إذ طوّرت تطبيق "يورايت" (YouWrite) ليكون أداة مساعدة في الكتابة العلمية، تحلّل الأبحاث وتقدّم خيارات تسهّل على الباحثين إعداد أوراقهم بشكل احترافي.

منذ ذلك الحين، شهدت التكنولوجيا تطورات متسارعة. فقد مهدت الورقة العلمية الشهيرة لغوغل "Attention is All You Need" (عام 2017) الطريق لنماذج مثل BERT في 2018، وGPT-1، وصولًا إلى GPT-3 وDavinci، التي أثبتت عبرها OpenAI القدرات الهائلة للذكاء الاصطناعي التوليدي. وقد ظهر ذلك بوضوح مع منصة "شات جي بي تي" (ChatGPT) التي سمحت للجمهور العريض بالتفاعل مع هذه التقنيات بشكل عملي.

حاليًا، تعمل شركات عالمية عملاقة، مثل "غوغل" و"ميتا" و"آنثروبيك" و"ديب مايند" على تطوير هذه التقنيات في مجالات متنوّعة، وأصبحت النماذج اللغوية المتقدمة تدعم اللغة العربية بشكل جيد، وإن لم تصل إلى مستوى دعمها للغة الإنجليزية للأسباب التي سبق أن أشرنا إليها.

على الصعيد العربي، ظهرت مبادرات إقليمية تهدف إلى تطوير نماذج لغوية خاصة بالعربية، مثل "علّام" في السعودية و"فنار" في قطر و"جيس" في الإمارات، وهي خطوات مشجّعة لتعزيز حضور العربية في هذا المجال. لكن هذه المشاريع، على أهميتها، ما تزال بحاجة إلى مزيد من الدعم والتكثيف، خاصة في جانب البحث العلمي وإتاحة الموارد مفتوحة المصدر.

من جهة أخرى، هناك العديد من المشاريع المفتوحة المصدر، كنماذج LLaMA للغات، وأدوات تحويل النصوص إلى أصوات مثل Parler وT5، وتقنيات إنتاج الصور مثل Stable Diffusion. ومع تضافر جهود الباحثين والمهندسين حول العالم، باتت هذه الأدوات منافسًا حقيقيًا للمنتجات التجارية.

أرى أن تعزيز هذه المبادرات ودعمها من شأنه تسريع دمج اللغة العربية في مختلف تطبيقات الذكاء الاصطناعي بشكل مفتوح، وهو ما لا يرفع من مكانة العربية رقميًا فحسب، بل يخلق أيضًا بيئة حاضنة للابتكار. وبذلك يمكن للغة العربية مواكبة التطورات العالمية وتلبية احتياجات الأجيال القادمة في عالم يزداد رقمية واتصالا.

بالحديث عن التعليم.. اخترت أن ترفع تحدي التعليم والتكوين في الإعلام الآلي والذكاء الاصطناعي باستعمال اللغة العربية.. صِف لنا تجربتك هذه.. وهل نستطيع اعتبار القول إن اللغة العربية لا تتلاءم والتخصصات التقنية والدقيقة قولا عاريًا من الصحة؟

لا يختلف اثنان اليوم على أن اللغة الإنجليزية تحتل موقع الصدارة في العلوم والتكنولوجيا، نظرا لغزارة المحتوى والبحوث والإنتاج العلمي بها. لكن إيصال هذه المعارف بسرعة ودقة للناطقين بالعربية يشكل تحديا حقيقيا، بسبب اعتماد النخبة المثقفة على الإنجليزية في النشر والاستهلاك المعرفي، إضافة إلى الاختلافات في ترجمة المصطلحات الحديثة بين الدول العربية، ما يعرقل جهود تعريب العلوم.

وعندما ظهرت تقنيات الذكاء الاصطناعي التوليدي، وجدتُ فيها فرصة لخوض تجربة تعليمية جديدة باللغة العربية الفصحى. أطلقت دورات عبر منصتي "GPT4AR"، التي أهدف من خلالها إلى تبسيط المفاهيم المعقدة ونقل المعرفة التقنية لجمهور عربي واسع. وقد اعتمدت أسلوبا مزدوجا، حيث أقدّم الشرح باللغة العربية الفصحى وأبقي على المصطلحات الإنجليزية مع شرحها وتبسيطها بالعربية، لأضمن الفهم الدقيق للمتدربين.

ومن خلال تجربتي مع أكثر من 1800 متدرب، اتضح لي جليا أن اللغة العربية قادرة على استيعاب المفاهيم المعقدة ونقل العلوم الحديثة بكفاءة، شريطة توافر العزيمة والجهود المبذولة في ابتكار المصطلحات وتنسيقها بشكل سليم. فقد وجدت أن المتعلمين يتفاعلون بعمق أكبر مع المحتوى حين يُشرح لهم بلغتهم الأم، خاصة إذا تمت مواءمة هذه اللغة مع مصطلحات العلم الحديثة.

إن تعريب التخصصات التقنية ليس أمرا مستحيلا، بل هو خطوة مهمة تمنح المتعلم خيارات أوسع، وتغني التجربة التعليمية دون أن تحصرها في قالب لغوي واحد. ومع استمرار تطوير المصطلحات والموارد التعليمية وربطها بالمفاهيم الإنجليزية، يمكن للتعليم باللغة العربية أن يشكل رافدا معرفيا أصيلا، يربطنا بعمق تراثنا اللغوي ويمنحنا جسراً للتواصل المثمر مع العلوم العصرية.

دائما في السياق نفسه.. تحتل الجامعات والمؤسسات الأكاديمية مكانة محورية في تطوير الأبحاث والتقنيات، حيث يمكن أن تلعب دورًا في إعداد جيل جديد من الباحثين والمهندسين. مثلا، تراهن الجزائر على استثمار الموارد البشرية والمادية المتاحة في تطوير الرقمنة والحوسبة والذكاء الاصطناعي، ومن الأمثلة على ذلك تأسيس المدرسة الوطنية العليا للذكاء الاصطناعي. في رأيك، كيف يمكن لهذه المؤسسات، سواء في الجزائر أو أي دولة عربية أخرى، أن تساعد على إدماج اللغة العربية وتعزيز حضورها في هذا المجال؟

تلعب الجامعات دورا محوريا في إثراء اللغة العربية تكنولوجيًا من خلال بناء جسور بين العلوم اللغوية والعلوم التقنية. فتطوير مناهج دراسية متخصصة في الذكاء الاصطناعي تتضمّن مفردات ومصطلحات عربية، إلى جانب إنشاء مختبرات بحثية مشتركة تجمع خبراء في مجال اللغة مع مبرمجين وعلماء حاسوب، يشكّل نقطة انطلاق حقيقية لابتكار حلول تدعم حضور العربية رقميًا.

في الجزائر مثلا، تجسّد الاستثمار في الموارد البشرية والمادية عبر مشاريع طموحة مثل إنشاء المدرسة الوطنية العليا للذكاء الاصطناعي، التي تضم نخبة من الأساتذة والطلبة المتميزين في مجالات الذكاء الاصطناعي المتنوعة. كما خُلقت فضاءات بحثية ودورات تعليمية في الجامعات عبر دُور الذكاء الاصطناعي بهدف تحفيز الديناميكية والابتكار في هذا المجال، إلى جانب دعم الطلبة أصحاب المشاريع الواعدة.

ولتحقيق نقلة نوعية، لا بد من مساندة هذه الجهود عبر حملات إعلامية مكثفة، فضلًا عن توفير دعم مالي مستمر يشمل المنح البحثية والجوائز العلمية. كما يمكن للاستفادة من كفاءات الجاليات العربية المهاجرة ودمج خبراتهم في منظومات البحث المحلية أن يضفي بعدًا عالميا، خاصة في ظل سهولة التعاون عبر الإنترنت التي نشهدها اليوم.

ولا يكتمل المشهد دون تشجيع الشراكات مع القطاع الصناعي، وتوفير مصادر تعليمية مفتوحة، وسياسات حكومية داعمة لتطوير المحتوى العربي التقني. بهذه الخطوات المتكاملة، يصبح من الممكن بناء بيئة حاضنة للابتكار تولّد جيلا من الباحثين والمهندسين المتمكنين من توظيف العربية في عالم الذكاء الاصطناعي، مما يعزّز حضورها إقليميًا وعالميًا.

يمثل العمل في مجال الذكاء الاصطناعي تحديًا وفرصة للمطورين والباحثين، خاصة في ضوء المنافسة العالمية. ما النصائح التي تقدمها لهم إذا كانوا يرغبون في العمل على تقنيات الذكاء الاصطناعي باللغة العربية؟ وكيف يمكنهم الاستفادة من الموارد المتاحة؟

تكمن الخطوة الأولى في التركيز على بناء مجموعات بيانات عربية ذات جودة عالية، والاستفادة من الأدوات والنماذج مفتوحة المصدر المتاحة عالميا. كما ينبغي الانخراط في المجتمعات البحثية النشطة لتبادل الخبرات والمعلومات، والاستفادة من الدورات التدريبية والمنصات التعليمية المتخصصة.

ومن المهم أيضا تطوير أدوات تقييم معايير أداء النماذج العربية، مثل "Open Arabic LLM Leaderboard"، لمقارنة النتائج وتحسين الأداء باستمرار. هذا المزيج من المعرفة التقنية والشبكات المهنية والموارد المفتوحة هو مفتاح النجاح في مجال الذكاء الاصطناعي بالعربية.

في الأخير، ومع التقدم السريع في مجال الذكاء الاصطناعي، يبقى التساؤل حول مستقبل اللغة العربية مفتوحًا، خصوصًا مع ظهور تقنيات جديدة مثل التعلم العميق. كيف ترى مستقبل اللغة العربية في ظل هذه التطورات، وما الفرص المتاحة لترقيتها وتعزيز استخدامها؟

مستقبل اللغة العربية في عصر الذكاء الاصطناعي واعد ومشرق. إذ تتقدم نماذج التعلم العميق في قدرتها على فهم السياق اللغوي والتعامل مع تراكيب العربية المعقدة، مما يتيح إطلاق تطبيقات تفاعلية، وتحسين أنظمة الترجمة الآلية، وإثراء المحتوى الرقمي العربي.

مع نمو المحتوى الرقمي العربي وتزايد المبادرات البحثية، نلحظ حضورًا أكبر للعربية في المشهد التقني العالمي. هذا التطور يشمل أيضا تحسين أساليب تعليم اللغة العربية، وتسهيل تعلمها لغير الناطقين بها، وتعزيز التبادل الثقافي والمعرفي عبر الحدود اللغوية. إن استثمار الجهود وتضافرها سيضمن للغة العربية مكانة مرموقة في المشهد التكنولوجي العالمي.