يتعرف على الحروف العربية.. تطبيق تونسي يحوّل المخطوطات إلى نصوص رقمية قابلة للتعديل

تشير بعض التقديرات إلى وجود ما لا يقل عن 3 ملايين مخطوط عربي ظلّ الوصول إليها مقصورًا على الباحثين، في الوقت الذي بات فيه استخدام تقنيات التعرف البصري على الأحرف العربية المكتوبة يدويًا موضوع بحث وتطوير.

بفضل الذكاء الصناعي تطبيق "زنكي" سيحوّل المخطوطات إلى نصوص (فليكر)

طوّر مهندسون تونسيون تطبيقًا فريدًا يستخدم الذكاء الصناعي، لتحويل المخطوطات العربية القديمة والكتابات اليدوية إلى نص قابل للتعديل. كما يتيح التطبيق القيام بالبحث داخل الوثائق العربية المخطوطة، وأرشيف المطبوعات العربية القديمة التي لا تتعرف عليها وسائل المعالجة الأخرى.

هذا الإنجاز سيساعد في إخراج ثروة من ملايين المخطوطات العربية القديمة إلى النور، بعد أن ظلّت حبيسة المكتبات المتخصصة لقرون عدة حكرًا على الباحثين.

ملايين المخطوطات العربية ظلّت إلى الآن حكرًا على الباحثين (فليكر)

المخطوطات العربية خارج التغطية

تمثّل المخطوطات التاريخية التي أنتجتها الحضارة العربية الإسلامية طوال قرون ازدهارها ثروة لا تقدّر بثمن. وتشير بعض التقديرات إلى وجود ما لا يقل عن 3 ملايين مخطوط عربي في المكتبات المتخصصة المنتشرة في مختلف مناطق العالم. وقد ظلّ الوصول إليها مقصورًا على الباحثين والمتخصصين في مجال المخطوطات، لذلك لم تشمل جهود تحقيقها وطباعتها سوى بضعة آلاف منها.

وقد مكّن التقدم العلمي والتقني من تطوير تقنيات "التعرف البصري على الأحرف" ( OCR) التي تتيح التحويل الإلكتروني لصور النص المكتوب، أو المكتوب بخط اليد أو المطبوع بالأحرف اللاتينية إلى نص قابل للتعديل.

إعلان

وإذا استُخدمت هذه التقنية في التعرف على الأحرف العربية المطبوعة بطريقة حديثة، فإن استخدامها للتعرف على الأحرف العربية المكتوبة يدويًا بخطوط مختلفة، أو على تلك الموجودة في صور المستندات، ظلّ إلى الآن موضوع بحث وتطوير.

"زنكي" يتعرف على الحروف العربية المخطوطة بالذكاء الصناعي

وفي هذا الإطار، توصّلت مجموعة من الباحثين والمهندسين التونسيين إلى تطوير تطبيق يعمل باستخدام الذكاء الصناعي، يمكّن من التعرف بدقة عالية على الحروف في المخطوطات العربية القديمة، ثم تحويلها إلى نص قابل للتعديل.

فكرة التطبيق طُرحت منذ عام 2018 بهدف "البحث عن كيفية خدمة اللغة العربية باستخدام الذكاء الصناعي"، كما يقول المهندس الدكتور فراس بن عبيد المدير التنفيذي للشركة الناشئة "ريفمبر" (Revampr)، التي قامت بتطوير التطبيق، مضيفًا أن "الفكرة تبلورت فيما بعد في مشروع استخدام تقنيات التعرف البصري على الأحرف، لتحويل المخطوطات إلى نصوص قابلة للمعالجة والتعديل".

المشروع عبارة عن منصة أُطلق عليها اسم "زنكي دوت إيه إي" (Zinki.ai) وتحتوي على محرك بحث في المخطوطات العربية والمستندات المصورة. يقوم المحرك بإنجاز جميع مراحل معالجة المخطوطات باستخدام الذكاء الصناعي، تبدأ بمرحلة المعالجة الأولية للمستند لتحسين جودة الصورة، تليها مرحلة المعالجة التي تشمل تجزئة الوثيقة، وكشف التخطيط وتقسيم الأسطر وتحديد الكلمات، ثم التعرف الضوئي على الحروف.

وفي المرحلة الأخيرة يعالج التطبيق "زنكي" اللغة ويحلل النص ويضبطه ضبطًا دقيقًا. ثم يقوم محرك البحث باكتشاف موضوع الوثيقة واستخلاص المعلومات المفيدة منها وتصنيفها. كما يقوم بالتعرف على الأعلام والتصحيح الآلي للنص، ووضع الفهرسة إلى جانب التخريج الآلي للآيات والأحاديث والأشعار.

منصة "زنكي" توفّر أداة فعالة للمؤسسات والباحثين للتحويل الآلي للوثائق العربية (الجزيرة)

ملايين المخطوطات ستخرج إلى النور

إعلان

المنصة تم اطلاقها مؤخرًا بصفة تجريبية "وهي الأولى من نوعها التي يمكن استعمالها ذاتيًا من المستخدمين، لتحويل المخطوطات العربية إلى نصوص"، كما يقول بن عبيد.

ويكفي المستخدم تحميل المخطوط أو الوثيقة على الموقع ليتم معالجتها بدقة عالية والحصول على نص قابل للتعديل. وعند تعديل النص، تقوم المنصة بدورها بإعادة استخدام البيانات الجديدة في تحسين جودة المعالجة وزيادة دقة التحويل، فيما يُعرف بالتعلم العميق.

وبدعمها لجميع الخطوط الشرقية والمغربية القديمة منها والحديثة، توفر المنصة -وفق الباحث التونسي- "حلولًا فعّالة للمؤسسات والباحثين تمكّنهم من التحويل الآلي للوثائق العربية بشكل دقيق وسريع، وبأقل وقت وجهد ممكن"، مما سيكون له تأثير مباشر في إخراج ملايين المخطوطات العربية القديمة إلى النور.

كما تتميز المنصة -أيضًا- بقدرتها على التعرف على الأحرف العربية في الوثائق القديمة المطبوعة بالطريقة الحجرية، وتحويلها إلى نص قابل للتعديل. هذا إلى جانب التعرف على الأحرف المطبوعة المكتوبة ببعض الخطوط العربية؛ مثل: الخط الفاسي، والتي عجزت الوسائل المتوفرة حاليًا على معالجتها.

وحسب بن عبيد، فقد سابق الفريق -الذي يضمّ مختصين في التراث وعلم المخطوطات وإدخال البيانات إلى جانب مهندسين في تقنية المعلومات- الزمن لتطوير المنصة الجديدة، قبل فرق بحثية أخرى تعمل في بريطانيا وألمانيا وروسيا على مشروعات مماثلة لمعالجة المخطوطات العربية.

وقد أبدى عدد من المؤسسات المختصة في مجال المخطوطات؛ مثل: المكتبة الوطنية التونسية، ومؤسسة علم لإحياء التراث والخدمات الرقمية المصرية اهتمامًا بتطبيق "زنكي". بينما تجري اتصالات -في الوقت الراهن- مع عدد من المؤسسات والهياكل التي تُعنى بالتراث والمخطوطات، في كل من قطر والجزائر والمغرب وموريتانيا.

إعلان
المصدر : الجزيرة + مواقع إلكترونية

إعلان