تنوعت تطبيقات الذكاء الاصطناعي في السنوات الأخيرة ودخلت مجالات متنوعة على غرار الألعاب، وتقنيات التعرف على الصوت، والروبوتات، إلى جانب تطبيقات الرؤية التي تسمح للحاسوب بالتعرف على الأجسام من خلال صورها.

وتعمل العديد من الشركات التقنية على تطوير خدمات قادرة على إدراك الصور، حيث أطلق موقع استضافة الصور الشهير "فليكر" في أكتوبر/تشرين الأول الماضي خدمةً لمعالجة الصور تدعى "بارك أور بيرد"، وهي عبارة عن موقع يستطيع المُستخدم رفع الصور عليه، لتقوم الخدمة بتحليل الصورة وإعطاء بيانات عنها على غرار الموقع الجغرافي الذي التقطت فيه، والعناصر الموجودة فيها.

وعمل فريق "فليكر فيجن" على جعل هذه الخدمة قادرة على التعرف على أكثر من ألف عنصر في الصورة الواحدة، وذلك باستخدام إحدى تقنيات الشبكات العُصبونية، وتُعد الطيور من أبرز الأشياء التي يستطيع هذا النظام تمييزها.

والعصبون هو الوحدة العصبية الأساسية أو الخلية العصبية التي تكوّن بتشابكاتها مع عصبونات أخرى الألياف العصبية التي تكوّن بدورها الأعصاب، أما الشبكات العصبونية الاصطناعية فهي عبارة عن مجموعة مترابطة من عصبونات افتراضية تنشئها برامج حاسوبية لتحاكي عمل العصبيات واتصالاتها ويحاول من خلالها العلماء محاكاة عملية معالجة البينات في الدماغ البشري، وهي تلعب دورا كبيرا في مجال الذكاء الاصطناعي.

وتستفيد الخدمة من إحدى الخوارزميات البسيطة التي تعتمد على تمرير الصورة عبر سلسلة من الطبقات، تستفيد كل طبقة من مخرجات الطبقة التي تسبقها، وتم تدريب نظام  التعرف على الصور عبر تمرير ملايين الصور من خلاله مما ضاعف من قدرته على التمييز بين عناصر الصورة.

وعلى سبيل المثال، تستطيع أول طبقة إدراك العناصر البسيطة على غرار الخطوط المُستقيمة القصيرة والزوايا والأقواس، في حين تستطيع الطبقة الثانية إدراك عناصر أكثر تعقيداً مثل الدوائر والأشكال البسيطة، وتستطيع باقي الطبقات إدراك أشياء على غرار العين والرأس والجناح.

وطبق فريق "فليكر فيجن" تقنية الشبكات العصبونية هذه على موقع فليكر ليجعل من  مهمة البحث عن الصور أكثر بساطة وسهولة، حيث أشار مدير الإنتاج لدى ياهو (الشركة المالكة لفليكر)، جيري بيسافينتو، إلى أن ياهو تعتزم الاستفادة من التقنيات الذكية لجعل خدمة فليكر أكثر متعة وبساطة.

إن الخوارزميات التي يستخدمها فليكر للتعرف على الأجسام تُعدُ قسماً من مجموعة خوارزميات يتم العمل عليها لجعل الروبوتات قادرة على الإبصار

خوارزميات
ومن فوائد تقنية إدراك الصور التي تعمل عليها فليكر؛ أنه يمكن للمستخدم استثمارها في البحث عن صوره بطريقة فعالة من خلال البحث داخل محتويات الصور، كأن يبحث المُستخدم عن جسم على غرار "كرة" أو "طائر"، ليقوم النظام بترشيح الصور وعرض تلك التي تضم المُكوِن المطلوب حتى لو لم يشر المُستخدم إلى تلك العناصر مُسبقاً.

إن الخوارزميات التي يستخدمها فليكر للتعرف على الأجسام تُعدُ قسماً من مجموعة خوارزميات يتم العمل عليها لجعل الروبوتات قادرة على الإبصار والتعرف على الأجسام والتحرك بحرية، بحسب "سيمون أوسنديرو" من ياهو.

يُذكر أن شركة غوغل طورت تقنية مُشابهة منذ عامين عبر قيامها بتدريب شبكات عصبونية لتستطيع التعرف على القطط التي تظهر في مقاطع فيديو موقع يوتيوب الشهير، كما دخلت خدمة البحث الصينية الشهيرة "بايدو" هذا المجال من خلال توفيرها تطبيق ترجمة يسمح للمستخدم بتصوير جسم ما لتتم ترجمة اسم الشيء المصور إلى اللغة الإنجليزية.

كما استفادت شركة أمازون الأميركية من تقنية مشابهة في هاتفها "فاير" عبر تزويده بالقدرة على التعرف على غطاء كتاب ما، ومن ثم توجيه المُستخدم نحو موقع التسوق المُناسب الذي يمكن من خلاله شراء هذا الكتاب.

وخلال السنوات الأخيرة، ازدادت دقة تقنيات التعرف على الأجسام، وذلك بحسب أولجا روسكوفسكي من جامعة ستانفورد التي تنظم مسابقة سنوية مُنذ عام 2010، يتم فيها إدخال صور إلى الخوارزميات المُطورة من قبل المُتسابقين والتي من المفترض أن تتعرف على أكبر قدر ممكن من الأجسام.

وللمقارنة، فإن الخوارزمية الرابحة ارتكبت عام 2010 أخطاء بمعدل 28.2%، في حين ارتكبت الخوارزمية الرابحة عام 2014 أخطاء بمعدل 6.7% فقط.

ولن تقتصر الفوائد التي تقدمها تقنية إدراك الصور فقط على تسهيل عملية البحث من خلال محركات البحث الشهيرة، بل ستتجاوزها لتقدم حلولاً يمكن للأشخاص المصابين بالعمى أو السيارات الذاتية القيادة الاستفادة منها في التعرف على الأشخاص والإشارات على الطرقات.

المصدر : البوابة العربية للأخبار التقنية