طور علماء من جامعة نانيانغ التكنولوجية Nanyang Technological University بسنغافورة (NTU Singapore) نظام لـ الذكاء الاصطناعي (AI) يتعرف على إيماءات اليد من خلال الجمع بين الأجهزة الإلكترونية التي تشبه الجلد و رؤية الكمبيوتر .
و قد كان التعرف على إيماءات اليد البشرية بواسطة أنظمة الذكاء الاصطناعي تطوراً قيماً على مدار العقد الماضي و تم اعتماده في الروبوتات الجراحية عالية الدقة ومعدات المراقبة الصحية وأنظمة الألعاب.
و تم تحسين أنظمة التعرف على إيماءات الذكاء الاصطناعي التي كانت مرئية في البداية فقط من خلال دمج المدخلات من أجهزة استشعار قابلة للارتداء ، و هو نهج يُعرف باسم "دمج البيانات data fusion ".
إذ تعمل المستشعرات القابلة للارتداء على إعادة إنشاء قدرة الجلد على الإحساس ، والتي يُعرف أحدها باسم "الحسية الجسدية 'somatosensory'".
و لا تزال دقة التعرف على الإيماءات تعوقها الجودة المنخفضة للبيانات التي تصل من أجهزة الاستشعار القابلة للارتداء.
و عادةً يكون السبب وراء عدم دقة أجهزة الاستشعار :
- ضخامتها
- و ضعف الاتصال بالمستخدم ،
- و تأثيرات الأجسام المحجوبة بصرياً
- و ضعف الإضاءة.
و تنشأ تحديات أخرى من تكامل البيانات المرئية و الحسية لأنها تمثل مجموعات بيانات غير متطابقة يجب معالجتها بشكل منفصل ثم دمجها في النهاية ، و هو أمر غير فعال ويؤدي إلى أوقات استجابة أبطأ.
من أين أتت الفكرة الجديدة؟
لمواجهة هذه التحديات ، أنشأ فريق NTU نظام دمج بيانات "مستوحى من بيولوجيا الكائنات الحية" 'bioinspired " data fusion system" يستخدم مستشعرات ضغط شبيهة بالجلد قابلة للمط و التمدد مصنوعة من أنابيب نانوية كربونية أحادية الجدار single-walled carbon nanotubes ، و نهج لـ الذكاء الاصطناعي يشبه الطريقة التي يتم بها التعامل مع حواس الجلد و الرؤية معاً في الدماغ .
و قد طور علماء جامعة نانيانغ التكنولوجية NTU نظام الذكاء الاصطناعي المستوحى من بيولوجيا الكائنات الحية من خلال الجمع بين ثلاثة أساليب للشبكات العصبية في نظام واحد: حيث استخدموا "شبكة عصبية تلافيفية convolutional neural network " ،
و هي طريقة تعلم الآلة للمعالجة البصرية المبكرة ، و شبكة عصبية متعددة الطبقات multilayer neural network لمعالجة المعلومات الحسية الجسدية المبكرة ، و "شبكة عصبية متفرقة sparse neural network " لدمج المعلومات المرئية والحسية الجسدية معاً .
أسفرت النتائج عن نظام يمكنه التعرف على الإيماءات البشرية بشكل أكثر دقة وكفاءة من الأساليب الحالية.
و قال المؤلف الرئيسي للدراسة ، البروفيسور تشين شياودونغ Chen Xiaodong ، من كلية علوم وهندسة المواد School of Materials Science and Engineering في جامعة NTU:
"أن بنية دمج البيانات لدينا تتصف بميزاتها الفريدة المستوحاة من الأحياء، و التي تشمل نظاماً من صنع الإنسان يشبه التسلسل الهرمي للاندماج الجسدي البصري somatosensory-visual fusion hierarchy في الدماغ.
و نحن نعتقد أن مثل هذه الميزات تجعل بنيتنا فريدة من نوعها بالنسبة للطرق والأساليب الحالية."
و أضاف البروفيسور تشين Prof Chen ، و هو أيضاً مدير المركز المبتكر للأجهزة المرنة (iFLEX) في NTU :
"بالمقارنة مع المستشعرات الصلبة القابلة للارتداء التي لا تشكل اتصالاً حميمياً (صميمياً) بدرجة كافية مع المستخدم لجمع البيانات بدقة ، فإن ابتكاراتنا تستخدم مستشعرات ضغط قابلة للتمدد و المط يتم تثبيتها بشكل مريح على جلد الإنسان.
و هذا يسمح بالحصول على إشارة عالية الجودة ، و هو أمر حيوي لمهام التعرف عالية الدقة " .
و يذكر أن الفريق المؤلف من علماء من NTU Singapore و جامعة سيدني للتكنولوجيا (UTS) قد نشروا نتائجهم في المجلة العلمية إلكترونيات الطبيعة Nature Electronics في يونيو.
دقة التعرف العالية حتى في الظروف البيئية السيئة :
لالتقاط بيانات حسية موثوقة من إيماءات اليد ، قام فريق البحث بصنع مستشعر ضغط شفاف و قابل للتمدد يلتصق بالجلد، و لكن لا يمكن رؤيته في صور الكاميرا.
و قد اختبر الفريق كدليل على المفهوم ، نظام الذكاء الاصطناعي المستوحى من الأحياء باستخدام روبوت يتم التحكم فيه من خلال إيماءات اليد وتوجيهه عبر متاهة.
و أظهرت النتائج أن التعرف على إيماءات اليد المدعومة من نظام الذكاء الاصطناعي AI المستوحى من الأحياء كان قادراً على توجيه الروبوت عبر المتاهة بدون أخطاء ، و ذلك مقارنة بستة أخطاء في التعرف تم إجراؤها بواسطة نظام التعرف المرئي visual-based recognition system .
و قد تم الحفاظ على الدقة العالية أيضاً عند اختبار نظام الذكاء الاصطناعي الجديد في ظل ظروف سيئة بما في ذلك الضوضاء والاضاءة غير المواتية. حيث عمل نظام الذكاء الاصطناعي بشكل فعال في الظلام ، وحقق دقة التعرف على أكثر من 96.7% .
و قال المؤلف الأول للدراسة ، الدكتور وانغ مينغ Wang Ming من كلية علوم وهندسة المواد في NTU Singapore :
"يكمن السر وراء الدقة العالية في هندستنا في حقيقة أن المعلومات المرئية والحسية الجسدية يمكن أن تتفاعل وتكمل بعضها البعض في مرحلة مبكرة قبل تنفيذ تفسير معقد.
ونتيجة لذلك ، يمكن للنظام جمع معلومات متماسكة بشكل منطقي مع بيانات أقل تكراراً وغموضاً إدراكياً أقل ، مما يؤدي إلى دقة أفضل. " .
أهمية الدراسة الجديدة
قال البروفيسور ماركوس أنتونيتي Markus Antonietti ، مدير معهد ماكس بلانك للغرويات والواجهات Max Planck Institute of Colloids and Interfaces في ألمانيا ، مقدماً وجهة نظر مستقلة :
"تقدم لنا نتائج هذه الورقة خطوة أخرى إلى الأمام نحو عالم أكثر ذكاءً ومدعوماً بالآلات. إنه يشبه إلى حد كبير اختراع الهاتف الذكي الذي أحدث ثورة في المجتمع ، و يمنحنا هذا العمل الأمل في أن نتمكن يوماً ما من التحكم فعلياً في كل العالم المحيط بنا بموثوقية ودقة كبيرين من خلال إيماءة واحدة".
و تابع البروفيسور أنتونيتي :
"ببساطة هناك تطبيقات لا حصر لها لمثل هذه التكنولوجيا في السوق و ذلك من أجل دعم هذا المستقبل. فعلى سبيل المثال ، من تحكم روبوت عن بعد في أماكن العمل الذكية إلى هياكل خارجية للمسنين ".
و يتطلع فريق البحث في جامعة NTU الآن إلى بناء نظام VR و AR يعتمد على نظام الذكاء الاصطناعي المطور ، و ذلك من أجل الاستخدام في المناطق التي تكون فيها الدقة العالية في التعرف والتحكم مطلوبة ، مثل تقنيات الترفيه وإعادة التأهيل في المنزل.
عزيزي القارئ
لأننا نهتم، نتمنى أن تكتب لنا في التعليقات عن المواضيع التي ترغب و تهتم بها لنتمكن من تقديمها لك، لرغبتنا في أن يعبِّر موقعنا عن اهتمامات القارىء العربي.
كما ونرجوا منك مشاركة المقال في حال أعجبك المحتوى.
ننصحك بقراءة المقالات التالية :
الذكاء الاصطناعي للتنبؤ بإنتاج طاقة الرياح .. جوجل ديب مايند
الذكاء الاصطناعي AI .. ساحة المعركة الجديدة
الذكاء الاصطناعي Artificial Intelligence لتعزيز الأداء الإدراكي