طور فريق من الباحثين المغاربة والأجانب، نموذج جديد للذكاء الاصطناعي، أطلقوا عليه اسم “أطلس شات”، والذي يُعد أول نموذج من نوعه يتم تصميمه خصيصا بالدارجة المغربية.
وجاء هذا المشروع في إطار تعاون يجمع بين جامعة محمد بن زايد للذكاء الاصطناعي وجامعة باريس، بهدف سد الفجوة الكبيرة في معالجة اللغات واللهجات.
وعلى الرغم من التقدم الذي أحرزته النماذج اللغوية في معالجة اللغة العربية الفصحى، إلا أن “أطلس شات” يركز بشكل أساسي على الدارجة المغربية، وهي اللهجة التي يتحدث بها أزيد من 40 مليون مغربي.
وأوضح الباحثون في الورقة البحثية المنشورة على منصة “arXiv” أن ” الدارجة المغربية لطالما كانت لغة غير ممثلة بشكل كاف في مجال معالجة اللغة الطبيعية.. فعلى الرغم من أهميتها الثقافية الكبيرة، غالبا ما يتم تجاهلها لصالح لغات أخرى أكثر معيارية أو غنية بالموارد والمصادر، مثل: الفصحى أو الإنجليزية”.
وتمزج الدارجة المغربية، التي تعد اللغة اليومية في المغرب، بين الفصحى والأمازيغية والفرنسية والإسبانية، ما يجعل من الدارجة لغة معقدة يصعب معالجتها بنماذج الذكاء الاصطناعي، خاصة مع غياب قواعد معيارية واضحة، وذلك على عكس اللغة العربية الفصحى المستخدمة في السياقات الرسمية، مثل: الإدارات والتعليم.
واعتمد الفريق المشرف على “أطلس شات”، على استراتيجية شاملة لتطوير النموذج، حيث قام بجمع الموارد اللغوية المتاحة للدارجة، وابتكر مجموعات بيانات جديدة، بعضها جُمع يدويا وأخرى تم توليدها تلقائيا، كما تم تحويل التعليمات الإنجليزية إلى الدارجة مع اتباع إجراءات دقيقة لضمان الجودة والدقة.
وذكر الفريق المشرف على هذا النموذج أنه تم استخدام هذه البيانات لتدريب نماذج “أطلس شات 9B” و”أطلس شات 2B”، التي أظهرت قدرة عالية على فهم وتنفيذ التعليمات باللغة الدارجة، والتي استطاعت أن تحقق نتائج مبهرة في المهام المتعلقة بمعالجة اللغة الطبيعية.
وفي اختبارات الأداء، تفوق “أطلس شات” على بعض النماذج اللغوية الأخرى المتخصصة في اللغة العربية، مثل: “LLaMa” و”Jais” و”AceGPT”، محققا تحسنا بنسبة 13% في الاختبارات المتعلقة بالدارجة، وذلك على الرغم من أن حجمه أقل من بعض النماذج الأخرى الكبيرة.
ويعتبر تطوير “أطلس شات” نقطة تحول في معالجة اللهجات واللغات ذات الموارد المحدودة، خصوصا أن اللهجات العربية، مثل الدارجة، تُستخدم بشكل يومي عبر العالم العربي، ومع ذلك، تواجه تحديات كبيرة في المعالجة بسبب قلة الموارد الرسمية المتاحة لها.
وإلى جانب تطوير هذا النموذج، قام الفريق بإنشاء مجموعة اختبارات خاصة بالدارجة، تقيس قدرة “أطلس شات” على تنفيذ مهام متعددة، من قبيل الترجمة الآلية وتحليل المشاعر، ويأمل الباحثون أن تسهم الأساليب التي تم استخدامها في تطوير هذا النموذج في تحفيز مشاريع مستقبلية تهدف إلى تعزيز التنوع اللغوي في الذكاء الاصطناعي.
وفي ختام الورقة البحثية، عبّر أحد الباحثين عن تفاؤله من التغيير الذي يمكن أن يحدثه هذا النموذج، قائلا: “نعتقد أن هذه ليست سوى البداية، هناك العديد من اللغات واللهجات التي لم تحظَ بالاهتمام الكافي في مجال معالجة اللغة الطبيعية، ونأمل أن يكون ‘أطلس شات’ الخطوة الأولى نحو نماذج لغوية أكثر شمولية تعكس التنوع الفعلي للغات التواصل في العالم.”
وتجدر الإشارة إلى أن الأبحاث التي تم على أساسها بناء نموذج الذكاء الاصطناعي “أطلس شات”، قد تمت بالتعاون بين جامعة زايد للذكاء الاصطناعي، وجامعات ومعاهد مغربية، ويتعلق الأمر بكل من مدرسة المناجم بالرباط، وجامعة محمد السادس متعددة التخصصات، والمعهد الملكي للتكنولوجيا، ثم معهد أطلس للذكاء الاصطناعي، وكذا مدرسة البوليتكنيك.
تعليقات( 0 )