الإمارات: "إنسبشن" التابع لـ"جي 42" يطلق نموذج "جيس" للذكاء الاصطناعي مفتوح المصدر للغة العربية

  • 2023-08-30
  • 11:00

الإمارات: "إنسبشن" التابع لـ"جي 42" يطلق نموذج "جيس" للذكاء الاصطناعي مفتوح المصدر للغة العربية

 

أطلق مركز "إنسبشن" للذكاء الاصطناعي التابع لمجموعة "جي 42" في الإمارات، الإصدار مفتوح المصدر من نموذج "جيس" اللغوي الكبير للغة العربية الأعلى جودة على مستوى العالم.

 

 

للاطلاع:

"المركز" يطلق تقارير توقعات القطاع العقاري الخليجي

 

13 مليار مؤشر

 

ويستند "جيس" إلى 13 مليار مؤشر، وتم تدريبه على مجموعة بيانات جرى تطويرها حديثاً وتضم 395 مليار رمز باللغتين العربية والإنكليزية، وسيسخّر نموذج "جيس" الذي تمت تسميته تيمناً بأعلى قمة في دولة الإمارات، مزايا الذكاء الاصطناعي التوليدي في العالم العربي.

ويعدّ هذا النموذج ثمرة تعاون بين مركز "إنسبشن"؛ و"جامعة محمد بن زايد للذكاء الاصطناعي" وشركة "سيريبراس سيستمز".

 

"كوندور جالاكسي"

 

وتم تدريب النموذج باستخدام حاسوب "كوندور جالاكسي" المدعوم بالذكاء الاصطناعي بقدرة حوسبة متعددة الإكسافلوبس (مليون تريليون عملية حسابية في الثانية)، والذي تم تصميمه بالتعاون بين "جي 42" و"سيريبراس سيستمز".

ويعدّ إطلاق "جيس" محطة بالغة الأهمية في مضمار الذكاء الاصطناعي في العالم العربي، ذلك أن هذا النموذج، الذي تم تطويره في أبوظبي، يتيح لأكثر من 400 مليون متحدث باللغة العربية فرصة مهمة لاستكشاف القدرات الكامنة للذكاء الاصطناعي التوليدي، كما يعزز مكانة دولة الإمارات باعتبارها مركزاً رائداً للذكاء الاصطناعي، والابتكار، وصون الثقافة، والتعاون الدولي.

 

مشاركة المجتمعات العلمية والأكاديمية

 

ويسعى مركز "إنسبشن"، من خلال فتح مصدر نموذج "جيس"، إلى تحفيز مشاركة المجتمعات العلمية والأكاديمية والمطورين في تسريع نمو منظومة حيوية للذكاء الاصطناعي باللغة العربية والارتقاء بمستوى الابتكار في هذا المجال، فقد يشكّل "جيس" نموذجاً يحتذى به للغات أخرى لا تحظى حالياً بدرجة كافية من التمثيل في بيئات الذكاء الاصطناعي الرائجة.

 

مزايا متطورة

 

ويعدّ "جيس" نموذجاً لغوياً كبيراً قائماً على المحولات يستخدم العديد من المزايا المتطورة، بما فيها ميزة الانتباه للتحيزات الخطية "ALiBi" التي تمكّن النموذج من استقراء تسلسل طويل لتوفير سياق أفضل وأدق. ومن التقنيات الرائدة التي يستخدمها النموذج أيضاً دالة تنشط الوحدات الخطية المسورة "SwiGLU"، وتحديد معلمات الحد الأقصى للتحديث بغية تعزيز كفاءة تدريب النموذج ودقته.

 

عمل متواصل

 

وعمل فريقا "جامعة محمد بن زايد للذكاء الاصطناعي" ومركز "إنسبشن" على تقييم وتعديل نموذج "جيس" مفتوح المصدر، الذي تم تدريبه على مجموعة بيانات مخصصة تضم 116 مليار رمز مميز "tokens" باللغة العربية لاستيعاب تعقيد وتنوع وغنى هذه اللغة، وذلك باستخدام "كوندور جالاكسي 1" (CG-1)، حاسوب الذكاء الاصطناعي الفائق الذي تم الإعلان عن تطويره مؤخراً بالتعاون بين "جي 42" وشركة "سيريبراس سيستمز". وتضمنت مجموعة البيانات أيضاً 279 مليار رمز مميز باللغة الإنجليزية لضمان الارتقاء بأداء النموذج عبر التحويل ثنائي اللغة، وسيواصل مركز "إنسبشن" وجامعة محمد بن زايد للذكاء الاصطناعي تحسين نموذج "جيس" وتوسيع نطاقه لمواكبة نمو مجتمع مستخدميه.

 

معيار جديد لتقدم الذكاء الاصطناعي في المنطقة

 

وفي هذا السياق، قال الرئيس التنفيذي لمركز "إنسبشن" للذكاء الاصطناعي أندرو جاكسون إن المركز يرسي معياراً جديداً لتقدم الذكاء الاصطناعي في منطقة الشرق الأوسط مع ضمان مكانة متميزة للغة العربية بكل ثرائها وإرثها في مشهد الذكاء الاصطناعي، مشيراً إلى أن "جيس" يعكس التزام المركز الراسخ بالتميز والابتكار ونشر منظومة الذكاء الاصطناعي على نطاق أوسع.

 

مواصلة الريادة، النماذج اللغوية الكبيرة

 

من جانبه، قال رئيس "جامعة محمد بن زايد للذكاء الاصطناعي" إيريك زينغ إن تطوير نموذج لغوي كبير للغة العربية من هذا المستوى تطلّب إجراء أبحاث متقدمة في مجال الذكاء الاصطناعي، واكتساب فهم عميق للغة العربية بتنوعها وإرثها الغني وللأهمية المتنامية للنماذج اللغوية الكبيرة في مختلف جوانب المجتمع، مؤكداً مواصلة الجامعة ريادة النماذج اللغوية الكبيرة التي تتميز بالكفاءة والفاعلية والدقة.

 

مساهمة كبيرة

 

اما الرئيس التنفيذي لشركة "سيريبراس سيستمز" أندرو فيلدمان فقال إن الشراكة الاستراتيجية مع "جي 42" حققت نتائج متميزة بالفعل، حيث تم تقديم منذ بضعة أسابيع حاسوب "كوندور جالاكسي" الفائق المدعوم بالذكاء الاصطناعي مع قدرة حوسبة متعددة الإكسافلوبس.

وأضاف أن هذه الشراكة تقدم إنجازاً استثنائياً آخر يتمثل بالنموذج اللغوي الكبير للغة العربية الموجه إلى مجتمع البرمجيات مفتوحة المصدر، مشيراً إلى أن "جيس" يشكل مساهمة كبيرة إلى مجتمع البرمجيات مفتوحة المصدر العالمي، ودليلاً ملموساً على سهولة استخدام حاسوب "كوندور جالاكسي 1" وقدرته على تطوير نماذج الذكاء الاصطناعي بسرعة فائقة.