يوم 30 ديسمبر من العام المنصرم أطلق نموذج ChatGPT التابع لشركة openai، والقائم على نماذج لغة الذكاء الاصطناعي أو المحولات التوليدية المدربة مسبقاً GPT والمرتكزة وظيفتها على إدخال نص قصير لإخراج نصوص طويلة كالمقالات والقصص والقصائد وغيرها، بفضل خوارزمياتها وشبكاتها العصبية الذكية. مما يأذن ذلك لميلاد ثورة أدبية اصطناعية موازية لثورات الأدب البشري. قبل ذلك اليوم كان هناك قلق متزايد بشأن الفجوة المستمرة في التوسع بين المحتوى المنشور باللغة العربية والمحتوى باللغة الإنجليزية، والتي تسطع بشكل خاص في مجالات العلوم والتكنولوجيا والطب. حيث أصبحت اللغة الإنجليزية اللغة السائدة في تعليم ونشر المعرفة في تلك المجالات.
في هذا المقال، سوف نحاول استكشاف عمق الفجوة بين المحتويين العربي والإنجليزي، ودور نماذج لغة الذكاء الاصطناعي في إدامة هذه الفجوة، والآثار المحتملة على العالم العربي نتيجة لذلك، والكيفية التي يمكننا من خلالها النهوض بالمحتوى العربي وسد الفجوة مع محتوى اللغة الإنجليزية.
وفقاً لدراسة أجراها برنامج الأمم المتحدة الإنمائي، فإن نسبة المنشورات العلمية باللغة العربية لا تتجاوز 0.3 % من الإجمالي العالمي، في حين أن نسبة المنشورات باللغة الإنجليزية تزيد عن 60 %. هذا التفاوت أكثر وضوحا في مجال التكنولوجيا، حيث يتم إيداع 0.1 % فقط من براءات الاختراع باللغة العربية، مقارنة بنسبة 75 % باللغة الإنجليزية. وفقا للمنظمة العالمية للملكية الفكرية (WIPO)، اللغة الإنجليزية هي اللغة الأكثر استخداما على الإنترنت، بنسبة 54 % من جميع محتويات الويب. في مقابل 2.1 % للغة العربية والتي تحتل المرتبة السادسة. تشير هذه الأرقام إلى وجود فجوة كبيرة بين كمية المحتوى المتاح باللغة الإنجليزية والكمية المتاحة باللغة العربية على الإنترنت.
تخضع GPT وغيرها من النماذج اللغوية القائمة على الذكاء الاصطناعي لعمليات تدريب واسعة على بيانات هائلة من المحتوى النصي الرقمي المنشور، ونظراً للحصة الكبيرة التي تملكها اللغة الانجليزية من البيانات المنشورة على الإنترنت فإن تلك النماذج تستقي منها بشكل أكبر. مما يساهم في تحيز النموذج تجاه محتوى اللغة الإنجليزية. وجدت دراسة حديثة أجرتها OpenAI أن GPT-3 الإصدار الأخير لها، على سبيل المثال، أكثر عرضة بثلاث مرات لتوليد نص متماسك وصحيح نحويا باللغة الإنجليزية منه باللغة العربية. يرجع هذا التفاوت إلى نسبة البيانات باللغة الإنجليزية في النموذج والمقدرة بحوالي 93 من جملة بيانات التدريب. ومن جانب آخر تعد وفرة التطبيقات والأدوات المنشئة للنصوص بالذكاء الاصطناعي باللغة الإنجليزية وعدم دعمها للغة العربية عامل آخر يساهم في الفجوة بين اللغتين. ويمكن أن يكون الرواج للمنشور من الأبحاث والأوراق العلمية باللغة الإنجليزية في المجلات العالمية سبب آخر للفجوة بين محتوي اللغتين ويساهم فيه الكتاب العرب.
إن الآثار المترتبة على تحيز أنظمة الذكاء الاصطناعي، وتنافسية المؤسسات والأفراد المشتغلين باللغة الإنجليزية على إنشاء أدوات تستند في عملها على هذه التقنيات المستحدثة كنماذج التحادث ChatGPT, Peo, Bard, cluods, sparrow وغيرها. قد تساهم في تحول البحث والتفاعل إلى اللغة الإنجليزية على حساب اللغة العربية؛ وذلك بغية الدقة والخدمات الموفرة للوقت والجهد. كما أن تحيز النماذج يولد محتوى دقيق وواسع باللغة الإنجليزية مقابل محتوى عربي يفتقر للموثوقية والرصانة، مما سيتسبب في العزوف عن الاعتماد عليه أو استخدامه. كما أن محدودية تمكن العرب من اللغة الإنجليزية، ومحدودية المنشور باللغة العربية عن الذكاء الاصطناعي وقفزاته المتسارعة يمكن أن يجعل المهتمين والباحثين في العالم العربي بعيدين عن المعارف والمعلومات الحديثة وأحدث التطورات في المجال.
على الرغم من هذه التحديات، إلا أن هناك إمكانية استخدام نماذج لغة الذكاء الاصطناعي ذات التحيز للغة الإنجليزية للعب دوراً في سد الفجوة بين المحتويين المنشورين العربي والإنجليزي، باستغلال قدراتها العالية في الترجمة بين اللغات، كما هو الحال في GPT. ومن جانب أخر يمكن الاستثمار في إنشاء تطبيقات وأدوات تجود المخرجات العربية المنتجة من النماذج اللغوية الإنجليزية وغيرها. كما يمكن اللجوء للاستثمار التشاركي بين أطراف في العالم العربي لإنشاء نماذج لغوية ترتكز على الذكاء الاصطناعي وقائمة على المحتوى العربي على حساب المحتوى الإنجليزي، واستغلال تقدم بعض الدول العربية في مجال الذكاء الاصطناعي كدولة الإمارات العربية المتحدة التي تمتلك نموذج (NOOR) العربي القائم على الذكاء الاصطناعي. وفي ذات السياق يمكن لتوفير الدعم للكتاب والتقنيين وناشري المحتوى الرقمي أن يساهم في تضييق الفجوة بين المحتويين العربي والإنجليزي.
في الختام، يجب ألا نقف مكتوفي الأيدي أمام التحديات التي تقف أمام اللغة العربية في ثورة الذكاء الاصطناعي، يجب أن نستغل مصادر الخوف وندفع بها لتكون الحل أو جزءً منه. ويجب أن نهتم بمجالات التكنولوجيا والبحث العلمي ورفع وتيرة التعليم المعتمد على التفكير النقدي وحل المشكلات والقائم على المشاريع؛ لأن ذلك كفيل بخلق أجيال بشرية منتجة للمعرفة ومساندة للمؤسسات ومحركة لها نحو مصاف الدولة الرائدة في مختلف المجالات.
** **
سعيد الكلباني - باحث دكتوراه في علوم التربية - جامعة محمد الخامس - الرباط - سلطنة عمان