Culture Magazine Thursday  04/10/2012 G Issue 382
قراءات
الخميس 18 ,ذو القعدة 1433   العدد  382
 
المدونة اللغوية العربية لمدينة الملك عبد العزيز: ملاحظات تمهيدية
صالح جواد الطعمة

 

لقد أنجز أخيراً أكبر مشروع عربي طموح يهدف إلى تمثيل اللغة العربية في مختلف عصورها منذ العصر الجاهلي حتى يومنا هذا ألا وهو مشروع (المدونة اللغوية العربية لمدينة الملك عبد العزيز) التي تضم حالياً ما يزيد عن سبعمائة مليون كلمة، والمستهدف أن يزيد حجمها إلى أن تبلغ بليون كلمة (أو أكثر) في مراحل قادمة. وقد أعلن عن تدشين هذه المدونة خلال معرض الرياض الدولي للكتاب في آذار (مارس) 2012 كما أعلن عن إطلاق الموقع الإلكتروني لها مشفوعاً بالدعوة العامة إلى إبداء الملاحظات أو الاقتراحات أو توجيه الأسئلة بشأنها.

لا أشك في أن المعنيين بدراسة العربية وتعليمها سيرحبون بإنجاز هذه المدونة وقد طال انتظارهم لمثل ما تحققه من مسح لغوي شامل ضروي لاستعمال اللغة العربية وخاصة في العصر الحديث لأسباب كثيرة بينها ضرورته في دراسة تطور اللغة العربية واستعمالها عبر العصور وفوائده المتعددة للمعنيين بتدريسها لمتكلميها وغير الناطقين بها أو بإعداد مختلف المعاجم علماً بأن هذه المدونة ليست الأولى من نوعها إذ قد سبقتها محاولات عدة غربية بصفة خاصة أو عربية كما يتضح من الجدول الوارد في دراسة السليطي (2006)(1).

غير أن هذه المدونة تتميز عن سواها بخصائص بارزة يمكن إجمالها فيما يلي:

أولاً: البعد الزمني أو التاريخي فقد حاولت أن تغطي إلى حد ما مراحل مختلفة من تاريخ العربية قديماً وحديثاً.

ثانياً: البعد الجغرافي ويراد به تمثيل الأقطار العربية خاصة باختيار نصوص صادرة فيها بالإضافة إلى محاولتها الجزئية في اختيار نصوص منشورة في أقطار أخرى شرقية أو غربية كإيران وتركيا وبريطانيا والولايات المتحدة.أما الأقطار (أو المناطق الجغرافية) فتشمل حسب ترتيب المدونة (غير المطرد الفبائيا) ما يلي:

اسبانيا- إيران- الأردن- الإمارات العربية- البحرين - الجزائر- الدانمارك- السودان- العراق- الكويت- المغرب- المملكة العربية السعودية- المملكة المتحدة- الهند- الولايات المتحدة- اليمن- باكستان- تركمانستان- تركيا- تونس- سوريا- عمان- فلسطين- قطر- كندا- لبنان- ليبيا- مصر.

ثالثاً: أوعية النشر. وقد تم اختيار عشرة أوعية تشمل بنسب متفاوتة الصحف والمجلات والكتب والمناهج الدراسية والرسائل الجامعية والإصدارات الرسمية والدوريات المحكمة والمخطوطات المحققة ووكالات الأنباء والانترنت وقد روعي في اختيار الأوعية الالتزام بالعربية الفصحى، وتم استبعاد نصوص أو مواد (تغلب) عليها العامية أو اللهجات الدارجة كما جاء في موقع المدونة، وأغلب الظن أن المقصود من ذلك ليس موضوع (غلبة) العامية بل ورود عبارات أو كلمات عامية فيما استبعد من مواد كالمنتديات الحوارية وصفحات الانترنت الخاصة أي أنها تقتصر على الفصحى كما استعملت أو تستعمل كتابة.

رابعاً: المجال المعرفي ويراد به (ما يحدد مجال النص وسمته العامة) كالأخبار والمقالات تحت وعاء الصحف، أو العقائد والفقه وعلوم اللغة وغيرها تحت أوعية أخرى كالمخطوطات المحققة.

خامساً: التصنيف الموضوعي وبموجبه يدرج تحت كل مجال موضوعاته البارزة مثل الأخبار الاجتماعية، الأخبار السياسية، الأخبار الرياضية وغيرها تحت مجال الأخبار في وعاء الصحف، أو أصول الفقه الشافعي والمالكي والحنفي والاثنى عشري تحت مجال الفقه.

و يضم موقع المدونة الإحصائيات التالية:

- عدد الكلمات الكلى: 011,119, 739

- عدد الكلمات بدون تكرار:396,464, 7

- العدد الكلي للنصوص:478, 950نصًا

العدد الكلي للمؤلفين 1900مؤلفًا

كما جاء في الموقع الإيضاحات التالية بشأن استخدام أدوات المدونة:

1- البحث: حيث يتم البحث عن الكلمة وتظهر النتائج كما تظهر في أي محرك بحث مع إعطاء معلومات عن النص الذي ظهرت فيه الكلمة مع إمكانية استخدام محددات البحث الواضحة على صفحة البحث.

2- تكرار الكلمة: توضح هذه الأداة توزيع الكلمة على الأوعية أو الفترات الزمنية ويمكن الاستفادة منها للمقارنة بين استخدام مجموعة من الكلمات أو معرفة الفترات التي ظهرت أو اندثرت فيها لفظة بعينها.

3- التوافق: تستخدم هذه الأداة لتتبع معاني الألفاظ من خلال السياق الذي تظهر فيه هذه الكلمة كما يمكن استخدام الأداة لدراسة اختلاف وتغير معاني الكلمات حسب الأوعية أو الفترات الزمنية.

4- النص: استعراض المعلومات الأساسية لنصوص المدونة واستعراض تكرار كلمات كل نص على حدة.

5- إحصائيات: معلومات عامة عن توزيع محتوى المدونة إحصائياً على الأوعية والفترات الزمنية والمناطق الجغرافية.

6- الكلمات الأكثر تكراراً: استعراض الكلمات العشرة آلاف الأكثر تكراراً في المدونة.

إن أهم ما يدعو إلى الانتباه أو يستدعي التساؤل فيما يتصل بالبعد التاريخي أن المدونة في مرحلتها الحالية لا تغطي الفترات الزمنية بنسب واضحة المعايير، إذ يلاحظ أن نسبة الفترات ما قبل القرن التاسع عشر لا تتجاوز 10.5% من المجموع الكلي للكلمات، ونصيب قرن كامل - القرن التاسع عشر 1% (واحد بالمائة، ونسبة ثمانية عقود من القرن العشرين) (1900 - 1980) 4% (أربعة بالمائة) أما العقود الأخرى فقد تراوحت نسبها بين 7.5% لفترة 1980- 1990 و39.5% لعام 2011.

وقد جاء في موقع المدونة ما ينص على أن عدد كلمات المدونة يزداد كلما اقتربنا من العصر الحديث كما جاء في الجدول الخاص بتوزيع محتوى المدونة على الفترات الزمنية. الشكل المرفق()

إن هذا التفاوت غير المتناسب في تمثيل الفترات الزمنية وأخص بالذكر القرنين التاسع عشر والعشرين يتطلب في رأيي إعادة النظر أو في الأقل توضيح المعيار المتبع، إذ لا يبدو مقبولاً أو مبرراً مثلاً أن يمثل القرن الأول لما يسمى بعصر النهضة (أي القرن التاسع عشر) بهذه النسبة الضئيلة نظراً لما شهده القرن من تحولات وتيارات فكرية أو ثقافية في مواجهة الغزو الأوربي. وهناك قضايا أخرى تخصّ تصميم المدونة لا أريد الخوض فيها بالتفصيل قبل أن تتضح المعايير التي اتبعت في اختيار النصوص والأوعية التي قد لا تمثل البعد التاريخي أو البعد الجغرافي، ولكن لابد من الإشارة إلى بعض الموضوعات كموضوع اختيار الصحف لكل قطر عربي، ومدى تمثيل الصحيفة المختارة لقطرها مثل اختيار (الشرق الأوسط) بدلاً من صحف سعودية أخرى كالرياض أو الجزيرة، إذ تعد الشرق الأوسط بالرغم من انتمائها السعودي في طليعة الصحف العربية التي تتميز في تغطيتها ذات البعد العربي أو العالمي أكثر مما تعرف ببعدها الجغرافي المحلي أو الوطني السعودي.

وتقال الملاحظة نفسها حول التفاوت الكبير في نسبة الأوعية المستخدمة إذ يلاحظ أن نصيب الصحف والمجلات يزيد عن 54% من مجموع كلمات المدونة بينما لا يزيد نصيب الكتب عن 18% مما قد يوحي بهامشية (الكتاب) كوعاء عند العرب في هذا العصر خاصة.

أضف إلى ذلك كله طريقة البحث في المدونة فهي تعتمد أساساً على البحث عن الكلمة أو اللفظة المستقلة في صورة معينة، فإذا أردت البحث عما يرد في المدونة حول موضوع الحداثة فإنك لا تستطيع أن تلم به بالبحث عن صيغة محددة بل عليك تكرار البحث عن حداثة - حداثه (بدون نقطتين)، الحداثة، حداثته، حداثتها، حداثتنا، حداثتهم، حداثتك، حداثتكم، حداثي، حداثيون، حداثيين، حداثية، حداثوية ...إلخ، وإذا أردت البحث عن الديمقراطية، فستواجه ضرورة تكرار البحث، باستخدام (الديمقراطية) و(ديمقراطية) وستعجب أو قد تعجب أن الصيغتين لا تردان في أوعية القرن التاسع عشر. وقل الشيء نفسه عند البحث عن لفظة انتخاب إذ لابد من تكرار البحث عن صيغها المختلفة معرفة أو نكرة، مستقلة أو متصلة بضمير أو حرف جرّ: انتخاب، الانتخاب، بالانتخاب، بانتخاب، انتخابه، انتخابها، ...إلخ.

أما إذا أردت البحث عن تركيب أو اسم علم يتكون من كلمتين مستقلتين أو أكثر مثل (صلاح الدين) (أحمد شوقي) (عبد الله الغذامي) أو غيرهم من الإعلام أو (الواقعية الانتقادية) و(الشعر الحر) فستجد نفسك مضطراً إلى استخدام محددات البحث أو أداة التوافق المذكورة في موقع المدونة بتخصيص عدد الكلمات التي تسبق اللفظة المستهدفة والتي تتبعها وهي طريقة لا تحقق الهدف المراد بسهولة - كما جربت عملياً - بل تستغرق زمناً طويلاً وقد تزودك بأمثلة كثيرة لا علاقة لها بما تبحث عنه.

وإذا جاز لي أن استشهد بتجربتي الشخصية مستخدماً مدونة جامعية أخرى في الولايات المتحدة ألا وهي Parkinson, Dilworth B. (2006- 2012). arabiCorpus.byu.edu.

فلابد من التنويه بسهولة البحث في المدونة المذكورة سواء كان ذلك يتصل بالألفاظ المستقلة أو بالتراكيب المتعددة الألفاظ ك(صلاح الدين الأيوبي) وعبد الله الغذامي والشعر الحرو (حركة الأخوان المسلمين) بدون اللجوء إلى استخدام محددات البحث.

إن هذه الملاحظات وأمثالها مما سأذكر في مقالات لاحقة لا تخفى - في اعتقادي - على العاملين في إعداد المدونة العربية وأغلب الظن أنهم سيسعون في المستقبل القريب إلى تطوير المدونة بشكل ييسر على الباحثين الرجوع إليها ويشجع استخدامها لأغراض متنوعة ويحقق أشمل تغطية ممكنة للغة العربية في مختلف عصورها وأقطارها وحقولها المعرفية.

***

- Al- Sulaiti, Latifa and Erick Atwell. «The Design of A Corpus of Contemporary Arabic.» International

Journal of Corpus Linguistics 11.1 (2006): 1- 36.

وأود أن أشير- للتاريخ- مشروعا لبنانيا باسم « مشروع اللغة العربية الأساسية» كان موضوع ندوة عقدت في لبنان (حزيران 1973)و كان هدفه القيام بمسح إحصائي للعربية كما تستعمل اليوم على أساس نصوص مختارة لا يقل مجموع كلماتها عن مليون (1,000,000)كلمة.

- أستاذ العربية المتفرغ - جامعة إنديانا

 
 

صفحة الجزيرة الرئيسية

الصفحة الرئيسية

البحث

أرشيف الأعداد الأسبوعية

ابحث في هذا العدد

صفحات العدد

خدمات الجزيرة

اصدارات الجزيرة