فاطمة المتحمي
مؤخراً أصبحت تتردد مصطلحات تقنية على مسامعنا كثيراً، لكن البعض يجهل مضمون هذه المصطلحات. مؤخراً يتردد مصطلح علم البيانات كثيراً لأهميته.
إذاً ما هو علم البيانات؟ هل هو علم مستحدث؟ وهل هو تقني بحت؟
علم البيانات (Data science) علم يغلب عليه تداخل الاختصاصات وجمع علوم من مجالات متعددة تشمل الأمور الإحصائية واستخدام الخوارزميات والأساليب والأنظمة والذكاء الاصطناعي لتساعد في تحليل البيانات لاستخلاص المعرفة والرؤى من البيانات بشكليها، سواء مُهيكلة، أو غير مهيكلة. تُستخدم هذه التحليلات لمساعدة المستخدمين على توقع نتائج الأعمال واتخاذ القرارات المناسبة وتطوير الأعمال للأفضل.
علم البيانات ليس بعلم مُستحدث وإنما علم يتطور بشكل مستمر مع التطور التقني الذي سهل إجراء عمليات إحصائية لبيانات ضخمة. يعتمد علم البيانات على تقنيات تعلم الآلة والذكاء الصناعي وبرامج معالجة البيانات الضخمة من أجل فهم وتحليل ظاهرة فعلية باستخدام البيانات.
علم البيانات علم يقوم بتوظيف نظريات وأساليب مستمدة من حقول معرفية متعددة كالرياضيات والإحصاء وعلم المعلومات وعلوم الحاسب.
كيف يعمل علم البيانات وما مراحله؟
عملية تحليل البيانات عملية تكرارية بشكل مستمر، هذه العملية هي الطريقة التي تسهم في تدفق البيانات عن طريق دورة حياة البيانات حتى تسهل نمذجة البيانات لاحقاً.
ملخص مراحل التطبيق:
1 - طرح التساؤلات (Questioning)
تبدأ العملية بطرح أسئلة يجب الإجابة عليها. مثلاً:
لماذا هذا المشروع؟ ما المراد به؟ ما النتائج المطلوبة والمتوقعة؟ ما النجاح المراد الوصول إليه مبدئياً؟ ماذا سيحدث لو أحدثنا بعض التغييرات؟ ما الوقت المناسب لأداء أي مهمة؟ إلخ.
بناءً على هذه التساؤلات يتم جمع البيانات في المرحلة الثانية.
2 - جمع البيانات (Data Collection)
بعد طرح التساؤلات من الضروري البحث عن البيانات التي يمكنها أن تساعد في الإجابة. يمكن أن تأتي هذه البيانات وتُجمع من مصادر مختلفة لا حصر لها. ولكن من المهم العثور على مصادر تُقدم المعلومات بطريقة موثوق بها ومنظمة.
3 - معالجة وتنظيم البيانات (Data Processing and Classification)
نظام معالجة البيانات يقوم بمعالجة البيانات التي تم جمعها لمجموعة من المدخلات لتنتج مخرجات محددة. في هذه المرحلة يتم التأكد من صحة البيانات المقدمة ووضوحها. كما يتم فرزها وتصنيفها من ثم ترتيبها في مجموعات بناءً على المعطيات ليتم تلخيص البيانات التفصيلية إلى نقاط أو بيانات رئيسية. من ثم تجميعها وجعلها مترابطة.
عندما يتم تنظيم البيانات ومعالجتها يمكن البدء بعملية التحليل.
4 - تحليل البيانات (Data Analysis)
بعد جمع وتنقية ومعالجة البيانات، تبدأ عملية الفحص والتدقيق للبيانات، وتمشيطها لتكون أكثر دقة، وإعادة تشكيلها، وتخزينها لنحصل على معلومات يمكن استخدامها في تسهيل اتخاذ وتحديد القرارات. يتم استخدام أدوات وبرامج عدة لتحليل البيانات لتسهم في فهم الاستنتاجات وتفسيرها واستخلاصها بناءً على الأهداف والتساؤلات التي تم وضعها مسبقًا.
يختلف تحليل البيانات بناءً على المجال. تحليل البيانات يصنف إلى:
- تحليل وصفي.
- تحليل استكشافي.
- تحليل استنتاجي.
- تحليل تنبؤي.
- تحليل سببي.
- تحليل ميكانيكي.
الهدف من تحليل البيانات هو إعداد وتطوير نموذج قاعدة بيانات.
5 - تطوير النماذج والخوارزميات (Develop Models and Algorithms).
بعد تحليل البيانات يأتي الدور على تطوير النماذج واستخدام الخوارزميات، من أجل الوصول إلى إجابات على التساؤلات التي تم طرحها في المرحلة الأولى. فاستخدام الخوارزميات يسهل إيجاد نماذج يغفل البشر عن إدراكها، أو حتى لتحليل كم هائل من البيانات في دقائق معدودة. استخدام نماذج البيانات والخوارزميات يعد أمرًا ضروريًا، خاصة في ظل عدم القدرة على الاعتماد على العقل البشري، لذلك فهي تساعد على اتخاذ أفضل القرارات بأقل مجهود وفي أقل فترة زمنية.
6 - اتخاذ القرارات
بعد إتمام جميع المراحل السابقة تأتي أهم مرحلة وهي عملية اتخاذ القرارات بناء على المعلومات الناتجة عن تحليل البيانات التي جُمعت وحُللت. تُسهم هذه المعلومات أيضاً في وضع أهداف وإستراتيجيات وبرامج زمنية للخطط المستقبلية.
أهمية علم البيانات:
وفي الختام علم البيانات علم مهم جداً لمساهمته في تقديم خدمات عالية الجودة وفهم الأمور المعقدة واتخاذ القرارات الملائمة.
أهميته تكمن في استخدام الأساليب العلمية والرياضيات لمعالجة البيانات لاستخلاص المعلومات المفيدة في أي مجال (علمي، حكومي، تقني، طبي، تجاري، إلخ) مما تساعد في تطوره وتجنب المشاكل بشكل علمي.