التعامل مع البيانات - علم البيانات - ثاني ثانوي

الدرس الثاني التعامل مع البيانات رابط الدرس الرقمي www.ien.edu.sa ما المقصود بالبيانات الضخمة ؟ What is Big Data يشير مصطلح البيانات الضخمة (Big Data) إلى البيانات الكبيرة جدًا أو المعقدة التي لا يمكن البيانات الضخمة (Big Data) مجموعة بيانات كبيرة تتطلب تقنيات معالجتها بالطرائق التقليدية، ونظرًا لأن كم هذه البيانات يُعدّ كبيرًا جدًا لتتم معالجتها باستخدام قابلة للتوسع لتخزينها ومعالجتها وإدارتها أنظمة الحوسبة التقليدية، فإن تخزين مجموعاتها ومعالجتها يُعد تحديًا كبيرًا، وكذلك قد تتطلب السرعة الهائلة لعملية جمع البيانات متطلبات تخزين عالية للغاية. وتحليلها وذلك نظرا لخصائص حجمها، وتنوعها وسرعتها وتباينها وبالطبع قيمتها. خصائص البيانات الضخمة Characteristics of Big Data هناك خمسة معايير أساسية تساعدنا في تصنيف أي بيانات تحت مصطلح "البيانات الضخمة" وهي: التنوع، والقيمة، والحجم، والموثوقية، والسرعة. وتُعدّ البيانات ضخمة عندما تأتي بأحجام كبيرة، وبمعدل سريع جدا ، وبتنوع كبير، وبدقة عالية ، وفائدة. ويجب أن تستوفي البيانات جميع هذه المعايير لكي تعد بيانات ضخمة. التنوع Variety يشير التنوع إلى العديد من أنواع البيانات المتوافرة ، ويتم هيكلة البيانات التقليدية المختلفة وتكييفها بدقة في قواعد البيانات العلائقية ولكن مع ظهور البيانات الضخمة، أصبحت البيانات تتوافر في أنواع جديدة غير منظمة. تتطلب أنواع البيانات غير المنظمة وشبه المنظمة ( مثل النصوص والصوت والفيديو) معالجة إضافية مسبقة لاستخلاص المعاني ودعم معلومات البيانات الوصفية المتعلقة بتلك البيانات، ودون هذه البيانات الوصفية يكون من المستحيل معرفة ما يجري تخزينه وكيف يمكن معالجته. القيمة יוון الحجم التنوع ☑ الموثوقية الشكل 1.6: خصائص البيانات الضخمة - المعايير الخمسة السرعة 21 وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

ما المقصود بالبيانات الضخمة؟

خصاص البيانات الضخمة

التنوع

الموثوقية Veracity القيمة Value إن جمع الكثير من البيانات لا يعني أن تلك البيانات ترتبط صحة البيانات بمدى دقة مجموعة البيانات أو هي ذات قيمة، فقيمة البيانات تتمثل في إمكانية الحصول موثوقيتها . لا ترتبط الموثوقية بجودة البيانات نفسها فحسب، على التوصيات والوصول إلى بعض الأفكار من خلالها. بل أيضًا بمدى مصداقية مصدر البيانات ونوعها وكيفية يشير مصطلح القيمة إلى مدى فائدة البيانات في اتخاذ القرارات، وبالطبع فإن إجراء التحليلات المناسبة هو وسيلة استخراج قيمة البيانات الضخمة. الحجم Volume معالجتها. السرعة Velocity نظرًا لأنه يجب معالجة كميات كبيرة من البيانات غير المنظمة يشير مصطلح السرعة إلى معدل التقاط البيانات وتخزينها. والتي تتميز بقلة الكثافة وتسمى low density data) ، فإن كم تنتج البيانات من معظم الأجهزة الذكية المتصلة بالإنترنت البيانات يُعدُّ جانبًا مهما في البيانات الضخمة. يمكن أن تكون أجهزة إنترنت الأشياء ) والأجهزة المحمولة في الوقت الحقيقي قيمة بعض هذه البيانات غير معروفة قبل القيام بتحليلها، مثل أو قريبًا من الوقت الحقيقي، مما يتطلب الجمع الفوري لتلك بيانات تصفح المستخدمين لأحد مواقع الويب أو أحد تطبيقات البيانات وكذلك نقلها وتخزينها. الهاتف الذكي، أو تلك البيانات التي يتم الحصول عليها من أجهزة إنترنت الأشياء المدعمة بأجهزة الاستشعار. قد يصل حجم هذه البيانات إلى العشرات بل المئات من التيرابايت من البيانات. تقنيات إدارة البيانات الضخمة Technologies that Enable the Management of Big Data تستخدم الشركات أنظمة الحاسب وقواعد البيانات للاحتفاظ بالسجلات المختلفة مثل المعاملات المتعلقة بمعالجة الطلبات والمدفوعات وتتبع العملاء وإدارة التكلفة في الشركات. تحتاج الشركات أيضًا إلى نظام لإعداد التقارير لتوفير المعلومات التي تساعدها على العمل بكفاءة والمساعدة المديرين التنفيذيين على اتخاذ القرارات المدروسة التي تضمن أداء أفضل للأعمال. يحتاج مديرو المتجر الإلكتروني إلى تحسين تجربة الشراء والتأكد من أن زوار الموقع الذين يتصفحون المنتجات سيصبحون زبائن للمتجر وذلك من خلال شراء المنتجات، وكذلك العمل على عودة الزبائن للشراء مرات أخرى في المستقبل من خلال الموقع. يمكن للشركة تحليل جميع البيانات التي يتم جمعها أثناء تصفح الزوار للمتجر الإلكتروني على الويب أو من خلال تطبيق الهاتف الذكي، وتتضمن تلك البيانات تفاصيل دقيقة عن تصفح الزوار للموقع، بما فيها أماكن وضع المؤشر على الشاشة وأجزاء الموقع التي يقضون وقتًا أطول في تصفحها ، ومدة المرور فوق المنتج قبل الضغط للحصول على المزيد من المعلومات عنه أو للقيام بشرائه بالفعل. ينتج عن هذه التفاصيل الدقيقة التي يتم جمعها كم هائل من البيانات التي يجب تحليلها لتقديم رؤية واضحة وقيمة للقائمين علي أعمال الشركة يتم استخدام نتائج تحليل تلك المعلومات لإحداث تغييرات في مخطط موقع الويب أو المتجر، ولتعديل أسعار المنتجات سواء بالزيادة أو بالخصم ، ولتنظيم الحملات التسويقية للمنتجات على وسائل التواصل الاجتماعي للتأثير على سلوكيات الشراء لدى الزبائن. يتطلب القيام بهذا الأمر من الشركات توفير تقنيات وأدوات جديدة لإدارة وتحليل البيانات الضخمة لاستخراج قيمة الأعمال، ويجب جمع البيانات المطلوبة من المصادر الداخلية كدوائر المبيعات والتصنيع والمحاسبة، وكذلك من المصادر الخارجية كالبيانات الإحصائية عن النمو السكاني وطبيعة الزبائن وأعمارهم، وكذلك البيانات المتعلقة بالشركات المنافسة مثلا ، وذلك لاستخراج معلومات موجزة وموثوقة حول الوضع الحالي والمستقبلي للشركة والتأثيرات المحتملة لمتغيرات السوق. تحتوي البنية التحتية الحديثة لذكاء الأعمال على مجموعة من الأدوات والتقنيات لتخزين البيانات ومعالجتها للحصول على معلومات مفيدة من البيانات الضخمة، وتشمل هذه التقنيات مستودعات البيانات وبحيرات البيانات وعمليات الحوسبة في الذاكرة. وزارة التعليم Ministry of Education 2024-1446 22

الدرس الثاني: التعامل مع البيانات

القيمة

الحجم

الموثوقية

السرعة

تنقيبات إدارة البيانات الضخمة

الحوسبة في الذاكرة In-Memory Computing مستودعات البيانات Data Warehouse قد تُعدّ مستودعات البيانات الأداة الأقدم لتحليل بيانات الشركات. يشير هي طريقة لتسهيل عملية تحليل البيانات الضخمة مستودع البيانات إلى قاعدة البيانات التي تخزن البيانات الحالية والتاريخية لاعتمادها بصورة أساسية على ذاكرة الحاسب الرئيسة مثل التي نتجت عن العديد من أنظمة المعاملات التشغيلية الأساسية مثل أنظمة ذاكرة الوصول العشوائي (RAM) لتخزين البيانات. يصل المبيعات، ودعم العملاء، والتصنيع، والتي تجعل البيانات متاحة لصانعي القرار المستخدمون إلى البيانات المخزنة في الذاكرة الأساسية في الشركة، ويتم دمج هذه البيانات مع البيانات من المصادر الخارجية لتحويل للنظام وبالتالي يتم تجاوز معوقات استرداد وقراءة البيانات البيانات غير المكتملة إلى بيانات منظمة قبل تخزينها في مستودع البيانات. يوفر الموجودة في قاعدة البيانات التقليدية المستندة إلى التخزين نظام مستودع البيانات أيضًا مجموعة من الأدوات للتحليل والاستعلام وكذلك على الأقراص مما يعني تقليل وقت الاستعلام بشكل كبير. تتميز الخوادم السحابية بشكل خاص بوجود سعة كبيرة من ذاكرة الوصول العشوائي، مما يسهل استخدامها في عمليات الحوسبة في الذاكرة. أدوات إعداد التقارير الرسومية. بحيرة البيانات Data Lake بحيرة البيانات هي مستودع بيانات عادةً ما يكون سحابيًا يُستخدم لتخزين كميات هائلة من البيانات الأولية وغير المعالجة. في هذه الطريقة يتم استخدام عنوان URL ثابت لدعم كل من البيانات المنظمة ( مثل قواعد البيانات) والبيانات غير المنظمة ( مثل رسائل البريد الإلكتروني والمستندات). يُعد التمييز بين هذه التقنيات الثلاثة مهما نظرًا للأغراض المختلفة لاستخدامها ولكيفية عملها في معالجة البيانات بشكل صحيح. لا تعمل هذه التقنيات معًا ، ولكن يتم اختيار إحداها اعتمادًا على نوع الشركة، فقد تكون بحيرة البيانات هي الخيار الجيد لإحدى الشركات، بينما يعد مستودع البيانات الخيار الأفضل لشركة أخرى. التنقيب في البيانات الضخمة Mining Big Data كما عرفت سابقا ، يتم جمع البيانات الضخمة باستمرار بواسطة أجهزة الاستشعار والتطبيقات التنقيب في البيانات (Data Mining) العامة والتطبيقات الشخصية. إن عملية جمع البيانات ليست سوى الخطوة الأولى في العملية المشار إليها باسم اكتشاف المعرفة. عملية اكتشاف الأنماط في كمية كبيرة يشير اكتشاف المعرفة إلى العملية الشاملة للوصول إلى المعرفة المفيدة من البيانات، ويشير التنقيب من البيانات واستخراج المعلومات المفيدة في البيانات إلى خطوة معينة في هذه العملية، فالتنقيب عن البيانات هو تطبيق لخوارزميات محددة في توقع السلوك المستقبلي. الأنماط من البيانات، وتحديد العلاقات المختلفة داخل هذه البيانات. تُعدّ الخطوات الأخرى لاستخراج في عملية اكتشاف المعرفة مثل تنظيف البيانات، وتكامل البيانات، وتحويل صيغة البيانات والتفسير الصحيح لنتائج التنقيب ضرورية لضمان اشتقاق المعرفة المفيدة من البيانات ( انظر الجدول 1.6) بعض المهام الرئيسة التي يتم إنجازها عن طريق التنقيب في البيانات: تحليل البيانات لاكتشاف الأنماط والاتجاهات. صياغة التنبؤات لمدخلات مجموعات البيانات المختلفة. تصنيف أو تجميع أو توقع القيم المختلفة لمجموعة البيانات. تسهيل عملية اتخاذ القرارات المدروسة 23 وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

مستودع البيانات

الحوسبة في الذاكرة

بحيرة البيانات

يعتبر التمييز بين هذه التقنيات الثلاثة مهماً نظراً للأغراض المختلفة لاستخدامها ولكيفية عملها في معالجة البيانات بشكل صحيح.

التنقيب في البيانات الضخمة

24 الجدول 1.6 خطوات اكتشاف المعرفة تصحيح البيانات : تنظيف البيانات التالفة وغير المطابقة، وإزالة أنواع البيانات الخاطئة وما إلى ذلك. تكامل البيانات: يحدث التنقيب في البيانات من مصادر متعددة، ويجب دمج مصادر البيانات هذه في مجموعة بيانات واحدة. تحديد جزء مجموعة البيانات الذي يجب استخدامه لعملية استخراج البيانات، ومن المهم تحديد مجموعة البيانات الأكثر اختيار البيانات مواءمة لأهدافك لأن استخراج البيانات مهمة تستغرق وقتا طويلًا. تحويل صيغة البيانات: يُعد إعداد مجموعات البيانات الأولية وتنسيقها أمرًا ضروريًا؛ لأن عمليات التنقيب عن البيانات تحتاج إلى أن يكون لمدخلاتها تنسيق محدد لتحليلها. التنقيب في البيانات: هي العملية الفعلية لتحليل البيانات واستخراج النتائج المرجوة من التحليل من خلال الأنماط. تقييم النمط : تقييم الأنماط التي تم إنشاؤها خلال خطوات التنقيب عن البيانات، وتحديد أيها مفيد لكل هدف محدد. تمثيل المعرفة : تمثيل النتائج التي تم الحصول عليها من خلال التقارير، والرسوم البيانية، والمخططات الواضحة والمختصرة. البيانات الضخمة والتخزين السحابي Big Data and Cloud Storage هناك خياران معتمدان لتخزين البيانات الضخمة التخزين السحابي والتخزين الداخلي، ولقد كان تطوير تطبيقات البيانات الضخمة في الماضي يعتمد أساسًا على حفظ البيانات في وسائط التخزين داخليا ( على الخوادم داخل الشركات والمؤسسات) ، مما تطلب توفر مستودعات بيانات محلية عالية التكلفة، وكذلك تثبيت برامج معقدة لإدارة تلك المستودعات، إلا أن التطورات الحديثة في علوم الحوسبة والبيانات أسهمت في استبدال تلك الطريقة بالتخزين السحابي، والذي يُعدُّ بمثابة الحل الأمثل لتخزين البيانات الضخمة، وذلك لما يلي: أ) توافر النطاق العريض عالي السرعة على نطاق واسع مما سهل حركة البيانات من مكان إلى آخر. ومع وجود بيانات منتجة محليًا لم تعد هناك حاجة لتخزين البيانات داخليا ، بل أصبح بالإمكان نقلها إلى التخزين السحابي لتحليلها. ب أصبحت غالبية التطبيقات تعتمد على التخزين السحابي، مما يعني أن عملية إنتاج المزيد من البيانات وتخزينها سحابيًا تزداد باستمرار ، ولقد ساهم ذلك في قيام أعداد متزايدة من رواد الأعمال بعمل تحليلات جديدة للبيانات الضخمة لمساعدة الشركات على تحليل البيانات السحابية في كثير من المجالات مثل: معاملات التجارة الإلكترونية وبيانات أداء تطبيقات الويب. هناك جوانب متعددة للتخزين السحابي تجعله خيارًا أفضل للشركات، فمثلا يمكن أن يشمل التخزين السحابي أنظمة تخزين البيانات الضخمة وكذلك أنظمة النسخ الاحتياطي. وتوجد الكثير من الخيارات المتاحة من قبل مزودي الخدمات مثل أمازون (Amazon) ومايكروسوفت Microsoft) وقول (Google للتخزين السحابي مع توفيرها حماية البيانات والخصوصية، وبالطبع قابلية التوسع والتكلفة المعقولة لهذه الخدمات. شكل :1.7 مركز بيانات يوفر خدمة التخزين السحابي وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

البيانات الضخمة والتخزين السحابي

خطوت اكتشاف المعرفة

باستخدام النسخ الاحتياطي السحابي للبيانات الضخمة، يمكن للمؤسسات الاستفادة من خدمات مراكز البيانات التي تمتد عبر مواقع جغرافية متعددة، مما يضمن التوافر الدائم واستعادة البيانات بسهولة. وباستخدام التخزين السحابي يمكن نسخ البيانات احتياطيًا عبر عدة مراكز بيانات في مناطق مختلفة من العالم، وبذلك لا يتم الاحتفاظ بالنسخ الاحتياطية في مكان واحد. توفر تقنيات التخزين السحابي خصائص أخرى للحماية للنسخ الاحتياطية، حيث يضمن مقدمو تلك التقنيات حماية البيانات المنسوخة احتياطيًا إلى التخزين السحابي عبر تقنيات التشفير المتقدمة قبل القيام بنقل البيانات وخلال نقلها وكذلك بعد نقلها . وكما ذكر سابقًا ، فإن معالجة البيانات الضخمة تتطلب سعة تخزين وقوة معالجة، أما من حيث السعة التخزينية، فإن التقنيات السحابية تفي بهذا الأمر، ويمكن للشركات الحصول على خدمات التخزين القابلة للتوسع بيسر. يمكن لهذه التقنيات أيضًا تلبية متطلبات الحوسبة لتحليل البيانات الضخمة ، وقد أصبح خبراء تحليلات البيانات يوصون باستخدام الخدمات المدعومة سحابيًا للقيام بعمليات التحليل لإدراكهم بالإمكانيات غير المحدودة التي توفرها التقنيات مزايا وعيوب تخزين البيانات الضخمة سحابيًا Pros and Cons of Big Data Cloud Storage يمكن من خلال الجمع بين تحليلات البيانات الضخمة والحوسبة السحابية إيجاد فرص لم تكن ممكنة من قبل لفهم البيانات والحصول على المعرفة ودعم عمليات اتخاذ القرارات. يجب عليك النظر إلى المزايا وكذلك إدراك التحديات التي تتعلق باستخدام الحوسبة السحابية في العمليات المتعلقة بالبيانات الضخمة. جدول :1.7 مزايا وعيوب تخزين البيانات الضخمة سحابيًا المزايا العيوب تتطلب الكميات الكبيرة من البيانات المنظمة وغير المنظمة توفر شبكات ذات نطاق إرسال واسع وذلك لسرعة الإرسال والتخزين. يوفر التخزين السحابي بنية تحتية متاحة بسهولة مع القدرة على التوسع للتعامل مع أي مقدار من حركة مرور البيانات ومتطلبات التخزين تقدم إمكانيات تحكم مباشر أقل في أمن البيانات، وقد تتعرض لعمليات تؤدي إلى انتهاك البيانات، وبالتالي إلى عواقب خطيرة فيما يتعلق بلوائح خصوصية البيانات. يؤدي تخزين البيانات الضخمة سحابيًا إلى التخلص من الحاجة إلى الاحتفاظ بأجهزة وبرامج وموظفين متخصصين عند الحاجة، ويُعد نموذج الحوسبة السحابية المبني على الدفع حسب الحاجة إلى الخدمات أكثر فعالية من حيث التكلفة، مما يساهم في خفض التكلفة وزيادة الكفاءة والحد من هدر الموارد. يمكن لمزود الخدمة السحابية رفع تكلفة الخدمات التي يقدمها في أي وقت، مما يعني ارتفاع التكلفة لأعمال الشركات المستخدمة لهذه الخدمات، والتي لا يمكنها الانتقال بسهولة إلى مقدم خدمات آخر يقدم أسعارًا تنافسية. تركّز الشركة على عمليات تحليل البيانات بدلا من إدارة البنية التحتية، مما ينعكس بشكل إيجابي على الأداء والميزة التنافسية. يعني تخزين البيانات الضخمة سحابيًا أن توفر البيانات يعتمد على الاتصال بالشبكة. تؤثر المشاكل المتعلقة بالشبكات كتدني جودة الاتصال أو تأخر الاستجابة (Latency)، والتي قد تظهر في البيئة السحابية على سرعة جمع البيانات ومعالجتها وتخزينها. 25 وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

يمكن للمؤسسات الاستفادة من الخدمات من مراكز البيانات التي تعتمد عبر مواقع جغرافية متعددة

مزايا وعيوب تخزين البيانات الضخمة سحابياً

26 سياسة الشركات وحوكمة البيانات Data Governance and Policies تحدد الضوابط والهياكل التنظيمية للشركات والمؤسسات المسؤوليات وطرائق اتخاذ القرارات المتعلقة بإدارة البيانات، والتي تتضمن تطوير السياسات والإجراءات الداخلية التي تتحكم بإدارة البيانات. تساعد إدارة البيانات المؤسسات الخاصة أو المؤسسات الحكومية وغير الربحية في التعامل مع عمليات إدارة البيانات بجودة عالية خلال جميع مراحل دورة حياة البيانات، وتؤدي هذه السياسات والإجراءات الفعّالة إلى تحسين الأعمال والنتائج، حيث تقوم الشركات والمؤسسات بجمع كميات هائلة من البيانات الداخلية والخارجية، وتُعدّ إدارة البيانات ضرورية لاستخدام تلك البيانات بنجاح وإدارة المخاطر وخفض التكاليف المختلفة. تضمن حوكمة البيانات أن البيانات: آمنة. موثوقة. موثقة. مدارة مدققة. أهمية حوكمة البيانات The Importance of Data Governance من غير الممكن تصحيح التناقضات الموجودة في بيانات الأنظمة المختلفة داخل المؤسسة دون إدارة مناسبة للبيانات. فعلى سبيل المثال، قد يتم تخزين أسماء العملاء في أنظمة المبيعات وأنظمة خدمة العملاء بطرائق مختلفة. قد يُصعب هذا الأمر من تكامل البيانات ويؤثر على دقة ذكاء الأعمال وعلى إعداد التقارير. كذلك فقد لا يتم اكتشاف أخطاء البيانات الموجودة وبالتالي لا يتم تصحيحها في الوقت المناسب، مما يعرض سلامة البيانات للخطر. أصبح واجبًا على المؤسسات أن تمتثل للتشريعات الجديدة الخاصة بخصوصية البيانات وحمايتها مثل اللائحة العامة لحماية البيانات في الاتحاد الأوروبي (GDPR) وقانون خصوصية المستهلك في كاليفورنيا (CCPA)، وذلك لأن حوكمة البيانات بصورة سيئة تجر المؤسسات إلى صعوبات وتجعلها تحت طائلة مواجهة العقوبات. يُنظم قانون حماية البيانات الشخصية (PDPL) الجديد في المملكة العربية السعودية موضوع معالجة البيانات الشخصية، ويُعدُّ بمثابة التشريع الأول الخاص بخصوصية البيانات الحكومية في المملكة العربية السعودية . يشمل هذا التشريع جميع الصناعات وأنواع المؤسسات، ويشرف مكتب إدارة البيانات الوطنية (NDMO) على اللوائح الجديدة ويفرضها، وينطبق هذا القانون أيضًا على المؤسسات الأجنبية العاملة في المملكة العربية السعودية التي تتعامل البيانات الشخصية للمواطنين والمقيمين في المملكة، وبشكل خاص تلك البيانات الصحية والائتمانية والمالية. مع تتطلب بعض أنواع البيانات كالبيانات المالية والصحية معالجة بشكل أكثر دقة من البيانات الأخرى، فعادة ما يتم تنظيم البيانات الصحية بشكل جيد بدءًا من مرحلة جمع تلك البيانات حتى إعداد التقارير ونشر المعلومات. يتفهم جميع من يهمهم الأمر تماما المخاطر المتعلقة بالخصوصية وتلك القيود التي تفرضها التشريعات، وبالتالي فإن تحديد إطار عمل حوكمة البيانات في المؤسسات الصحية كالمستشفيات يُعد أمرًا مهما للغاية. مكونات إطار عمل حوكمة البيانات Data Governance Framework Components تشكل السياسات والضوابط التوجيهية والعمليات والهياكل التنظيمية والتقنيات المنفذة كجزء من برنامج الحوكمة إطار عمل لحوكمة البيانات، ويحدد إطار العمل أيضًا مهمة البرنامج وأهدافه والمسؤوليات المختلفة وكيفية قياس النجاح في المهام التي سيتم تضمينها في البرنامج. ـب إنشاء إطار الحوكمة في أي مؤسسة ونشره داخليًا وشرح آلية عمله بحيث يكون لدى كل مشارك فهم واضح منذ البداية. وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

سياسة الشركات وحوكمة البيانات

أهمية حوكمة البيانات

مكونات إطار عمل حكومة البيانات

تضمن حوكمة البيانات أن البيانات

تتطلب بعض أنواع البيانات كالبيانات المالية والصحية معالجة بشكل أكثر دقة من البيانات الأخرى

معايير حوكمة البيانات Data Governance Standards قامت منظمة المعايير الدولية ISO بتطوير معيار 38505 ISO/IEC لتطبيق مبادئ حوكمة تقنية المعلومات على متطلبات إدارة البيانات. جدول 1.8 : المبادئ الستة لحوكمة البيانات المسئولية تُعين للأفراد. الاستراتيجية تتوافق مع مهمة المؤسسة ورؤيتها. الحيازة تتوافق مع المتطلبات التنظيمية. التوافق ضمان الامتثال للتشريعات والسياسات الداخلية وأخلاقيات العمل. الأداء تلبية متطلبات المؤسسة. السلوك الإنساني تشجيع الناس على المشاركة. معايير إدارة البيانات السعودية Saudi Data Management Standards على غرار متطلبات إدارة البيانات الدولية 38505 ISO/IEC ، طوّر مكتب إدارة البيانات الوطنية (NDMO) ضوابط إدارة البيانات الوطنية وحماية البيانات الشخصية في المملكة. يُعد مكتب إدارة البيانات الوطنية مسؤولاً عن تنفيذ الضوابط والسياسات وآليات الحوكمة والضوابط الخاصة بالبيانات والذكاء الاصطناعي ومتابعة الامتثال من قبل المنظمات والشركات تنطبق المعايير على جميع البيانات بغض النظر عن النموذج أو النوع بما فيها السجلات الورقية والبيانات الرقمية والتسجيلات الصوتية والصور ومقاطع الفيديو، وكذلك المستندات المكتوبة بخط اليد أو أي شكل من أشكال البيانات المسجلة. NDMO 1 إطار إدارة البيانات الوطنية وحوكمتها وحماية البيانات الشخصية تم تحديد الضوابط لتشتمل على ضوابط ومواصفات في جميع المجالات الـ 10 المذكورة في إمام والتي تغطي دورة حياة البيانات من لحظة إنشائها واستخدامها حتى إتلافها والتخلص منها الشكر NDMO https://sdaia.gov.sa/ndmo 回 i - تدين البيانات إطار إدارة البيانات الوطنية وحوكمتها وحماية البيانات الشخص q % جودة البيانات المرجعية والرئيسية ١٢- دية المعلومات 1. حوكمة البيانات حماية البيانات 14 - حماية البيانات الشخصية الشكل ا: إطار إدارة البيانات الوطنية وحوكمتها وحماية البيانات الشخصية في المملكة ان حوكمة البيانات في مجموعة من الممارسات والإجراءات التي تساعد على ضمان إدارة أمو وضع الخطة المعنية بالبيانات وتطوير الضوابط والسياسات وحتى التنفيذ والامثال، يتم تحد يوضح الأدوار والمسؤوليات بين ذوي العلاقة. المخرجات المرتبطة بالبيانات الوصفية Metadata. فهو إطار مرجعي يصف البيانات ومكوناته كخارطة بيانات تفصيلية، كما أنه يحدد مصدر الحقيقة للبيانات في الجهة العامة NDMO مكتب إدارة البيئات الوطنية. البيانات الوصفية ودليل البيانات البيانات الوصفية في معلومات تفصيلية تصف البيانات وفا مكتب إدارة البيانات الوطنية من ثلاثة أنواع : البيانات الوصفية للأعمال ٢- البيانات الوصفية الفنية ٣- البيانات الوصفية الله ضوابط ومواصفات إدارة البيانات الوطنية جودة البيانات: تمثل جودة البيانات مجموعة من العمليات الدورية لمعالجة البيانات وضمان وحوكمتها وحماية البيانات الشخصية متطلبات العمل. تخزين البيانات آلية حفظ البيانات على أجهزة ووسائل تخضع للتدابير اللازمة لتوفير البيانات بس الإصدار 1.0 يناير ٢٠٢١ شكل 1.8 نماذج لصفحات من مكتب إدارة البيانات الوطنية - ضوابط ومواصفات إدارة البيانات الوطنية وحوكمتها وحماية البيانات الشخصية © الهيئة السعودية للبيانات والذكاء الاصطناعي مثال أنشأت شركة اتصالات سعودية قطاع تحليل البيانات المؤسسية للمساعدة في تحقيق هدفها المتمثل في تقديم أفضل ممارسات حوكمة البيانات وإدارتها. تُعدّ البيانات والأشخاص والعمليات والتقنيات من أهم ركائز الشركة في الحوكمة حيث تتضمن المبادرة تحقيق جميع الركائز لأجل تحول رقمي ناجح. تسعى الشركة الآن إلى اعتماد حلول حوكمة البيانات المبتكرة التي تعزز الذكاء الاصطناعي وتوسع مفهوم حوكمة البيانات إلى "حوكمة التحليلات". يهدف هذا السعي إلى تحقيق تغيير إيجابي في الأعمال وذلك من خلال تحديد المتطلبات وخطوات سير الأعمال بشكل واضح. 27 وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

معايير حوكمة البيانات

المبادئ الستة لحوكمة البيانات

معايير إدارة البيانات السعودية

أنشأت شركة اتصالات سعودية قطاع تحليل المؤسسية (CAD) عام 2016

28 حوكمة البيانات وإدارتها Data Governance and Data Management تعد حوكمة البيانات أحد مكونات إدارة البيانات الشاملة. إن وضع القواعد الإرشادية إدارة البيانات (Data Management): لحوكمة البيانات دون التنفيذ الفعلي لها يُعد مضيعة للوقت والجهد دون معنى أو قيمة حقيقية، فحوكمة البيانات تحدد جميع الضوابط والسياسات والعمليات، والتي تُنفذ بواسطة إدارة البيانات هي إنشاء وتنفيذ البنى إدارة البيانات، ومهمتها جمع البيانات واستخدامها في صنع القرار من خلال اتباع أساسيات والسياسات والإجراءات التي تدير احتياجات دورة حياة البيانات الكاملة الحوكمة التي تتمثل بالضوابط والسياسات والعمليات المتعلقة بالبيانات. تشبه حوكمة البيانات عملية تطوير التصميم لبناء منزل جديد، أما إدارة البيانات فهي عملية البناء نفسها، فإذا تخيلت هذا الأمر، فيمكنك بناء منزل دون تصميم ، ولكن هذا البناء سيكون أقل كفاءة وجودة، مع وجود احتمال الفشل في بنائه بالدرجة الأولى. تحديات حوكمة البيانات Data Governance Challenges تعد التحديات المرتبطة بالبيانات السحابية والبيانات الضخمة من الأمور الشائعة التي تواجهها المؤسسات بخصوص حوكمة البيانات، فالخدمات السحابية وأنظمة البيانات الضخمة تستدعي متطلبات حوكمة جديدة. لقد كان تركيز برامج حوكمة البيانات حتى وقت قريب على البيانات المنظمة المخزنة في مركز البيانات، أما الآن فأصبح من الضروري التعامل مع الكثير من البيانات المنظمة وغير المنظمة وشبه المنظمة التي قد تظهر معًا في بيئات البيانات الضخمة، بالإضافة إلى تهديدات الخصوصية المرتبطة بأنظمة البيانات السحابية. من المسؤول عن حوكمة البيانات؟ Who is Responsible for Data Governance تضم عملية حوكمة البيانات مجموعة متنوعة من الأشخاص في معظم المؤسسات، ويُضمّ للمؤسسة. مالك البيانات Data Owner) المستخدمون النهائيون المطلعون على البيانات ذات العلاقة في أنظمة المؤسسة، وكذلك مديرو الأعمال، والمتخصصون في إدارة البيانات، وموظفو تقنية المعلومات، ويتحمل المسئولية الرئيسة شخص أو أشخاص مسؤولون عن بيانات عن الحوكمة عادة رئيس قسم المعلومات (CIO) أو كبير مسؤولي البيانات (CDO) ومدير إدارة البيانات (DGM). يُعد رئيس قسم المعلومات أحد كبار المسؤولين التنفيذيين عن برنامج حوكمة البيانات، وتشمل مسؤولياته الحصول على الموافقة والتمويل والتوظيف في البرنامج، وكذلك تقديم المبادرات، وتقييم تطور البرنامج، والترويج له بفاعلية. ، محددة. مشرف بيانات Data Steward): تتضمن مهام مشرف البيانات إدارة البيانات من خلال تنفيذ سياسات حوكمة فاعتمادًا على حجم المؤسسة، يتم تعيين مدير عام لإدارة البيانات وقيادة مبادرة الحوكمة البيانات والمحافظة عليها داخل المؤسسة. وتنسيقها، حيث يتولى عقد الاجتماعات، وتنفيذ الدورات التدريبية، وتتبع مؤشرات الأداء الرئيسة ، وإدارة الاتصالات الداخلية للمبادرة. ويعمل مدير إدارة البيانات مع مالكي البيانات والمسؤولين الذين يضمنون تطبيق ضوابط حوكمة البيانات وقواعدها واتباع المستخدمين النهائيين لها. وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

حوكمة البيانات وإرادتها

تحديات حكومة البيانات

من المسؤول عن حوكمة البيانات؟

إدارة البيانات

مالك البيانات

مشرف بيانات

1 تمرينات حدد الجملة الصحيحة والجملة الخاطئة فيما يلي: 1. تشير البيانات الضخمة إلى البيانات الكبيرة جدًا أو المعقدة التي لا يمكن معالجتها باستخدام الطرائق التقليدية 2. من التقنيات الخمس التي تمكن من إدارة البيانات الضخمة السرعة والمصداقية ومستودع البيانات. .3 يُعد اكتشاف المعرفة عملية بسيطة لا تتطلب أي خطوات محددة. 4. التخزين السحابي هو طريقة التخزين الوحيدة المستخدمة لكم البيانات الكبير مثل البيانات الضخمة. 5. تُعدّ قابلية التوسع والتكلفة المنخفضة لتحليل البيانات من المزايا العديدة لتخزين البيانات الضخمة سحابيًا. 6. مستودع البيانات هو مستودع يتوافر سحابيًا عادةً لتخزين كميات هائلة من البيانات الأولية وغير المعالجة. 7. الحوسبة في الذاكرة هي طريقة لتسهيل تحليل البيانات الضخمة لاعتمادها بصورة أساسية على ذاكرة الحاسب الرئيسة ذاكرة الحاسب الرئيسة مثل ذاكرة الوصول العشوائي (RAM) لتخزين البيانات. 8. تشير بحيرة البيانات إلى قاعدة البيانات التي تخزن البيانات الحالية والتاريخية الناتجة عن أنظمة المعاملات الأساسية في المؤسسة. 9. اختيار البيانات هو تحديد جزء من مجموعة البيانات الذي نريد استخدامه لعملية اكتشاف المعرفة. 10 تمثيل المعرفة هو عملية استخراج البيانات من خلال تحليلات الأنماط. صحيحة خاطئة 29 وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

حدد الجملة الصحيحة والجملة الخاطئة فيما يلي تشير البيانات الضخمة إلى البيانات الكبيرة جدا

30 2 اذكر ثلاثة أمثلة على استخدام البيانات الضخمة للمساعدة في الأعمال التجارية. 3 ابحث في الإنترنت عن مزودي خدمات الحوسبة السحابية الأكثر شهرة اليوم في السوق العالمية والمستخدمة في تخزين ومعالجة البيانات الضخمة. 4 اشرح بإيجاز مدى مساعدة التخزين السحابي لنا في التعامل مع مشكلة تخزين الكم الهائل من البيانات الناتج عن البيانات الضخمة. وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

أذكر ثلاثة أمثلة على استخدام البيانات الضخمة للمساعدة في الأمال التجارية

اشرح بإيجاز مدى مساعدة التخزين السحابي لنا في التعامل مع مشكلة تخزين الكم الهائل من البيانات الناتج عن البيانات الضخمة

ابحث في الإنترنت عن مزودي خدمات الحوسبة السحابية الأكثر شهرة اليوم في السوق العالمية والمستخدمة في تخزين ومعالجة البيانات الضخمة

5 البيانات الضخمة هي تطور حديث في تاريخ الحوسبة، فهل يمكنك تحديد عاملين ساهما في هذا النمو المفاجئ 6 في جمع البيانات؟ قارن بين التقنيات الثلاث لتخزين البيانات الضخمة، وإذا قمت بتطوير تطبيق يتطلب وصولا سريعا جدًا إلى البيانات، فما التقنية التي ستختارها؟ 7 لماذا يُعد تقييم أنماط البيانات مهمًا في عملية التنقيب عن البيانات؟ 31 وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

البيانات الضخمة هي تطور حديث في تاريخ الحوسبة, فهل يمكنك تحديد عاملين ساهما في هذا النمو المفاجئ في جمع البيانات؟

قارن بين التقنيات الثلاث لتخزين البيانات الضخمة، وإذا قمت بتطوير تطبيق يتطلب وصولاً سريعا جداً إلى البيانات، فما هي التقنية التي ستختارها؟

لماذا يعد تقييم أنماط البيانات مهماً في عملية التنقيب عن البيانات؟

وزارة التعليم Ministry of Education 2024-1446 8 اشرح كيفية عمل قابلية التوسع في تخزين البيانات السحابية، ثم ابحث عن خدمتين لتخزين البيانات سحابيًا على شبكة الإنترنت. ما الغرض من حوكمة البيانات؟ وهل تُعدّ حوكمة البيانات مرادفة لإدارة البيانات؟ ابحث في الإنترنت عن معلومات حول ضوابط إدارة البيانات الصحيحة أو قوانينها في المملكة العربية السعودية، ثم اذكر العواقب المترتبة على تسرب بيانات أحد مرافق الرعاية الصحية. 9 10 32

الدرس الثاني: التعامل مع البيانات

اشرح كيفية عمل قابلية التوسع في تخزين البيانات السحابية، ثم ابحث عن خدمتين لتخزين البيانات سحابياً على شبكة الإنترنت

ما الغرض من حوكمة البيانات؟ وهل تعتبر حوكمة البيانات مرادفة لإدارة البيانات؟

ابحث في الإنترنت عن معلومات حول ضوابط أو قوانين إدارة البيانات الصحية في المملكة العربية السعودية، ثم اذكر العواقب المترتبة على تسرب بيانات أحد مرافق الرعاية الصحية؟

11 أنشئ تقريراً عن تغير المناخ من خلال مقارنة بيانات الطقس التاريخية لدولتين من اختيارك، ثم حدد أين ستبحث عن المعلومات في الإنترنت، واشرح العوامل المؤثرة وراء قرارك هذا. 12 ما مخاوف الخصوصية التي يمكنك التفكير بها عند تعامل مؤسسة كبيرة مع البيانات الضخمة؟ 13 هل لديك فكرة عن المعلومات التي تمتلكها شبكة التواصل الاجتماعي التي انضممت إليها حول عائلتك وأصدقائك؟ إذا كانت الإجابة نعم، اكتب قائمة قصيرة بهذه المعلومات. 33 وزارة التعليم Ministry of Education 2024-1446

الدرس الثاني: التعامل مع البيانات

أنشئ تقريراً عن تغير المناخ من خلال مقارنة بيانات الطقس التاريخية لدولتين من اختيارك، ثم حدد أين ستبحث عن المعلومات على الأنترنت، واشرح العوامل المؤثرة وراء قرارك هذا

ما مخاوف الخصوصية التي يمكنك التفكير بها عند تعامل مؤسسة كبيرة مع البيانات الضخمة؟

هل لديك فكرة عن المعلومات التي تمتلكها شبكة التواصل الاجتماعي التي انضممت إليها حول عائلتك وأصدقائك؟ إذا كانت الإجابة نعم أكتب قائمة قصيرة بهذه المعلومات