البيانات والمعلومات والمعرفة - علم البيانات - ثاني ثانوي

8 .1 . مقدمة في علم البيانات سيتعرف الطالب في هذه الوحدة على المفاهيم الأساسية لعلم البيانات، ويشمل ذلك تعريف معنى البيانات والمعلومات والمعرفة والفرق بينها، وسيتم تناول موضوع دورة حياة علم البيانات وطريقة التعامل مع البيانات الضخمة، وأيضًا سيتم مناقشة بعض الموضوعات الخاصة بالسياسات المتعلقة بالبيانات وحوكمة البيانات. وفي الختام سيتعرف الطالب على أساسيات علم البيانات مع التركيز على الفرص الوظيفية التي يوفرها علم البيانات. أهداف التعلم بنهاية هذه الوحدة سيكون الطالب قادرًا على أن : يُعرف مصطلح علم البيانات. > يُفرّق بين البيانات والمعلومات والمعرفة. > يُفرِّق بين علم البيانات وذكاء الأعمال. يُوضح أوجه التقارب بين علم البيانات والذكاء الاصطناعي. > يُحدد مراحل دورة حياة علم البيانات. يُعرف مصطلح البيانات الضخمة. يُحدد خصائص البيانات الضخمة. يُصنف تقنيات البيانات الضخمة. V V V V V V V V يُعرف مفهوم إدارة البيانات. يُحدد مبادئ حوكمة البيانات. > يُناقش المهارات والأدوات التي يتطلبها علم البيانات. > يُحدد المهن المتعلقة بعلم البيانات. > يُوضّح أهمية المجتمعات الرقمية لعلم البيانات. متطلب البرمجة بلغة البايثون يتطلب منهجا علم البيانات والهندسة في نظام المسارات معرفة أساسيات البرمجة بلغة البايثون. يرجى مسح رمز الاستجابة السريع أدناه للوصول لمحتوى تعريفي بالبايثون. والمعرفة الموضوعات المتوفرة والوصول السريع لكل وحدة ، يمكنك الاطلاع على الصفحات 208-209 Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

مقدمة في علم البيانات

شرح مقدمة في علم البيانات

أهداف التعلم: مقدمة في علم البيانات

شرح أهداف التعلم: مقدمة في علم البيانات

متطلب الرمجة بلغة البايثون

الدرس الأول البيانات والمعلومات والمعرفة علم البيانات Data Science رابط الدرس الرقمي www.ien.edu.sa تكمن أهمية علم البيانات (Data Science) في أن البيانات أصبحت جزءًا أساسيًا في جميع الصناعات لكونها مطلبًا رئيسًا من قبل الشركات لكي تتوسع أعمالها وتتطور، حيث تمكّن الأساليب علم البيانات Data Science) القائمة على البيانات الشركات من اتخاذ القرارات المناسبة وذلك من خلال تحليل كميات كبيرة علم البيانات هو مجال الدراسة الذي من البيانات لاستخراج رؤى وتوصيات قيمة لإدارة تلك الشركات. مجالات تطبيق علم البيانات التطبيقات التجارية والصناعية. الرعاية الصحية، والمعلوماتية الحيوية، والعلوم الطبيعية. الاقتصاد الرقمي، وتحليل وسائل التواصل الاجتماعي، والشبكات الاجتماعية. المنازل الذكية، والمدن الذكية والمواصلات الذكية. التعليم والتعلم الإلكتروني والترفيه الطاقة، والاستدامة، والمناخ البيانات والمعلومات Data and Information يتعامل مع كميات هائلة من البيانات باستخدام الأدوات والتقنيات الحديثة لإيجاد أنماط غير بديهية داخل تلك البيانات، وللوصول إلى معلومات مهمة يمكن أن تساهم في اتخاذ القرارات المتعلقة بكافة الأعمال. مثال تطبق منصة استشراف (Estishraf) التابعة لمركز المعلومات الوطني (NIC) تقنيات علم البيانات المتقدمة على قاعدة بياناتها لتقديم رؤى وتنبؤات مستقبلية بأكثر من 50 سيناريو لدعم صناع القرار في المملكة. تحيط بك البيانات بصورة يومية في كل مكان، فتتلقى المعلومات من التلفاز ومن الصحف والكتب وشبكة الإنترنت، ولكن هل فكرت في أن هناك فرقا بين البيانات والمعلومات؟ و البيانات (Data) تعد البيانات تمثيلا للحقائق أو الأفكار بصورة شكلية، بحيث يمكن إيصالها أو معالجتها من تمثيل الحقائق أو الأفكار بتنسيق مناسب خلال طريقة أو عملية ما . فعلى سبيل المثال، يعرض الشكل 1.1 مجموعة من البيانات الشخصية للتخزين أو المعالجة أو النقل. لأحد الطلبة. عندما تتم معالجة البيانات، أو تنظيمها، أو تحليلها ، أو تقديمها في سياق معين لتكون مفيدة وذات معنى، فإنها تصبح معلومات . فعلى سبيل المثال، يعرض الشكل 1.2 معلومات منظمة عن طالب ما ، المعلومات (Information): ويمكنك أن تلاحظ هنا وجود معلومات حول الطالب مثل: اسمه ، وعنوان المنزل، والهاتف والبريد مجموعة من البيانات التي خضعت للمعالجة وأصبحت منظمة ذات معنى الإلكتروني، وتاريخ الميلاد. محمد 14 شارع بدر. 05******** mohammadsa.bl@outlook.com بطاقة طالب الاسم : محمد عنوان المنزل : 14 شارع بدر. رقم الهاتف: البريد الإلكتروني : 05******** وتقدم في سياق محدد ومفيد وتمكّن عمليات صنع القرار. السادس عشر من أبريل mohammadsa.bl@outlook.com شكل 1.1 بيانات غير منظمة تاريخ الميلاد : السادس عشر من أبريل شكل 1.2 معلومات 9. وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

أهمية علم البيانات

شرح أهمية علم البيانات

مجالات تطبيق علم البيانات

شرح مجالات تطبيق علم البيانات

علم البيانات

شرح علم البيانات

البيانات والمعلومات

شرح البيانات والمعلومات

تطبيق منصة استنزاف التابعة لمركز المعلومات الوطني

شرح تطبيق منصة استنزاف التابعة لمركز المعلومات الوطني

البيانات

شرح البيانات

المعلومات

شرح المعلومات

10 البيانات الأولية والمعلومات Raw Data and Information تطلق تسمية البيانات الأولية على البيانات التي تم جمعها حديثًا من مصادر مختلفة، ولكن لم تجر معالجتها أو تحليلها بعد بأي شكل من الأشكال، وعادة ما ترمز كلمة البيانات (Data) إلى البيانات الأولية، ولكن بمجرد تحليلها فإنها تتحول إلى معلومات. لتشاهد بعض الأمثلة: يُعدُّ الرقم "8122001" بيانات أولية باعتباره قيمة ليست ذات معنى سياقي، ولكن إذا تم عرض هذه القيمة بصورة تاريخ ميلاد هو "8/12/2001"، أصبحت معلومات، وذلك لتوفيرها معرفة حول أمر معين، وهو تاريخ ميلاد شخص ما. تمثل نتيجة اختبار كل طالب جزئيةً واحدة من البيانات، بينما يُعدُّ متوسط درجات الفصل الدراسي أو المدرسة بأكملها معلومات تم اشتقاقها من البيانات الموجودة معلومات للمزيد من المعالجة Information for Further Processing يمكن دمج البيانات والمعلومات من مصادر مختلفة لإنشاء مجموعات بيانات ذات أثر أكبر، ويُطلق على هذه العملية اسم دمج البيانات Data Blending). يمكنك على سبيل المثال دمج مجموعة من المعلومات من أقسام التسويق والمبيعات لتحديد الحملات التسويقية الأكثر تأثيرًا وتحقيقاً للأرباح لمجموعة من المنتجات. جدول :1.1 أوجه الاختلاف بين البيانات والمعلومات البيانات المعلومات غير منظمة. منظمة منطقيًا. يتم عرضها على صورة أرقام، أو رسومات، أو إحصائيات. يتم تقديمها من خلال التقارير ، أو الرسوم البيانية، أو المخططات. مستقلة بذاتها. تعتمد على البيانات. يتم الحصول عليها من مدخلات المستخدمين أو من مدخلات يتم الحصول عليها من عمليات معالجة البيانات. محوسبة. المعرفة Knowledge تُعدُّ المعرفة تمثيلا لفهمك للعالم، وهي بشكل أساسي مجموعة من المعلومات يتم استخدامها لتقديم فائدة أو تحقيق غرض معين. يمكنك القول أن فهم الشخص لبعض المعلومات حول شيء ما يوفر لديه معرفة به ، فتصبح المعلومات معرفة عند تطبيق عمليات التفكير النقدي، أو التقييم، أو التخطيط، أو التنظيم. لتشاهد المثال في الشكل 1.3 ، يمكنك ملاحظة أن البيانات الموجودة أسفل المخطط هي قائمة من الكلمات التي تخلو من أي سياق، وإذا جرى تنظيم هذه البيانات وترتيبها ، فيمكن توفير بعض المعلومات. وعلى فرض أن هذه القائمة تحتوي على نتائج مبيعات نكهات المثلجات في اليوم السابق، يمكنك من خلال إجراء بعض عمليات التحليل عليها أن تحصل على بعض المعلومات المفيدة ، فمثلا يمكنك أن تدرك أن نكهة الشوكولاتة هي الأكثر مبيعًا. تُمكّن المعرفة هنا مدير المتجر من اكتشاف أن نكهة الشوكولاتة هي الأكثر رواجًا ، وهكذا يمكنه أن يطلب خمسة أضعاف كمية المثلجات بنكهة الشوكولاتة في المرة القادمة مقارنة بالنكهات الأخرى مثل نكهة القهوة (Mocha). وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

البيانات الأولية والمعلومات

شرح البيانات الأولية والمعلومات

معلومات للمزيد من المعالجة

شرح معلومات للمزيد من المعالجة

أوجة الإختلاف بين البيانات والمعلومات

شرح أوجة الإختلاف بين البيانات والمعلومات

المعرفة

شرح المعرفة

O ☐ ☐ المعرفة ☐ ☐ ☐☐ ☐ ☐ ☐ ☐ المعلومات البيانات جدول 1.2 أوجه الاختلاف بين المعلومات والمعرفة شكل 1.3 هرم البيانات – المعلومات - المعرفة قائمة الطلبات قهوة (Mocha) شوكولاتة kg 1 kg 5 مبيعات أطعم المثلجات قهوة (Mocha) فانيلا شوكولاتة فراولة قهوة (Mocha) فانيليا شوكولاتة شوكولاتة فانيلا فراولة شوكولاتة شوكولاتة فانيليا شوكولاتة المعلومات المعرفة المعنى بيانات تمت معالجتها لتصبح ذات سياق مفهوم. استنتاجات مستقاة من المعلومات تساعد في اتخاذ القرارات. القدرة على التنبؤ لا تكفي وحدها للتوصل إلى استنتاجات أو قرارات. تساهم في القدرة على التنبؤ واتخاذ القرارات. للآخرين إيصال النتائج يمكن إيصالها بسهولة من خلال الطرائق الشفوية أو الورقية أو الإلكترونية تتطلب اطلاعا بالموضوع المحدد. النتائج ينتج عنها الفهم. ينتج عنها الإدراك. الهدف تجيب عن أسئلة مثل: مَن، ومتى، وماذا، وأين. تجيب عن أسئلة مثل: كيف، ولماذا. 11 وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

هرم البيانات - المعلومات - المعرفة

شرح هرم البيانات - المعلومات - المعرفة

أوجة الاختلاف بين المعلومات والمعرفة

شرح أوجة الاختلاف بين المعلومات والمعرفة

12 علم البيانات وذكاء الأعمال Data Science and Business Intelligence ذكاء الأعمال (Business Intelligence) : توجد البيانات في كل مكان من حولك، ويجري استخدامها ومعالجتها وتحليلها في جميع مجالات الحياة. تتطور نوعية البيانات واستخداماتها باستمرار، وتُستخدم بشكل خاص في العديد من التطبيقات المهمة مثل ذكاء الأعمال (Business Intelligence) ، ولهذا يُعدّ ذكاء الأعمال عملية هو نظام مبني على البيانات ويشمل جمع قائمة على التقنية لتحليل البيانات وتوفير معلومات مهمة تساعد المديرين التنفيذين وغيرهم من البيانات وتخزينها وتحليلها وتمثيلها لدعم عمليات اتخاذ القرارات. المسؤولين وصناع القرار على اتخاذ قرارات دقيقة خاصة بالأعمال. وعلى الرغم من أن كلا من علم البيانات وذكاء الأعمال يتضمن العمل على البيانات، إلا أنهما يختلفان عن بعضهما. يُعد علم البيانات أكثر تعقيدًا مقارنة بذكاء الأعمال، حيث يقتصر نطاق ذكاء الأعمال على مجال الأعمال، ويجري فيه تحليل البيانات السابقة من خلال تطوير لوحات المعلومات وعرض مستخلصات ( رؤى ) الأعمال، وكذلك ترتيب البيانات وتنظيمها وتحليلها ، وذلك لاستخراج المعلومات التي من شأنها مساعدة الشركات على النمو وتحقيق أهدافها بناء على فهم الاتجاهات الحالية للأعمال. ويعتمد علم البيانات على استخدام البيانات المتوفرة للقيام بتنبؤات مستقبلية وعرض توقعات نمو الأعمال التجارية، وذلك بتوظيف مجموعة واسعة مما يسمى بالنماذج التنبؤية والخوارزميات الإحصائية المعقدة. يتمثل الدور الأساسي لأدوات ذكاء الأعمال في تحليل معلومات المؤسسات والشركات والمساهمة في إعداد استراتيجيات الأعمال، أما أدوات عالم البيانات فتشمل أدوات معالجة البيانات وأدوات البيانات الضخمة وكذلك نماذج خوارزمية معقدة لتحليل البيانات واستخلاص التوصيات. جدول 1.3 أوجه الاختلاف بين علم البيانات وذكاء الأعمال علم البيانات ذكاء الأعمال تحلل البيانات السابقة لاستنتاج الاتجاهات الحالية المدى تُستخدم البيانات لعمل تنبؤات مستقبلية لتطوير الأعمال. للأعمال. الأدوات يتضمن نماذج حسابية معقدة ومعالجة البيانات وأدوات البيانات تقتصر الأدوات على تحليل المعلومات الإدارية والإشراف على الضخمة. استراتيجيات الأعمال. أنواع البيانات تتعامل بشكل أساسي مع البيانات غير المنظمة ويمكنها كذلك التعامل مع البيانات المنظمة. وشبه المنظمة، تتعامل مع البيانات المنظمة التي يتم تخزينها عادة في مستودعات البيانات. التعقيد أكثر تعقيدًا مقارنة بذكاء الأعمال. أيسر بكثير مقارنة بعلم البيانات. المرونة أكثر مرونة حيث يمكن إضافة مصادر البيانات حسب الحاجة. أقل مرونة حيث يجب تصميم مصادر البيانات مسبقا. وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

علم البيانات وذكاء الأعمال

شرح علم البيانات وذكاء الأعمال

ذكاء الأعمال

شرح ذكاء الأعمال

أوجه الاختلاف بين علم البيانات وذكاء الأعمال

شرح أوجه الاختلاف بين علم البيانات  وذكاء الأعمال

علم البيانات والذكاء الاصطناعي Data Science and Artificial Intelligence كما تعرفت سابقا على مفهوم علم البيانات، فإن مجال الذكاء الاصطناعي (Artificial Intelligence) الذكاء الاصطناعي يُعد مجالًا آخر يتعامل مع كم كبير من البيانات. = مختلفة، كذلك يمكن لكل منهما إكمال بعضهما والتقارب معًا. (Artificial Intelligence-Al) يمكن استخدام كل تقنية من هاتين التقنيتين بصورة منفصلة عن الأخرى للوصول لحلول لتحديات أحد مجالات علوم الحاسب ويهدف لبناء أنظمة قادرة على أداء المهام التي يختص علم البيانات بمعالجة البيانات التاريخية باستخدام أدوات حسابية للقيام بما يسمى بالتحليل تتطلب عادة ذكاءً بشريا مثل القدرة الوصفي Descriptive Analysis للبيانات والذي يقدم وصفًا للمواقف المحددة، وكذلك للتنبؤ بالنتائج على التعلم والاستدلال ، وحل المشكلات من خلال التحليل التنبؤي Predictive Analysis ، ولتقديم الحلول والتوصيات للمشكلات من خلال ومعالجة اللغة الطبيعية والإدراك. التحليل التوجيهي (Prescriptive Analysis . من أكثر الأدوات استخدامًا هي الأدوات الإحصائية والإدارية التي يمكن بواسطتها تحليل البيانات المؤرخة. ومن ناحية أخرى يستخدم الذكاء الاصطناعي مجموعة متنوعة من التقنيات لمحاكاة الطريقة التي يفكر بها البشر والتي يقومون بناء عليها باتخاذ القرارات وتحليلها ، فبدلاً من التركيز على إجراء الحسابات الرياضية ، يتم التركيز عند استخدام أدوات الذكاء الاصطناعي على عناصر المعرفة والذكاء كعناصر حاسمة لحل المشكلات، ويهتم الذكاء الاصطناعي كذلك بالحوسبة المعرفية (Cognitive Computing). ومن المهم الإشارة إلى أن الفروقات التي ذُكرت سابقًا بين علم البيانات والذكاء الاصطناعي تبدو أقل وضوحًا في الاستخدامات العملية لهما؛ لأن مشروعات علم البيانات المعقدة غالبًا ما تتضمن استخدام تقنيات تعلم الآلة - أحد فروع الذكاء الاصطناعي - لتسهيل تحليل البيانات التنبؤي والتوجيهي. يقدم علم البيانات والتعلم الآلي مساهمات كبيرة للعديد من المؤسسات عند استخدامهما بصورة منفصلة، إلا أن تقنيات تحليل البيانات التقليدية لا تتناسب مع العمل ببيانات غير كاملة أو غير دقيقة، أو في حال كانت السياقات التجارية أو العلمية تتغير بسرعة كبيرة مما يجعل البيانات تتقادم وتفقد قيمتها بسرعة كبيرة. كما تجدر الإشارة إلى أن تقنيات التعلُّم الآلي تتطلب قدرًا كبيرًا من البيانات نسبيًا. يستخدم الجيل القادم من أدوات علم البيانات ومنصات ذكاء الأعمال تعلّم الآلة للقيام ببعض الإجراءات مثل التعرف على الأنماط في البيانات لاكتشاف الأنماط المخفية وتقديم التصورات والرؤى المهمة لاتخاذ القرارات، ويُزوّد تعلم الآلة والتعلُّم العميق علم البيانات بتنبؤات أكثر دقة. إن توافر مجموعات البيانات الضخمة وانخفاض تكلفة معالجتها سحابيًا يُمكّن تعلم الآلة من توفير إمكانات لم تكن ممكنة في الماضي. وعند الجمع بين علم البيانات والذكاء الاصطناعي، يمكن الحصول على طريقة فعّالة جدًا في الحصول على نتائج دقيقة بشكل ملحوظ تساهم في اتخاذ قرارات أفضل وأسرع. مثال أنشأت شركة أرامكو السعودية قسمًا جديدًا بمسمى قسم المصنع الرقمي للشركات Corporate Digital Factory Department)، وتم تدعيم هذا القسم بعلماء البيانات وخبراء تعلم الآلة للبحث عن التحديات التشغيلية وتطوير حلول ذكية للمساعدة في تحسين أداء الأعمال. تعمل الشركة بجد في الترويج للحلول المستوحاة من الذكاء الاصطناعي وذلك باستخدام المليارات من نقاط البيانات التي قام بجمعها الخبراء والجيولوجيون ومهندسو البترول على مدى عدة عقود. ونظرًا لأن أرامكو كانت على الدوام من رواد استخدام تقنيات الذكاء الاصطناعي، تقوم الشركة باستخدام علم البيانات وأدوات التعلم الآلي لتحسين عمليات استخراج البترول من المخزون الموجود تحت سطح البحر أيضًا، وتعمل تقنيات الذكاء الاصطناعي المتقدمة على تحسين خطط تطوير الحقول ومسارات الآبار؛ مما يؤدي إلى خفض التكلفة والحفاظ على البيئة. يستخدم علماء الجيولوجيا بالشركة أدوات الذكاء الاصطناعي في دراسة البيانات بشكل أسرع وأكثر كفاءة من أي وقت مضى. تعمل هذه العملية على تحسين فهم الخصائص البتروفيزيائية للتضاريس المراد استكشافها وحفرها وبالتالي تعزيز عملية اتخاذ القرارات. 13 وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

علم البيانات والذكاء الاصطناعي

شرح علم البيانات والذكاء الاصطناعي

مثال: أنشأت شركة أرامكو السعودية قسماً جديداً بمسمى قسم المصنع الرقمي للشركات

شرح مثال: أنشأت شركة أرامكو السعودية قسماً جديداً بمسمى قسم المصنع الرقمي للشركات

14 دورة حياة علم البيانات Data Science Life Cycle يقوم علماء البيانات والمتخصصين في العمل على مشروعات علم البيانات بتوظيف خبراتهم من خلال خطوات محددة لتنفيذ كل مشروع جديد بكفاءة. يُطلق على هذه العملية اسم دورة حياة علم البيانات وتتضمن خمس مراحل . تتميز كل من المراحل المختلفة لهذه الدورة بخصائص معينة، مما يجعل من الممكن أن تشمل مشروعات خاصة مثل مشروعات الذكاء الاصطناعي وتعلُّم الآلة، أو تمثيل العمليات الداخلية لمؤسسات معينة. 1 تعريف المشكلة وصياغتها 2 جمع البيانات 5 تصوير البيانات 4 التحليل الاستكشافي للبيانات 3 تجهيز البيانات وتصحيحها شكل :1.4 مراحل دورة حياة علم البيانات (Problem Definition and Formulation) 1. تعريف المشكلة وصياغتها Problem Definition and Formulation من أجل تصميم وإيجاد حل لمشكلة بواسطة علم البيانات، فإنك تحتاج أولاً إلى فهم تعريف المشكلة وصياغتها ماهية المشكلة نفسها. يُعدّ التحليل الشامل للمشكلة وبيئتها والمتغيرات التي تؤثر عليها أمرًا ضروريًا لتطوير الحلول اللازمة لتلك المشكلة، ويمكن أن يؤدي فهمك لمشكلة ما إلى تحسين إمكانية حلها أو إعاقة حلها بشكل كبير ، وذلك لارتباطه المباشر بالنهج الذي فهم أهداف ومتطلبات العمل أو المشكلة سيتم اتباعه لحل تلك المشكلة. ويكمن الهدف التالي في تحديد الغاية المرجوة من هذا العلمية وتحويل هذه المعرفة إلى مسألة يمكن الحل، حيث أن مجموعة البيانات تتضمن دائمًا البيانات نفسها ، ولكن طبيعة الإجابات حلها بتحليل البيانات. التي تريد الوصول إليها قد تختلف حسب المشكلة المراد حلها. جدول 1.4 أشهر أنواع تحليلات البيانات تحليل الانحدار Regression Analysis) الحصول على الكميات أو الصفات الموجودة في مجموعة البيانات. تحليل التصنيف Classification Analysis) تنظيم البيانات في فئات. التحليل العنقودي (Clustering) تنظيم البيانات في مجموعات. تحليل انحراف البيانات (Anomaly Detection Analysis) نظم التوصية (Recommendation engines) البحث عن انحراف أو شذوذ في البيانات. إعطاء توصية مستنيرة لمسألة محددة. وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

دورة حياة علم البيانات

شرح دورة حياة علم البيانات

تعريف المشكلة وصياغتها

شرح تعريف المشكلة وصياغتها

أشهر أنواع تحليلات البيانات

شرح أشهر أنواع تحليلات البيانات

2 جمع البيانات Data Collection جمع البيانات (Data Collection): بعد أن يتم تحديد الأهداف، يجب توفير مجموعة البيانات نفسها، ورغم أنه قد يتم إدخال البيانات يدويًا أحيانًا ، فمن المهم التنقيب وجمع البيانات، حيث يتعين في هذه المرحلة جمع عملية جمع القراءات أو الحقائق بيانات كافية لمواصلة معالجتها. ويمكن أن تأتي البيانات نفسها من مجموعة متنوعة من المصادر، فمثلا تقوم أجهزة ا ة الاستشعار البيئية وتطبيقات الهاتف المحمول ومنصات الويب بتوليد البيانات بصورة مستمرة ليتم تخزينها تلقائيًا في قواعد البيانات. وتنسيقها ، وتشمل الحصول عليها وتسميتها وتحسينها جدول 1.5 تنسيقات تخزين البيانات الأكثر شيوعًا الملفات المنسقة (Formatted Files) JSON و XML و CSV وجدول بيانات XLS قواعد البيانات العلائقية (Relational Databases) خادم مايكروسوفت SQL وقاعدة بيانات أوراكل وأوراكل MySQL. قواعد البيانات غير العلائقية .AWS DynamoDB, Azure Cosmos DB, MongoDB (Non-Relational (NoSQL) Databases) قواعد البيانات الرسومية (Graph Databases) قواعد بيانات السلاسل الزمنية (Time-series Databases) .Dgraph, AWS Neptune, Neo4j .AWS Timescale, InfluxDB 3. تجهيز البيانات وتنظيفها Data Preparation and Cleaning تُعد عملية تنظيف البيانات ومعالجتها أحد أهم المراحل في دورة حياة علم البيانات. يجب على عالم البيانات تصحيح وتجهيز البيانات التي تم جمعها في مرحلة التنقيب للتأكد من تنظيف البيانات (Data Cleaning) مناسبتها لمرحلة التحليل اللاحقة، وعند دمج البيانات من مصادر متعددة تزيد احتمالية عملية متعددة المراحل المراجعة تكرار البيانات أو تداخلها، الأمر الذي يتطلب عملية تصحيح وتصويب لتلك البيانات. وكذلك البيانات وتصحيحها للتأكد من أنها في هو الحال إذا وجدت بيانات تالفة أو منسقة بشكل غير صحيح أو مكررة أو خاطئة أو حتى صيغة موحدة، ويتضمن ذلك معالجة غير مكتملة. تكمن أهمية تصحيح تلك البيانات في أن الرؤى أو الاستنتاجات المستمدة القيم المفقودة والبيانات المشوشة وحل في مرحلة التحليل من تلك البيانات ستكون خاطئة وسيصعب للغاية استنتاج ما إذا كانت التناقضات والتكرارات. أخطاء في خطوات التحليل أو أن البيانات نفسها لم يتم تصحيحها ، ولهذا السبب فإن عملية تنظيف البيانات والتحقق من صحتها جيدًا قبل تحليلها تُعدّ أمرًا مهمًا للغاية للعملية بأكملها. المشكلة ناشئة من 15 وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

جمع البيانات

شرح جمع البيانات

تنسيق تخزين البيانات الأكثر شيوعاً

شرح تنسيق تخزين البيانات الأكثر شيوعاً

تجهيز البيانات وتنظيفها

شرح تجهيز البيانات وتنظيفها

تنظيف البيانات

شرح تنظيف البيانات

4. التحليل الاستكشافي للبيانات Exploratory Data analysis جمعت البيانات وقمت بتصحيحها ، يمكنك تحليل مجموعة البيانات واستنباط أن بعد = :(Exploratory Data Analysis) هو نهج لتحليل مجموعات البيانات التحليل الاستكشافي للبيانات الإجابات المطلوبة لأسئلتك ، ويتم إجراء تحليل البيانات باستخدام أدوات تحليل البيانات اد والمكتبات البرمجية المتخصصة، وقد يكون التحليل بسيطا وذلك بدراسة متغير أو الأكواد و واحد أو أكثر، وقد يتسع ليشمل عمليات أكثر تعقيدًا تتضمن عمليات إحصائية متقدمة. لتلخيص خصائصها الرئيسة ، ويتم يُعدّ تعلّم الآلة من أكثر الطرائق شيوعًا في الوقت الحالي لتحليل مجموعة البيانات، ويجب عادة باستخدام الأساليب المرئية. اتباع خطوات محددة لتحليل البيانات باستخدام تعلّم الآلة، ففي البداية يجب تحديد نموذج تعلم الآلة بإيجاد قيم المدخلات والمخرجات يليها بناء خوارزمية التحليل نفسها. تُعدّ هذه العملية معقدة، ولهذا فإن هناك متخصصين للقيام بها مثل علماء البيانات ومهندسي تعلّم الآلة. بعد الانتهاء من الخوارزمية، يتم تجريب النموذج واختباره، وعند اكتمال هاتين المرحلتين يمكنك استخدام البيانات الناتجة منه للوصول للإجابات المرجو الحصول عليها من عمليات التحليل. 5. تصوير البيانات Data Visualization يتم تقديم البيانات التي يتم تحليلها عادة بصورة جداول بيانات مما يتيح لمحللي البيانات ذوي الخبرة استخدامها ، ويقدم التمثيل المرئيي لتحليل البيانات إمكانية استخلاص رؤى وتوصيات ذات جودة أفضل، بينما توفر الرسوم البيانية والمخططات وحتى الخرائط، وكذلك تصوير البيانات :(Data Visualization) يسلط التمثيل الرسومي للمعلومات التقارير المنسّقة طريقة فعّالة لرؤية وفهم أنماط البيانات واتجاهاتها أي ما توحي به تلك البيانات. الضوء على أنماط واتجاهات البيانات، ويساعد القارئ على تطوير يُعد تمثيل النتائج أمرًا ضروريًا لاتخاذ قرارات مستندة إلى البيانات عند التعامل مع رؤى وتوصيات بناءً على تلك البيانات. كميات هائلة من المعلومات. وزارة التعليم Ministry of Education 2024-1446 Global Status Gsas Coronavirus Report - Powered by SAS® ViyaⓇ Back to Summary Coronavirus Company Message Location Analysis Epidemiological Analysis Trend Analysis Spread over time Collective Insights 2019-20 Novel Coronavirus Outbreak Global Cases and Analysis of SARS-CoV-2 Cases as of: Country View Prevalence Rate Curve Comparison Prevalence / 100k Curve Comparison Prevalence (%) by Variable Dimension Date (EPI) grouped by Country/Region May 31, 2020 Select a time base line | Number of Days since 100th Case Select country/region 0.5% Afghanistan Albania Algeria 0.4% Andorra Angola Antigua and Barbuda 0.3% Argentina Armenia Aruba 0.2% Australia 0.507% 0.479% 0.425% 0.446% 0.487% 0.504% 0.469% 0.488% 0.470% 0.471% 0.452% 0.464% 0.457% 0.446% 0.408 % 0.428% 0.396% 0.357% 0.380% 0.364% 0.352% 0.336% 0.3528 0.339% 0.416% 0.431% 0.398% 0.410% 0.390% 0.372% 0.379% 37% 0.363% 0.375% 0.381% 0.359% 0.368% 0.346% 0.317% 0.299 0.285% 0.292% 0.296% 0.268% /0270% 0.255% 0.240% 0.223% 0.205% 0.201% 0.213% 0.139 0.160% 0.251% 0.260% 0.226 0.245 % 0.256% 0.262% 0.314% 0.329% 0.286% 0.290% 0.268% 0.271% 0.274% 0.279% 0.287% 45% 0.279% 0.273% 0.229% 0.538% 0.544% 0.502% 0.512% 10% 0.49 0.479% Austria 0.1% Azerbaijan 0.141% 0.120% 89% 0.100% 0.081% Bahamas Bahrain 0.054% 0.038% 0.035% 0.063% 0.017% 019% 0.039% 0.00% 0.00% 0.00% 0.00% 0.00% 0.00% 0.00% 0.005% 0.005% 0.005% 0.006 % 0.00 % 0.00 % 0.00 % 0.00 % 0,006 % 0.00 % 0.00% 0.006% 0.006% 0.006% 0.006% 0.006% 0.006% 0.000% 0.000% 0.002% 0.003% 0.005% 0.005% 0.00% 0.00% 0.00% 0.006% 0.006% 0.006% 0.006% 0.006% 0.00% 0.006% 0.006% 0.006% 0.006% 0.00% 0.006% 0.000% 0.00% 0.0% Bailiwick of Guernsey 16 32 47 92 107 122 [ Ranaladash Ssas Incidence - New confirmed cases / country population (2019), represented as new cases per 100,000 people. Prevalence - Total confirmed cases / country population (2019), represented as total cases per 100,000 people. Mortality Rate is the ratio of number of deaths to the total population (2019) of impacted country. SAS Viya Country/Region China France Italy Spain United States Source, Disclaimer and Data Information الشكل 1.5 تحليل تفشي فيروس كورونا (19-COVID) باستخدام التحليلات المرئية. معهد ساس - SAS. © 2022 SAS I. 16

الدرس الأول: البيانات والمعلومات والمعرفة

التحليل الاستكشافي للبيانات

شرح التحليل الاستكشافي للبيانات

التمثيل الرسومي للبيانات

شرح التمثيل الرسومي للبيانات

1 تمرينات حدد الجملة الصحيحة والجملة الخاطئة فيما يلي: 1. علم البيانات هو حقل متعدد التخصصات يركز على استخراج معلومات ذات فائدة من البيانات. .2. يُطلق اسم المعرفة على البيانات عند تحليلها وتنظيمها وهيكلتها لتصبح ذات معنى. 3. يتم الحصول على المعلومات من خلال عمليات تحليل البيانات. 4. يطلق اسم المعرفة على عملية جمع البيانات بطريقة صحيحة تجعلها ذات فائدة. 5. تُعد الرسوم البيانية والمخططات من وسائل عرض المعلومات. 6. تعد معلومات حالة الطقس المقدمة من الأرصاد الجوية بمثابة معرفة. 7. علم البيانات، والذكاء الاصطناعي، وذكاء الأعمال ثلاث مجالات مختلفة ومستقلة عن بعضها البعض. 8. يساعد استخدام التمثيل المرئي لتحليل البيانات على استنباط رؤى أفضل مما يعني اكتساب معرفة أفضل بمعنى تلك البيانات. 9. تُعدّ نُظم التوصية الذكية وتحليل الانحدار من أفضل طرائق تخزين البيانات. .10 تُعدّ قواعد بيانات السلاسل الزمنية وقواعد البيانات غير العلائقية (NoSQL) جزءًا من وسائل جمع البيانات. صحيحة خاطئة 17 وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

جدد الجملة الصحيحة والجملة الخاطئة فيما يلي علم البيانات هو حقل متعدد التخصصات

حل جدد الجملة الصحيحة والجملة الخاطئة فيما يلي علم البيانات هو حقل متعدد التخصصات

18 2 أنشئ قائمة من البيانات ثم حول تلك البيانات إلى معلومات مفيدة، ثم وضّح كيف يحوّل الحاسب البيانات إلى معلومات؟ 3 وضح الفروق الثلاثة الرئيسة بين علم البيانات والذكاء الاصطناعي، وادعم إجاباتك ببعض الأمثلة. 4 وضّح وقارن بين علم البيانات وذكاء الأعمال، وإذا كان لديك شركة استثمارية، أي الحقلين سيكون خيارك المفضل للاستثمار ؟ وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

أنشئ قائمة من البيانات ثم حول تلك البيانات إلى معلومات مفيدة، ثم وضح كيف يحول الحاسب البيانات إلى معلومات؟

حل أنشئ قائمة من البيانات ثم حول تلك البيانات إلى معلومات مفيدة، ثم وضح كيف يحول الحاسب البيانات إلى معلومات؟

وضح الفروق الثلاثة الرئيسية بين علم البيانات والذكاء الاصطناعي، وادعمم إجاباتك ببعض الأمثلة

حل وضح الفروق الثلاثة الرئيسية بين علم البيانات والذكاء الاصطناعي، وادعمم إجاباتك ببعض الأمثلة

وضح وقارن بين علم البيانات وذكاء الأعمال، وإذا كان لديك شركة استثمارية، أي الحقلين سيكون المفضل للاستثمار؟

حل وضح وقارن بين علم البيانات وذكاء الأعمال، وإذا كان لديك شركة استثمارية، أي الحقلين سيكون  المفضل للاستثمار؟

5 ما مدى جدوى تقارب علم البيانات والذكاء الاصطناعي ؟ ابحث في الإنترنت واذكر مثالين ناجحين على ذلك. 6 وضّح المقصود بعلم البيانات، واذكر ثلاثة تطبيقات حياتية في المجال الصحي ومجال الأعمال التجارية والترفيه، ثمّ بيّن لماذا يُعدّ علم البيانات ضروريًا لمثل هذه المجالات؟ 7 وضّح وقارن بين مجموعات البيانات المعالجة وغير المعالجة التي تصف الدرجات الفصلية للطالب وأدائه خلال العام الدراسي ما الانطباعات والأفكار التي يمكنك الحصول عليها من مجموعات البيانات هذه ؟ وهل يمكنك توقع الأداء الأكاديمي المستقبلي للطالب في الجامعة من خلال هذه البيانات؟ 19 وزارة التعليم Ministry of Education 2024-1446

الدرس الأول: البيانات والمعلومات والمعرفة

ما مدى فعالية تقارب علم البيانات والذكاء الاصطناعي؟ ابحث في الأنترنت واذكر مثالين ناجحين على ذلك

حل ما مدى فعالية تقارب علم البيانات والذكاء الاصطناعي؟ ابحث في الأنترنت واذكر مثالين ناجحين على ذلك

وضح المقصود بعلم البيانات، وأذكر ثلاثة تطبيقات حياتية في المجال الصحي, ومجال الأعمال التجارية، والترفيه، ثم بين لماذا يعد علم البيانات ضرورياً لمثل هذه المجالات؟

حل وضح المقصود بعلم البيانات، وأذكر ثلاثة تطبيقات حياتية في المجال الصحي, ومجال الأعمال التجارية، والترفيه، ثم بين لماذا يعد علم البيانات ضرورياً لمثل هذه المجالات؟

وضح وقارن بين مجموعة البيانات المعالجة وغير المعالجة التي تصف الدرجات الفصلية للطالب وأدائه خلال العام الدراسي

حل وضح وقارن بين مجموعة البيانات المعالجة وغير المعالجة التي تصف الدرجات الفصلية للطالب وأدائه خلال العام الدراسي

وزارة التعليم Ministry of Education 2024-1446 "" ابحث عن مزيد من المعلومات حول مصنع أرامكو السعودية الرقمي" وحدِّد ثلاثة أمثلة لاستخدام الذكاء الاصطناعي في استخراج البيانات، ومن ثم أعطنا رأيك في مدى تأثير هذه التقنيات على العمليات التشغيلية للشركة؟ ابحث في الإنترنت بصورة مفصلة عن نماذج دورة حياة علم البيانات التي تصف المراحل الرئيسة المذكورة في هذا الدرس، ومن ثم اختر إحداها وحدِّد المراحل الإضافية واشرحها بإيجاز. 8 9 20

الدرس الأول: البيانات والمعلومات والمعرفة

أبحث في الإنترنت بصورة مفصلة عن نماذج دورة حياة علم البيانات التي تصف المراحل الرئيسة المذكورة في هذا الدرس، ومن ثم اختر إحداها وحدد المراحل الإضافية وأشرحها بإيجاز

حل أبحث في الإنترنت بصورة مفصلة عن نماذج دورة حياة علم البيانات التي تصف المراحل الرئيسة المذكورة في هذا الدرس، ومن ثم اختر إحداها وحدد المراحل الإضافية وأشرحها بإيجاز

ابحث عن مزيد من المعلومات حول "مصنع أرامكو السعودية الرقمي" وحدد ثلاثة أمثلة لاستخدام الذكاء الاصطناعي في استخراج البيانات، ومن ثم اعطينا رأيك في مدى تأثير هذه التقنيات على العمليات التشغيلية

حل ابحث عن مزيد من المعلومات حول "مصنع أرامكو السعودية الرقمي" وحدد ثلاثة أمثلة لاستخدام الذكاء الاصطناعي في استخراج البيانات، ومن ثم اعطينا رأيك في مدى تأثير هذه التقنيات على العمليات التشغيلية