معالجة اللغات الطبيعية
استخدام التعلم الموجه لفهم النصوص: معالجة النصوص الطبيعية
تعلم الآلة
التعلم الموجه
التعلم غير الموجه
التعلم المعزز
مزايا أنواع تعلم الآلة وعيوبها
التعلم الموجه
الانحدار
التصنيف
مجموعات بيانات تحتوي على عمودين: نص التقييم
تجهيز البيانات والمعالجة المسبقة: مكتبة سكليرن
أداة countVectorizer
مقطع برمجي لتمثيل مجموعات بيانات التدريب IMDb بالمتجهات 1
وبحسب المتوقع تحتاج المصفوفة المتباعدة إلى ذاكرة أقل بكثير وتحديدا 0.000048 ميجابايت
بناء خط أنابيب التنبؤ
يتنبأ خط الأنابيب بشكل صحيح بالقيمة الايجابية والسلبية للتقييمين الأول والثاني على التوالي
تحتوي مصفوفة الدقة على عدد التصنيفات الحقيقية مقابل المتوقعة
شرح متنبئات الصندوق الأسود
النموذج المحايد المحلي القابل للتفسير والشرح
يقدم نموذج التنبؤ تنبؤ سلبيا مؤكدا بدرجة كبيرة في هذا المثال البسيط
يزيد المعامل السالب من احتمالية التصنيف السالب بينما يقلل المعامل الموجب منه
على الرغم من أن هذا التقييم إيجابي بشكل واضح الا أن نموذج التنبؤ قدم تنبؤ سلبيا مؤكدا
تحسين البرمجة الاتجاهية للنصوص
تحديد العبارات
كتابة كل جملة بأحرف صغيرة وتغذيتها الى دالة findall() من مكتبة re لتقوم تحديد تكرارات 1
عند تطبيقها على الجملتين المقسمتين بالمثال الموضح بالأعلى سيحقق نموذج العبارة النتائج التالية
يستخدم المقطع البرمجي التالي دالة annotate_phrases() لتفسير كل من تقييمات التدريب والاختبار من مجموعة بيانات IMDb. 1
استخدام مقياس تكرار المصطلح - تكرار المستند العكسي في البرمجة الاتجاهية للنصوص
أداة TfidVectorizer
يمكن الآن إدخال أداة التمثيل بالمتجهات في مصنف بايز الساذج لبناء خط أنابيب نموذج تنبؤ جديد
يتنبأ خط الأنابيب الجديد بشكل صحيح بالقيمة الايجابية لهذا التقييم
حدد الجملة الصحيحة والجملة الخاطئة فيما يلي: في التعلم الموجه تستخدم مجموعات البيانات المعنونة لتدريب النموذج
اشرح لماذا تتطلب المصفوفة الكثيفة مساحة من الذاكرة أكبر من المصفوفة المتباعدة
حلل كيف يستخدم العاملان الرياضيان في تكرار المصطلح - تكرار المستند العكسي لتحديد أهمية الكلمة في النص
لديك X_train_text وهي عبارة عن مصفوفة numPy تتضمن مستنداً واحداً في كل صف
أكمل المقطع البرمجي التالي بحيث يمكنه بناء مفسر نصوص النموذج المحايد المحلي القابل للتفسير واشلرح