استخدام التعلم غير الموجه لفهم النصوص: خوارزميات التجميع
تقنيات تقليص الأبعاد
النماذج التوليدية
وإحدى المزايا الرئيسة لاستخدام التعلم غير الموجه هي أنه يمكن استخدامه
تجميع المستندات
جدول 3.2 : العوامل التي تحدد جودة النتائج
تحديد عدد العناقيد
في التعلم غير الموجه يشير عدد العناقيد الى عجج المجموعات أو التصنيفات التي تقسم اليها البيانات
البرمجة الاتجاهية للنصوص
يستخدم المقطع البرمجي التالي أداة TSENVVisuaalizer من مكتبة yellowbrick لاسقاط وتصوير النصوص
تقليص الأبعاد
جدول 3.3: تفنيات تقليص الأبعاد
تحديد الخصائص الرئيسة لتقنية تضمين المجاور العشوائي الموزع على شكل T
يستخدم المقطع البرمجي التالي قيم بيانات الحقيقة المعقدة وثلاثة دوال مختلفة لتسجيل النقاط
البرمجة الاتجاهية للكلمات باستخدام الشبكات العصبية
نموذج الكلمة الى المتجه
الأبعاد العشرة الأولى للتضمين العددي لكلمة fox (ثعلب)
يمكن استخدام التصوير في التحقق من صحة تضمينات هذا النموذج المدرب مسبقا
استخدام طريقة تضمين المجاور العشوائي الموزع على شكل (T-SINE T) لتخفيض التضمينات
البرمجة الاتجاهية للجمل باستخدام التعلم العميق
تمثيلات الترميز ثنائية الاتجاه من المحولات
تمثيلات ترميز الجمل ثنائية الاتجاه من المحولات
مكتبة الجمل والمحولات
لقد استخدمت في وقت سابق في هذه الوحدة أداة تضمين المجاور العشوائي الموزع على شكل T
يستخدم المقطع البرمجي التالي هذا المقترح لحساب العناقيد وحساب مقياس التقييم
حدد الجملة الصحيحة والجملة الخاطئة فيما يلي: في التعلم غير الموجه ومجموعات البيانات المعنونة لتدريب النموذج
استعرض بعض التطبيقات التي يستخدم فيها تقليص الأبعاد وصف التقنيات المستخدمة فيها
اشرح وظائف البرمجة الاتجاهية لمقياس تكرار المصطلح - تكرار المستند العكسي (TF-IDF)
لديك مصفوفة numPy تدعى Docs تتضمن مستنداص نصيا واحداً في كل صف لديك كذلك مصفوفة labels تتضمن قيم كل مستند في Docs
اكمل المقطع البرمجي التالي بحيث تستخدم نموذج الكلمة الى المتجه (WordZVex) لاستبدال كل كلمة في إحدى الجمل بأخرى تكون أكثر شبها بها