ما هي خطوات عملية تعلم الآلة
من خطوات عملية تعلم الآلة
- جمع البيانات .
- تجهيز البيانات .
- اختيار نموذج .
- تدريب النموذج .
- تقييم النموذج .
- ضبط المعلمة .
- جعل التنبؤات .
قد يرى بعض الأشخاص أن هذا الأمر شبه مستحيل ولكن في الحقيقة هو أمر عادي وسلس، هناك سبعة خطوات أساسية سيتم من خلالها نقل الذكاء إلى الآلات [1]:
جمع البيانات
: بدايه تعلم الآلات يكون عن طريق مجموعه البيانات والأوامر والتعليمات التي تُعطي لها، من اللازم مراعاة المكان الذي تُؤخذ و تُقتبس منه البيانات عند جمعها لكي نتأكد من كونها موثوقة .
لكي يتمكن نموذج التعلم الآلي من إيجاد الأنماط الصحيحة، ويتم التوصل الي نسبه الدقه الخاصة بالنموذج المقدم عن طريق الجودة الخاصة بالبيانات التي يتم اعطائها للاجهزه، ففي حالة كون البيانات المُدخله غير صحيحة أو غير حديثه .
فستكون النتائج والتنبؤات غير صحيحة في حالة استخدامك للليانات مجهولة المصدر أو مصدر غير موثوق سيكون لها تأثير سلبي على النتائج التي ستُعطي لك، أما في حالة كون البيانات سليمة يكون بها عدد قيم مفقوةه ومتكررة قليلة جدا وتكاد تكون منعدمة كما أن تمثيلها لكل الفئات والاقسام سيكون سليم وجيد .
تجهيز البيانات
: من اللازم إعداد البيانات بعد أن يتم الحصول عليها، في حالة تجميعك لكل البيانات التي تمكنت من الحصول عليها من الأزم أن تبدأ بتقسيمها ولكن بشكل عشوائي بدون اتباع أي قواعد للتصنيف والتوزيع .
هذا يضمن لك توزيع البيانات والمعلومات بشكل متساوي كما أن الترتيب ليس له أي تأثير في عملية التعلم، وبعد ذلك قم بمراجعة البيانات وحذف كل ما لا ترغب فيه وجميع الأمور المكررة وربما هذا يضطرك إلى عمل هيكله من أول وجديد لجميع البيانات .
حاول أن تتخيل وتتصور البيانات لكي تفهم ما العلاقة التي تربط المعلومات ببعضها وفرز الفئات المختلفة، وفي النهاية قم بتقسيم البيانات المهمة إلى مجموعتين الأولى خاصة بالتدريب، وهي تلك التي يقوم النموذج الخاص بك التعلم منها، والأخرى مجموعة اختبار وظيفتها تحديد مدى دقة النموذج الخاص بك فور الانتهاء من التدريب.
اختيار نموذج:
من اللازم أن تقوم باختيار نموذج يرتبط بالمهمة والمعلومات التي طُرحت وذا صلة بهم، حيث أن النموذج هو الذي يقوم بتحديد مجموعة النواتج والمخرجات التي يتم الحصول عليها، بعد أن يتم تشغيل خوارزمية التعلم الآلي على مجموعة البيانات المُدخلة. النماذج متعددة تتلائم مع مهام كثيره مثل التعرف على كلا من الصور والكلام والتنبؤ .
تدريب النموذج
: اهم مرحله في خطوات التعلم الآلي هي التدريب، حيث ما يتم خلالها هو تمرير مجموعة البيانات التي تم اعدادها إلى نموذج التعلم الآلي الذي حُدد سابقاً لكي يتم إيجاد الأنماط وإجراء التنبؤات الملائمة .
ينتج عنه حدوث تعلم النموذج من خلال البيانات لكي يتم الانتهاء من إتمام مجموعة من المهام. وبالتكرار والتدريب يحدث تقدم وتحسين نتائج التنبؤ.
تقييم النموذج
: فور الانتهاء من مرحلة تدريب النموذج من اللازم أن تتحقق لكي تتمكن من معرفة مدى سلامة أدائه وكيفيتها، ويُعرف ذلك من خلال إجراء اختبار خاص بأداء النموذج على البيانات الغير معروفه بالنسبه له و الغير مرئية .
حيث أن البيانات الغير المرئية هي تلك التي قُسمت إليها البيانات في الخطوات السابقة، ويتم اللجوء إليها لان في حاله استخدام نفس البيانات الخاصه بالتدريب سيكون الناتج غير دقيق .
ضبط المعلمة
: فور إنشاء النموذج وعمل تقييم خاص به تحقق من كون هذا النموذج بحاجة إلى إجراء تحسين لدقته أم لا، والطريقه الي ذلك ضبط المعلمات المتواجدة بالفعل في النموذج .
المعلمات هي عبارة عن متغيرات تتواجد بالنموذج، وهناك قيمه محدده للمعلمة يكون الدقة عندها بلغت حدها الأقصى وما يشير عليه ضبط تلك المعلمة هو التوصل إلى هذه القيم .
جعل التنبؤات
: في النهاية تتاح لك الفرصة لاستخدام النموذج وتطبيقه على البيانات غير المرئية لكي ينتج عنه تنبؤات صحيحة ودقيقة .
اول خطوة من الخطوات الأساسية لعملية تعلم الآلة
أول خطوة من تعليم الآلة هي
جمع البيانات
.
وهي تعتبر اول المسار الذي يقودنا إلى تطوير نموذج التعلم الآلي، فمثلا سنتناول الفاكهة كمثال توضيحي، يجب أن نقوم بجمع كل البيانات المرتبطة بالثمار حتى نتمكن من توظيفها لنميز بين الثمرتين [2].
يتم استخدام معلمات متعددة لكي نصنف الفاكهة هل هي تفاحة أم هي برتقاله.وسوف تحدد محكين أو ميزتين للعمل عليهما، أول ميزة اللون الخاص بالثمرة أما بالنسبة للميزة الثانية فهي شكل الثمرة .
نأمل أن يتمكن النموذج من إجراء التمييز بينهما بتلك المعلومات بشكل دقيق، بالنسبة لخاصية اللون فمن اللازم الإستعانه بآلة وقد يكون المطياف، أما بالنسبة لخاصية الشكل .
ممكن استخدام صور للفواكه لكي يتعامل معها كأرقام ثنائية الأبعاد، ويجب إيجاد وجمع كل أنواع وأصناف البرتقال والتفاح المتعدد والمختلف وذلك بهدف جمع البيانات بأكبر قدر ممكن، ومن اللازم تجنب اختيار خصائص وميزات غير الصحيحة والتركيز على عدد وأنواع محدودة من المعلومات المدخلة لآن ذلك سيجعل النموذج غير صالح وغير فعال .
خوارزميات تعلم الآلة
- خوارزمية SVM .
- الانحدار الخطي .
- خوارزمية الغابة العشوائية .
- شجرة القرار .
- خوارزمية بايز الساذجة .
- خوارزمية KNN .
- الانحدار اللوجستي .
- K- يعني .
- خوارزميات تقليل الأبعاد .
هناك مجموعة منتشرة من الخوارزميات التي يتم استخدامها في التعلم الآلي وهي [3]
خوارزمية SVM
: تستخدم في التصنيف عن طريق عمل رسم مرتبط بالبيانات الأولية، ثم يربط كل ميزة بإحداثية محددة لكي يُسهل التصنيف .
الانحدار الخطي
: حتي تتمكن من فهمها يجب أن تدرك وتتمعن في هذا المثال في حالة وجود مجموعه من الخشب ذات اوزان مختلفة وعشوائية، فكيف سوف تقوم بترتيبها وتنسيقها، صعب جدا أن تقوم بوزن كل واحدة منهم .
لكن قم بتخمين الوزن عن طريق إجراء تحليل مرئي وذلك يتشابه مع الانحدار الخطي، وفي هذه الحالة تنشأ علاقة بين المتغيرات المستقلة والتابعة تسمى بخط الانحدار ومعادلته Y = a * X + b
Y – حيث متغير تابع
A منحدر
X – متغير مستقل
B اعتراض
خوارزمية الغابة العشوائية
: يتم استخدامها في حالة تصنيف شئ أو كأن جديد وفقا للخصائص التي تميزه .
شجرة القرا
ر : خاصة بأمور التصنيف المتعلقة بالمشكلات كما أنها تم استخدامها في عملية تقسيم السكان لمجموعات.
خوارزمية بايز الساذجة
: قائمه على أن ليس هناك علاقة بين الفئات التي يتواجد بها ميزه ما مع أي ميزة أخرى تتواجد في فئة ثانية، حتى إذا كان بينهما شئ مشترك او مرتبطين ببعضهما .
خوارزمية KNN
: تستخدم في النطاقات الواسعه لكي تتغلب على المشكلات الناتجة عن التصنيف، ولكن يجب أن تعالج البيانات قبل أن تستخدمها .
الانحدار اللوجستي
: يستطيع أن يجد تقدير لمجموعة القيم المنفصلة، بالإضافة إلى التنبؤ بمدى نسبة وقوع حدث في حالة مناسبته للبيانات وذلك عن طريق استخدام هذه الاستراتيجيات، وشروط التفاعل والقضاء على الميزات بالإضافة إلى تنظيم التقنيات واستخدام النموذج الغير خطي .
K- يعني
: لا تخضع لأي إشراف وما يميزها أن لها القدرة على حل أي مشكلة من مشاكل التجميع .
خوارزميات تقليل الأبعاد
: تستطيع أن تعثر على مجموعه التفاصيل الدقيقة المرتبط بالأمر المتناول .