التعلم الآلي
تعريف التعلم الآلي
يعرف التعلم الآلي (بالإنجليزية: Machine learning) بأنه فرع من فروع الذكاء الاصطناعي و إحدى علوم الحاسوب ، وحقيقة أن هذا العلم يركز بشكل كبير على استخدام البيانات (بيانات التدريب) والخوارزميات، من أجل تقليد الطريقة التي يتعلم بها الإنسان والعمل على تحسينها بشكل تدريجي.
لذلك فإن التعلم الآلي عبارة عن برنامج يظهر قدرة معرفية تتشابه إلى حد كبير مع قدرة الإنسان، فهو يهدف إلى جعل أجهزة الكمبيوتر تفكر وتحل مختلف المشاكل التي تواجهها بالطريقة التي يقوم بها الإنسان الطبيعي، من خلال الاستفادة من النماذج الإحصائية والخوارزميات للتعلم.
والهدف من التعليم الآلي جعل الأنظمة قادرة على التعلم والتطور بشكل تلقائي، من خلال التجربة، ودون الحاجة إلى القيام بعمليات برمجية، وبالتالي فإن التعلم الآلي يعطي لبرامج الكمبيوتر القدرة على الوصول إلى البيانات واستخدامها بصورة مباشرة، من دون أن يتدخل الإنسان في هذه العملية.
ويتكون التعلم الآلي من ثلاثة أجزاء أساسية، هي:
- الخوارزمية الحسابية التي تستخدم في اتخاذ القرارات.
- المتغيرات والميزات التي تتكون منها عملية اتخاذ القرار.
- القاعدة المعرفية التي من أجلها تُعّرف الإجابة.
أهمية التعلم الآلي
إن البيانات هي الأساس الحقيقي لأي عمل يمكن القيام به في الحياة، وما يتخذ من قرارات اعتمادًا على هذه البيانات من شأنه أنّ يصُنع الفارق الذي بدوره يقرر اللحاق بركب التطور أو التخلف عنه، فاليوم يستخدم كل تطبيق عبر الإنترنت التعلم الآلي بشكل معين، حيث أصبح مستخدمًا من قبل الشركات لحل العديد من المشاكل.
كما أن التطبيقات العملية للتعلم الآلي يمكن أن تؤدي إلى زيادة أرباح الشركات في وقت قياسي، حيث تتطور التقنيات في هذا المجال بصورة سريعة ويتوسع نطاق التعليم الآلي ليشمل إمكانيات كثيرة.
مثلًا تتضمن الصناعات كمية هائلة من البيانات والمعلومات ، وغالبًا ما تحتاج إلى أنظمة خاصة، من أجل القيام بتحليلها بكل كفاءة ودقة، حيث إنها تبنت الآلة باعتبارها أفضل طريقة مستخدمة، من أجل بناء النماذج، وكذلك لوضع الاستراتيجيات، والتخطيط للعمليات المستقبلية.
أنواع التعلم الآلي
يبدو أن التعلم الآلي مثله مثل باقي أنواع التعليم إذ يتضمن طرق مختلفة للتدريب على خوارزميات هذا التعليم، ولكل واحد منها عيوبه ومزاياه، ولا بد من الإشارة هنا إلى أن البيانات التي يتم استيعابها في التعلم الآلي تكون على نوعين، هما:
- البيانات المسماة
وهي بيانات تضم في الغالب جميع بيانات الإدخال والإخراج، التي تكون في نمط يمكن للآلة قراءته بشكل واضح، ولكن هذا النوع من البيانات يتطلب وجود كثير من الأشخاص العاملين، لكي يقوموا بتسمية جميع البيانات.
- البيانات غير المسماة
هذا النوع من البيانات يحتوي على معلومة واحدة أو لا توجد أي معلومة، ولكنه نموذج يمكن قراءته آليًا، وفي هذا النوع من البيانات، تنتفي الحاجة للعمل البشري، ولكنه يتطلب حلول أخرى غالبًا ما توصف بأنها معقدة نوعًا ما.
وعليه فإن أنواع خوارزميات التعلم الآلي في الوقت الراهن هي ثلاثة أنواع تتمثل في الآتي:
التعلم المراقب
أو التعلم الخاضع للإشراف، وهو من أكثر الأنواع استخدامًا، لكونه أساسيًا في هذا المجال، وفيه يدرّب على خوارزمية التعلم الآلي المبنية على البيانات المسماة، وبالتالي يتطلب أن تسمى البيانات بشكل دقيق، تجنبًا لحدوث أي أخطاء في الاستخدام، وغالبًا ما تكون هذه البيانات المسماة عبارة عن مجموعة بيانات تدريبية صغيرة للعمل معها.
وتعمل على إعطاء الخوارزمية فكرة أساسية عن ماهية المشاكل التي يمكن أن تقع، وطرق حلها، ونقاط البيانات التي يجب أن يُتعامل معها، وتعد خوارزميات التعليم الآلي المراقب ذات طبيعة متطورة، حيث تستمر في القيام بعمليات التحسين، واكتشاف أنماط لعلاقات جديدة في أثناء القيام بتدريبها على بيانات أخرى جديدة.
التعلم غير المراقب
أو التعلم غير المشرف عليه، وهذا النوع من التعليم يتعامل مع البيانات غير المسماة، وبالتالي فإنه لا يحتاج إلى وجود الإنسان لجعل مجموعة البيانات قابلة للقراءة بطريقة آلية، وهو ذات الأمر الذي سيسمح بإدخال أكبر مجموعة من البيانات بواسطة البرنامج.
وبالتالي، فإن هذا النوع من التعليم سوف يكون متعدد الاستخدامات، ولا يقتصر على نوع واحد، كما أن خوارزميات التعليم غير المراقبة، سوف يمكنها التكيف مع مختلف البيانات، مما يوفر مزيدًا من التطوير حتى بعد عملية المعالجة، وهو ما تفتقده الطريقة الأولى التي تتم بالمراقبة.
التعليم المعزز
يقوم هذا النوع من التعليم بمحاكاة تعلم الإنسان من البيانات في حياته، حيث ينشئ خوارزمية تعمل باستمرار على تحسين أدائها، وتتعلم من المواقف المستجدة من خلال استخدام طريقة التجربة والخطأ، وبالتالي سوف يشجع جميع المخرجات الإيجابية ويعززها، ولا يشجع المخرجات السلبية.
ويعمل نظام التعلم المعزز من خلال وضع الخوارزمية في بيئة عمل بشكل مباشر، مع توفير مترجم فوري ونظام مكافأة، وبعد كل تكرار للخوارزمية، سوف يقيم المترجم النتيجة سواء كانت إيجابية أم سلبية.
وعلى هذا الأساس في حالة إذا ما عثر البرنامج على الحلول الصحيحة سيقوم المترجم بتعزيزها، من خلال مكافأة الخوارزمية بصورة مباشرة، إما إذا كانت النتيجة سلبية وغير مواتية، سوف تضطر الخوارزمية إلى التكرار لحين الحصول على نتائج أفضل.
تطبيقات التعلم الآلي
هناك العديد من تطبيقات التعلم الآلي التي أصبحت جزءًا لا يتجزأ من حياة الإنسان في الوقت الراهن، ومنها ما يأتي:
- التعرف على الصور
وهو أحد أشهر التطبيقات للتعلم الآلي والتي باتت معروفة لأغلب الناس، حيث تستخدم لتحديد الأشخاص، والصور الرقمية، والأماكن، وغيرها من الأمور.
- التعرف على الكلام
من التطبيقات الحديثة للتعلم الآلي، والتي أصبحت شائعة حيث يتم من خلالها تحويل التعليمات الصوتية إلى نص مكتوب، ويبدو واضحًا هذا التطبيق عند البحث على محرك البحث جوجل بوجود خيار البحث الصوتي.
- معرفة طرق المرور والتنبؤ بحركة السير
وهي أيضًا من التطبيقات التي أصبحت شائعة لدى الكثيرين من مستخدمي السيارات، من أجل معرفة الطريق الصحيح للوصول إلى الجهة المقصودة، كما أصبحت هذه التطبيقات تتنبأ بحركة السير، من حيث كونها طرق خالية أم شديدة الازدحام، ولعل خير مثال على هذه التطبيقات برنامج الخرائط الذي توفره جوجل للمستخدمين.
- التوصية ببعض المنتجات التجارية
يستخدم التعليم الآلي بشكل واسع من قبل العديد من شركات التجارة الإلكترونية للترويج عن منتجاتها مثل شركة أمازون، وكذلك شركات الترفيه التي تقدم العروض السينمائية والألعاب لجذب أكبر عدد من المشاهدين مثل شركة نتفليكس.
- السيارات ذاتية القيادة
يبدو أن السيارات ذاتية القيادة أصبحت اليوم من أشهر التطبيقات بالنسبة للتعلم الآلي، إذ أصبحت كبرى شركات تصنيع السيارات تعتمد على هذا الأمر في تصنيع سيارات عالية التقنيات والكفاءة ومنها شركة تيسلا الرائدة في هذا المجال.
- تطبيقات تنظيف البريد الإلكتروني العشوائي والبرامج الضارة
من أحدث التطبيقات للتعلم الآلي إذ أصبحت كبرى شركات البريد الإلكتروني تستخدمه، من أجل فرز الرسائل الإلكترونية العشوائية أو الضارة وإرساله إلى صندوق البريد العشوائي بدلًا من أن تكون في صندوق البريد العادي الخاص بالشخص.
- المساعدين الافتراضين
من أحدث وأشهر التطبيقات للتعلم الآلي أصبح وجود بعض المساعدين الافتراضيين، مثل مساعد جوجل، وأليكسا، وكورتانا، وسيري، وغيرهم، وهؤلاء جميعهم بدأوا بمساعدة الإنسان في العثور على ما يرغب به من معلومات من خلال استخدام التعليمات الصوتية.
- كشف عمليات الاحتيال والنصب الإلكترونية
أصبحت تطبيقات التعلم الآلي تساعد الإنسان في الكشف عن عمليات النصب والاحتيال التي يمكن أن يتعرض لها عندما يجري بعض التعاملات المصرفية عبر الإنترنت، وخير مثال ما تقدمه شبكة (Feed Forward Neural) التي تقدم نصيحتها للأشخاص فيما يتعلق بكون المعاملة المصرفية حقيقة أم عملية نصب واحتيال.
- عمليات التداول في سوق الأوراق المالية
وهي من أحدث تطبيقات التعلم الآلي إذ أصبحت تستخدم على نطاق واسع في أسواق المال والبورصة، للتنبؤ بحالات صعود وهبوط الأسهم المالية وتحديد ماهية اتجاهات هذه الأسواق.
- التشخيص الطبي
أصبحت تطبيقات التعلم الآلي والذكاء الاصطناعي تستخدم بكثرة في المجالات الطبية لمساعدة الأطباء والمتخصصين في عمليات تشخيص الأمراض، كما أصبحت لها القدرة على التنبؤ ببعض الأماكن في جسم الإنسان والتي من المحتمل أن تصاب بمرض معين، مثل العثور على أورام المخ والدماغ بصورة سهلة وسريعة.
- الترجمة الآلية للغات
وهي أيضًا من التطبيقات التي باتت معروفة وشائعة الاستخدام، حيث لم يعد الإنسان مضطرًا لتعلم لغة المكان الذي ينوي زيارته، إذ يمكنه استخدام التطبيقات المتاحة للترجمة الآلية لأي لغة يرغب بها، ولعل أشهر مثال الترجمة الآلية التي توفرها جوجل.
تحديات التعلم الآلي
مع نمو وتطور تطبيقات التعلم الآلي وتنوعها وزيادة استخدامها من قبل الإنسان، نشأت العديد من التحديات التي أصبحت تواجه متخصصي التعلم الآلي والتي تتعلق بعمليات تعلم الآلة مختلف المهارات منذ البداية، ولعل من أهم تلك التحديات ما يأتي:
- تدني جودة البيانات
يبدو أن تدني جودة بعض البيانات هي من أهم التحديات التي تواجه متخصصي التعلم الآلي، إذ يسعى هؤلاء إلى أن تقديم خوارزمية ذات تنبؤات دقيقة للغاية بعيدة عن الأخطاء.
- سوء تجهيز البيانات
وهي من الأمور التي يمكن أن تحدث عندما لا تكون البيانات قادرة على إنشاء علاقة صحيحة ودقيقة بين متغيرات الإدخال والإخراج، وبالتالي ينبغي العمل على زيادة وقت التدريب وتعزيز النماذج المستخدمة من خلال إضافة بعض المميزات للبيانات وغيرها من الإجراءات.
- الإفراط في عمليات تجهيز بيانات التدريب
وهي من إحدى أهم التحديات التي يواجهها متخصصو التعلم الآلي، والمتعلقة بضخ كميات كبيرة من البيانات إلى الخوارزمية، والتي تؤثر بشكل كبير على مستوى الأداء فتجعله أقل كفاءة.
- التعليم الآلي عملية معقدة للغاية
مما لا شك فيه أن عملية التعلم الآلي من العمليات الصناعية الحديثة والمتغيرة باستمرار، ولكي يتمكن متخصصو التعليم الآلي من مواكبة هذه التغيرات فهم قد يعمدوا إلى إجراء بعض التجارب بشكل سريع ومن دون تروي وهو ما قد يعرضهم للوقوع في بعض الأخطاء غير المقصودة.
- البطء في عمليات التنفيذ
يبدو أن البطء والتراخي في عمليات التنفيذ أحد أهم التحديات الشائعة التي يواجهها متخصصو التعلم الآلي، إذ إن نماذج التعليم العالي تمتاز بكفاءة عالية فيما يتعلق بتقديم نتائج عالية في الدقة بعيدًا عن الأخطاء، وهو الأمر الذي يجعل من عمليات التنفيذ تستغرق وقت أطول فضلًا عن أنها تحتاج إلى الكثير من المراقبة والصيانة لضمان أفضل النتائج.
- نمو البيانات وتطورها
وهي من أكثر التحديات التي يواجهها متخصصو التعلم الآلي، إذ أنها تشكل ضغط وإرهاق كبير عليهم والسبب في ذلك أن البيانات في نمو وتطور سريع للغاية، وبالتالي يجعل هذا الأمر قواعد البيانات المنظمة اليوم عديمة الفائدة بل وغير دقيقة في المستقبل القريب، لذا سوف تتطلب ترتيب وصيانة ومراقبة طوال الوقت للمحافظة على عمل الخوارزمية بشكل صحيح.
نشأة التعلم الآلي
اعتمد التعلم الآلي بشكل جزئي على نموذج للتفاعل بين خلايا الدماغ، وهو نموذج أنشئ من قبل العالم دونالد هب في عام 1949م في كتاب وضعه يحمل عنوان (تنظيم السلوك)، والذي قدم فيه نظرياته حول الإثارة العصبية والتواصل بين الخلايا العصبية، والتي تُرجمت إلى شبكات عصبية اصطناعية وخلايا عصبية اصطناعية.
ثم طور العالم صموئيل الذي كان يعمل في شركة IBM برنامج كمبيوتر من أجل تطبيق لعبة يطلق عليها اسم الداما وكان ذلك في خمسينيات القرن الماضي، ونظرًا لأن البرنامج الذي كان يعمل عليه لا يمتلك ذاكرة كبيرة بدأ صموئيل استخدام برنامج (تقييم ألفا بيتا)، وهو عبارة عن خوارزمية تقلل من عدة الاحتمالات.
ومن ثم لكي يقوم هذا البرنامج من تلقاء نفسه باختيار خطواته التي يخطوها باستخدام استراتيجية (minimax)، التي طورت إلى خوارزمية (minimax) والتي أطلق عليها اسم التعلم عن ظهر قلب، ومن ثم ابتكر واستخدم صموئيل عبارة التعلم الآلي لأول مرة عام 1952م.
خوارزميات التعلم الآلي
تجدر الإشارة إلى أنه لا توجد خوارزمية واحدة من أجل التعلم الآلي تعمل بشكل جيد مع كل مشكلة، كما لا يوجد خوارزمية أفضل من أخرى، ونتيجة لذلك لا بد من تجربة العديد من الخوارزميات المختلفة خلال مجموعة اختبارات للبيانات من أجل تقييم الأداء، واختيار الجيد منها.
مع ملاحظة أن الخوارزمية المستخدمة مناسبة للمشكلة المطروحة، وهنا سوف يأتي دور مهمة التعليم الآلي، فعلى سبيل المثال، إذا ما احتاج الإنسان لتنظيف منزله فيمكنه استخدام المكنسة ولكنه لن يستخدم مجرفة الحفر بكل تأكيد.
ويقوم مبدأ خوارزمية التعلم الآلي على تعلم وظيفة مستهدفة (F) لوضع تنبؤات مستقبلية تقوم في الأساس على ما يتم تعينه من متغيرات الإدخال التي يرمز لها بـ (X) وتحويلها إلى متغير إخراج (Y)، لذلك Y = f (X)، حيث أن (Y) يمثل التنبؤات المستقبلية.
أما أهم خوارزميات التعليم الآلي فهي:
الانحدار الخطي
الانحدار الخطي (بالإنجليزية: Linear Regression) من أكثر الخوارزميات شهرة في مجال الإحصاء والتعلم الآلي، ولفهم وظيفة هذه الخوارزمية يمكن تخيل العقل أنه يقوم بعملية ترتيب سجل عشوائي لمادة معينة، مثل مجموعة من الأخشاب بالاعتماد على الوزن.
ومع عدم القدرة على تسجيل وزن كل قطعة فيمكن وضع تخمين لوزنها من خلال النظر إلى ارتفاعها وحجمها، وترتيب هذا الأمر من خلال استخدام مجموعة من المؤشرات المرئية وهذا ما يشبه الانحدار الخطي في التعلم الآلي.
الانحدار اللوجستي
الانحدار اللوجستي (بالإنجليزية: Logistic Regression) وهو أسلوب آخر للإحصاء يستخدم في التعلم الآلي، وهي طريقة يطلق عليها تسمية (go-to) لتحديد مشاكل التصنيف الثنائي أي المشاكل التي تتعلق بقيميتين لفئتين.
والانحدار اللوجستي يشبه الانحدار الخطي من حيث الهدف فكلًا منهما يهدف إلى العثور على قيم المعاملات التي تتوازن مع كل متغير يتم إدخاله، ولكنه يختلف عنه فهو يتم فيه تحويل التنبؤ بالمخرجات باستخدام وظيفية غير خطية يطلق عليها بالوظيفة اللوجستية.
تحليل التمييز الخطي
التحليل التمييزي الخطي (بالإنجليزية: Linear Discriminant Analysis) هو أداة أو وسيلة للتصنيف وتقليل الأبعاد وتصور البيانات، وهو من الطرق البسيطة وغير المعقدة والتي غالبًا ما تنتج نتائج تصنيفية تتصف بالقوة وبقابليتها على التفسير، خاصة عندما تتولى معالجة مشاكل التصنيف في العالم الواقعي.
وهذا النوع من التحليل غالبًا يستخدم قبل اللجوء إلى طرق أخرى أكثر تعقيد، من الأمثلة البارزة على تحليل التمييز الخطي توقع الإفلاس بالنسبة للشركات التجارية، وهو نموذج تولى وضعه إدوارد أليتمان عام 1968م والخاص باحتمالية تعرض الشركة لخطر الإفلاس.
وذلك من خلال استخدام معاملات التمييز الخطي والتي كانت تتراوح فيها صحة التنبؤات ودقتها بين 80% إلى 90%، إذ قيمت على مدار 31 عامًا.
شجرة القرار
شجرة القرار (بالإنجليزية: Decision Tree) تحتوي هذه الشجرة على عقد ورقية تضم متغير الإخراج (y) الخاص بعمل التنبؤات، ومن خلال التقدم عبر تفرعات الشجرة سيتم الوصول إلى العقدة الورقية ومن ثم إخراج الفئة فيها، وهذه الطريقة من الطرق التي توصف بأنها سريعة ودقيقة في وضع التنبؤات لمجموعة كبيرة من المشاكل.
المصنف البايزي الساذج
المصنف البايزي الساذج (بالإنجليزية: naive bayesian classifier) وهي من الخوارزميات البسيطة ولكنها قوية في مجال وضع نماذج التنبؤات، حيث يتكون النموذج من نوعين من الاحتمالات والتي يجب أن توضع حسابات مباشرة لها من خلال بيانات التدريب الخاصة بمصممي التعلم الآلي وهي طريقة فعالة لمعالجة الكثير من المشاكل المعقدة.
كي- أقرب جار
كي - أقرب جار (بالإنجليزية: K-Nearest Neighbors) وهي خوارزمية تفترض وجود أشياء متشابهة على مقربة من بعضها البعض، وبالتالي هي خوارزمية تعتمد على أن يكون هذا الافتراض صحيح بدرجة كافية لكي تكون هذه الخوارزمية في النهاية مفيدة، لذلك فهي تأخذ فكرة التشابه (ويطلق عليها المسافة أو القرب).
ويمكن تقسيم فكرة المسافة هذه أو القرب إلى أبعاد عالية في حالة كان هناك الكثير من متغيرات الإدخال، ولكنه أمر يؤثر بسلبية على إداء الخوارزمية، ولعلاجه يجب أن يستخدم متغيرات الإدخال الأكثر صلة بالتنبؤ بمتغير الإخراج.
الفرق بين التعلم الآلي والتعلم العميق
إن التعلم الآلي هو عبارة عن مجموعة فرعية من الذكاء الصناعي الذي يهتم بتزويد مختلف الآلات الصناعية بالقدرة على التعلم والتصرف بشكل تلقائي بناء على ما الخبرة السابقة، وهذه العملية تتم من خلال تنفيذ خوارزميات مختلفة الأنواع بما فيها الشبكات العصبية، من أجل وضع حلول لمختلف المشاكل التي تواجه الإنسان في الحياة.
أما التعليم العميق (بالإنجليزية: Deep Learning) وفيه سوف تتخذ الشبكات العصبية منهج مختلف لتصنيف الكائنات، فهو لا يحتاج إلى بيانات صور منظمة ليتمكن من تصنيف الكائنات إلى عدة فئات، كما هو الحال في التعليم الآلي، إذ أن معالجة بيانات الصورة في التعليم العميق تتم من خلال مجموعة من طبقات مختلفة من الشبكات العصبية.
من ثم تحدد كل شبكة من هذه الشبكات بشكل هرمي لوضع ميزات محددة للصور، على سبيل المثال بالنسبة للحيوانات سوف تضع صور محددة لها من خلال ما يكسو جسمها أو بالنسبة للمناظر الطبيعية في حالة وجود مياه متدفقة أو أعشاب خضراء وهكذا، وهي آلية مشابهة لآلية عمل عقل الإنسان من حيث تصنيف الأشياء.