ما هو نسيان الآلة (Machine Unlearning)؟
ربما سمعت عن تعلم الآلة (Machine Learning) في الذكاء الاصطناعي، لكن هل سمعت عن نسيان الآلة (Machine Unlearning)؟ وهو، بمعناه الحرفي، أن نجعل النموذج ينسى جزءًا من البيانات التي تعلم منها.
أولًا: ما معنى نموذج تعلم الآلة؟
لتوضيح الفكرة، تخيل أنك أحضرت هاتفين:
أحدهما من شركة سامسونج والآخر من شركة هواوي، لكن لم يتم إخبارك أيهما لأي شركة. ثم طُلب منك تحديد الشركة المصنعة لكل هاتف.
غالبًا ستستطيع معرفة ذلك، لأنك رأيت الكثير من هواتف هاتين الشركتين سابقًا، وبالتالي يمكنك التمييز بينهما من خلال الشكل أو الشعار أو نظام التشغيل أو غير ذلك.
إذا نظرنا إلى الأمر من منظور رياضي مبسط، يمكن تخيله كأن لديك دالة تأخذ هذه الخصائص (الشكل، الشعار، النظام...) وتُخرج نوع الجهاز.
هذه الدالة تشبه ما نسميه في الذكاء الاصطناعي نموذجًا (Model).
فعندما نقول إننا نريد تدريب نموذج، فالفكرة هي عرض عدد كبير من الصور أو البيانات على النموذج ليكتشف منها الأنماط ويكوّن دالة قادرة على تحديد نوع الجهاز عند رؤية صورة جديدة.
وبذلك يكون تعلم الآلة نوعًا من محاكاة طريقة تعلم الإنسان.
الفرق بين الفهم والحفظ
لو سألتك الآن: هل تستطيع تذكر هاتف هواوي رأيته قبل خمس سنوات؟
غالبًا لا.
لكن لو عرض عليك هاتف الآن، فستستطيع غالبًا تحديد إن كان من سامسونج أو هواوي. لماذا؟
لأنك تفهم الفرق بينهما، ولا تعتمد فقط على حفظ أمثلة محددة.
أي أنك قادر على تصنيف أجهزة جديدة حتى لو لم ترَها من قبل.
ولكن لو سألتك بعد خمس سنوات: هل تتذكر الهاتف الذي عرضته عليك قبل سنوات وكيف صنفته؟
غالبًا لن تتذكر.
أين المشكلة في نماذج الذكاء الاصطناعي؟
المشكلة أن بعض نماذج الذكاء الاصطناعي قد تسمح – بطرق معينة – باستخراج معلومات عن البيانات التي تدربت عليها.
عندما تكون البيانات مثل صور هواتف، فالأمر ليس مشكلة كبيرة.
لكن عندما تكون البيانات بيانات شخصية مثل معلومات العملاء في البنوك، فهنا تصبح المشكلة خطيرة.
هنا يأتي مفهوم Machine Unlearning
في بعض الحالات نريد أن نجعل النموذج ينسى جزءًا من البيانات التي تدرب عليها، بحيث يصبح من الصعب استرجاعها، مع الحفاظ قدر الإمكان على دقة النموذج.
الحل البسيط: إعادة التدريب من الصفر
أبسط حل هو:
إعادة تدريب النموذج بالكامل بعد حذف البيانات التي لا نريدها.
وهذا حل صحيح، لكنه مكلف جدًا، لأن تدريب النماذج الحديثة قد يستغرق شهورًا ويكلف ملايين الدولارات.
حل آخر: إضافة تشويش (Noise)
هناك فكرة أخرى، وهي إضافة نوع من التشويش إلى النموذج حتى يعيد النظر في بعض الأنماط التي تعلمها.
يمكن تشبيه ذلك بمثال:
لو عرضت عليك هاتفًا من هواوي لكنه يشبه كثيرًا هاتف سامسونج ولا يحمل شعارًا واضحًا، فقد تصنفه على أنه سامسونج.
لكن عندما يتم إخبارك أنه في الحقيقة من هواوي، ستبدأ بمراجعة بعض الافتراضات التي كنت تعتقدها صحيحة.
إضافة هذا النوع من التشويش قد يساعد النموذج على نسيان بعض المعلومات المرتبطة بالبيانات الأصلية.
لكن المشكلة في هذه الطريقة أنها قد تقلل من دقة النموذج، وهذا أحد عيوبها.
خلاصة الفكرة
موضوع Machine Unlearning ما زال مجالًا بحثيًا نشطًا، ولا تزال هناك محاولات لإيجاد طرق فعالة تجعل النماذج تنسى بيانات معينة دون التأثير الكبير على أدائها.
كما توجد مسابقات بحثية على منصات مثل Kaggle تهدف إلى إيجاد حلول أفضل لهذه المشكلة.
ومن المتوقع أن تظهر نتائج وتجارب جديدة خلال الفترة القادمة توضح أفضل الطرق للتعامل مع هذا التحدي.