هل تبحث عن طريقة لتدريب ذكاء اصطناعي قوي لتطبيقاتك المحددة؟ حاول نقل التعلم!
إذا كنت مهتمًا بتدريب نموذج الذكاء الاصطناعي الخاص بك على معالجة اللغة الطبيعية (NLP) أو رؤية الكمبيوتر ، فيجب أن تتعرف على تعلم النقل وكيفية استخدام النماذج المدربة مسبقًا.
بدون نقل التعلم ، سيكون تدريب نموذج فعال وموثوق به في كثير من الأحيان مسعى يحظر الموارد ويتطلب ذلك الكثير من المال والوقت والخبرة ، مع مطور ChatGPT ، يُقدر أن OpenAI أنفق الملايين في تدريب GPT-3 و GPT-3.5 و GPT-4. بفضل قوة التعلم بالنقل ، يمكنك تدريب نموذجك الخاص بقوة نموذج GPT الأحدث بموارد قليلة في فترة قصيرة.
ما هو تعلم النقل بالذكاء الاصطناعي؟
التعلم الانتقالي هو فكرة اتخاذ نموذج مدرب مسبقًا مثل BERT أو أحد نماذج نماذج GPT مختلفة وتدريبها على مجموعة بيانات مخصصة للعمل على مهام لم يكن بالضرورة تدريبًا على معالجتها.
على سبيل المثال ، يمكنك أن تأخذ نموذجًا مدربًا مسبقًا لتصنيف أنواع مختلفة من القطط وتدريبها على تصنيف الكلاب. من خلال التعلم عن طريق النقل ، يجب أن يستغرق تدريب نموذج تصنيف الكلاب وقتًا وموارد أقل بكثير ليصبح موثوقًا مثل نموذج تصنيف القطط الأصلي.
يعمل هذا لأن القطط والكلاب تشترك في العديد من السمات التي يمكن للنموذج المدرب مسبقًا تحديدها بالفعل. نظرًا لأن نموذج تصنيف القطط يمكنه تحديد السمات المختلفة للقطط ، مثل امتلاك أربعة أرجل ، ومعاطف من الفرو ، ومظهر بارز الخطم ، يمكن لنموذج تصنيف الكلاب تخطي كل التدريب لتحديد تلك السمات ورثها من الأصل نموذج. بعد وراثة كل هذه الشبكات العصبية ، تقوم بعد ذلك بقطع الطبقات الأخيرة من النموذج المدرب المستخدم لتحديد السمات الأكثر تحديدًا للقط واستبدالها بمجموعة بيانات خاصة بالكلاب.
ما هي نماذج الذكاء الاصطناعي التي يمكنك استخدامها لنقل التعلم؟
لاستخدام التعلم بالنقل ، ستحتاج إلى نموذج مدرب مسبقًا. يُعرف النموذج المدرَّب مسبقًا باسم نموذج الذكاء الاصطناعي المُدرَّب بغرض اكتساب معرفة عامة حول موضوع أو فكرة معينة. هذه الأنواع من النماذج المدربة مسبقًا مصممة خصيصًا للأشخاص لضبط وإنشاء المزيد من النماذج الخاصة بالتطبيقات. بعض النماذج الأكثر شيوعًا المدربة مسبقًا مخصصة للغة البرمجة اللغوية العصبية ، مثل BERT و GPT، ورؤية الكمبيوتر ، مثل VGG19 و Inceptionv3.
على الرغم من شيوعها ، إلا أن هذه النماذج التي يمكن ضبطها بسهولة ليست هي الوحيدة التي يمكنك استخدامها لنقل التعلم. يمكنك أيضًا استخدام النماذج المدربة على مهام أكثر تحديدًا من التعرف على الأشياء أو اللغة بشكل عام. طالما أن النموذج قد طور شبكات عصبية قابلة للتطبيق على النموذج الذي تحاول تدريبه ، يمكنك استخدام أي نموذج لنقل التعلم.
يمكنك الحصول على نماذج مدربة مسبقًا متاحة للجمهور من أماكن مثل TensorFlow Hub و Hugging Face وسوق نموذج OpenAI.
فوائد استخدام تعلم النقل بالذكاء الاصطناعي
يوفر التعلم الانتقالي العديد من الفوائد على تدريب نموذج الذكاء الاصطناعي من البداية.
- تقليل وقت التدريب: عند تدريب نموذج من الصفر ، يتم إنفاق جزء كبير من عملية التدريب على المعرفة التأسيسية العامة. من خلال نقل التعلم ، يرث نموذجك تلقائيًا كل هذه المعرفة الأساسية ، وبالتالي تقليل وقت التدريب بشكل كبير.
- متطلبات أقل من الموارد: نظرًا لأن جميع المعارف التأسيسية موجودة بالفعل ، فكل ما عليك فعله هو مواصلة تدريب النموذج على تفاصيل التطبيق الخاص بك. غالبًا ما يتطلب هذا فقط مجموعة بيانات صغيرة نسبيًا يمكن معالجتها بقوة حوسبة أقل.
- تحسين الأداء: ما لم تنفق ملايين الدولارات على بناء نموذجك من الصفر ، لا يمكنك توقع نموذج جيد أو موثوق به كنموذج لغة كبير (LLM) من شركة تقنية عملاقة. باستخدام تعلم النقل ، يمكنك الاستفادة من الإمكانات القوية لهذه LLMs المدربة مسبقًا ، مثل GPT ، لتحسين أداء نموذجك.
من الممكن تدريب نموذج ذكاء اصطناعي من البداية ، لكنك تحتاج إلى موارد أكبر للقيام بذلك.
كيف يعمل نقل التعلم؟
في الأساس ، هناك ثلاث مراحل عندما يتعلق الأمر بنقل التعلم.
- اختيار نموذج تم تدريبه مسبقًا: يخضع النموذج المدرَّب مسبقًا إلى تدريب أولي باستخدام مجموعة بيانات كبيرة من مهمة مصدر ، مثل ImageNet ، أو مجموعة كبيرة من النصوص. تمكن مرحلة التدريب الأولية هذه النموذج من اكتساب المعرفة بالميزات والأنماط العامة الموجودة في مجموعة البيانات. يعتمد مقدار الوقت والموارد التي توفرها من نقل التعلم على أوجه التشابه بين النموذج المدرب مسبقًا والنموذج الذي تحاول بناءه.
- ميزة استخراج: بمجرد اختيار نموذج مدرب مسبقًا للضبط الدقيق ، يتم تجميد الطبقات الأولية للنموذج المدرب مسبقًا (الأقرب إلى الإدخال) ؛ هذا يعني أن أوزانهم تظل ثابتة أثناء الضبط الدقيق. يؤدي تجميد هذه الطبقات إلى الاحتفاظ بالمعرفة العامة التي تم تعلمها خلال مرحلة ما قبل التدريب ويمنعها من التأثر بشدة بمجموعة البيانات الخاصة بمهام النموذج المستهدف. بالنسبة للنماذج المدربة تدريباً كاملاً لتطبيقات محددة ، تتم إزالة الطبقات النهائية للنماذج أو عدم تعلمها حتى يتم تدريب النموذج المستهدف في تطبيقات محددة أخرى.
- الكون المثالى: بعد تجميد النموذج المدرَّب مسبقًا وإزالة الطبقات العليا ، يتم تغذية مجموعة بيانات جديدة لخوارزمية التعلم ، والتي تُستخدم بعد ذلك لتدريب النموذج الجديد وخصائص تطبيقه.
هناك ما هو أكثر من المراحل الثلاث ، لكن هذا المخطط يوضح بالتفصيل تقريبًا كيفية عمل عملية تعلم نقل الذكاء الاصطناعي ، مع بعض الضبط الدقيق.
قيود نقل التعلم بالذكاء الاصطناعي
على الرغم من أن التعلم عن طريق النقل هو مفهوم قيم في تدريب النماذج الفعالة والموثوقة ، إلا أن هناك عددًا قليلاً من القيود التي تحتاج إلى معرفتها عند استخدام التعلم الانتقالي لتدريب نموذج.
- عدم تطابق المهمة: عند اختيار نموذج أساسي لنقل التعلم ، يجب أن يكون وثيق الصلة قدر الإمكان بالمشكلات التي سيحلها النموذج الجديد. من المرجح أن يؤدي استخدام نموذج يصنف القطط لإنشاء نموذج لتصنيف الكلاب إلى نتائج أفضل من استخدام نموذج تصنيف السيارة لإنشاء نموذج للنباتات. كلما كان النموذج الأساسي أكثر ملاءمة للنموذج الذي تحاول بناءه ، زاد الوقت والموارد التي ستوفرها خلال عملية تعلم النقل.
- انحياز مجموعة البيانات: على الرغم من أن النماذج المدربة مسبقًا غالبًا ما يتم تدريبها في مجموعات بيانات كبيرة ، إلا أنه لا يزال هناك احتمال أن تكون قد طورت تحيزًا معينًا أثناء تدريبها. قد يؤدي استخدام النموذج الأساسي شديد التحيز أيضًا إلى أن يرث النموذج تحيزاته ، مما يقلل من دقة نموذجك وموثوقيته. لسوء الحظ ، من الصعب تحديد أصل هذه التحيزات بسبب طبيعة الصندوق الأسود للتعلم العميق.
- التجهيز: تتمثل إحدى الفوائد الرئيسية لتعلم النقل في أنه يمكنك استخدام مجموعة بيانات صغيرة نسبيًا لتدريب النموذج بشكل أكبر. ومع ذلك ، فإن تدريب النموذج على مجموعة بيانات صغيرة جدًا قد يتسبب في زيادة التجهيز ، مما يقلل بشكل كبير من موثوقية النموذج عند تزويده ببيانات جديدة.
لذلك ، في حين أن التعلم عن طريق النقل هو أسلوب تعليمي مفيد للذكاء الاصطناعي ، إلا أن هناك قيودًا ، وهي ليست رصاصة فضية.
هل يجب عليك استخدام نقل التعلم؟
منذ توفر النماذج المدربة مسبقًا ، لطالما تم استخدام التعلم التحويلي لعمل نماذج أكثر تخصصًا. لا يوجد سبب حقيقي لعدم استخدام التعلم بالنقل إذا كان هناك بالفعل نموذج مدرب مسبقًا ذي صلة بالمشكلات التي سيحلها نموذجك.
على الرغم من أنه من الممكن تدريب نموذج بسيط للتعلم الآلي من البداية ، فإن القيام بذلك على نموذج التعلم العميق سيتطلب ذلك الكثير من البيانات والوقت والمهارة ، والتي لن تكون منطقية إذا كان بإمكانك إعادة توظيف نموذج حالي مشابه للنموذج الذي تخطط له يدرب. لذلك ، إذا كنت ترغب في إنفاق وقت ومال أقل في تدريب نموذج ، فحاول تدريب النموذج الخاص بك من خلال نقل التعلم.