YOLO-NAS هي ذروة نماذج اكتشاف الأجسام في سلسلة YOLO. لكن لماذا يعتبر الأفضل؟
بعد YOLOv8 ، هناك نموذج جديد وأفضل على أحدث طراز للكشف عن الأشياء ، YOLO-NAS. إنها خوارزمية لاكتشاف الكائنات تم تطويرها بواسطة Deci AI لمعالجة قيود نماذج YOLO السابقة (أنت تنظر مرة واحدة فقط).
تم بناء النموذج من AutoNAC ، محرك بحث معماري عصبي. إنه يتجاوز سرعة وأداء نماذج SOTA ، مما يمثل قفزة كبيرة في اكتشاف الكائنات من خلال تحسين دقة وقت الاستجابة ودعم المقايضة.
ستناقش هذه المقالة نقاط القوة والميزات في YOLO-NAS ، واستكشاف سبب كونها أفضل نموذج للكشف عن الكائنات في سلسلة YOLO.
فهم كيفية عمل YOLO-NAS
يولد AutoNAC (البناء الآلي للعمارة العصبية) من Deci بنية YOLO-NAS. AutoNAC هي عملية سلسة توفر تعزيزًا لأداء الشبكات العصبية العميقة الحالية.
يأخذ خط أنابيب AutoNAC شبكة عصبية عميقة مدربة من قبل المستخدم كمدخل ومجموعة بيانات والوصول إلى نظام استنتاج. ثم تخضع الشبكة العصبية العميقة التي يدربها المستخدم لإعادة التصميم باستخدام خط الأنابيب. ثم يتم تحقيق بنية محسنة بزمن انتقال أقل دون المساس بالدقة.
يستخدم YOLO-NAS RepVGG. RepVGG يجعله متاحًا لتحسين ما بعد التدريب عن طريق إعادة تحديد المعايير أو تكميم ما بعد التدريب. إنه نوع من بنية الشبكات العصبية القائمة على VGG. يستخدم تقنيات التنظيم المصممة لتعزيز قدرة التعميم لنماذج التعلم العميق.
تصميم العمارة أكثر كفاءة من حيث السرعة والذاكرة. تخضع RepVGG للتدريب باستخدام بنية متعددة الفروع لتحقيق استدلال أسرع. ثم يتم تحويلها إلى فرع واحد باستخدام إعادة تحديد المعاملات.
تجعل هذه الميزة YOLO-NAS مفيدة جدًا لنشر الإنتاج. هذا لأنه من الممكن تدريب النموذج وتحسينه بدقة كاملة لسرعة الاستدلال واستخدام الذاكرة.
الميزات الرئيسية لـ YOLO-NAS
تشمل الميزات الرئيسية لـ YOLO-NAS ما يلي:
- التدريب على الوعي الكمي: يستخدم النموذج QSP و QCI (وحدات مدركة للتكميم) لتقليل فقدان الدقة أثناء تكميم ما بعد التدريب من خلال الجمع بين إعادة تحديد المعايير لتكمية 8 بتات.
- تصميم معماري آلي: تبحث AutoNAC ، وهي تقنية NAS المملوكة لشركة Deci ، عن بنية نموذجية مثالية تدمج هياكل نماذج YOLO الأساسية للتوصل إلى نموذج محسن.
- تقنية التكميم الهجين: طريقة التكميم القياسية تؤثر على النموذج بأكمله. في المقابل ، تقوم تقنية التكميم الهجين بتحديد جزء من النموذج لتحقيق التوازن بين الكمون ودقة النموذج.
- استخدم مناهج فريدة لإعداد النموذج للتدريب باستخدام البيانات المصنفة تلقائيًا. ثم يتعلم النموذج من توقعاته ويصل إلى كميات كبيرة من البيانات.
التحليل المقارن: YOLO-NAS مقابل نماذج YOLO الأخرى
فيما يلي مقارنة بين مختلف موديلات سلسلة YOLO.
يعد YOLO-NAS أفضل من نماذج الكشف عن الكائنات الموجودة مسبقًا ، ولكنه يأتي مع عيوبه. فيما يلي قائمة بمزايا وعيوب YOLO-NAS:
الايجابيات
- إنه مفتوح المصدر.
- إنه أسرع بنسبة 10-20٪ من طرازات YOLO الموجودة مسبقًا.
- إنه أكثر دقة مقارنة بنماذج YOLO الموجودة مسبقًا.
- يستخدم بنية أفضل ، AutoNAC. يؤدي هذا إلى تسجيل رقم قياسي جديد في اكتشاف الكائنات ، مما يوفر أفضل أداء للمفاضلة بين الدقة والكمون.
- دعم سلس لمحركات الاستدلال مثل NVIDIA. هذه الميزة تجعلها نموذجًا جاهزًا للإنتاج.
- لديها كفاءة ذاكرة أفضل وسرعات استدلال متزايدة.
سلبيات
- إنها ليست مستقرة حتى الآن لأن التكنولوجيا لا تزال جديدة ولم يتم استخدامها على نطاق واسع في الإنتاج.
تنفيذ YOLO-NAS
ستستخدم جوجل كولاب لكتابة وتشغيل الرموز في هذا التنفيذ. سيكون البديل لجوجل كولاب هو خلق بيئة افتراضية و استخدم IDE على جهازك المحلي.
النموذج كثيف الاستخدام للموارد. تأكد من أن لديك ذاكرة وصول عشوائي (RAM) بسعة 8 جيجابايت على الأقل قبل تشغيلها على جهازك. كلما زاد حجم الفيديو ، زادت مساحة الذاكرة التي يستخدمها.
تثبيت التبعيات
قم بتثبيت تبعية YOLO-NAS ، التدرجات الفائقة باستخدام الأمر أدناه:
نقطة تثبيت التدرجات الفائقة ==3.1.2
بعد التثبيت الناجح ، ستتمكن الآن من تدريب نموذج YOLO-NAS.
تدريب نموذجي
لتدريب النموذج ، قم بتشغيل كتلة التعليمات البرمجية أدناه:
من التدريبات الفائقة يستورد عارضات ازياء
yolo_nas_l = Models.get ("yolo_nas_l"، الأوزان_المحددة مسبقًا ="كوكو")
أنت تستورد نموذج التدريب من مكتبة SuperGradients المثبتة في هذا الرمز. أنت بعد ذلك تستخدم أوزان النموذج المدربة مسبقًا من مجموعة بيانات COCO.
نموذج الاستدلال
يحتوي استنتاج النموذج على تطبيقات محتملة لاكتشاف الصور وتصنيفها وتجزئتها.
في هذه الحالة ، سوف تركز على مهمة الكشف عن الكائن لمقاطع الفيديو والصور. لاكتشاف كائن في صورة ، قم بتشغيل كتلة التعليمات البرمجية أدناه:
url = "img_path"
yolo_nas_l.predict (url، conf =0.25).يعرض()
تأكد من استخدام المسار الدقيق لصورتك. في هذه الحالة ، قم بتحميل الصورة على بيئة Google Colab ، ثم انسخ مسار الصورة.
الناتج المتوقع:
لاكتشاف الكائنات في مقطع فيديو ، قم بتشغيل كتلة التعليمات البرمجية أدناه:
يستورد شعلة
input_video_path = "path_to_video"
output_video_path = "الكشف. mp4"
جهاز = "كودا"لو torch.cuda.is_available () آخر"وحدة المعالجة المركزية"
yolo_nas_l.to (الجهاز]. التنبؤ (input_video_path). حفظ (output_video_path)
مثل بيانات الصورة ، قم بتحميل الفيديو الذي تريد اكتشاف كائناته في بيئة Google Colab وانسخ المسار إلى متغير الفيديو. يمكن الوصول إلى الفيديو المتوقع من بيئة Google Colab باستخدام الاسم الكشف. mp4. قم بتنزيل الفيديو على جهازك المحلي قبل إنهاء جلستك.
الناتج المتوقع:
يدعم YOLO-NAS أيضًا ضبط النموذج والتدريب على البيانات المخصصة. الوثائق متاحة على ديسي صقل دفتر بداية.
تطبيقات العالم الحقيقي لـ YOLO-NAS
يمكن الوصول إلى شفرة مصدر YOLO-NAS بموجب ترخيص Apache 2.0 ، والذي يمكن الوصول إليه للاستخدام غير التجاري. للاستخدام التجاري ، يجب أن يخضع النموذج لإعادة التدريب من البداية للحصول على أوزان مخصصة.
إنه نموذج متعدد الاستخدامات يمكن تطبيقه في عدة مجالات ، مثل:
المركبات المستقلة والروبوتات
يمكن لـ YOLO-NAS تحسين قدرات الإدراك للمركبات ذاتية القيادة ، وتمكينها من اكتشاف وتتبع الأجسام بشكل أسرع وأكثر دقة في الوقت الفعلي. تساعد هذه القدرة على ضمان السلامة على الطريق وتجربة قيادة سلسة.
أنظمة المراقبة والأمن
يمكن أن يوفر النموذج اكتشافًا سريعًا ودقيقًا وفي الوقت الفعلي للأشياء للمراقبة والأمن الأنظمة التي تساعد في تحديد التهديدات المحتملة أو الأنشطة المشبوهة ، مما يؤدي إلى تحسين الأمان الأنظمة
البيع بالتجزئة وإدارة المخزون
يمكن أن يوفر النموذج إمكانات سريعة ودقيقة لاكتشاف الأشياء التي تسمح بإدارة المخزون المؤتمتة والفعالة في الوقت الفعلي ، وتتبع المخزون ، وتحسين الرفوف. يساعد هذا النموذج في تقليل تكاليف التشغيل وزيادة الأرباح.
الرعاية الصحية والتصوير الطبي
في مجال الرعاية الصحية ، YOLO-NAS قادرة على المساعدة في الكشف والتحليل الفعالين للأمراض الشاذة أو مجالات اهتمام محددة. يمكن أن يساعد النموذج الأطباء في تشخيص الأمراض بدقة ومراقبة المرضى ، وبالتالي تحسين قطاع الرعاية الصحية.
YOLO-NAS الوجبات الجاهزة
YOLO-NAS هو نموذج جديد لاكتشاف الأجسام رائد طريقة جديدة لأداء اكتشاف الكائن. إنه أفضل من موديلات SOTA. يعد أداءه في اكتشاف الكائنات قفزة كبيرة لمشاريع رؤية الكمبيوتر.