عندما ينظر الإنسان إلى مشهد أو صورة ، فإنه يفهمها - ما هي الأشياء الموجودة فيه وما الذي يحدث إذا حدث فعل ما. من ناحية أخرى ، يعالج الكمبيوتر البيانات الرقمية فقط التي تصف قيمة اللون لكل بكسل. بالنسبة للإنسان ، فإن التعرف على البيتزا على طاولة غير مرتبة أمر سهل. ولكن حتى وقت قريب ، لم تكن أجهزة الكمبيوتر قادرة على أداء نفس المهمة.

تتيح الرؤية الحاسوبية أو السيرة الذاتية للكمبيوتر القدرة على انتقاء المعلومات المهمة من المدخلات المرئية وتقديم تنبؤات وتوصيات دقيقة بناءً على تلك المعلومات.

كيف تعمل رؤية الكمبيوتر؟

قبل رؤية الكمبيوتر ، لإنشاء برنامج يتعرف على صورة معينة ، يتعين على الشخص القيام بساعات من العمل اليدوي للساق. أولاً ، يجب تجميع قاعدة بيانات للصور المتشابهة.

بعد ذلك ، يجب تحليل هذه الصور يدويًا وقياسها والتعليق عليها بالبيانات ذات الصلة أن الباحث يعتقد أنه يمكن تحديد الكائن المعني (مثل اللون والقياسات و شكل). عندها فقط يمكن استخدام البرامج لعمل تنبؤات.

من ناحية أخرى ، تعمل رؤية الكمبيوتر على أتمتة هذه العملية بأكملها باستخدام نهج التعلم الآلي المعروف باسم التعلم العميق. يستخدم التعلم العميق شبكة عصبية متعددة الطبقات

instagram viewer
مع مئات الطبقات المحتملة. في حالة الصور ، تكون هذه عادةً شبكة عصبية تلافيفية (CNN).

إن شرح كيفية عمل التعلم العميق والشبكات العصبية بالتفصيل هو أبعد من نطاق هذه المقالة. في الأساس ، يتم إدخال كميات كبيرة من البيانات في الشبكة العصبية. تقوم الشبكة العصبية بتحليل البيانات بشكل متكرر حتى تتمكن من تكوين تنبؤات دقيقة حولها.

في حالة استخدام CNN لمهمة رؤية الكمبيوتر ، تأخذ الشبكة العصبية البيانات من خلال عدة خطوات. أولاً ، يقوم بتقليص الصورة إلى عدة أجزاء (وحدات بكسل فردية أو مجموعات بكسل تم تمييزها مسبقًا).

بعد ذلك ، يقوم بعمل تنبؤات حول ما هو موجود في أجزاء مختلفة من الصورة (مثل الحواف الصلبة أو كائنات معينة). يتحقق من دقة هذه التنبؤات بشكل متكرر ويغير بشكل طفيف أجزاء من الخوارزمية في كل مرة حتى تصبح دقيقة للغاية.

أصبحت أجهزة الكمبيوتر الآن قوية جدًا لدرجة أنها تستطيع تحليل صورة أسرع بكثير من الدماغ البشري ، خاصةً بعد أن تتعلم التعرف على أنماط معينة. بهذه الطريقة ، من السهل أن ترى كيف يمكن لخوارزمية التعلم العميق أن تتفوق على القدرات البشرية.

ما هي أنواع الرؤية الحاسوبية؟

تتضمن رؤية الكمبيوتر تحليل وفهم الصور ومخرجات التنبؤات أو القرارات ذات الصلة حول الصور. هناك العديد من المهام التي ستستخدمها رؤية الكمبيوتر لتحقيق هذه الأهداف. بعض هذه تشمل:

  • تصنيف الصورة: يتم التعرف على نوع الصورة. على سبيل المثال ، ما إذا كان وجه شخص أو منظر طبيعي أو شيء ما. يمكن استخدام هذا النوع من المهام لتحديد وتصنيف الصور بسرعة. أحد الاستخدامات لذلك هو التعرف تلقائيًا على المحتوى غير اللائق وحظره على وسائل التواصل الاجتماعي.
  • التعرف على الأشياء: على غرار تصنيف الصور ، يمكن أن يتعرف التعرف على الكائن على كائن معين داخل مشهد - مثل بيتزا على طاولة غير مرتبة.
  • كشف الحد: من الاستخدامات الشائعة للرؤية الحاسوبية ، وعادة ما تكون الخطوة الأولى في اكتشاف الكائن ، تحديد الحواف الصلبة في الصورة.
  • تحديد الكائن: هذا هو التعرف على أمثلة فردية لشيء أو صورة ، مثل تحديد شخص معين أو بصمات أصابع أو مركبة.
  • كشف الكائن: الاكتشاف هو تحديد سمة معينة داخل صورة ، مثل كسر العظام في الأشعة السينية.
  • تجزئة الكائن: هذا هو تحديد وحدات البكسل في الصورة التي تنتمي إلى الكائن المعني.
  • تتبع الكائن: في تسلسل الفيديو ، بمجرد التعرف على كائن ، يمكن بسهولة تتبعه طوال الفيديو.
  • استعادة الصورة: يمكن إزالة التعتيم والضوضاء والتشوهات الأخرى للصورة عن طريق التحديد الدقيق لمكان الكائن مقابل الخلفية في الصورة.

أمثلة على الرؤية الحاسوبية

الذكاء الاصطناعي تستخدم بالفعل في العديد من الصناعات ذات تأثير مذهل ، وهذا ينطبق على رؤية الكمبيوتر. فيما يلي بعض الأمثلة على السيرة الذاتية المستخدمة بالفعل اليوم.

التعرف على الوجه

يعد التعرف على الوجه أحد الطرق الرئيسية التي تستخدم بها رؤية الكمبيوتر اليوم. عند مقارنتها بقواعد بيانات الوجوه المعروفة ، يمكن لخوارزميات الرؤية الحاسوبية تحديد الأفراد بدقة شديدة.

  • تحلل وسائل التواصل الاجتماعي الصور وتضع علامات على المستخدمين تلقائيًا بأن لديها مجموعة جيدة من الصور لهم.
  • يمكن لأجهزة الكمبيوتر المحمولة والهواتف وأجهزة الأمان تحديد الأشخاص للسماح بالوصول.
  • يستخدم تطبيق القانون التعرف على الوجه في أنظمة الدوائر التلفزيونية المغلقة لتحديد المشتبه بهم.

طب

تُستخدم رؤية الكمبيوتر حاليًا في الرعاية الصحية لتقديم تشخيصات أسرع وأكثر دقة مما يمكن للخبراء إجراؤه. تتضمن العديد من التطبيقات تحليل صور الأشعة السينية أو التصوير المقطعي المحوسب أو التصوير بالرنين المغناطيسي لحالات معينة ، بما في ذلك الأمراض العصبية والأورام والعظام المكسورة أو المكسورة.

سيارات ذاتية القيادة

تحتاج المركبات ذاتية القيادة إلى فهم محيطها للقيادة بأمان. وهذا يعني التعرف على الطرق والممرات وإشارات المرور والمركبات الأخرى والمشاة وغير ذلك. تستخدم كل هذه المهام أنظمة رؤية الكمبيوتر في الوقت الفعلي لتجنب الاصطدامات والقيادة بأمان.

رؤية الكمبيوتر صعبة

بدأت التطبيقات الحالية لرؤية الكمبيوتر بالفعل في تغيير طريقة عملنا في مختلف الصناعات. بدءًا من القدرة على اكتشاف المعدات المعيبة أو المعطلة إلى التشخيص الدقيق للسرطان ، فإن رؤية الكمبيوتر لديها القدرة على تحسين الأنظمة وإنقاذ الأرواح.

لكنها لا تخلو من التحديات. لا تزال رؤية الكمبيوتر بعيدة عن الرؤية البشرية. لدينا آلاف السنين من التطور تمكننا من التعرف على وفهم كل ما يحدث حولنا في الوقت الفعلي. لكن ليس لدينا أي فكرة عن كيفية أداء العقول البشرية لهذه المهام.

يعد التعلم العميق خطوة هائلة في الاتجاه الصحيح ، لكنه لا يزال يتطلب قدرًا مذهلاً من العمل لإنشاء نظام يمكنه أداء مهمة يمكن للبشر القيام بها بسهولة شديدة ، مثل تحديد سيارة على طريق. وذلك لأن أجهزة الكمبيوتر تؤدي المهام المقيدة بشكل فعال للغاية. إن تطوير جهاز كمبيوتر يمكنه فهم التعقيد الكلي للعالم المرئي هو لعبة كرة مختلفة تمامًا.

مع إجراء المزيد من الأبحاث في كل من تطبيقات الذكاء الاصطناعي وعلم الأحياء البشري ، من المحتمل أن نشهد انفجارًا في الاستخدامات المحتملة للرؤية الحاسوبية في المستقبل القريب.

بريد إلكتروني
ما هي خوارزميات التعلم الآلي؟ إليك كيف تعمل

تم تصميم خوارزميات التعلم الآلي لتسهيل الحياة وتحسين الأنظمة ، ولكن يمكن أن تنحرف مع عواقب وخيمة.

اقرأ التالي

مواضيع ذات صلة
  • شرح التكنولوجيا
  • برمجة
  • الذكاء الاصطناعي
  • الشبكات العصبية
عن المؤلف
جيك هارفيلد (16 مقالة منشورة)

جيك هارفيلد كاتب مستقل مقيم في بيرث ، أستراليا. عندما لا يكتب ، عادة ما يكون في الأدغال لتصوير الحياة البرية المحلية. يمكنك زيارته على www.jakeharfield.com

المزيد من Jake Harfield

اشترك في نشرتنا الإخبارية

انضم إلى النشرة الإخبارية لدينا للحصول على نصائح تقنية ومراجعات وكتب إلكترونية مجانية وصفقات حصرية!

خطوة أخرى أيضا…!

يرجى تأكيد عنوان بريدك الإلكتروني في البريد الإلكتروني الذي أرسلناه لك للتو.

.