منذ أكثر من 70 عامًا ، عندما تم وضع تصور للذكاء الاصطناعي ، نشر آلان تورينج ورقة بحثية وصفت كيفية التعرف عليه. عُرف لاحقًا باسم اختبار تورينج ، وقد تم استخدامه لعقود للتمييز بين الإنسان والذكاء الاصطناعي.

ومع ذلك ، مع تقديم روبوتات الدردشة المتقدمة بالذكاء الاصطناعي مثل ChatGPT و Google Bard ، أصبح من الصعب معرفة ما إذا كنت تتحدث إلى AI. يطرح السؤال. هل اختبار تورينج عفا عليه الزمن؟ وإذا كان الأمر كذلك ، فما هي البدائل؟

هل اختبار تورينج قديم؟

حقوق الصورة: Jesus Sanz /صراع الأسهم

لتحديد ما إذا كان اختبار تورينج قديمًا ، يجب عليك أولاً فهم كيف يعمل. لكي يجتاز الذكاء الاصطناعي اختبار تورينج ، يجب أن يقنع محققًا بشريًا أنه إنسان. ولكن هناك مشكلة - يتم تقييم الذكاء الاصطناعي جنبًا إلى جنب مع الإنسان ، ويجب أن يستجيب باستخدام النص.

أعتقد أنه من مثل هذا؛ إذا كنت المحقق ، وكنت تطرح أسئلة على اثنين من المشاركين عبر الإنترنت باستخدام النص ، ولكن أحدهما هو أحد نماذج الذكاء الاصطناعي ، فهل ستفرق بينهما بعد خمس دقائق؟ ضع في اعتبارك أن الهدف من اختبار تورينج ليس تحديد نموذج الذكاء الاصطناعي بناءً على الإجابات الصحيحة ولكن لتقييم ما إذا كان بإمكان الذكاء الاصطناعي التفكير أو التصرف كإنسان.

instagram viewer

تكمن مشكلة نهج اختبار تورينج في تحديد الاستجابات المشابهة للإنسان فقط في أنه لا يأخذ في الاعتبار عوامل أخرى. على سبيل المثال ، ذكاء نموذج الذكاء الاصطناعي أو معرفة المحقق. بالإضافة إلى ذلك ، يقتصر اختبار Turing على النص فقط ، ويصبح من الصعب تحديد الذكاء الاصطناعي الذي يولد صوتًا بشريًا أو فيديوهات التزييف العميق التي تحاكي السلوك البشري.

ومع ذلك ، فإن نماذج الذكاء الاصطناعي الحالية مثل ChatGPT-4 و Google Bard لم تتقدم بعد إلى درجة يمكنها اجتياز اختبار Turing باستمرار. في الواقع ، إذا كنت معتادًا على الذكاء الاصطناعي ، يمكنك ذلك بقعة النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.

أفضل 5 بدائل لاختبار تورينج

من الممكن أن نماذج الذكاء الاصطناعي المستقبلية مثل ChatGPT-5 يمكن أن يجتاز اختبار تورينج. إذا حدث ذلك ، فسنحتاج إلى اختبارات مختلفة مقترنة باختبار تورينج لتحديد ما إذا كنا نتحدث إلى ذكاء اصطناعي أو إنسان. فيما يلي أفضل بدائل اختبار تورينج:

1. اختبار ماركوس

اقترح غاري ماركوس ، العالم المعرفي الشهير وباحث الذكاء الاصطناعي ، بديلاً لاختبار تورينج الذي نُشر في نيويوركر لتحديد القدرة المعرفية للذكاء الاصطناعي. الاختبار بسيط - يمكنك الحكم على نموذج AI بناءً على قدرته على مشاهدة وفهم مقاطع فيديو YouTube والبرامج التلفزيونية بدون ترجمة أو نصوص. لكي يجتاز الذكاء الاصطناعي اختبار ماركوس ، يجب أن يفهم السخرية والفكاهة والسخرية والقصة عند مشاهدة مقاطع الفيديو وشرحها كإنسان.

في اللحظة، يمكن لـ GPT-4 وصف الصور، ولكن حتى الآن ، لا يوجد حاليًا نموذج ذكاء اصطناعي يمكنه فهم مقاطع الفيديو مثل الإنسان. مركبات ذاتية القيادة اقترب ، لكنها ليست مستقلة تمامًا وتتطلب أجهزة استشعار لأنها لا تستطيع فهم كل شيء في بيئتها المحيطة.

2. اختبار تورينج البصري

وفقا لورقة بحثية نشرت في PNAS، يمكن استخدام اختبار تورينج المرئي لتحديد ما إذا كنت تتحدث إلى إنسان أو مع الذكاء الاصطناعي باستخدام أسئلة الاستجواب. إنه يعمل مثل اختبار تورينج ، ولكن بدلاً من الإجابة على الأسئلة باستخدام النصوص ، يتم عرض الصور على المشاركين ومن المتوقع أن يجيبوا على أسئلة بسيطة أثناء التفكير مثل الإنسان. ومع ذلك ، فإن يختلف اختبار تورينج المرئي عن كابتشا نظرًا لأن جميع الإجابات صحيحة - ولكن لاجتياز الاختبار ، يجب على الذكاء الاصطناعي معالجة الصور بشكل مشابه للإنسان.

علاوة على ذلك ، إذا تم عرض صور متعددة للذكاء الاصطناعي والإنسان جنبًا إلى جنب وطُلب منهما تحديد صور واقعية ، فسيكون لدى الإنسان القدرة المعرفية لاجتياز الاختبار. هذا لأن نماذج الذكاء الاصطناعي تجد صعوبة في تمييز الصور التي لا تبدو وكأنها التقطت في العالم الحقيقي. في الحقيقة ، هذا هو سبب قدرتك على ذلك تحديد الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي باستخدام حالات شاذة لا معنى لها.

3. اختبار لوفليس 2.0

النظرية القائلة بأن الكمبيوتر لا يستطيع أن يخلق أفكارًا أصلية تتجاوز ما تمت برمجته للقيام به تم تصورها لأول مرة من قبل Ada Lovelace قبل اختبار Turing. ومع ذلك ، اعترض آلان تورينج على هذه النظرية بحجة أن الذكاء الاصطناعي لا يزال بإمكانه مفاجأة البشر. لم يتم تطوير الإرشادات الخاصة باختبار Lovelace حتى عام 2001 لتمييز الذكاء الاصطناعي عن الإنسان - ووفقًا لـ مكتبة thekurzweillibrary تم تعديل القواعد لاحقًا في عام 2014.

لكي ينجح الذكاء الاصطناعي في اجتياز اختبار Lovelace ، يجب أن يثبت أنه قادر على توليد أفكار أصلية تتجاوز تدريبه. لا تملك نماذج الذكاء الاصطناعي الحالية مثل GPT-4 القدرة على ابتكار اختراعات جديدة تتجاوز معرفتنا الحالية. لكن، الذكاء العام الاصطناعي يمكنه تحقيق هذه القدرة واجتياز اختبار لوفليس.

4. اختبار تورينج العكسي

ماذا عن اختبار تورينج ، ولكن يتم إجراؤه في الاتجاه المعاكس؟ بدلاً من محاولة معرفة ما إذا كنت تتحدث إلى إنسان ، فإن الهدف من اختبار تورينج العكسي هو خداع الذكاء الاصطناعي حتى تعتقد أنك ذكاء اصطناعي. ومع ذلك ، فأنت بحاجة أيضًا إلى نموذج ذكاء اصطناعي آخر للإجابة على نفس الأسئلة باستخدام النص.

على سبيل المثال ، إذا كان ChatGPT-4 هو المحقق ، فيمكنك تسجيل Google Bard وإنسان آخر كمشاركين. إذا تمكن نموذج الذكاء الاصطناعي من تحديد المشارك البشري بشكل صحيح بناءً على الإجابات ، فقد اجتاز الاختبار.

الجانب السلبي لاختبار تورينج العكسي هو أنه لا يمكن الاعتماد عليه ، خاصة بالنظر إلى ذلك في بعض الأحيان لا يمكن للذكاء الاصطناعي التفريق بين الذكاء الاصطناعي الذي يتم إنشاؤه والمحتوى الذي كتبه الإنسان.

5. إطار تصنيف الذكاء الاصطناعي

وفقًا لإطار تصنيف الذكاء الاصطناعي الذي طورته كريس سعد، فإن اختبار تورينج هو مجرد طريقة تقييم واحدة لمعرفة ما إذا كنت تتحدث إلى الذكاء الاصطناعي. بشكل أكثر إيجازًا ، يعتمد إطار تصنيف الذكاء الاصطناعي على نظرية الذكاء المتعدد ، والتي تتطلب ذكاءً بشريًا لتلبية ثمانية معايير مختلفة على الأقل ، والتي تشمل: الإيقاع الموسيقي ، والذكاء المنطقي الرياضي ، والتعرف البصري ، والذكاء العاطفي ، والذكاء الانعكاسي الذاتي ، والقدرة على التفكير الوجودي ، والجسم حركة.

نظرًا لأنه يتم تقييم الذكاء الاصطناعي وفقًا لثمانية معايير مختلفة ، فمن غير المرجح أن يمر على الإنسان حتى لو كان أداؤه أفضل من المتوسط ​​في معايير معينة. على سبيل المثال، يمكن لـ ChatGPT حل مسائل الرياضياتووصف الصور والتحدث بلغة طبيعية مثل الإنسان ، لكنها ستفشل في الفئات الأخرى المحددة في إطار تصنيف الذكاء الاصطناعي.

اختبار تورينج ليس حاسمًا

كان من المفترض أن يكون اختبار تورينج تجربة فكرية أكثر من كونه اختبارًا قاطعًا للتمييز بين البشر والذكاء الاصطناعي. عندما تم اقتراحه في البداية ، كان هو المعيار المحوري لقياس ذكاء الآلة.

ومع ذلك ، مع التطور الأخير لنماذج الذكاء الاصطناعي ذات القدرات التفاعلية في الكلام والبصرية والسمع ، فإن اختبار تورينج يقصر لأنه يقتصر على المحادثة النصية. سيكون الحل الأكثر فعالية هو تقديم بدائل اختبار تورينج التي تميز نماذج الذكاء الاصطناعي عن البشر.