تتميز شركات إنتاج الفن بالذكاء الاصطناعي بسمعة سيئة لأنها تنتج صورًا غير دقيقة للأيدي. دعونا نحرض Midjourney v5 ضد Dall-E 2 لنرى أيهما أفضل.

يستمر مولدات الفن بالذكاء الاصطناعي في إثارة الإعجاب ، مما يسمح لنا بإنشاء أي شيء يمكننا تخيله. ومع ذلك ، يبدو أن التقنية قد اصطدمت بجدار من الطوب عندما يتعلق الأمر بتوليد أيدي تبدو واقعية.

هنا ، نلقي نظرة على اثنين من تطبيقات الفن التوليدي الرائدة ونضعهما في وضع واحد - أو جنبًا إلى جنب - لنرى أيهما يمكن أن يولد أيديًا أفضل ، Midjourney v5 أو Dall-E 2. هل تتقن أي من هذه التطبيقات الأيدي؟ هيا نكتشف!

مشكلة الذكاء الاصطناعي في اليدين

منذ أن أصبح الفن المولّد بواسطة الذكاء الاصطناعي واسع الانتشار على الإنترنت ، كان هناك انتقادات بخصوص جودة الأيدي التي رسمها الذكاء الاصطناعي. على الرغم من التحديثات الأخيرة ، كما هو موضح في مقارناتنا جنبًا إلى جنب ، لم تكن النتائج مرضية.

يعمل كلا المتنافسين على تحسين قدراتهم وجودة مخرجاتهم مع كل تكرار. آخر تحديث ، الإصدار 5 من Midjourney، أظهرت تقدمًا مثيرًا للإعجاب. ومع ذلك ، تظل مشكلة العقارب التي رسمها الذكاء الاصطناعي دون حل ولا يمكن تجاهلها.

instagram viewer

المقارنة 1: استخدام موجهات "اليد" و "اليدين"

ستحتوي مقارناتنا على نفس المطالبات بالضبط لكل من Dall-E 2 و Midjourney v5. سنقوم بتصميم المطالبات لتكون خاصة باليد بدلاً من مجرد إنشاء الأشخاص ليروا كيف تبدو اليدين. كما أننا نمنح كل تطبيق فرصة واحدة فقط (لفة) لكل مطالبة.

يُسلِّم

لنبدأ الأمور بأبسط موجه موجه: "اليد".

ميدجورني الإصدار الخامس:

Dall-E 2:

نحن لسنا في بداية جيدة!

اتخذ Midjourney الطريق غير المعتاد لربط اليد بمواقف إبداعية إلى حد ما. بدلاً من التركيز على اليد فقط ، نرى ساحرًا وقفازات وهيكل عظمي وتمثال صغير. تفقد صورة القفازات إصبعًا أيضًا.

يأخذ Dall-E 2 النهج المعاكس ويقدم لنا يدًا واحدة فقط على خلفية عادية. لكن الغريب ، هناك بعض المواقف الغريبة ، خاصة مع الإبهام ، والتي لا تبدو طبيعية أو مريحة. يتم أيضًا قطع كل يد في أحد جانبي الصور.

من يفوز في هذه الجولة؟ سنمنحه لـ Dall-E 2 من أجل الدقة الشاملة.

الأيدي

الآن ، دعنا نجعل صيغة الجمع الفورية ، "الأيدي" ، ونرى ما يأتي به الذكاء الاصطناعي.

ميدجورني الإصدار الخامس:

Dall-E 2:

تبين أن محاولة Midjourney "للأيدي" أفضل هذه المرة. لكن الصور الأربعة كلها بالأبيض والأسود ، ولدينا بعض الأصابع المفقودة. عند الفحص الدقيق ، يمكنك أيضًا رؤية أن بعض الأرقام تتشكل بشكل غريب أو تتحول إلى بعضها البعض.

يستمر Dall-E 2 في إبراز الأيدي بخلفية عادية. لا توجد أرقام مفقودة ، لكن الأيدي مقطوعة في الصورة الثالثة وتبدو النسخ الأخرى نوعًا ما خرقاء في التكوين وتفتقر إلى الإبداع تمامًا.

دعنا نسمي هذه المقارنة بالتعادل. سيفوز Dall-E 2 من حيث الدقة إذا كان هذا هو العامل الوحيد ، لكن Midjourney تمكن من إنشاء البعض صور جميلة في عروضها بالأبيض والأسود ، حتى لو لم تكن جميع الإصدارات الأربعة جيدة حقيقي.

انت تستطيع دائما استخدم Photoshop لإصلاح فن Midjouney الخاص بك، بما في ذلك اليدين.

المقارنة 2: إيماءات اليد

لنقارن بين إيماءات اليد المتعارف عليها عالميًا تقريبًا.

تشابك الاصابع

أولاً ، لنجرب "تشابك الأصابع".

ميدجورني الإصدار الخامس:

Dall-E 2:

من الآمن أن نقول إن Midjourney أخطأ تمامًا في هذه المطالبة. نحن نفتقد أصابع ولا تبدو أي من الإصدارات طبيعية على الإطلاق.

رفع القبعات مرة أخرى إلى Dall-E 2 للحصول على عدد الإصبع الصحيح ، ولكن هذه هي الأخبار الجيدة الوحيدة. كل نسخة تبدو وكأن الأصابع تضرب وضعيات اليوجا الخاصة بها في لعبة تويستر.

لا يوجد فائز في هذه المقارنة.

ممتاز

بعد ذلك ، سنذهب مع "ممتاز".

ميدجورني الإصدار الخامس:

Dall-E 2:

يحصل Midjourney على عدد الإصبع الصحيح أثناء معالجة كل مطالبة بطريقة إبداعية. لاحظ إدخال أسلوب توضيحي؟

يحصل Dall-E 2 أيضًا على نقاط للدقة أثناء عدم محاولة هز القارب بإضافة أي شيء إبداعي إلى كل نتيجة.

لا يوجد فائز واضح هنا.

المقارنة 3: الأيدي مع الأشياء

الآن ، سنزيد من التعقيد عن طريق حث الأيدي على التفاعل مع الأشياء.

كرة بلورية تمسك باليد

لنبدأ بجسم عشوائي ، باستخدام "كرة بلورية تمسك باليد".

ميدجورني الإصدار الخامس:

Dall-E 2:

بينما نزيد التعقيد ، يبدأ Midjourney في التألق. بصرف النظر عن اثنين من عمليات الترحيل التي تبدو غير طبيعية ، تبدو اليدين والكرات الكريستالية جميلة. يستغرق Midjourney الوقت الكافي لإنشاء انعكاسات في الزجاج تضيف بالتأكيد إلى الإبداع العام.

لكن للمرة الأولى ، نرى Dall-E 2 ينقصه رقمًا في إحدى اليدين على الأقل ، ويبدو العقرب الرابع غريبًا تمامًا. كما أن الكرات الكريستالية لا تبدو مثيرة للإعجاب مقارنةً بكرات Midjourney.

ميدجورني يحقق فوزه الأول.

اليد القابضة للمياه

دعنا نجرب شيئًا أكثر تعقيدًا من خلال عبارة "تمسك اليد بالماء".

ميدجورني الإصدار الخامس:

Dall-E 2:

يدير Midjourney فقط لف صورة واحدة بالعدد الصحيح من الأرقام. على الرغم من أنه تم تقديمه بشكل جميل ، إلا أننا بدأنا مرة أخرى في رؤية الشقوق في قسم المصداقية.

يكافح Dall-E 2 من أجل الحصول على أيدي طبيعية أيضًا ولكنه يقوم بعمل أفضل بكثير. يقوم بتبديل اللون في الخلفية أيضًا لبعض التنوع.

سنعطي هذه الجولة لـ Dall-E 2.

المقارنة 4: الأيدي العاملة

بالنسبة لهذه المقارنة ، سننشئ مطالبات لها اليد العاملة المشاركة في الأنشطة.

يد صب الطين

دعونا نرى كيف تتعامل نماذج الذكاء الاصطناعي مع "طين صب الأيدي".

ميدجورني الإصدار الخامس:

Dall-E 2:

أخطأ Midjourney إصبعًا في صورتين لكن كل شيء آخر يبدو رائعًا.

تبدو صور Dall-E 2 مربكة ومزدحمة ، حيث تلجأ إلى إضافة أيدي شخص آخر في نصف الإصدارات.

يذهب الحافة إلى Midjourney.

عجينة ضغط اليدين

لنجرب نشاطًا مشابهًا ، "ضغط العجين باليدين".

ميدجورني الإصدار الخامس:

Dall-E 2:

تبدو صور Midjourney رائعة بشكل عام. لكن مرة أخرى ، نصفهم ينقصهم أرقام. لكن لا يمكن لوم الصور بسبب أسلوبها الفني.

تفتقد إصدارات Dall-E 2 أصابع أيضًا في نصف عمليات الترحيل السري ، بل إنها تضيف واحدة إلى آخر توزيع ورق في المجموعة.

دعنا نسمي هذا بالتعادل.

إذا كنت ترغب في تجربة هذه المقارنات بنفسك ، فإننا نعرض لك ذلك كيفية استخدام Midjourney لإنشاء فن AI.

ماذا تخبرنا النتائج؟

من الممتع إجراء مقارنات وتحديد الفائز بشكل عام. وإذا كان علينا الاختيار ، فسنسميها لصالح Midjourney v5. على الرغم من أن Dall-E 2 ابتكر أيديًا بالعدد الصحيح من الأصابع في كثير من الأحيان ، إلا أن Midjourney هي التي صنعت صورًا جذابة وفنية أكثر.

لكن كلا التطبيقين لهما مكان في السوق للفنانين الذين يعيدون توظيف صور Dall-E 2 و Midjourney لعملهم. كلاهما قادر على إنشاء أيدي يمكن استخدامها كقواطع أو في تركيبات للاستخدام الفني والتحريري والتجاري. إنها مجرد مسألة تفضيل شخصي.

الذكاء الاصطناعي سوف ينتصر في النهاية

قطعت التطبيقات الفنية التوليدية مثل Dall-E 2 و Midjourney شوطًا طويلاً في قدرتها على إنشاء فن واقعي ورائع. لا يزالون يكافحون من أجل توليد الأيدي ، ولكن بالنظر إلى تسارع التكنولوجيا التوليدية ، لا يمكننا توقع التحسن إلا في المستقبل القريب.