قبل أشهر قليلة ، إذا كنت ترغب في إنشاء صورة لشيء ما ، فيجب أن تكون قادرًا على الرسم أو الرسم أو استخدام إحدى أدوات التصوير التي يستمر الآخرون في الحديث عنها. بعد عام 2022 ، تغير كل شيء ، كل ذلك بفضل الذكاء الاصطناعي - نعم ، كما هو الحال في "الذكاء الاصطناعي".

بدلاً من محاولة السيطرة على العالم ، يمكن لأدوات الذكاء الاصطناعي ذات الميول الفنية تحويل أي شيء تصفه لهم إلى صورة.

تعال معنا ونحن ندخل عالم تصور النص المدعوم بالذكاء الاصطناعي ، وشاهد كيف يمكنك استخدام هذه الأدوات لتحويل أفكارك إلى صور فعلية بمجرد كتابة ما يدور في ذهنك.

Dall-E: الجانب الفني من OpenAI's GPT-3

أول الأدوات التي تعمل بالذكاء الاصطناعي والتي أصبحت شائعة كانت تعتمد على OpenAI's GPT-3. كان أحد الأسباب هو انفتاح المشروع على الوصول الخارجي ، مما أدى إلى بعض الاقتراحات التي GPT-3 هو مستقبل العمل الإبداعي.

اليوم يمكنك استخدام الأدوات الرسمية التي يمكنك العثور عليها في موقع OpenAI التجريبي التجريبي أو حلول الطرف الثالث التي تستفيد من قدراتها اللغوية الخارقة. على سبيل المثال ، يمكنك أن تطلب من GPT-3 الخروج بمسودة لمنشور ، أو الإجابة عن أسئلة بسيطة ، أو حتى مراجعة بعض النصوص أو ترجمتها.

instagram viewer

في عام 2022 ، كشفت شركة OpenAI أن GPT-3 كانت جيدة بنفس القدر في صياغة الصور. يستخدم مشروع DALL-E ، وهو مسرحية على فيلم Pixar's WALL-E واسم Dali ، GPT-3 ليس للعمل مع النص ولكن كمحرك لصنع الصور.

تمامًا كما هو الحال مع GPT-3 والنصوص ، فإن DALL-E ليس عبقريًا مبدعًا حقًا ، ويتجسد الصور من فراغ. بدلاً من ذلك ، تم "تدريبه" على ملايين الصور الموجودة بالفعل على الإنترنت. تكمن قوى الذكاء الاصطناعي الخاصة به في تحليل تلك الصور ، وأخذ العناصر منها ، والتغيير والتبديل ، والتعديل ، ثم دمجها أخيرًا في صور جديدة.

على الأقل ، هذه نسخة مبسطة لما يحدث في الخلفية. سيهتم معظم الناس بما يرونه أمامهم فقط ، وهذا هو مربع نص حيث يمكنك كتابة شيء ما ورؤيته تحول إلى صورة بعد بضع دقائق.

إجابة Imagen من Google

يعد Google أحد "اللاعبين" الثلاثة الأوائل في أبحاث الذكاء الاصطناعي. ومع ذلك ، فإن تقدمهم لا يمكن إدراكه بسهولة ، كما أن تطبيقاته في المنتجات لا يمكن الوصول إليها مثل عروض OpenAI.

كانت إحدى أولى تطبيقات Google AI المتاحة على نطاق واسع في محرّر مستندات Google و Gmail ، في شكل المزيد من الإكمال التلقائي الذكي والاقتراحات ، والمعروفة باسم الكتابة الذكية. لن نتعمق في التفاصيل منذ أن غطيناها سابقًا الكتابة الذكية (وكيف يمكنك استخدامها).

عندما تكون هذه الميزات نشطة ، تقارن تطبيقات الويب من Google ما يكتبه المستخدم بما كتبه ملايين الآخرين في الماضي. ثم يقترح ما كتبوه بعد ذلك.

إنه دليل على أنه على الرغم مما نحب أن نصدقه ، فنحن لسنا مختلفين. إذا كتب 99 من كل 100 شخص "لاحقًا" بعد "أراك" ، فمن المحتمل أن يكون هذا هو ما سنستمر في كتابته أيضًا.

لقد استخدمنا جميعًا شكلاً من أشكال الإكمال التلقائي ، حتى من الخلف في نظام النص التنبئي T9 في عصر "dumbphone". هذا هو السبب في أن أدوات الذكاء الاصطناعي من Google لا تبدو ذكية مثل GPT-3 الخاصة بـ OpenAI. لم يشعروا بأنهم قيد الاستخدام أكثر من نظام T9 أفضل تم تحسينه للقرن الحادي والعشرين. وهذا أيضًا سبب صدمة الكشف عن Imagen.

مثل DALL-E على المنشطات ، Imagen هي أداة تصور النص. استنادًا إلى ما هو متاح اليوم ، يمكن لـ Imagen إنتاج صور "أنظف" وأكثر إشراقًا مع معرفة كيفية التعامل مع الميزات المتقدمة مثل الانتشار والشفافية.

لسوء الحظ ، في وقت كتابة هذا التقرير ، لا يزال الوصول إلى Imagen مقيدًا ، لذلك لم نتمكن من تجربته.

DALL-E Mini and Friends: مفتوح للعمل

لا يمكنك الوصول بحرية إلى DALL-E و Imagen - حتى الآن. ومع ذلك ، تتوفر العديد من البدائل بالفعل إذا كنت تريد العبث باستخدام إنشاء الصور النصية المدعومة بالذكاء الاصطناعي.

مع الأخذ في الاعتبار أن هذه هي الأيام الأولى ، وأن النتائج أو تجربة المستخدم التي تقدمها قد تكون بعيدة عن أن تكون مثالية ، فلا يزال من المفيد التحقق من بعض ما يلي.

صنع Memes مع Dall-E Mini

بفضل مزيج من النتائج الأكثر من كافية والواجهة سهلة الاستخدام ، ولكن الأهم من ذلك ، توفره على نطاق واسع ، أصبح DALL-E mini أحد أكثر مصورات نصوص الذكاء الاصطناعي شيوعًا.

بعيدًا عن الكمال ، في بعض الأحيان قد تكون نتائج DALL-E mini مجردة أكثر من المقصودة.

في أحيان أخرى ، قد يفشل في إنشاء ما يدور في ذهنك ولكن يمكن أن يكون قريبًا جدًا.

بعد انفجار شعبيته ، نقله مبتكرو DALL-E mini إلى منزل جديد بعلامة تجارية جديدة. يمكنك الآن العثور على أحدث إصدار من DALL-E mini كـ كرايون على موقعه الخاص.

يعد استخدام Craiyon اليوم سهلاً مثل البحث عبر الإنترنت عن صورة موجودة. يمكنك زيارة موقعه ، وكتابة وصف لصورتك في حقل النص الخاص بها ، والضغط على Enter. بعد فترة ، سترى النتائج على شاشتك.

اللافت للنظر هو مدى جودة Craiyon والأدوات المماثلة في محاكاة الأنماط المرئية. على سبيل المثال ، طلبنا منه استحضار صور جرو على لوح تزلج:

بعد ذلك ، استخدمنا العبارة الدقيقة ولكننا أضفنا بعدها "نمط Pixar". بعد فترة ، عرض Craiyon شبكة من المزيد من الصور "الكارتونية" ، أقرب إلى ما نعتبره رسومات Pixar ذات التتبع الشعاعي في أفلامهم المحببة.

أعطانا Craiyon نتائج أفضل عندما استبدلنا "أسلوب Pixar" بـ "نمط animé" في نفس المطالبة.

الرسوم المتحركة هي أكثر منمقة في مظهرها من صور بيكسار الأكثر واقعية ، والتي يبدو أنها ساعدت Craiyon في إنتاج بعض الصور الجاهزة للاستخدام تقريبًا.

العبث بالانتشار الكامن

نموذج الانتشار الكامن المدرب على مجموعة بيانات LAION-400M هو مصور نصوص AI آخر مثير للاهتمام. ومع ذلك ، فهو أيضًا أكثر تعقيدًا في استخدامه. يجب عليك تشغيله عبر الإنترنت في جهاز افتراضي واللعب بمعلماته المختلفة بدلاً من مجرد الكتابة في حقل نصي. ومع ذلك ، فهو أسهل مما يبدو.

  1. قم بزيارة Google Latent Diffusion colab space هذا هو منزله حاليًا.
  2. قم بالتمرير لأسفل قليلاً ولاحظ ملف مستعجل تحت المجال المعلمات. استبدل الموجه الافتراضي بما تريد أن تصوره صورتك.
  3. يختار تشغيل الكل من مدة العرض القائمة ، أو اضغط كنترول + F9.
  4. إذا كنت تريد أن تكون قادرًا على تصدير الصور المنتجة مباشرةً من داخل الأداة ، فأجب بشكل إيجابي عند سؤالك عما إذا كنت تريد ربطها بحساب Google Drive الخاص بك. تستغرق الأداة بعض الوقت لإكمال التكوين وتحتاج إلى تنزيل بعض الملفات أثناء العملية.

زيادة قيم خطوات, التكرارات، و عينات في الموازية، قد يؤدي إلى نتائج أكثر تفصيلاً. ومع ذلك ، فإن الأداة تتطلب الكثير من الموارد على خوادم Google. نتيجة لذلك ، قد تتعطل إذا قمت بزيادة هذه القيم أكثر من اللازم ، أو تصبح عملية إنشاء صورة معينة أكثر تعقيدًا مما هو متوقع.

بدائل مثيرة للاهتمام

لقد أمضينا وقتًا طويلاً في اختبار DALL-E mini و Latent Diffusion. يتكون طريقتنا العلمية من جزأين متميزين. أولاً ، كان علينا التوصل إلى مفاهيم يمكن وصفها بدقة بالجنون. بعد ذلك ، اطلب من هؤلاء المصورين للذكاء الاصطناعي تحويلهم إلى صور. نجحوا في كثير من الأحيان أكثر مما كان متوقعًا ، حيث اقتربوا من الإعداد العام الذي تصورناه.

لقد جربنا أيضًا بعض البدائل المتاحة لهذه المقالة. ما زلنا ننتظر الوصول إلى الآخرين. بعض الأشياء التي تستحق المراجعة هي (بدون ترتيب معين):

  • ميدجورني
  • MindsEye بيتا
  • النجوم
  • حلم
  • انتشار الديسكو

هل سيحل الفن المولّد بالذكاء الاصطناعي محل الفنون المرئية؟

أدت وفرة الأدوات التي تعمل بالذكاء الاصطناعي لتوليد الصور وزيادة شعبيتها باستمرار إلى استنتاج أن الفنون البصرية ستموت قريبًا. ما الفائدة من استثمار الوقت والطاقة لتعلم كيفية رسم أو استخدام برامج معقدة لتصور الأشياء عندما يكون بإمكان الذكاء الاصطناعي القيام بذلك بشكل أسرع (وسرعان ما يكون أفضل) منك؟

إذا لاحظت ، فهذه الأدوات كلها "مدربة على مجموعات البيانات". في اللغة الإنجليزية البسيطة ، هذا يعني أنهم يفعلون ما يفعلونه بفضل البشر الذين فعلوا الشيء نفسه من قبل.

هذا هو التلميح إلى سبب عدم قدرة هذه الأدوات على استبدال الفن البشري والإبداع والبراعة. إنهم مقلدون ، مكررات ذكية. بدون النسخ الأصلية التي تم إنتاجها بشريًا والتي تم تدريبهم عليها ، لن يتمكنوا من إنتاج أي إنتاج.

ومع ذلك ، هذا هو الآن ، ونعترف أننا لا نعرف ما يخبئه المستقبل. في الوقت الحالي ، يمكن للفنانين المرئيين النوم بأمان. في ظل معدل تطور الذكاء الاصطناعي ، يتفق العديد من المتخصصين في هذا الموضوع على أنها ليست مسألة ما إذا كان سيحل محل عمل أشخاص مثلك حقًا. إنها فقط مسألة وقت.

لكن مهلا ، ليس كل شيء كئيبا وكئيبا. بينما يستعد Skynet لأخذ وظائفنا ، يمكننا على الأقل تحسين مزاجنا من خلال إنشاء صور للكلاب على ألواح التزلج دون عناء!