لقد منحت OpenAI ChatGPT القدرة على التحدث باستخدام صوت مركب، وستتوفر على هاتفك الذكي قريبًا.

تم إعداد ChatGPT ليصبح تجربة ذكاء اصطناعي تفاعلية. كشفت OpenAI أن برنامج الدردشة الآلي الرائد في العالم الذي يعمل بالذكاء الاصطناعي سيكون قادرًا على التحدث والرد على استفسارات المستخدم باستخدام صوت مركب، يُفترض أنه تم إنشاؤه بواسطة الذكاء الاصطناعي.

إلى جانب صوته المكتشف حديثًا، سيتمكن ChatGPT أيضًا من الرد ومناقشة صور معينة تم تحميلها عليه أو التقاطها أثناء استخدام تطبيق ChatGPT Android أو iOS. تبدو ميزة التعرف على الصور مشابهة لـ Google Lens والتطبيقات الأخرى التي تستخدم الشبكات العصبية لاكتشاف البيانات والمعلومات بدقة.

OpenAI يمنح ChatGPT صوتًا

في 25 سبتمبر 2023، قام مطور ChatGPT كشفت OpenAI من شأنه أن يمنح برنامج الدردشة الآلي الرائد عالميًا صوتًا. يمكن لمستخدمي ChatGPT التحدث مباشرة إلى chatbot ومطالبته بالرد، مما يسمح لـ ChatGPT بالتحدث مباشرة بالصوت لأول مرة.

يُظهر مقطع نموذج OpenAI امرأة تطلب من ChatGPT إنشاء قصة فريدة قبل النوم، والتي يستجيب لها ChatGPT على النحو الواجب بصوت نسائي مركب.

وفق

instagram viewer
سلكي، تم تطوير نموذج تحويل النص إلى كلام الجديد داخليًا. يمكنه إنشاء صوت "شبيه بالإنسان" من النص وبضع ثوانٍ من عينة الكلام (باستخدام نموذج OpenAI Whisper) والتحدث بألوان وأساليب مختلفة. يمكنك العثور على مجموعة من العينات الصوتية على مدونة OpenAI.

بدأت بعض الشركات بالفعل في استخدام النموذج الصوتي الجديد لـ OpenAI. على سبيل المثال، يستخدم Spotify نموذج تحويل النص إلى كلام الخاص بـ OpenAI لترجمة البودكاست إلى لغات مختلفة، ويجمع بين براعة ترجمة اللغة في ChatGPT وقدرته الجديدة على التحدث.

نموذج تحويل النص إلى كلام الجديد في ChatGPT متاح فقط لمشتركي Plus وEnterprise الذين يستخدمون الإصدار الرسمي تطبيقات Android وiOS ومن المتوقع طرحها خلال الأسبوعين المقبلين (بدءًا من 25 سبتمبر). 2023). علاوة على ذلك، تقتصر ميزة الصوت الجديدة على اللغة الإنجليزية في البداية، على الرغم من أننا نتوقع أن يتغير هذا بسرعة.

يستطيع ChatGPT التعرف على الصور والصور الفوتوغرافية وتحليلها

الجزء الثاني من تحديث ChatGPT الخاص بـ OpenAI هو القدرة على تحليل الصور التي تم تحميلها إلى الأداة والتحدث عنها. تم عرض خيار تحليل الصور المرئية في مقاطع فيديو تحديث GPT-4 ولكن لم تتم مناقشته كثيرًا منذ ذلك الوقت (مترجم رمز ChatGPT جانبًا).

الآن، يكتسب ChatGPT وظائف مشابهة لـ Google Lens. يمكنك تحميل صورة إلى ChatGPT أو التقاط صورة باستخدام كاميرا هاتفك الذكي في تطبيق ChatGPT، وسيقوم التطبيق بتوضيح الصورة وإضافة المزيد من السياق عند الحاجة.

إن وصفها بأنها "شبيهة بـ Google Lens" يعد ظلمًا حقًا. إن القدرة على الدردشة ذهابًا وإيابًا حول الصورة للحصول على مزيد من المعلومات والسياق تجعلها مفيدة للغاية لمجموعة واسعة من الإعدادات. ومع ذلك، من المهم ملاحظة التفاصيل الدقيقة، حيث أوضحت OpenAI أنها حدت من "قدرة ChatGPT على التحليل والإدلاء ببيانات مباشرة عن الأشخاص" لأسباب تتعلق بالخصوصية والدقة. ومع ذلك، هل يمكن أن تكون أداة "من هذا" التي تعمل بنظام OpenAI قيد العمل في المستقبل؟ (دعونا نأمل لا!)

مثل نموذج تحويل النص إلى كلام الجديد، ستطرح OpenAI ميزة التعرف على الصور في الأسبوعين المقبلين، على الرغم من أنها ستكون متاحة على جميع الأنظمة الأساسية، وليس فقط تطبيق ChatGPT.

الخصوصية والأمن وقضايا أخرى

إن الآثار المترتبة على تطبيق ChatGPT الذي يعمل بالطاقة الصوتية صارخة. بالتأكيد، إنه أمر مثير. ومع ذلك، فإن القدرة على إنشاء صوت مركب بشكل فريد باستخدام مقتطف قصير فقط كمثال ينطوي على مشكلات كبيرة تتعلق بالخصوصية والأمان. إن احتمال قيام الجهات الفاعلة الخبيثة باستغلال هذه الأدوات هائل، وكما هو الحال مع أي أداة ذكاء اصطناعي توليدية، بمجرد خروج الجني من القمقم، فلن يعود إليه مطلقًا. ولا يمكن لأي قدر من تنظيم الذكاء الاصطناعي من جانب الحكومات أو قادة الفكر أن يقلب هذا المد.

حتى تحذير OpenAI حول هذا الموضوع يبدو وكأنه يلتف حول ما هو واضح على الرغم من ذكر المشكلات:

ومع ذلك، فإن هذه القدرات تمثل أيضًا مخاطر جديدة، مثل احتمال قيام الجهات الفاعلة الخبيثة بانتحال شخصيات عامة أو ارتكاب عمليات احتيال. ولهذا السبب نستخدم هذه التقنية لتشغيل حالة استخدام محددة، ألا وهي الدردشة الصوتية.

نظرًا لأن هذا هو قمة جبل الجليد، فتوقع ردًا على صوت ChatGPT المكتشف حديثًا، خاصة مرة واحدة هناك ارتفاع يمكن التنبؤ به في العناوين الرئيسية البغيضة التي تزعم أن ChatGPT يُستخدم لارتكاب عمليات احتيال، وهكذا على.

OpenAI تجعل ChatGPT تطبيق Go-To AI

كلما أضاف OpenAI ميزات سهلة الاستخدام إلى ChatGPT، أصبح تطبيق الذكاء الاصطناعي المولد الأكثر استخدامًا. باعتباره أول من وصل إلى الشهرة على نطاق واسع خلال طفرة الذكاء الاصطناعي التوليدي الأولي، لا يزال ChatGPT يقود الطريق وهو التطبيق الوحيد الذي يستخدمه البعض، على الرغم من المنافسة من أمثال Google Bard (وربما Google Gemini) وAnthropic's كلود.

وطالما أن OpenAI يمكنه الاستمرار في إضافة ميزات تجعل ChatGPT أسهل في الاستخدام، فسوف يبقي الأشخاص مدمنين ويدفعهم إلى الاقتراب أكثر من هدفه المتمثل في أداة ذكاء اصطناعي متعددة الوسائط حقًا.