اكتشف قوة واجهة OpenAI's API وكل الاحتمالات التي تتيحها.

تسببت القوة التوليدية لـ ChatGPT في حدوث جنون في عالم التكنولوجيا منذ إطلاقها. لمشاركة حدس منظمة العفو الدولية ، أصدرت OpenAI واجهات برمجة تطبيقات ChatGPT و Whisper API في 1 مارس 2023 للمطورين لاستكشاف التطبيق واستهلاكه.

تتميز واجهات برمجة تطبيقات OpenAI بالعديد من نقاط النهاية القيمة التي تجعل تكامل الذكاء الاصطناعي أمرًا سهلاً. دعنا نستكشف قوة واجهات OpenAI APIs لنرى كيف يمكن أن تفيدك.

ما الذي يمكن أن تفعله OpenAI API؟

ال OpenAI API حزم في مجموعة من المرافق للمبرمجين. إذا كنت تنوي تقديم الذكاء الاصطناعي داخل التطبيق يوميًا ، فإن OpenAI ستجعل حياتك أسهل بالقدرات التالية.

محادثة

تساعد نقطة نهاية إكمال دردشة OpenAI API المستخدم النهائي على إدارة جلسة تفاعلية طبيعية وصديقة للإنسان مع مساعد افتراضي باستخدام نموذج GPT-3.5-turbo.

Backstage ، يستخدم استدعاء API مجموعة رسائل من الأدوار والمحتوى. من جانب المستخدم ، المحتوى عبارة عن مجموعة من التعليمات للمساعد الظاهري ، والتي تشرك المستخدم ، بينما بالنسبة للنموذج ، المحتوى هو استجابته.

دور المستوى الأعلى هو النظام ، حيث تحدد الوظيفة العامة للمساعد الظاهري. على سبيل المثال ، عندما يخبر المبرمج النظام بشيء مثل "أنت مساعد افتراضي مفيد" ، فإنك تتوقع أن يجيب على أسئلة مختلفة ضمن قدرته على التعلم.

instagram viewer

بعد إخباره بأنه "مساعد افتراضي مفيد" ، إليك كيفية إجراء إحدى محادثات سطر الأوامر مع طراز GPT-3.5-turbo:

يمكنك أيضًا تحسين أداء النموذج من خلال توفير معلمات مثل درجة الحرارة ، وعقوبة الوجود ، وعقوبة التردد ، والمزيد. إذا سبق لك استخدام ChatGPT ، فأنت تعرف بالفعل كيف يعمل نموذج إكمال الدردشة الخاص بـ OpenAI.

اكتمال النص

توفر واجهة برمجة تطبيقات إكمال النص وظائف محادثة وإدراج نص وإكمال نص استنادًا إلى نماذج GPT-3.5 المتقدمة.

النموذج البطل في نقطة نهاية إكمال النص هو text-davinci-003 ، وهو أكثر سهولة من نماذج اللغة الطبيعية GPT-3. تقبل نقطة النهاية مطالبة المستخدم ، مما يسمح للنموذج بالاستجابة بشكل طبيعي وإكمال الجمل المعقدة باستخدام نص سهل الاستخدام.

على الرغم من أن نقطة نهاية إكمال النص ليست بديهية مثل نقطة نهاية الدردشة ، إلا أنها تتحسن - كلما زادت الرموز المميزة للنص المقدمة إلى نموذج text-davinci-003.

على سبيل المثال ، حصلنا على بعض الإكمالات نصف المخبوزة عندما وضعنا النموذج على max_tokens من سبعة:

ومع ذلك ، فإن زيادة max_tokens إلى 70 تولد أفكارًا أكثر تماسكًا:

خطاب إلى نص

يمكنك نسخ وترجمة الكلام الصوتي باستخدام نسخ OpenAI ونقاط نهاية الترجمة. تعتمد نقاط نهاية تحويل الكلام إلى نص على نموذج Whisper v2-large ، الذي تم تطويره من خلال إشراف ضعيف واسع النطاق.

ومع ذلك ، تقول شركة OpenAI إنه لا يوجد فرق بين نموذج Whisper ونموذج المصدر المفتوح. لذلك فهو يوفر فرصًا لا حصر لها لدمج الناسخ متعدد اللغات والمترجم AI في تطبيقك على نطاق واسع.

استخدام نقطة النهاية بسيط. كل ما عليك فعله هو تزويد النموذج بملف صوتي واستدعاء أوبناي. ترجمة صوتية أو أوبناي. تسجيل الصوت نقطة النهاية لترجمتها أو نسخها على التوالي. تقبل نقاط النهاية هذه حجم ملف أقصى يبلغ 25 ميغابايت وتدعم معظم أنواع الملفات الصوتية ، بما في ذلك mp3 و mp4 و MPEG و MPGA و m4a و wav و webm.

مقارنة نصية

تقيس نقطة نهاية مقارنة نص OpenAI API العلاقة بين النصوص باستخدام نموذج text-embedding-ada-002 ، وهو نموذج تضمين من الجيل الثاني. تستخدم واجهة برمجة تطبيقات التضمين هذا النموذج لتقييم العلاقة بين النصوص بناءً على المسافة بين نقطتي متجه. كلما اتسع الاختلاف ، قل ارتباط النصوص قيد المقارنة.

تتميز نقطة نهاية التضمين بتجميع النص والاختلافات والملاءمة والتوصيات والمشاعر والتصنيف. بالإضافة إلى ذلك ، يتم تحصيل رسوم لكل حجم رمزي.

على الرغم من أن وثائق OpenAI تنص على أنه يمكنك استخدام نماذج التضمين من الجيل الأول الأخرى ، فإن النموذج الأول أفضل بنقطة سعر أرخص. ومع ذلك ، تحذر OpenAI من أن نموذج التضمين قد يُظهر تحيزًا اجتماعيًا تجاه بعض الأشخاص ، كما ثبت في الاختبارات.

إتمام الكود

تم بناء نقطة نهاية إكمال الكود على OpenAI Codex ، وهي مجموعة من النماذج المدربة باستخدام لغة طبيعية ومليارات من خطوط الكود من المستودعات العامة.

نقطة النهاية في إصدار تجريبي محدود وخالية من الكتابة ، وتقدم الدعم للعديد من لغات البرمجة الحديثة ، بما في ذلك JavaScript و Python و Go و PHP و Ruby و Shell و TypeScript و Swift و Perl و SQL.

باستخدام نموذج code-davinci-002 أو code-cushman-001 ، يمكن لنقطة نهاية إكمال التعليمات البرمجية إدراج خطوط التعليمات البرمجية تلقائيًا أو تدوير كتل التعليمات البرمجية من مطالبة المستخدم. في حين أن النموذج الأخير أسرع ، فإن الأول هو مركز القوة لنقطة النهاية ، حيث يتميز بإدخالات الكود للإكمال التلقائي للكود.

على سبيل المثال ، يمكنك إنشاء مقطع رمز عن طريق إرسال موجه إلى نقطة النهاية في تعليق اللغة الهدف.

فيما يلي بعض الردود التي حصلنا عليها عندما حاولنا إنشاء بعض الكتل البرمجية في Python و JavaScript عبر المحطة الطرفية:

توليد الصور

هذه واحدة من أكثر ميزات واجهة OpenAI API بديهية. استنادًا إلى نموذج صورة DALL.E ، تتميز وظيفة صورة OpenAI API بنقاط نهاية لتوليد وتحرير وإنشاء أشكال مختلفة للصور من مطالبات اللغة الطبيعية.

على الرغم من أنه لا يحتوي حتى الآن على ميزات متقدمة مثل الترقية لأنه لا يزال في مرحلة تجريبية ، إلا أن مخرجاته غير المقاسة أكثر إثارة للإعجاب من تلك الخاصة بالتوليد نماذج فنية مثل Midjourney وانتشار مستقر.

أثناء الوصول إلى نقطة نهاية إنشاء الصورة ، تحتاج فقط إلى توفير موجه وحجم الصورة وعدد الصور. لكن نقطة نهاية تحرير الصورة تتطلب منك تضمين الصورة التي ترغب في تحريرها وقناع RGBA يحدد نقطة التحرير بالإضافة إلى المعلمات الأخرى.

من ناحية أخرى ، لا تتطلب نقطة نهاية التباين سوى الصورة الهدف وعدد التباين وحجم الإخراج. في وقت كتابة هذا التقرير ، لا يمكن لنقاط نهاية الصور التجريبية الخاصة بـ OpenAI قبول سوى الإطارات المربعة في النطاق 256 × 256 و 512 × 512 و 1024 × 1024 بكسل.

لقد أنشأنا تطبيقًا بسيطًا لتوليد الصور باستخدام نقطة النهاية هذه ، وعلى الرغم من أنه فاته بعض التفاصيل ، إلا أنه أعطى نتيجة مذهلة:

كيفية استخدام OpenAI API

استخدام OpenAI API بسيط ويتبع نمط استهلاك API التقليدي.

  1. تحميل هذا أوبناي الحزمة باستخدام النقطة: نقطة تثبيت openaiإذا كنت تستخدم Node بدلاً من ذلك ، فيمكنك القيام بذلك باستخدام npm: npm تثبيت openai.
  2. احصل على مفاتيح API الخاصة بك: قم بتسجيل الدخول إلى لوحة معلومات OpenAI الخاصة بك وانقر فوق رمز ملف التعريف الخاص بك في الجزء العلوي الأيمن. اذهب إلى عرض مفاتيح API وانقر إنشاء مفتاح سري جديد لإنشاء مفتاح سر API الخاص بك.
  3. قم بإجراء مكالمات API لنقاط نهاية النموذج التي اخترتها عبر لغة من جانب الخادم مثل Python أو JavaScript (Node). قم بتغذية هذه إلى واجهات برمجة التطبيقات المخصصة الخاصة بك واختبر نقاط النهاية الخاصة بك.
  4. ثم جلب واجهات برمجة التطبيقات المخصصة عبر جافا سكريبت أطر عمل مثل React أو Vue أو Angular.
  5. قدم البيانات (طلبات المستخدم والاستجابات النموذجية) في واجهة مستخدم جذابة بصريًا ، وسيكون تطبيقك جاهزًا للاستخدام في العالم الحقيقي.

ما الذي يمكنك إنشاؤه باستخدام OpenAI API؟

تنشئ واجهات برمجة تطبيقات OpenAI نقاط دخول للاستخدام الواقعي للتعلم الآلي والتعلم المعزز. بينما تكثر فرص الإبداع ، إليك بعض ما يمكنك إنشاؤه باستخدام واجهات برمجة تطبيقات OpenAI:

  1. قم بدمج روبوت محادثة مساعد افتراضي بديهي في موقع الويب أو التطبيق الخاص بك باستخدام نقطة نهاية إكمال الدردشة.
  2. قم بإنشاء تطبيق لتحرير الصور ومعالجتها يمكنه بطبيعة الحال إدراج كائن في صورة ما في أي نقطة محددة باستخدام نقاط نهاية إنشاء الصورة.
  3. أنشئ نموذجًا مخصصًا للتعلم الآلي من الألف إلى الياء باستخدام نقطة نهاية ضبط نموذج OpenAI.
  4. أصلح الترجمة والترجمات لمقاطع الفيديو والصوت والمحادثات الحية باستخدام نقطة نهاية نموذج تحويل الكلام إلى نص.
  5. حدد المشاعر السلبية في تطبيقك باستخدام نقطة نهاية نموذج تضمين OpenAI.
  6. قم بإنشاء ملحقات لإكمال التعليمات البرمجية الخاصة بلغة البرمجة لمحرري الكود وبيئات التطوير المتكاملة (IDEs).

قم بالبناء إلى ما لا نهاية باستخدام واجهات برمجة تطبيقات OpenAI

غالبًا ما تتضمن اتصالاتنا اليومية تبادل المحتوى المكتوب. تعمل واجهة OpenAI API على توسيع ميولها الإبداعية وإمكاناتها فقط ، مع حالات استخدام لغة طبيعية لا حدود لها على ما يبدو.

لا تزال الأيام الأولى لواجهة برمجة تطبيقات OpenAI. لكن توقع أن تتطور مع المزيد من الميزات مع مرور الوقت.