ربما تكون قد سمعت عن برنامج GPT الخاص بشركة OpenAI، لكنها ليست برامج LLM الوحيدة في المجموعة.
الماخذ الرئيسية
- يعد GPT-4 من OpenAI هو نموذج اللغة الكبيرة الأكثر تقدمًا واستخدامًا على نطاق واسع، مع 1.76 تريليون معلمة وقدرات متعددة الوسائط.
- يتنافس Anthropic's Claude 2 مع GPT-4 في مهام الكتابة الإبداعية ويحتفظ بمهامه الخاصة على الرغم من قلة الموارد.
- Google PaLM 2، على الرغم من أنه ليس قاتل GPT-4، إلا أنه نموذج لغوي قوي يتمتع بقدرات قوية متعددة اللغات وإبداعية. Falcon-180B هو نموذج مفتوح المصدر ينافس العمالقة التجاريين ويمكنه التنافس من أخمص القدمين مع GPT-3.5.
إنه موسم الذكاء الاصطناعي، وتقوم شركات التكنولوجيا بإنتاج نماذج لغوية كبيرة مثل الخبز من المخبز. يتم إصدار نماذج جديدة بسرعة، ويصبح من الصعب جدًا تتبعها.
ولكن وسط موجة الإصدارات الجديدة، لم يرتفع سوى عدد قليل من النماذج إلى القمة وأثبتت نفسها كمنافسين حقيقيين في مساحة نماذج اللغات الكبيرة. مع اقترابنا من نهاية عام 2023، قمنا بتجميع نماذج اللغات الكبيرة الستة الأكثر إثارة للإعجاب والتي يجب عليك تجربتها.
1. OpenAI GPT-4
GPT-4 هو نموذج اللغة الكبيرة الأكثر تقدمًا والمتاح للعامة حتى الآن. تم تطويره بواسطة OpenAI وتم إصداره في مارس 2023،
GPT-4 هو أحدث إصدار في سلسلة المحولات التوليدية المدربة مسبقًا التي بدأت في عام 2018. بفضل قدراته الهائلة، أصبح GPT-4 أحد نماذج اللغات الكبيرة الأكثر استخدامًا والأكثر شعبية في العالم.على الرغم من عدم تأكيد ذلك رسميًا، تقدر المصادر أن GPT-4 قد يحتوي على 1.76 تريليون معلمة مذهلة. حوالي عشر مرات أكبر من سابقتها، GPT-3.5، وخمس مرات أكبر من الرائد في Google، PaLM 2. يتيح هذا النطاق الهائل قدرات GPT-4 المتعددة الوسائط، مما يسمح له بمعالجة كل من النص والصور كمدخلات. ونتيجة لذلك، يستطيع GPT-4 تفسير ووصف المعلومات المرئية مثل الرسوم البيانية ولقطات الشاشة بالإضافة إلى النص. توفر طبيعتها متعددة الوسائط فهمًا يشبه الإنسان لبيانات العالم الحقيقي.
في المعايير العلمية، يتفوق GPT-4 بشكل كبير على النماذج المعاصرة الأخرى عبر الاختبارات المختلفة. في حين أن المعايير وحدها لا توضح نقاط قوة النموذج بشكل كامل، فقد أظهرت حالات الاستخدام في العالم الحقيقي أن GPT-4 بارع بشكل استثنائي في حل المشكلات العملية بشكل حدسي. تتم محاسبة GPT-4 حاليًا بمبلغ 20 دولارًا شهريًا و يمكن الوصول إليه من خلال خطة ChatGPT Plus.
2. الأنثروبي كلود 2
على الرغم من أنه لا يحظى بشعبية مثل GPT-4، إلا أن Claude 2، الذي طورته Anthropic AI، يمكنه مطابقة المعايير الفنية لـ GPT-4 والأداء الواقعي في العديد من المجالات. في بعض الاختبارات الموحدة، بما في ذلك الاختبارات المختارة، يتفوق كلود 2 على GPT-4. يحتوي نموذج لغة الذكاء الاصطناعي أيضًا على نافذة سياق متفوقة إلى حد كبير بحوالي 100000 رمز مميز، مقارنةً بنماذج الرموز المميزة 8k و32k الخاصة بـ GPT -4. على الرغم من أن طول السياق الأكبر لا يُترجم دائمًا إلى أداء أفضل، إلا أن سعة Claude 2 الموسعة توفر مزايا واضحة، مثل استيعاب كتب كاملة مكونة من 75000 كلمة لتحليلها.
في الأداء العام، يظل GPT-4 متفوقًا، ولكن تظهر اختباراتنا الداخلية أن كلود 2 يتجاوزه في العديد من مهام الكتابة الإبداعية. يتخلف كلود 2 أيضًا عن GPT-4 في مهارات البرمجة والرياضيات بناءً على تقييماتنا ولكنه يتفوق في تقديم إجابات إبداعية شبيهة بالبشر. عندما طلبنا من جميع النماذج في هذه القائمة كتابة أو إعادة كتابة قطعة إبداعية، ست مرات من أصل عشرة، اخترنا نتيجة كلود 2 لنتائجها الطبيعية الشبيهة بالبشر. حالياً، Claude 2 متاح مجانًا من خلال برنامج الدردشة الآلي Claude AI. هناك أيضًا خطة مدفوعة بقيمة 20 دولارًا للوصول إلى الميزات الإضافية.
على الرغم من حصوله على دعم مالي أقل من الشركات العملاقة مثل OpenAI وMicrosoft، إلا أن نموذج Claude 2 AI من Anthropic يحتفظ بتميزه في مواجهة نماذج GPT الشهيرة وسلسلة PaLM من Google. بالنسبة إلى الذكاء الاصطناعي الذي يتمتع بموارد أقل، يعتبر Claude 2 منافسًا مثيرًا للإعجاب. إذا اضطررنا للمراهنة على النموذج الحالي الذي لديه أفضل فرصة لمنافسة GPT في المستقبل القريب، فإن كلود 2 يبدو الرهان الأكثر أمانًا. على الرغم من تفوق كلود 2 في التمويل، إلا أن القدرات المتقدمة تشير إلى أنه يمكن أن يصل إلى أخمص القدمين حتى مع الشركات العملاقة الممولة تمويلًا جيدًا (على الرغم من أنه من الجدير بالذكر أن Google قدمت العديد من المساهمات الكبيرة في أنثروبي). يتفوق هذا النموذج على فئة وزنه ويظهر وعدًا كمنافس ناشئ.
3. OpenAI GPT-3.5
على الرغم من أن إصدار GPT-4 طغى عليه، إلا أنه لا ينبغي الاستهانة بـ GPT-3.5 ومعلماته البالغ عددها 175 مليارًا. من خلال الضبط الدقيق والترقيات المتكررة التي تركز على الأداء والدقة والسلامة، قطع GPT-3.5 شوطًا طويلاً عن طراز GPT-3 الأصلي. على الرغم من أنه يفتقر إلى إمكانيات GPT -4 المتعددة الوسائط ويتخلف في طول السياق وعدد المعلمات، يظل GPT-3.5 ذو قدرة عالية، مع كون GPT-4 هو النموذج الوحيد القادر على تجاوز أدائه الشامل بشكل حاسم.
على الرغم من كونه نموذجًا من المستوى الثاني في عائلة GPT، إلا أن GPT-3.5 يمكنه الاحتفاظ بنماذجه الخاصة وحتى التفوق على نماذج Google وMeta الرئيسية في العديد من المعايير. في الاختبارات جنبًا إلى جنب للمهارات الرياضية والبرمجية ضد PaLM 2 من Google، لم تكن الاختلافات صارخة، حتى أن GPT-3.5 كان له ميزة طفيفة في بعض الحالات. المزيد من المهام الإبداعية مثل الفكاهة والكتابة السردية جعلت GPT-3.5 يتقدم بشكل حاسم.
لذلك، في حين يمثل GPT-4 علامة فارقة جديدة في الذكاء الاصطناعي، يظل GPT-3.5 نموذجًا قويًا بشكل مثير للإعجاب، وقادرًا على التنافس مع البدائل الأكثر تقدمًا وفي بعض الأحيان تجاوزها. يضمن تحسينها المستمر أن تظل ذات صلة حتى مع نماذج الجيل التالي الأكثر بهرجة.
4. جوجل بالم 2
عند تقييم قدرات نموذج الذكاء الاصطناعي، فإن الصيغة المثبتة هي قراءة التقرير الفني و تحقق من النتائج المرجعية، ولكن خذ كل ما تعلمته بحذر واختبر النموذج نفسك. قد يبدو الأمر غير بديهي، إلا أن النتائج المعيارية لا تتوافق دائمًا مع الأداء الواقعي لبعض نماذج الذكاء الاصطناعي. على الورق، كان من المفترض أن يكون PaLM 2 من Google هو قاتل GPT-4، حيث تشير نتائج الاختبار الرسمية إلى أنه يطابق GPT-4 عبر بعض المعايير. ومع ذلك، في الاستخدام اليومي، تظهر صورة مختلفة.
في التفكير المنطقي والرياضيات والإبداع، فإن PaLM 2 لا يرقى إلى مستوى GPT-4. كما أنه يتخلف عن كلود الأنثروبي في مجموعة من مهام الكتابة الإبداعية. ومع ذلك، على الرغم من فشله في الارتقاء إلى مستوى وصفه بأنه قاتل GPT-4، يظل Google PaLM 2 نموذجًا لغويًا قويًا في حد ذاتها، وبقدرات هائلة. ينبع الكثير من المشاعر السلبية المحيطة به من مقارنات مع نماذج مثل GPT-4 وليس من الأداء الضعيف الصريح.
مع 340 مليار معلمة، يعد PaLM 2 من بين أكبر النماذج في العالم. إنه يتفوق بشكل خاص في المهام متعددة اللغات ويمتلك قدرات قوية في الرياضيات والبرمجة. على الرغم من أنه ليس الأفضل في ذلك، إلا أن PaLM 2 فعال أيضًا في المهام الإبداعية مثل الكتابة. لذلك، في حين رسمت المعايير صورة متفائلة لم تتحقق بالكامل، لا تزال PaLM 2 تُظهر مهارات رائعة في الذكاء الاصطناعي، حتى لو لم تتفوق على جميع المنافسين في جميع المجالات.
5. تي آي آي فالكون-180 بي
ما لم تكن تواكب الوتيرة السريعة لإصدارات نماذج لغة الذكاء الاصطناعي، فمن المحتمل أنك لم تواجه Falcon-180B مطلقًا. يعد الصاروخ Falcon-180، الذي طوره معهد الابتكار التكنولوجي في دولة الإمارات العربية المتحدة، واحدًا من أقوى الصواريخ. نماذج اللغات مفتوحة المصدر موجودة، حتى لو كانت تفتقر إلى التعرف على الأسماء مثل نماذج GPT أو الاستخدام الواسع النطاق لـ Meta اللاما 2. لكن لا تخطئوا، فالكون 180B يمكن أن يقف على قدم المساواة مع الأفضل في فئته.
تكشف النتائج المعيارية أن Falcon-180B يتفوق على معظم النماذج مفتوحة المصدر ويتنافس مع الشركات التجارية العملاقة مثل بالم 2 و جي بي تي-3.5. وفي اختبار الرياضيات والبرمجة والاستدلال ومهام الكتابة الإبداعية، تفوقت على GPT-3.5 وPaLM 2 في مرات. إذا قمنا بتصنيف GPT-4 وGPT-3.5 وFalcon-180B، فسنضع Falcon-180B بشكل مباشر بين GPT-4 وGPT-3.5 من حيث نقاط قوته في العديد من حالات الاستخدام.
على الرغم من أننا لا نستطيع أن نقول بثقة أنه أفضل من GPT-3.5 في الأداء العام، إلا أنه يقدم مبررًا لنفسه. وعلى الرغم من غموضه، فإن هذا النموذج يستحق الاهتمام لأنه يطابق أو يتجاوز قدرات البدائل المعروفة. يمكنك تجربة طراز Falcon-180B عليه تعانق الوجه (منصة LLM مفتوحة المصدر).
Llama 2، نموذج اللغة الكبير الذي يبلغ 70 مليار معلمة من Meta AI، يعتمد على سابقه، Llama 1. على الرغم من أن Llama 2 أصغر من النماذج الرائدة، إلا أنها تتفوق بشكل كبير على معظم شهادات LLM مفتوحة المصدر المتاحة للعامة في المعايير والاستخدام في العالم الحقيقي. الاستثناء سيكون Falcon-180B.
قمنا باختبار Llama 2 ضد GPT-4، وGPT-3.5، وClaude 2، وPaLM 2 لقياس قدراته. ومن غير المستغرب أن يتفوق GPT-4 على Llama 2 في جميع المعايير تقريبًا. ومع ذلك، فقد صمد Llama 2 في مقابل GPT-3.5 وPaLM 2 في العديد من التقييمات. على الرغم من أنه قد يكون من غير الدقيق الادعاء بأن Llama 2 يتفوق على PaLM 2، إلا أن Llama 2 حلت العديد من المشكلات التي أعاقت PaLM 2، بما في ذلك مهام البرمجة. تفوق كلود 2 وGPT-3.5 على Llama 2 في بعض المناطق لكنهما كانا أفضل بشكل حاسم في عدد محدود من المهام.
لذلك، مع عدم تجاوز قدرات أكبر النماذج المسجلة الملكية، Llama 2 مفتوح المصدر يتفوق على فئة وزنه. بالنسبة للنموذج المتاح بشكل مفتوح، فإنه يُظهر أداءً مثيرًا للإعجاب، وينافس عمالقة الذكاء الاصطناعي مثل PaLM 2 في تقييمات مختارة. يقدم Llama 2 لمحة عن الإمكانات المستقبلية لنماذج اللغات مفتوحة المصدر.
فجوة الأداء بين نماذج الذكاء الاصطناعي تضيق
على الرغم من أن مشهد الذكاء الاصطناعي يتطور بوتيرة مذهلة، إلا أن GPT-4 من OpenAI يظل رائدًا في المجموعة. ومع ذلك، في حين أن GPT-4 لا يزال لا مثيل له من حيث الحجم والأداء، فإن نماذج مثل Claude 2 تظهر أنه مع ما يكفي من المهارة، يمكن للنماذج الأصغر حجمًا التنافس في مجالات محددة. Google PaLM 2، على الرغم من فشله في تلبية بعض التوقعات النبيلة، لا يزال يُظهر قدرات عميقة. ويثبت Falcon-180B أن المبادرات مفتوحة المصدر يمكن أن تقف جنبًا إلى جنب مع عمالقة الصناعة إذا توفرت الموارد الكافية.