يصل المستخدمون عادةً إلى نماذج اللغات الكبيرة (LLMs) من خلال استخدام واجهة المستخدم من خلال واجهة برمجة التطبيقات. على الرغم من توفير العديد من المزايا ، فإن استخدام واجهات برمجة التطبيقات (API) يقدم أيضًا قيودًا ، مثل الحاجة إلى الإنترنت الثابت الاتصال ، والتخصيصات المحدودة ، والمشكلات الأمنية المحتملة ، والشركات التي تحد من قدرات النموذج من خلال أ paywall.

مع LLMs الكمية المتاحة الآن على HuggingFace ، والأنظمة البيئية للذكاء الاصطناعي مثل H20 و Text Gen و GPT4All يسمح لك بتحميل أوزان LLM على جهاز الكمبيوتر الخاص بك ، لديك الآن خيار مجاني ومرن وآمن منظمة العفو الدولية.

لتبدأ ، إليك سبعة من أفضل LLMs المحلية / غير المتصلة بالإنترنت التي يمكنك استخدامها الآن!

1. هيرميس GPTQ

نموذج لغوي حديث تم ضبطه بدقة باستخدام مجموعة بيانات من 300000 تعليمات بواسطة Nous Research. تستند Hermes إلى Meta LlaMA2 LLM وتم ضبطها باستخدام معظم مخرجات GPT-4 الاصطناعية.

نموذج

هيرميس 13 ب GPTQ

حجم النموذج

7.26 غيغابايت

حدود

13 مليار

توضيح

4 بت

يكتب

LlaMA2

رخصة

GPL 3

يسمح استخدام LlaMA2 كنموذج أساسي لـ Hermes بمضاعفة حجم السياق أو أقصى حجم رمزي يبلغ 4096. من خلال إقران حجم السياق الطويل وبنية التشفير ، من المعروف أن Hermes يعطي استجابات طويلة ومعدلات هلوسة منخفضة. هذا يجعل من Hermes نموذجًا رائعًا للعديد

instagram viewer
معالجة اللغة الطبيعية (NLP) المهام ، مثل كتابة التعليمات البرمجية وإنشاء المحتوى وكونك روبوت محادثة.

هناك العديد من الكميات والإصدارات من Hermes GPTQ الجديد. نوصيك أولاً بتجربة طراز Hermes-Llama2 13B-GPTQ ، لأنه الإصدار الأسهل للنشر مع استمرار الأداء الرائع.

2. Falcon Instruct GPTQ

حقوق الصورة: John Schnobrich /Unsplash

تستند هذه النسخة الكمية من Falcon إلى بنية وحدة فك التشفير فقط التي تم ضبطها بدقة أعلى نموذج TII الخام Flacon-7b. تم تدريب نموذج Falcon الأساسي باستخدام 1.5 تريليون رمز مميز تم الحصول عليه عبر الإنترنت العام. كنموذج قائم على وحدة فك التشفير فقط مرخص بموجب Apache 2 ، يعد Falcon Instruct مثاليًا للشركات الصغيرة التي تبحث عن نموذج لاستخدامه في ترجمة اللغة وإدخال البيانات.

نموذج

Falcon-7B-Instruct

حجم النموذج

7.58 غيغابايت

حدود

7000000000

توضيح

4 بت

يكتب

فالكون

رخصة

اباتشي 2.0

ومع ذلك ، فإن هذا الإصدار من Falcon ليس مثاليًا للضبط الدقيق وهو للاستدلال فقط. إذا كنت ترغب في ضبط Falcon ، فسيتعين عليك استخدام النموذج الأولي ، والذي قد يتطلب الوصول إلى أجهزة تدريب على مستوى المؤسسات مثل NVIDIA DGX أو مسرعات AMD Instinct AI.

3.GPT4ALL-J جروفي

حقوق الصورة: Nubelson Fernandes /افصل

GPT4All-J Groovy هو نموذج مخصص لوحدة فك التشفير تم ضبطه بدقة بواسطة Nomic AI ومرخص بموجب Apache 2.0. يعتمد GPT4ALL-J Groovy على نموذج GPT-J الأصلي ، والذي يُعرف بكونه رائعًا في إنشاء النصوص من المطالبات. تم ضبط GPT4ALL -J Groovy كنموذج دردشة ، وهو أمر رائع لتطبيقات إنشاء النصوص السريعة والإبداعية. وهذا يجعل GPT4All-J Groovy مثاليًا لمنشئي المحتوى لمساعدتهم في الكتابة والأعمال الإبداعية ، سواء كانت شعرًا أو موسيقى أو قصصًا.

نموذج

GPT4ALL-J جروفي

حجم النموذج

3.53 جيجا بايت

حدود

7000000000

توضيح

4 بت

يكتب

GPT-J

رخصة

اباتشي 2.0

لسوء الحظ ، تم تدريب نموذج GPT-J الأساسي على مجموعة بيانات باللغة الإنجليزية فقط ، مما يعني أنه حتى طراز GPT4ALL-J الذي تم ضبطه بدقة يمكنه فقط الدردشة وتنفيذ تطبيقات إنشاء النصوص باللغة الإنجليزية.

4.WizardCoder-15B-GPTQ

حقوق الصورة: جيمس هاريسون /Unsplash

هل تبحث عن نموذج تم ضبطه خصيصًا للترميز؟ على الرغم من حجمه الأصغر إلى حد كبير ، يُعرف WizardCoder بأنه أحد أفضل نماذج الترميز التي تفوق النماذج الأخرى مثل LlaMA-65B و InstructCodeT5 + و CodeGeeX. تم تدريب هذا النموذج باستخدام طريقة Evol-Instruct الخاصة بالترميز ، والتي تقوم تلقائيًا بتحرير مطالباتك لتكون موجهًا أكثر فاعلية متعلقًا بالشفرة يمكن للنموذج فهمه بشكل أفضل.

نموذج

WizardCoder-15B-GPTQ

حجم النموذج

7.58 غيغابايت

حدود

15 مليار

توضيح

4 بت

يكتب

LlaMA

رخصة

بيج كود- openrail- م

نظرًا لأنه تم تقسيمه إلى نموذج مكون من 4 بتات ، يمكن الآن استخدام WizardCoder على أجهزة الكمبيوتر العادية ، حيث يمكن للأفراد استخدامه للتجريب وكمساعد ترميز لبرامج ونصوص أبسط.

5. Wizard Vicuna Uncensored-GPTQ

Wizard-Vicuna GPTQ هو نسخة كمية من Wizard Vicuna على أساس نموذج LlaMA. على عكس معظم LLMs التي تم إصدارها للجمهور ، فإن Wizard-Vicuna هو نموذج غير خاضع للرقابة مع إزالة محاذاة. هذا يعني أن النموذج لا يتمتع بنفس معايير السلامة والأخلاق مثل معظم النماذج.

نموذج

Wizard-Vicuna-30B-Uncensored-GPTQ

حجم النموذج

16.94 جيجا بايت

حدود

30 مليار

توضيح

4 بت

يكتب

LlaMA

رخصة

GPL 3

على الرغم من احتمال طرح ملف مشكلة التحكم في محاذاة الذكاء الاصطناعي، فإن امتلاك LLM غير خاضع للرقابة يبرز أيضًا أفضل ما في النموذج من خلال السماح له بالإجابة دون أي قيود. يتيح هذا أيضًا للمستخدمين إضافة محاذاة مخصصة لهم حول كيفية تصرف الذكاء الاصطناعي أو الإجابة عليه بناءً على موجه معين.

6. Orca Mini-GPTQ

حقوق الصورة: Alex Kondratiev /Unsplash

هل تتطلع إلى تجربة نموذج تم تدريبه على طريقة تعلم فريدة؟ Orca Mini هو تطبيق نموذج غير رسمي لأوراق بحث Orca من Microsoft. تم تدريبه باستخدام طريقة تعلم المعلم والطالب ، حيث كانت مجموعة البيانات مليئة بالتفسيرات بدلاً من المطالبات والاستجابات فقط. هذا ، من الناحية النظرية ، يجب أن ينتج عنه طالب أكثر ذكاءً ، حيث يمكن للنموذج فهم المشكلة بدلاً من مجرد البحث عن أزواج المدخلات والمخرجات مثل كيفية عمل LLM النموذجية.

نموذج

Orca Mini-GPTQ

حجم النموذج

8.11 جيجا بايت

حدود

3 بلايين

توضيح

4 بت

يكتب

LlaMA

رخصة

معهد ماساتشوستس للتكنولوجيا

مع ثلاثة مليارات معلمة فقط ، من السهل تشغيل Orca Mini GPTQ حتى على الأنظمة الأقل قوة. ومع ذلك ، لا ينبغي استخدام هذا النموذج لأي شخص محترف لأنه يولد معلومات خاطئة ، وردود متحيزة ومهينة. يجب استخدام هذا النموذج للتعلم والتجريب مع Orca وطرقها.

7.LlaMA 2 دردشة GPTQ

LlaMA 2 هو خليفة LlaMA LLM الأصلي ، الذي أنتج معظم الطرز في هذه القائمة. LlaMA 2 عبارة عن مجموعة من العديد من LLMs ، تم تدريب كل منها باستخدام 7-70 مليار معلمة. بشكل عام ، تم تدريب LlaMA 2 مسبقًا باستخدام 2 تريليون رمز من البيانات المأخوذة من مجموعات بيانات التعليمات المتاحة للجمهور.

نموذج

Falcon-40B-Instruct-GPTQ

حجم النموذج

7.26 غيغابايت

حدود

3 بلايين

توضيح

4 بت

يكتب

برنامج OpenLlaMA

رخصة

EULA (ترخيص Meta)

تم تصميم LlaMA 2 للاستخدام التجاري والبحثي. على هذا النحو ، يُفضل استخدام هذا النموذج بعد الضبط الدقيق للحصول على أداء أفضل في مهام محددة. تم تحسين نموذج GPTQ للدردشة LlaMA 2 المحدد وتحسينه للحوار باللغة الإنجليزية ، مما يجعله النموذج المثالي للشركات والمؤسسات ليكون روبوت محادثة مع القليل من التدريب الإضافي أو بدونه مطلوب. وفقًا للشروط ، يمكن للشركات التي لديها أقل من 700 مليون مستخدم استخدام LlaMA 2 دون دفع أي رسوم ترخيص من Meta أو Microsoft.

جرب نماذج اللغات المحلية الكبيرة اليوم

تحتوي بعض النماذج المذكورة أعلاه على عدة إصدارات من حيث المعلمات. بشكل عام ، تؤدي إصدارات المعلمات الأعلى إلى نتائج أفضل ولكنها تتطلب أجهزة أكثر قوة ، بينما تؤدي إصدارات المعلمات الأقل إلى نتائج ذات جودة أقل ولكن يمكن تشغيلها على أجهزة منخفضة النهاية. إذا لم تكن متأكدًا مما إذا كان الكمبيوتر الخاص بك يمكنه تشغيل النموذج ، فحاول الانتقال إلى إصدار المعلمة الأقل أولاً ، ثم استمر حتى تشعر أن انخفاض الأداء لم يعد مقبولاً.

نظرًا لأن النماذج الكمية في هذه القائمة لا تشغل سوى بضعة غيغابايت من المساحة ومنصات نشر النماذج مثل GPT4All و يمكن بسهولة تثبيت Text-Generation-WebUI من خلال أدوات التثبيت بنقرة واحدة ، وتجربة العديد من النماذج وإصدارات النماذج لا ينبغي أن تأخذ الكثير من الوقت والجهد.

فما تنتظرون؟ جرب نموذجًا محليًا اليوم!