القراء مثلك يساعدون في دعم MUO. عند إجراء عملية شراء باستخدام الروابط الموجودة على موقعنا ، فقد نربح عمولة تابعة. اقرأ أكثر.

ChatGPT عبارة عن روبوت محادثة AI غيرت قواعد اللعبة من OpenAI والذي يبقي الإنترنت مندهشًا. مقابل كل الاتجاهات التقنية الراسخة ، لم يمض وقت طويل حتى تجد ChatGPT طريقها إلى كل مجال تقريبًا من مجالات حياتنا الرقمية.

حظي عدد قليل جدًا من الابتكارات التقنية بالاهتمام الذي حققته ChatGPT في مثل هذا الوقت القصير. يبدو أن الحيل الرائعة لم تنفد أبدًا - نتعلم كل يوم أشياء جديدة ومثيرة لم نكن نعرف أنها يمكن أن تفعلها.

ولكن كيف يمكن لـ ChatGPT القيام بالأشياء التي يمكنه القيام بها؟ كيف يعمل ChatGPT؟

كيف تم إنشاء ChatGPT؟

لفهم كيفية عمل ChatGPT ، يجدر النظر في أصوله والدماغ الذي يقف وراء روبوت الدردشة المزود بالذكاء الاصطناعي.

أولاً ، على الرغم من السحر الذي قد يبدو عليه ChatGPT ، فقد تم إنشاؤه بواسطة عبقرية البشر ، تمامًا مثل كل تقنية برمجية جديرة بالاهتمام موجودة هناك. قامت شركة OpenAI بإنشاء ChatGPT ، الشركة الثورية للبحث والتطوير في مجال الذكاء الاصطناعي التي تقف وراء أدوات الذكاء الاصطناعي القوية الأخرى مثل DALL-E و InstructGPT و Codex. لقد أجبنا سابقا

instagram viewer
بعض الأسئلة التي قد تكون لديك حول ChatGPT، لذلك قم بإلقاء نظرة.

بينما انتشر ChatGPT في نهاية عام 2022 ، إلا أن معظم التكنولوجيا الأساسية التي تدعم ChatGPT كانت موجودة لفترة أطول بكثير ، على الرغم من أنها كانت أقل شهرة. تم بناء نموذج ChatGPT أعلى GPT-3 (أو بشكل أكثر تحديدًا ، GPT-3.5). GPT تعني "Generative Pre-trainer Transformer 3."

GPT-3 هو التكرار الثالث لخط GPT لنماذج الذكاء الاصطناعي وسبقه GPT-2 و GPT. تعد التكرارات السابقة لنماذج GPT مفيدة أيضًا ، لكن GPT-3 وتكرار GPT-3.5 المضبوط بدقة أكثر قوة. معظم ما يمكن أن يفعله ChatGPT يرجع إلى تقنية GPT-3 الأساسية.

ما هو GPT؟

لذا فقد أثبتنا أن ChatGPT مبني على الجيل الثالث من نموذج GPT. لكن ما هو GPT على أي حال؟

لنبدأ بتفريغ المختصرات بطريقة سهلة الفهم وغير تقنية.

  • يمثل "Generative" في GPT قدرته على إنشاء نص بلغة بشرية طبيعية.
  • يمثل "التدريب المسبق" حقيقة أن النموذج قد تم تدريبه بالفعل على مجموعة بيانات محدودة. يشبه إلى حد كبير قراءة كتاب أو ربما عدة كتب قبل أن يُطلب منك الإجابة عن أسئلة حوله.
  • يمثل "Transformer" بنية التعلم الآلي الأساسية التي تشغل GPT.

الآن ، بتجميع كل ذلك معًا ، فإن المحولات التوليدية المدربة مسبقًا (GPT) هي نموذج لغوي كان كذلك تم تدريبهم باستخدام بيانات من الإنترنت بهدف إنشاء نص بلغة بشرية عند تقديمه مع أ اِسْتَدْعَى. لذلك ، قلنا مرارًا وتكرارًا أن GPT تم تدريبه ، ولكن كيف تم تدريبه؟

كيف تم تدريب ChatGPT؟

لم يتم تدريب ChatGPT نفسها من الألف إلى الياء. بدلاً من ذلك ، إنها نسخة معدلة بدقة من GPT-3.5 ، والتي هي في حد ذاتها نسخة مضبوطة من GPT-3. تم تدريب نموذج GPT-3 بكمية هائلة من البيانات التي تم جمعها من الإنترنت. فكر في Wikipedia و Twitter و Reddit - فقد تم تغذيتها بالبيانات والنصوص البشرية المأخوذة من جميع أنحاء الإنترنت.

إذا كنت تتساءل عن كيفية عمل تدريب GPT ، فقد تم تدريب GPT-3 باستخدام مزيج من التعلم الخاضع للإشراف والتعلم المعزز من خلال التعليقات البشرية (RLHF). التعلم الخاضع للإشراف هو المرحلة التي يتم فيها تدريب النموذج على مجموعة بيانات كبيرة من النصوص المأخوذة من الإنترنت. مرحلة التعلم المعزز هي المكان الذي يتم فيه تدريبه على إنتاج استجابات أفضل تتماشى مع ما قد يقبله البشر على أنه شبيه بالإنسان وصحيح.

التدريب مع التعلم الخاضع للإشراف

لفهم كيفية تطبيق التعلم الخاضع للإشراف والمعزز بشكل أفضل على ChatGPT ، تخيل سيناريو حيث يتم تعليم الطالب كتابة مقال بواسطة المعلم. سيكون التعلم الخاضع للإشراف معادلاً لإعطاء المعلم للطالب مئات المقالات للقراءة. الهدف هنا هو أن يتعلم الطالب كيف يجب كتابة مقال من خلال التعود على نبرة ومفردات وهيكل مئات المقالات.

ومع ذلك ، سيكون هناك جيد وسيئ من بين تلك المئات من المقالات. نظرًا لتدريب الطالب على كل من النسخ الجيدة والسيئة ، في بعض الأحيان ، قد يكتب الطالب مقالًا سيئًا لأن الطالب قد تم تغذيته أيضًا بمقالات سيئة في مرحلة ما. هذا يعني أنه عندما يُطلب منك كتابة مقال ، قد يكتب الطالب نسخة غير مقبولة أو جيدة بما يكفي للمعلم. هذا هو المكان الذي يأتي فيه التعلم المعزز.

التدريب مع التعلم المعزز

بمجرد أن يثبت المعلم أن الطالب يفهم القواعد العامة لكتابة المقالات من خلال قراءة مئات المقالات ، يقوم المعلم بعد ذلك بإعطاء الطالب واجبات منزلية لكتابة المقالات بشكل متكرر. بعد ذلك ، سيقدم المعلم ملاحظات على الواجب المنزلي لكتابة المقالة ، ويخبر الطلاب بما قاموا به جيدًا وما يمكنهم تحسينه. يستخدم الطالب الملاحظات لتوجيه الواجب المنزلي التالي لكتابة المقالات ، مما يساعد الطالب على التحسن بمرور الوقت.

هذا مشابه لمرحلة التعلم المعزز لتدريب نموذج GPT. بعد تلقي كمية هائلة من النصوص المأخوذة من الإنترنت ، يمكن للنموذج الإجابة على الأسئلة. ومع ذلك ، فإن دقتها لن تكون جيدة بما فيه الكفاية. يسأل المدربون البشريون النموذج سؤالاً ويقدمون ملاحظات حول الإجابة الأكثر ملاءمة لكل سؤال.

يستخدم النموذج التغذية الراجعة لتحسين قدرته على الإجابة على الأسئلة بشكل أكثر دقة وأكثر مثل كيفية استجابة الإنسان. هذه هي الطريقة التي يمكن بها لـ ChatGPT توليد استجابات تبدو بشرية تكون متماسكة وجذابة ودقيقة بشكل عام.

كيف يمكن لـ ChatGPT الإجابة على الأسئلة؟

لذلك ، تقوم بزيارة موقع ChatGPT وتسجيل الدخول. تطالب ChatGPT: "اكتب أغنية راب بأسلوب Snoop Dogg." يستجيب بكلمات لأغنية راب تشبه إلى حد كبير ما يكتبه سنوب دوج. كيف يكون هذا ممكنا؟

حسنًا ، "السحر" وراء ChatGPT يربط بدقة في تدريبه.

بعد تغطية كل شبر من كتابك المدرسي فيزياء 101 ، هناك فرصة جيدة لأن تتمكن من الإجابة على أي سؤال يتم طرحه عليك. لماذا؟ لأنك قرأته وتعلمته. إنه نفس الشيء مع ChatGPT - إنه يتعلم. وكما أظهرت الحضارة الإنسانية ، مع التدريب الكافي ، فإن حل أي مشكلة تقريبًا ممكن.

بينما يمكنك على الأرجح إدارة مئات الكتب في حياتك ، فإن ChatGPT أو GPT قد استهلكت بالفعل جزءًا كبيرًا من الإنترنت. هذه ثروة هائلة من المعلومات. هناك ، في مكان ما ، ربما تكون كلمات لأغاني Snoop Dogg العديدة. لذلك ، بالطبع ، لا بد أن ChatGPT قد استهلكها (تذكر ، أنها مدربة مسبقًا) وأنماط متعارف عليها في كلمات Snoop Dogg. ثم يستخدم "المعرفة" بهذا النمط "للتنبؤ" بكلمات أغنية مشابهة لما سيكتبه سنوب دوج.

ينصب التركيز هنا على "توقع". لا يجيب ChatGPT على الأسئلة بنفس الطريقة التي يجيب بها البشر. على سبيل المثال ، عند مواجهة سؤال مثل ، "ما هي عاصمة البرتغال؟" يمكنك قول لشبونة وقلها من أجل "حقيقة". ومع ذلك ، فإن ChatGPT لا يجيب على الأسئلة بدقة 100٪. بدلاً من ذلك ، يحاول التنبؤ بالإجابة الصحيحة بالنظر إلى البيانات التي استهلكها في مجموعة بيانات التدريب الخاصة به.

نهج ChatGPT للإجابة على الأسئلة

لفهم مفهوم التنبؤ بالردود بشكل أفضل ، تخيل أن يكون ChatGPT محققًا مكلفًا بحل جريمة قتل. يتم عرض الأدلة على المحقق ، لكنهم لا يعرفون من ارتكب جريمة القتل وكيف حدثت. ومع ذلك ، مع وجود أدلة كافية ، يمكن للمحقق أن "يتوقع" بدقة كبيرة من المسؤول عن القتل وكيف تم ارتكاب الجريمة.

بعد استهلاك البيانات من الإنترنت ، يتجاهل ChatGPT البيانات الأصلية ويخزن الاتصالات أو الأنماط العصبية التي تعلمها من البيانات. هذه الروابط أو الأنماط هي بمثابة أدلة تحللها ChatGPT عندما تحاول الاستجابة لأي مطالبة.

لذا ، من الناحية النظرية ، فإن ChatGPT مثل المخبر الجيد جدًا. إنه لا يعرف على وجه اليقين ما هي الحقائق التي يجب أن تكون عليها الإجابة ، لكنه يحاول ، بشكل مثير للإعجاب الدقة ، للتنبؤ بالتسلسل المنطقي لنص اللغة البشرية الذي من شأنه أن يجيب بشكل مناسب أكثر على سؤال. هذه هي الطريقة التي تحصل بها على إجابات لأسئلتك.

وهذا هو السبب أيضًا في أن بعض هذه الإجابات تبدو مقنعة جدًا ولكنها خاطئة تمامًا.

ChatGPT: الإجابات مثل الإنسان ، يفكر مثل الآلة

التفاصيل الفنية الأساسية لـ ChatGPT معقدة. ومع ذلك ، من وجهة نظر بدائية ، فإنه يعمل من خلال التعلم وإعادة إنتاج ما تعلمه عند الطلب ، تمامًا كما نفعل كبشر.

مع تطور ChatGPT من خلال البحث ، قد تتغير طريقة عمله. ومع ذلك ، ستظل مبادئ العمل التأسيسية كما هي لبعض الوقت ، على الأقل حتى تظهر تقنية جديدة معطلة.