تقوم وحدة المعالجة المركزية بجهازك بإجراء ملايين العمليات الحسابية كل ثانية وهي مسؤولة عن كيفية عمل جهاز الكمبيوتر الخاص بك. العمل مع وحدة المعالجة المركزية هو وحدة المعالجة الحسابية (ALU) ، وهي مسؤولة عن المهام الرياضية ويتم تشغيلها بواسطة الرمز الصغير لوحدات المعالجة المركزية.
الآن ، هذا الرمز الصغير لوحدة المعالجة المركزية ليس ثابتًا ويمكن تحسينه ، وكان أحد هذه التحسينات مجموعة تعليمات AVX-512 من Intel. ومع ذلك ، تم تعيين Intel لقتل AVX-512 ، وإزالة وظائفه من وحدات المعالجة المركزية الخاصة به إلى الأبد. لكن لماذا؟ لماذا تقتل إنتل AVX-512؟
كيف يعمل ALU؟
قبل التعرف على مجموعة تعليمات AVX-512 ، من الضروري فهم كيفية عمل وحدة ALU.
كما يوحي الاسم ، يتم استخدام وحدة المعالجة الحسابية لأداء المهام الرياضية. تتضمن هذه المهام عمليات مثل عمليات الجمع والضرب وحسابات الفاصلة العائمة. لإنجاز هذه المهام ، تستخدم ALU دارة رقمية خاصة بالتطبيقات ، والتي تحركها إشارة الساعة لوحدة المعالجة المركزية.
لذلك ، تحدد سرعة ساعة وحدة المعالجة المركزية معدل معالجة التعليمات في ALU. لذلك ، إذا كانت وحدة المعالجة المركزية الخاصة بك تعمل بتردد ساعة 5 جيجاهرتز ، فيمكن لوحدة ALU معالجة 5 مليارات تعليمات في ثانية واحدة. لهذا السبب ، يتحسن أداء وحدة المعالجة المركزية مع زيادة سرعة الساعة.
ومع ذلك ، مع زيادة سرعة ساعة وحدة المعالجة المركزية ، تزداد كمية الحرارة التي تولدها وحدة المعالجة المركزية. لهذا السبب ، يستخدم مستخدمو الطاقة النيتروجين السائل عند رفع تردد التشغيل على أنظمتهم. لسوء الحظ ، تمنع هذه الزيادة في درجة الحرارة عند الترددات العالية الشركات المصنعة لوحدة المعالجة المركزية من زيادة تردد الساعة فوق حد معين.
إذن كيف يقدم معالج الجيل الجديد أداءً أفضل مقارنةً بالتكرارات القديمة؟ حسنًا ، يستخدم مصنعو وحدة المعالجة المركزية مفهوم التوازي لتعزيز الأداء. يمكن تحقيق هذا التوازي باستخدام بنية متعددة النواة حيث يتم استخدام العديد من نوى المعالجة المختلفة لتحسين القوة الحسابية لوحدة المعالجة المركزية.
هناك طريقة أخرى لتحسين الأداء وهي استخدام مجموعة تعليمات SIMD. بعبارات بسيطة ، تُمكِّن تعليمات البيانات المتعددة ذات التعليمات الفردية وحدة ALU من تنفيذ نفس التعليمات عبر نقاط بيانات مختلفة. يعمل هذا النوع من التوازي على تحسين أداء وحدة المعالجة المركزية ، و AVX-512 عبارة عن تعليمات SIMD تُستخدم لتعزيز أداء وحدة المعالجة المركزية عند أداء مهام محددة.
كيف تصل البيانات إلى ALU؟
الآن بعد أن أصبح لدينا فهم أساسي لكيفية عمل ALU ، نحتاج إلى فهم كيفية وصول البيانات إلى ALU.
للوصول إلى ALU ، يجب أن تنتقل البيانات عبر أنظمة تخزين مختلفة. تعتمد رحلة البيانات هذه على التسلسل الهرمي لذاكرة نظام الحوسبة. فيما يلي لمحة موجزة عن هذا التسلسل الهرمي:
- الذاكرة الثانوية: تتكون الذاكرة الثانوية على جهاز الكمبيوتر من جهاز تخزين دائم. يمكن لهذا الجهاز تخزين البيانات بشكل دائم ولكن ليس بنفس سرعة وحدة المعالجة المركزية. نتيجة لذلك ، لا تستطيع وحدة المعالجة المركزية الوصول إلى البيانات مباشرة من نظام التخزين الثانوي.
- ذاكرة الابتدائية: يتكون نظام التخزين الأساسي من ذاكرة الوصول العشوائي (RAM). يعد نظام التخزين هذا أسرع من نظام التخزين الثانوي ولكن لا يمكنه تخزين البيانات بشكل دائم. لذلك ، عندما تفتح ملفًا على نظامك ، فإنه ينتقل من القرص الصلب إلى ذاكرة الوصول العشوائي. ومع ذلك ، حتى ذاكرة الوصول العشوائي ليست سريعة بما يكفي لوحدة المعالجة المركزية.
- الذاكرة المؤقتة: يتم تضمين ذاكرة التخزين المؤقت في وحدة المعالجة المركزية وهي أسرع نظام ذاكرة على الكمبيوتر. ينقسم نظام الذاكرة هذا إلى ثلاثة أجزاء ، وهي ذاكرة التخزين المؤقت L1 و L2 و L3. أي بيانات تحتاج إلى المعالجة بواسطة ALU تنتقل من القرص الصلب إلى ذاكرة الوصول العشوائي ثم إلى ذاكرة التخزين المؤقت. ومع ذلك ، لا يمكن لـ ALU الوصول إلى البيانات مباشرة من ذاكرة التخزين المؤقت.
- سجلات وحدة المعالجة المركزية: يعد سجل وحدة المعالجة المركزية (CPU) على جهاز كمبيوتر صغير الحجم للغاية ، وبناءً على بنية الكمبيوتر ، يمكن أن تحتوي هذه السجلات على 32 أو 64 بتًا من البيانات. بمجرد انتقال البيانات إلى هذه السجلات ، يمكن لـ ALU الوصول إليها وتنفيذ المهمة المطروحة.
ما هو AVX-512 وكيف يعمل؟
مجموعة تعليمات AVX 512 هي التكرار الثاني لـ AVX وشقت طريقها إلى معالجات Intel في عام 2013. اختصار لـ Advanced Vector Extensions ، تم تقديم مجموعة تعليمات AVX لأول مرة في Intel's Xeon معمارية Phi (Knights Landing) وتم تحويلها لاحقًا إلى معالجات خادم Intel في Skylake-X وحدات المعالجة المركزية.
بالإضافة إلى ذلك ، شقت مجموعة تعليمات AVX-512 طريقها إلى الأنظمة المستندة إلى المستهلك مع هندسة Cannon Lake وتم دعمها لاحقًا من خلال أبنية Ice Lake و Tiger Lake.
كان الهدف الرئيسي لمجموعة التعليمات هذه هو تسريع المهام التي تتضمن ضغط البيانات ومعالجة الصور وحسابات التشفير. تقدم مجموعة تعليمات AVX-512 قوة حسابية مضاعفة مقارنة بالتكرارات القديمة ، وتوفر مكاسب كبيرة في الأداء.
إذن ، كيف ضاعفت Intel أداء وحدات المعالجة المركزية الخاصة بها باستخدام بنية AVX-512؟
حسنًا ، كما أوضحنا سابقًا ، لا يمكن لـ ALU الوصول إلا إلى البيانات الموجودة في سجل وحدة المعالجة المركزية. تزيد مجموعة تعليمات Advanced Vector Extensions من حجم هذه السجلات.
نظرًا لهذه الزيادة في الحجم ، يمكن لوحدة ALU معالجة نقاط بيانات متعددة في تعليمات واحدة ، مما يؤدي إلى زيادة أداء النظام.
من حيث حجم التسجيل ، توفر مجموعة تعليمات AVX-512 32 تسجيلًا بسعة 512 بت ، وهو ضعف عند مقارنته بمجموعة تعليمات AVX الأقدم.
لماذا تنتهي إنتل AVX-512؟
كما أوضحنا سابقًا ، توفر مجموعة تعليمات AVX-512 العديد من المزايا الحسابية. في الواقع ، تستخدم المكتبات الشائعة مثل TensorFlow مجموعة التعليمات لتوفير عمليات حسابية أسرع على وحدات المعالجة المركزية التي تدعم مجموعة التعليمات.
إذن ، لماذا تقوم Intel بتعطيل AVX-512 على معالجات Alder Lake الأخيرة؟
حسنًا ، تختلف معالجات Alder Lake عن المعالجات القديمة التي تنتجها Intel. بينما تستخدم الأنظمة القديمة نوى تعمل على نفس البنية ، تستخدم معالجات Alder Lake قلبين مختلفين. تُعرف هذه النوى في وحدات المعالجة المركزية لبحيرة Alder باسم P و E- النوى وهي مدعومة ببنى مختلفة.
بينما تستخدم النوى P الهندسة المعمارية الدقيقة لـ Golden Cove ، تستخدم النوى الإلكترونية الهندسة المعمارية المصغرة لـ Gracemont. يمنع هذا الاختلاف في البنى برنامج الجدولة من العمل بشكل صحيح عندما يمكن تشغيل تعليمات معينة على بنية واحدة ولكن ليس على الأخرى.
في حالة معالجات Alder Lake ، فإن مجموعة تعليمات AVX-512 هي أحد الأمثلة ، حيث أن P-cores لديها الأجهزة اللازمة لمعالجة التعليمات ، لكن النوى الإلكترونية ليست كذلك.
لهذا السبب ، لا تدعم وحدات المعالجة المركزية Alder Lake مجموعة تعليمات AVX-512.
ومع ذلك ، يمكن تشغيل تعليمات AVX-512 على بعض معالجات Alder Lake CPU حيث لم تقم Intel بدمجها فعليًا. للقيام بالشيء نفسه ، يتعين على المستخدمين تعطيل النوى الإلكترونية أثناء BIOS.
هل هناك حاجة إلى AVX-512 على مجموعات شرائح المستهلك؟
تزيد مجموعة تعليمات AVX-512 من حجم سجل وحدة المعالجة المركزية لتحسين أدائها. يتيح هذا التعزيز في الأداء لوحدات المعالجة المركزية معالجة الأرقام بشكل أسرع ، مما يسمح للمستخدمين بتشغيل خوارزميات ضغط الفيديو / الصوت بسرعات أعلى.
ومع ذلك ، لا يمكن ملاحظة هذا التعزيز في الأداء إلا عندما يتم تحسين التعليمات المحددة في البرنامج للتشغيل على مجموعة تعليمات AVX-512.
لهذا السبب ، فإن بنيات مجموعة التعليمات مثل AVX-512 هي أكثر ملاءمة لأحمال عمل الخادم ، ويمكن أن تعمل شرائح المستهلك بدون مجموعات تعليمات معقدة مثل AVX-512.