لا تزال الجداول المحورية من بين الأدوات الأكثر احترامًا والأكثر استخدامًا في MS Excel. سواء كنت محلل بيانات أو مهندس بيانات أو مجرد مستخدم عادي ، فمن المحتمل أن يكون لديك بالفعل نقطة ضعف لبرنامج MS Excel.
ومع ذلك ، هناك مجال متزايد لتكرار أدوات وأدوات مساعدة MS Excel ، خاصة في Python. هل تعلم أنه يمكنك إنشاء جداول محورية شاملة في إطارات بيانات Python ببضعة أسطر من التعليمات البرمجية نفسها؟
نعم هذا صحيح؛ إذا كنت مفتونًا ، فإليك كيفية القيام بذلك.
المتطلبات المسبقة لإنشاء الجداول المحورية
مثل أي لغة برمجة أخرى ، حتى Python تحتاج إلى تلبية بعض المتطلبات المسبقة قبل أن تتمكن من الوصول إلى البرمجة.
للحصول على أفضل تجربة أثناء إنشاء أول جدول محوري في Python ، إليك ما ستحتاج إليه:
- Python IDE: تحتوي معظم أكواد Python على بيئة تطوير متكاملة (IDE) مثبتة مسبقًا على نظامها. هناك العديد IDEs المتوافقة مع Python في السوق، بما في ذلك Jupyter Notebook و Spyder و PyCharm وغيرها الكثير.
- بيانات العينة: للتوضيح ، إليك نموذج لمجموعة بيانات يمكنك العمل عليها. بدلاً من ذلك ، لا تتردد في تعديل هذه الرموز مباشرة على بياناتك الحية.
رابط نموذج البيانات:عينة سوبرستور
استيراد المكتبات الأساسية
نظرًا لأن Python تعمل على مفهوم مكتبات الجهات الخارجية ، فأنت بحاجة إلى استيراد ملف الباندا مكتبة لإنشاء المحاور.
يمكنك استخدام Pandas ل قم باستيراد ملف Excel إلى Python وتخزين البيانات في DataFrame. لاستيراد الباندا ، استخدم ملف يستورد الأمر بالطريقة التالية:
يستورد الباندا كما pd
كيفية إنشاء النقاط المحورية في بايثون
نظرًا لأن المكتبة متاحة الآن ، فأنت بحاجة إلى استيراد ملف Excel إلى Python ، وهو الأساس لإنشاء واختبار المحاور في Python. قم بتخزين البيانات المستوردة في DataFrame بالرمز التالي:
# إنشاء DataFrame جديد
# استبدل المسار الخاص بك هنا
المسار = "C: // المستخدمون // المستخدم / OneDrive // سطح المكتب //"
# يمكنك تحديد اسم الملف هنا
ملف = "عينة - Superstore.xls"
df = pd.read_excel (مسار + ملف)
مدافع.رأس()
أين:
- df: اسم المتغير لتخزين بيانات DataFrame
- pd: الاسم المستعار لمكتبة الباندا
- read_excel (): وظيفة Pandas لقراءة ملف Excel إلى Python
- طريق: موقع تخزين ملف Excel (نموذج Superstore)
- ملف: اسم الملف المراد استيراده
- رأس(): يعرض الصفوف الخمسة الأولى من DataFrame افتراضيًا
يستورد الكود أعلاه ملف Excel إلى Python ويخزن البيانات في DataFrame. وأخيرا، فإن رأس تعرض الوظيفة الصفوف الخمسة الأولى من البيانات.
هذه الوظيفة مفيدة لضمان استيراد البيانات بشكل صحيح إلى Python.
ما هي حقول الجدول المحوري الموجودة في بايثون؟
مثل نظيره في Excel ، يحتوي الجدول المحوري على مجموعة مماثلة من الحقول في Python. فيما يلي بعض الحقول التي تحتاج إلى معرفتها:
- بيانات: يشير حقل البيانات إلى البيانات المخزنة في Python DataFrame
- قيم: البيانات العمودية المستخدمة داخل المحور
- فِهرِس: عمود (أعمدة) فهرس لتجميع البيانات
- الأعمدة: تساعد الأعمدة في تجميع البيانات الموجودة داخل إطار البيانات
الغرض من وراء استخدام وظيفة الفهرس
نظرًا لأن وظيفة الفهرس هي العنصر الأساسي في الجدول المحوري ، فإنها تعرض التنسيق الأساسي للبيانات. بمعنى آخر ، يمكنك تجميع بياناتك مع ملف فهرس وظيفة.
لنفترض أنك تريد رؤية بعض القيم المجمعة للمنتجات المدرجة ضمن قطعة عمودي. يمكنك حساب التجميع المحدد مسبقًا (القيمة المتوسطة) في Python عن طريق تحديد الأعمدة المعينة كقيمة anindex.
df.pivot_table (الفهرس = "قطعة")
أين:
- مدافع: DataFrame يحتوي على البيانات
- جدول محوري: دالة الجدول المحوري في بايثون
- فهرس: دالة مضمنة لتعريف العمود كفهرس
- قطعة: العمود المراد استخدامه كقيمة فهرس
أسماء المتغيرات في Python حساسة لحالة الأحرف ، لذا تجنب الانتقال بعيدًا عن أسماء المتغيرات المحددة مسبقًا المدرجة في هذا الدليل.
كيفية استخدام قيم الفهارس المتعددة
عندما تريد استخدام عدة أعمدة فهرس ، يمكنك تحديد أسماء الأعمدة في ملف قائمة ضمن دالة الفهرس. كل ما عليك فعله هو تحديد أسماء الأعمدة داخل مجموعة من أقواس مربعة ([ ])، كما هو مبين أدناه:
df.pivot_table (الفهرس = ["فئة", "تصنيف فرعي"])
تقوم الدالة المحورية بوضع مسافة بادئة لعمود الفهرس في الإخراج. تعرض Python ملف يعني لجميع القيم العددية مقابل كل قيمة مؤشر.
تعلم كيفية تقييد القيم في الإخراج
نظرًا لأن Python تختار جميع الأعمدة الرقمية افتراضيًا ، يمكنك تقييد القيم لتعديل النتائج المعروضة في الإخراج النهائي. استخدم ال القيم وظيفة لتحديد الأعمدة التي ترغب في رؤيتها.
df.pivot_table (الفهرس = ["منطقة", "فئة", "تصنيف فرعي"] ، القيم = "مبيعات")
في الإخراج النهائي ، سيكون هناك ثلاثة أعمدة فهرس ، والقيم المتوسطة لعمود المبيعات محرض مقابل كل عنصر.
تعريف الدالات التجميعية في الجدول المحوري
ماذا يحدث عندما لا تريد حساب القيم المتوسطة افتراضيًا؟ يحتوي الجدول المحوري على الكثير من الوظائف الأخرى ، والتي تمتد إلى ما بعد حساب المتوسط البسيط.
إليك كيفية كتابة الكود:
df.pivot_table (الفهرس = ["فئة"] ، القيم = "مبيعات"، aggfunc = [sum، max، min، len])
أين:
- مجموع: تحسب مجموع القيم
- الأعلى: تحسب القيمة القصوى
- الحد الأدنى: تحسب القيمة القصوى
- لين: تحسب عدد القيم
يمكنك أيضًا تحديد كل من هذه الوظائف في سطور منفصلة من التعليمات البرمجية.
كيفية إضافة الإجماليات الكلية إلى الجدول المحوري
لا يوجد أصل بيانات مكتمل بدون المجاميع الكلية. لحساب المجاميع الكلية وعرضها لكل عمود بيانات ، استخدم هوامش و هوامش_اسم وظيفة.
df.pivot_table (الفهرس = ["فئة"] ، القيم = "مبيعات"، aggfunc = [sum، max، min، len]، الهوامش = True، Marins_name ='المجاميع الكبرى')
أين:
- هوامش: وظيفة لحساب المجموع الكلي
- هوامش_اسم: حدد اسم الفئة في عمود الفهرس (على سبيل المثال ، الإجماليات الكلية)
تعديل واستخدام الكود النهائي
إليك ملخص الكود النهائي:
يستورد الباندا كما pd
# استبدل المسار الخاص بك هنا
المسار = "C: // المستخدمون // المستخدم / OneDrive // سطح المكتب //"
# يمكنك تحديد اسم الملف هنا
ملف = "عينة - Superstore.xls"
df = pd.read_excel (مسار + ملف)
df.pivot_table (الفهرس = ["منطقة", "فئة", "تصنيف فرعي"] ، القيم = "مبيعات",
aggfunc = [sum، max، min، len] ،
هوامش =حقيقي,
هوامش_اسم ='المجاميع الكبرى')
إنشاء الجداول المحورية في بايثون
عندما تستخدم الجداول المحورية ، فإن الخيارات ببساطة لا حصر لها. تتيح لك Python التعامل بسهولة مع مصفوفات البيانات الضخمة دون القلق بشأن تناقض البيانات وتأخر النظام.
نظرًا لأن وظائف Python لا تقتصر فقط على تكثيف البيانات في نقاط محورية ، يمكنك دمج العديد من مصنفات وأوراق Excel ، أثناء تنفيذ سلسلة من الوظائف ذات الصلة باستخدام Python.
مع بايثون ، هناك شيء جديد يلوح في الأفق دائمًا.