بايثون ، كلغة ، لها قيمة لا تُقاس ، خاصة عندما تريد العمل مع البيانات المنظمة. نظرًا لأن الأشخاص يقومون بتخزين الكثير من البيانات في ملفات Excel ، فمن الضروري دمج ملفات متعددة لتوفير الوقت والجهد.
تتيح لك Python القيام بذلك بالضبط ؛ بغض النظر عن عدد ملفات Excel التي تريد دمجها ، يمكنك القيام بذلك بسهولة نسبية. نظرًا لمجموعتها من المكتبات وموارد الجهات الخارجية ، يمكنك استيراد أدوات Python متعددة الأوجه واستخدامها لإجراء عروض التسعير الخاصة بك.
في هذا الدليل ، ستحتاج إلى تثبيت واستخدام مكتبات Pandas لاستيراد البيانات إلى Python قبل دمجها.
قم بتثبيت مكتبات Pandas في Python
Pandas هي مكتبة تابعة لجهة خارجية يمكنك تثبيتها في Python. تحتوي بعض IDEs بالفعل على Pandas مثبتة فيها.
إذا كنت تستخدم ملف إصدار IDE لا يأتي مع Pandas مثبتة مسبقًا ، كن مطمئنًا ، يمكنك تثبيته مباشرة في Python.
إليك كيفية تثبيت Pandas:
نقطة تثبيت الباندا
إذا كنت تستخدم Jupyter Notebook ، فيمكنك تثبيت Pandas مباشرةً باستخدام ملف أمر PIP. في الغالب ، عند تثبيت Jupyter مع Anaconda ، هناك فرص كبيرة لوجود Pandas بالفعل للاستخدام المباشر.
إذا لم تتمكن من الاتصال بـ Pandas ، فيمكنك استخدام الأمر أعلاه لتثبيتها مباشرة.
دمج ملفات Excel مع Python
أولاً ، تحتاج إلى إنشاء مجلد في موقعك المفضل مع جميع ملفات Excel. بمجرد أن يصبح المجلد جاهزًا ، يمكنك البدء في كتابة التعليمات البرمجية لاستيراد المكتبات.
ستستخدم متغيرين في هذا الكود:
- الباندا: توفر مكتبة Pandas إطارات البيانات لتخزين ملفات Excel.
- نظام التشغيل: المكتبة مفيدة لقراءة البيانات من مجلد جهازك
لاستيراد هذه المكتبات ، استخدم هذه الأوامر:
استيراد الباندا كملف pd
استيراد نظام التشغيل
- يستورد: تُستخدم صيغة Python لاستيراد المكتبات في Python
- الباندا: اسم المكتبة
- pd: الاسم المستعار المعطى للمكتبة
- نظام التشغيل: مكتبة للوصول إلى مجلد النظام
بمجرد قيامك باستيراد المكتبات ، قم بإنشاء متغيرين لتخزين مسار ملف الإدخال والإخراج. هناك حاجة إلى مسار ملف الإدخال للوصول إلى مجلد الملفات. مسار ملف الإخراج ضروري حيث سيتم تصدير الملف المدمج هناك.
إذا كنت تستخدم Python ، فتأكد من تغيير الشرطة المائلة للخلف إلى شرطة مائلة للأمام (\ ل /)
input_file_path = "C: / Users / gaurav / OneDrive / Desktop / Excel files /"
output_file_path = "C: / Users / gaurav / OneDrive / سطح المكتب /"
إلحاق / في النهاية أيضًا لإكمال المسارات.
ملفات المجلد متوفرة في قائمة. قم بإنشاء قائمة لتخزين جميع مراجع الملفات الخاصة بمجلد الإدخال باستخدام ملحق listdir وظيفة من نظام التشغيل مكتبة.
إذا لم تكن متأكدًا من الوظائف المتاحة داخل مكتبة ، فيمكنك استخدام ملحق دير وظيفة مع اسم المكتبة. على سبيل المثال ، للتحقق من الإصدار الدقيق لوظيفة listdir ، يمكنك استخدام الأمر كما يلي:
دير (نظام التشغيل)
سيتألف الإخراج من جميع الوظائف المرتبطة المتاحة داخل مكتبة نظام التشغيل. تعد وظيفة listdir واحدة من العديد من الوظائف المتاحة داخل هذه المكتبة.
قم بإنشاء متغير جديد لتخزين ملفات الإدخال من المجلد.
excel_file_list = os.listdir (input_file_path)
اطبع هذا المتغير لرؤية أسماء الملفات المخزنة داخل المجلد. يتم عرض جميع الملفات المخزنة داخل المجلد بمجرد استخدام وظيفة الطباعة.
طباعة (excel_file_list)
بعد ذلك ، تحتاج إلى إضافة إطار بيانات جديد لتخزين كل ملف Excel. تخيل إطار بيانات كحاوية لتخزين البيانات. إليك أمر إنشاء إطار بيانات.
df = pd. إطار البيانات ()
- df: متغير لتخزين قيمة DataFrame
- pd: الاسم المستعار لـ مكتبة الباندا
- إطار البيانات: بناء الجملة الافتراضي لإضافة إطار بيانات
يحتوي مجلد الإدخال على ثلاثة ملفات .xlsx الملفات في هذا المثال. أسماء الملفات هي:
File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx
لفتح كل ملف من هذا المجلد ، تحتاج إلى تشغيل حلقة. سيتم تشغيل الحلقة لكل ملف من الملفات الموجودة في القائمة التي تم إنشاؤها أعلاه.
إليك كيف يمكنك القيام بذلك:
لملفات excel في excel_file_list:
بعد ذلك ، من الضروري التحقق من امتدادات الملفات لأن الكود سيفتح ملفات XLSX فقط. للتحقق من هذه الملفات ، يمكنك استخدام امتداد إذا بيان.
استخدم ال ينتهي لهذا الغرض ، على النحو التالي:
لملفات excel في excel_file_list:
إذا كان excel_files.endswith (". xlsx"):
- ملفات_ Excel: قائمة بجميع قيم الملف
- ينتهي بـ: وظيفة للتحقق من امتداد الملفات
- (".xlsx"): يمكن أن تتغير قيمة السلسلة ، اعتمادًا على ما تريد البحث عنه
الآن بعد أن حددت ملفات Excel ، يمكنك إنشاء إطار بيانات جديد لقراءة الملفات وتخزينها بشكل فردي.
لملفات excel في excel_file_list:
إذا كان excel_files.endswith (". xlsx"):
df1 = pd.read_excel (input_file_path + excel_files)
- df1: إطار بيانات جديد
- pd: مكتبة الباندا
- قراءة_ excel: وظيفة لقراءة ملفات Excel داخل مكتبة Pandas
- input_file_path: مسار المجلد حيث يتم تخزين الملفات
- ملفات_ Excel: أي متغير يستخدم في حلقة for
لبدء إلحاق الملفات ، تحتاج إلى استخدام ملحق ألحق وظيفة.
لملفات excel في excel_file_list:
إذا كان excel_files.endswith (". xlsx"):
df1 = pd.read_excel (input_file_path + excel_files)
df = df.append (df1)
أخيرًا ، بعد أن أصبح إطار البيانات المدمج جاهزًا ، يمكنك تصديره إلى موقع الإخراج. في هذه الحالة ، تقوم بتصدير إطار البيانات إلى ملف XLSX.
df.to_excel (output_file_path + "Consolidated_file.xlsx")
- df: إطار البيانات المراد تصديره
- على التفوق: الأمر المستخدم لتصدير البيانات
- إخراج_ملف_المسار: المسار المحدد لتخزين المخرجات
- Consolidated_file.xlsx: اسم الملف الموحد
الآن ، دعنا نلقي نظرة على الكود النهائي:
يتم استخدام #Pandas كإطار بيانات للتعامل مع ملفات Excel
استيراد الباندا كما pd
استيراد نظام التشغيل# قم بتغيير الشرطة المائلة من "\" إلى "/" ، إذا كنت تستخدم أجهزة Windows
input_file_path = "C: / Users / gaurav / OneDrive / Desktop / Excel files /"
output_file_path = "C: / Users / gaurav / OneDrive / سطح المكتب /"# إنشاء قائمة لتخزين جميع مراجع الملفات لمجلد الإدخال باستخدام وظيفة listdir من مكتبة نظام التشغيل.
# لرؤية محتويات مكتبة (مثل وظيفة listdir ، يمكنك استخدام وظيفة dir في اسم المكتبة).
# استخدم dir (اسم_المكتبة) لقائمة المحتوياتexcel_file_list = os.listdir (input_file_path)
# طباعة جميع الملفات المخزنة في المجلد ، بعد تحديد القائمة
excel_file_list# بمجرد فتح كل ملف ، استخدم وظيفة الإلحاق لبدء دمج البيانات المخزنة في ملفات متعددة
# إنشاء إطار بيانات جديد وفارغ للتعامل مع عمليات استيراد ملف Excel
df = pd. إطار البيانات ()#Run a for loop للتكرار خلال كل ملف في القائمة
لملفات excel في excel_file_list:
# تحقق من ملفات لاحقة .xlsx فقط
إذا كان excel_files.endswith (". xlsx"):
# إنشاء إطار بيانات جديد لقراءة / فتح كل ملف Excel من قائمة الملفات التي تم إنشاؤها أعلاه
df1 = pd.read_excel (input_file_path + excel_files)
# إلحاق كل ملف بإطار البيانات الأصلي الفارغ
df = df.append (df1)
#transfer الإخراج النهائي إلى ملف Excel (xlsx) على مسار الإخراج
df.to_excel (output_file_path + "Consolidated_file.xlsx")
استخدام Python للجمع بين مصنفات Excel المتعددة
تعد Python's Pandas أداة ممتازة للمستخدمين المبتدئين والمتقدمين على حد سواء. يتم استخدام المكتبة على نطاق واسع من قبل المطورين الذين يرغبون في إتقان لغة Python.
حتى لو كنت مبتدئًا ، يمكنك الاستفادة بشكل كبير من خلال تعلم الفروق الدقيقة في Pandas وكيفية استخدام المكتبة داخل Python.
تعرف على الباندا مع هذه العمليات للمبتدئين.
اقرأ التالي
- برمجة
- بايثون
- مايكروسوفت اكسل
- جدول
يتمتع Gaurav Siyal بخبرة عامين في الكتابة ، ويكتب لسلسلة من شركات التسويق الرقمي ووثائق دورة حياة البرامج.
اشترك في نشرتنا الإخبارية
انضم إلى النشرة الإخبارية لدينا للحصول على نصائح تقنية ومراجعات وكتب إلكترونية مجانية وصفقات حصرية!
انقر هنا للاشتراك