إذا كنت تستخدم Python ، حتى لأبسط المهام ، فمن المحتمل أنك تدرك أهمية مكتبات الطرف الثالث. مكتبة Pandas ، مع دعمها الممتاز لـ DataFrames ، هي واحدة من هذه المكتبات.

يمكنك استيراد أنواع متعددة من الملفات إلى Python DataFrames وإنشاء إصدارات مختلفة لتخزين مجموعات بيانات مختلفة. بمجرد استيراد بياناتك باستخدام DataFrames ، يمكنك دمجها لإجراء تحليل مفصل.

معالجة الأساسيات

قبل أن تبدأ في الدمج ، يجب أن يكون لديك DataFrames لدمجها. لأغراض التطوير ، يمكنك إنشاء بعض البيانات الوهمية لتجربتها.

قم بإنشاء إطارات البيانات في بايثون

كخطوة أولى ، قم باستيراد مكتبة Pandas إلى ملف Python الخاص بك. Pandas هي مكتبة تابعة لجهة خارجية تتعامل مع DataFrames في Python. يمكنك استخدام ال يستورد بيان لاستخدام المكتبة على النحو التالي:

يستورد الباندا كما pd

يمكنك تعيين اسم مستعار لاسم المكتبة لاختصار مراجع التعليمات البرمجية الخاصة بك.

تحتاج إلى إنشاء قواميس يمكنك تحويلها إلى DataFrames. للحصول على أفضل النتائج ، أنشئ متغيرين في القاموس -ديكت 1 و dict2—لتخزين أجزاء معينة من المعلومات:

ديكت 1 = {"معرف المستخدم": ["001", "002
instagram viewer
", "003", "004", "005"],
"FName": ["جون", "براد", "رون", "رولد", "كريس"],
"LName": ["هارلي", "كوهين", "دحل", "هارينجتون", "كير هيسلوب"]}

ديكت 2 = {"معرف المستخدم": ["001", "002", "003", "004"], "سن": [15, 28, 34, 24]}

تذكر ، يجب أن يكون لديك عنصر مشترك في كلتا قيم القاموس ، لتعمل كمفتاح أساسي لدمج إطارات البيانات الخاصة بك لاحقًا.

تحويل القواميس الخاصة بك إلى DataFrames

لتحويل قيم قاموسك إلى DataFrames ، يمكنك استخدام الطريقة التالية:

df1 = PD. داتافريم (ديكت 1)
df2 = PD. داتافريم (ديكت 2)

تتيح لك بعض IDEs التحقق من القيم داخل DataFrame من خلال الرجوع إلى وظيفة DataFrame والضغط على تشغيل / تنفيذ. هنالك الكثير IDEs المتوافقة مع Python، حتى تتمكن من انتقاء واختيار الطريقة الأسهل بالنسبة لك للتعلم.

بمجرد أن تصبح راضيًا عن محتويات DataFrames الخاصة بك ، يمكنك الانتقال إلى خطوة الدمج.

دمج الإطارات مع وظيفة الدمج

وظيفة الدمج هي أول دالة في Python يمكنك استخدامها لدمج إطارين من DataFrames. تأخذ هذه الوظيفة الوسيطات الافتراضية التالية:

pd.merge (DataFrame1 ، DataFrame2 ، كيف = يكتبمندمج)

أين:

  • pd هو اسم مستعار لمكتبة الباندا.
  • دمج هي الوظيفة التي تدمج DataFrames.
  • إطار البيانات 1 و إطار البيانات 2 هما إطارا DataFrames المراد دمجهما.
  • كيف يحدد نوع الدمج.

تتوفر بعض الوسائط الاختيارية الإضافية ، والتي يمكنك استخدامها عندما يكون لديك بنية بيانات معقدة.

يمكنك استخدام قيم مختلفة لمعلمة كيفية تحديد نوع الدمج المطلوب تنفيذه. ستكون هذه الأنواع من الدمج مألوفة إذا كنت تفعل ذلك تستخدم SQL للانضمام إلى جداول قاعدة البيانات.

دمج اليسار

يحافظ نوع الدمج الأيسر على قيم DataFrame الأولى كما هي ويسحب القيم المطابقة من DataFrame الثاني.

الدمج الصحيح

يحافظ نوع الدمج الصحيح على قيم DataFrame الثانية سليمة ويسحب القيم المطابقة من DataFrame الأول.

الدمج الداخلي

نوع الدمج الداخلي يحتفظ بالقيم المطابقة من كل من DataFrames ويزيل القيم غير المطابقة.

الدمج الخارجي

نوع الدمج الخارجي يحتفظ بجميع القيم المتطابقة وغير المتطابقة ويدمج DataFrames معًا.

كيفية استخدام وظيفة Concat

ال concat تعتبر الوظيفة خيارًا مرنًا مقارنة ببعض وظائف الدمج الأخرى في Python. باستخدام وظيفة concat ، يمكنك دمج إطارات البيانات عموديًا وأفقيًا.

ومع ذلك ، فإن عيب استخدام هذه الوظيفة هو أنها تتجاهل أي قيم غير متطابقة افتراضيًا. مثل بعض الوظائف الأخرى ذات الصلة ، تحتوي هذه الوظيفة على عدد قليل من الحجج ، القليل منها فقط ضروري لسلسلة ناجحة.

concat (إطارات البيانات ، المحور = 0 ، الصلة ='خارجي'/داخلي)

أين:

  • concat هي الوظيفة التي تنضم إلى DataFrames.
  • أطر البيانات هي سلسلة من DataFrames للتسلسل.
  • محور يمثل اتجاه التسلسل ، 0 كونه أفقيًا ، و 1 عموديًا.
  • انضم تحدد صلة خارجية أو داخلية.

باستخدام إطاري DataFrames أعلاه ، يمكنك تجربة وظيفة concat على النحو التالي:

# تحديد إطارات البيانات في شكل قائمة
df_merged_concat = pd.concat ([df1، df2])

# طباعة نتائج وظيفة Concat
مطبعة(df_merged_concat)

يجمع غياب المحور ووسائط الانضمام في الكود أعلاه بين مجموعتي البيانات. يحتوي الناتج الناتج على جميع الإدخالات ، بغض النظر عن حالة المطابقة.

وبالمثل ، يمكنك استخدام وسيطات إضافية للتحكم في اتجاه وإخراج دالة concat.

للتحكم في الإخراج بجميع الإدخالات المتطابقة:

# ربط جميع القيم المطابقة بين إطاري البيانات بناءً على أعمدتهما
df_merged_concat = pd.concat ([df1 ، df2] ، المحور = 1 ، انضم = 'داخلي')

مطبعة(df_merged_concat)

تحتوي النتيجة على جميع القيم المطابقة بين إطاري البيانات فقط.

دمج DataFrames مع Python

تعد DataFrames جزءًا لا يتجزأ من Python ، مع الأخذ في الاعتبار مرونتها ووظائفها. نظرًا لاستخداماتها متعددة الأوجه ، يمكنك استخدامها على نطاق واسع لأداء مجموعة متنوعة من المهام بسهولة قصوى.

إذا كنت لا تزال تتعلم المزيد عن Python DataFrames ، فحاول استيراد بعض ملفات Excel ، ثم ادمجها بطرق مختلفة.