تجعل مكتبة الباندا من علم البيانات المستند إلى Python أمرًا سهلاً. إنها مكتبة Python شهيرة لقراءة البيانات ودمجها وفرزها وتنظيفها والمزيد. على الرغم من أن الباندا سهلة الاستخدام والتطبيق على مجموعات البيانات ، إلا أنها تحتوي على العديد من وظائف معالجة البيانات لتعلمها.

قد تستخدم الباندا ، ولكن هناك فرصة جيدة لأنك لا تستخدمها لحل المشكلات المتعلقة بالبيانات. فيما يلي قائمة بالبيانات القيمة التي تتلاعب بوظائف الباندا التي يجب على كل عالم بيانات معرفتها.

قم بتثبيت الباندا في بيئتك الافتراضية

قبل المتابعة ، تأكد من تثبيت الباندا في بيئتك الافتراضية باستخدام النقطة:

نقطة تثبيت الباندا

بعد تثبيته ، قم باستيراد ملفات الباندا في الجزء العلوي من النص الخاص بك ، ودعنا نتابع.

1. الباندا. داتافريم

انت تستخدم الباندا. إطار البيانات () لإنشاء DataFrame في الباندا. هناك طريقتان لاستخدام هذه الوظيفة.

يمكنك تكوين عمود DataFrame من خلال تمرير قاموس إلى ملف الباندا. إطار البيانات () وظيفة. هنا ، كل مفتاح عبارة عن عمود ، بينما القيم هي الصفوف:

استيراد الباندا
DataFrame = الباندا. إطار البيانات ({"أ": [1 ، 3 ، 4] ، "ب": [5 ، 9 ، 12]})
طباعة (DataFrame)
instagram viewer

الطريقة الأخرى هي تشكيل DataFrame عبر الصفوف. لكن هنا ، ستفصل القيم (عناصر الصف) عن الأعمدة. يجب أيضًا أن يتوافق عدد البيانات في كل قائمة (بيانات الصف) مع عدد الأعمدة.

استيراد الباندا
DataFrame = الباندا. إطار البيانات ([[1 ، 4 ، 5] ، [7 ، 19 ، 13]] ، الأعمدة = ["J" ، "K" ، "L"])
طباعة (DataFrame)

2. اقرأ من واكتب إلى Excel أو CSV في الباندا

يمكنك القراءة أو الكتابة إلى ملفات Excel أو CSV باستخدام الباندا.

قراءة ملفات Excel أو CSV

لقراءة ملف Excel:

#Replace example.xlsx بمسار ملف Excel
DataFrame = DataFrame.read_excel ("example.xlsx")

إليك كيفية قراءة ملف CSV:

#Replace example.csv بمسار ملف CSV
DataFrame = DataFrame.read_csv ("example.csv")

الكتابة إلى Excel أو CSV

الكتابة إلى Excel أو CSV هي عملية معروفة للباندا. وهو مفيد لحفظ الجداول المحسوبة حديثًا في أوراق بيانات منفصلة.

للكتابة في ورقة Excel:

DataFrame.to_excel ("full_path_of_the_destination_folder / filename.xlsx")

إذا كنت تريد الكتابة إلى CSV:

DataFrame.to_csv ("full_path_of_the_destination_folder / filename.csv")

يمكنك أيضًا حساب الاتجاهات المركزية لكل عمود في DataFrame باستخدام حيوانات الباندا.

فيما يلي كيفية الحصول على متوسط ​​القيمة لكل عمود:

DataFrame.mean ()

لقيمة الوسيط أو الوضع ، استبدل يعني() مع الوسيط() أو الوضع().

4. تحويل البيانات

الباندا DataFrame.transform () يعدل قيم DataFrame. يقبل الوظيفة كوسيطة.

على سبيل المثال ، يضاعف الكود أدناه كل قيمة في DataFrame بثلاثة باستخدام دالة لامدا في بايثون:

DataFrame = DataFrame.transform (lambda y: y * 3)
طباعة (DataFrame)

5. DataFrame.isnull

تقوم هذه الوظيفة بإرجاع قيمة منطقية وتضع علامات على جميع الصفوف التي تحتوي على قيم خالية كـ صحيح:

DataFrame.isnull ()

قد يكون من الصعب قراءة نتيجة الكود أعلاه لمجموعات البيانات الأكبر. لذا يمكنك استخدام ملف isnull (). sum () تعمل بدلا من ذلك. يؤدي هذا إلى إرجاع ملخص لجميع القيم المفقودة لكل عمود:

DataFrame.isnull (). sum ()

6. Dataframe.info

ال معلومات() الوظيفة هي عملية الباندا الأساسية. تقوم بإرجاع ملخص القيم غير المفقودة لكل عمود بدلاً من ذلك:

DataFrame.info ()

7. وصف DataFrame

ال يصف() تمنحك الدالة إحصائية موجزة لإطار DataFrame:

DataFrame.describe ()

8. DataFrame.replace

باستخدام DataFrame.replace () الطريقة في الباندا ، يمكنك استبدال الصفوف المحددة بقيم أخرى.

على سبيل المثال ، لتبديل الصفوف غير الصالحة بـ نان:

# تأكد من تثبيت Pip numpy حتى يعمل هذا
استيراد numpy
استيراد الباندا
# إضافة كلمة رئيسية داخلية وتعيينها على True تجعل التغييرات دائمة:
DataFrame.replace ([غير صحيح_1 ، غير صالح_2] ، numpy.nan ، inplace = True)
طباعة (DataFrame)

9. DataFrame.fillna

تتيح لك هذه الوظيفة ملء الصفوف الفارغة بقيمة معينة. يمكنك ملء كل شيء نان صفوف في مجموعة بيانات ذات قيمة متوسطة ، على سبيل المثال:

DataFrame.fillna (df.mean ()، inplace = True)
طباعة (DataFrame)

يمكنك أيضًا أن تكون خاصًا بالأعمدة:

DataFrame ['اسم_العمود']. fillna (df [اسم_العمود] .mean () ، inplace = صحيح)
طباعة (DataFrame)

10. DataFrame.dropna

ال قطرةنا () الأسلوب يزيل جميع الصفوف التي تحتوي على قيم خالية:

DataFrame.dropna (inplace = True)
طباعة (DataFrame)

11. DataFrame.insert

يمكنك استخدام الباندا إدراج() وظيفة لإضافة عمود جديد إلى DataFrame. يقبل ثلاث كلمات رئيسية ، اسم العمودوقائمة ببياناتها وبياناتها موقعك، وهو فهرس العمود.

إليك كيف يعمل ذلك:

DataFrame.insert (العمود = 'C' ، القيمة = [3 ، 4 ، 6 ، 7] ، loc = 0)
طباعة (DataFrame)

يقوم الكود أعلاه بإدراج العمود الجديد في فهرس العمود الصفري (يصبح العمود الأول).

12. DataFrame.loc

يمكنك استخدام مكان للعثور على العناصر في فهرس معين. لعرض جميع العناصر في الصف الثالث ، على سبيل المثال:

DataFrame.loc [2]

13. DataFrame.pop

تتيح لك هذه الوظيفة إزالة عمود محدد من pandas DataFrame.

يقبل ملف العنصر تقوم الكلمة الأساسية بإرجاع العمود المنبثق وتفصله عن باقي DataFrame:

DataFrame.pop (item = 'column_name')
طباعة (DataFrame)

14. DataFrame.max ، دقيقة

الحصول على القيم القصوى والدنيا باستخدام الباندا أمر سهل:

DataFrame.min ()

يُرجع الرمز أعلاه الحد الأدنى لقيمة كل عمود. للحصول على الحد الأقصى ، استبدل دقيقة مع الأعلى.

15. DataFrame.join

ال انضم() تتيح لك وظيفة الباندا دمج DataFrames بأسماء أعمدة مختلفة. يمكنك استخدام الصلة اليسرى أو اليمنى أو الداخلية أو الخارجية. للانضمام إلى اليسار إلى DataFrame مع اثنين آخرين:

# يسارًا - اربط أعمدة أطول بأخرى أقصر
newDataFrame = df1.join ([df_shorter2، df_shorter3]، how = 'left')
طباعة (newDataFrame)

للانضمام إلى DataFrames بأسماء أعمدة متشابهة ، يمكنك التمييز بينها بتضمين لاحقة إلى اليسار أو اليمين. قم بذلك عن طريق تضمين ملف lsuffix أو rsuffix الكلمة الأساسية:

newDataFrame = df1.join ([df2، rsuffix = '_'، how = 'Outer') 
طباعة (newDataFrame)

16. DataFrame.combine

ال يجمع() تأتي الوظيفة في متناول اليد لدمج إطارين من DataFrames يحتويان على أسماء أعمدة متشابهة بناءً على معايير محددة. يقبل أ وظيفة كلمة رئيسية.

على سبيل المثال ، لدمج إطارين من DataFrames بأسماء أعمدة متشابهة بناءً على القيم القصوى فقط:

newDataFrame = df.combine (df2، numpy.minimum)
طباعة (newDataFrame)

ملحوظة: يمكنك أيضًا تحديد وظيفة اختيار مخصصة وإدراجها numpy.minimum.

17. DataFrame.astype

ال أستيب () دالة تغير نوع البيانات لعمود معين أو DataFrame.

لتغيير كل القيم في DataFrame إلى سلسلة ، على سبيل المثال:

DataFrame.astype (str)

18. DataFrame.sum

ال مجموع() دالة في الباندا ترجع مجموع القيم في كل عمود:

DataFrame.sum ()

يمكنك أيضًا العثور على المجموع التراكمي لجميع العناصر التي تستخدم cumsum ():

DataFrame.cumsum ()

19. DataFrame.drop

الباندا قطرة() الدالة تحذف صفوفًا أو أعمدة معينة في DataFrame. يجب عليك توفير أسماء الأعمدة أو فهرس الصفوف ومحور لاستخدامه.

لإزالة أعمدة معينة ، على سبيل المثال:

df.drop (الأعمدة = ['colum1' ، 'عمود 2'] ، المحور = 0)

لإسقاط صفوف في الفهارس 1 و 3 و 4 ، على سبيل المثال:

df.drop ([1 ، 3 ، 4] ، المحور = 0)

20. DataFrame.corr

هل تريد العثور على الارتباط بين الأعمدة الصحيحة أو العائمة؟ يمكن أن تساعدك الباندا في تحقيق ذلك باستخدام كور () وظيفة:

DataFrame.corr ()

ترجع الكود أعلاه DataFrame جديدًا يحتوي على تسلسل الارتباط بين جميع الأعمدة الصحيحة أو العائمة.

21. DataFrame.add

ال يضيف() تتيح لك الوظيفة إضافة رقم محدد لكل قيمة في DataFrame. إنه يعمل عن طريق التكرار من خلال DataFrame والتشغيل على كل عنصر.

متعلق ب:كيفية استخدام For Loops في Python

لإضافة 20 إلى كل من القيم الموجودة في عمود معين يحتوي على أعداد صحيحة أو عوامات ، على سبيل المثال:

DataFrame ['interger_column']. add (20)

22. DataFrame.sub

مثل وظيفة الإضافة ، يمكنك أيضًا طرح رقم من كل قيمة في DataFrame أو عمود محدد:

إطار البيانات ['interger_column']. فرعي (10)

23. DataFrame.mul

هذه نسخة مضاعفة لوظيفة إضافة الباندا:

إطار البيانات ['interger_column']. مول (20)

24. DataFrame.div

وبالمثل ، يمكنك قسمة كل نقطة بيانات في عمود أو DataFrame على رقم معين:

إطار البيانات ['interger_column']. div (20)

25. DataFrame.std

باستخدام الأمراض المنقولة جنسياً () وظيفة ، تتيح لك الباندا أيضًا حساب الانحراف المعياري لكل عمود في DataFrame. يعمل عن طريق التكرار خلال كل عمود في مجموعة بيانات وحساب الانحراف المعياري لكل:

DataFrame.std ()

26. DataFrame.sort_values

يمكنك أيضًا فرز القيم تصاعديًا أو تنازليًا بناءً على عمود معين. لفرز DataFrame بترتيب تنازلي ، على سبيل المثال:

newDataFrame = DataFrame.sort_values ​​(بواسطة = "colmun_name" ، تنازلي = صحيح)

27. DataFrame.melt

ال إنصهار() وظيفة في الباندا تقلب الأعمدة في DataFrame إلى صفوف فردية. إنه مثل كشف تشريح إطار البيانات. لذلك يتيح لك عرض القيمة المخصصة لكل عمود بشكل صريح.

newDataFrame = DataFrame.melt ()

28. DataFrame.count

ترجع هذه الدالة العدد الإجمالي للعناصر في كل عمود:

DataFrame.count ()

29. استعلام DataFrame

الباندا استفسار() يتيح لك استدعاء العناصر باستخدام رقم الفهرس الخاص بهم. للحصول على العناصر في الصف الثالث ، على سبيل المثال:

استعلام DataFrame.query ("4") # استدعاء الاستعلام على الفهرس الرابع

30. DataFrame.where

ال أين() دالة هي استعلام الباندا الذي يقبل شرطا للحصول على قيم محددة في عمود. على سبيل المثال ، للحصول على جميع الأعمار الأقل من 30 عامًا من عمر عمود:

DataFrame.where (DataFrame ['Age'] <30)

ينتج عن الكود أعلاه DataFrame يحتوي على جميع الأعمار الأقل من 30 عامًا ولكن يتم تعيينه نان إلى الصفوف التي لا تلبي الشرط.

تعامل مع البيانات مثل المحترفين مع الباندا

الباندا هي كنز دفين من الوظائف والأساليب للتعامل مع مجموعات البيانات الصغيرة إلى الكبيرة الحجم باستخدام Python. المكتبة مفيدة أيضًا لتنظيف البيانات والتحقق منها وإعدادها للتحليل أو التعلم الآلي.

إن قضاء الوقت في إتقانها يجعل حياتك أسهل بالتأكيد كعالم بيانات ، وهي تستحق الجهد المبذول. لذلك لا تتردد في اختيار جميع الوظائف التي يمكنك التعامل معها.

20 وظيفة بايثون يجب أن تعرفها

تحتوي مكتبة Python القياسية على العديد من الوظائف للمساعدة في مهام البرمجة الخاصة بك. تعرف على التعليمات البرمجية الأكثر فائدة وأنشئ أكثر قوة.

اقرأ التالي

شاركسقسقةبريد الالكتروني
مواضيع ذات صلة
  • برمجة
  • بايثون
  • برمجة
  • قاعدة البيانات
عن المؤلف
إيدوو أوميسولا (تم نشر 123 مقالة)

Idowu شغوف بأي شيء التكنولوجيا الذكية والإنتاجية. في أوقات فراغه ، يلعب بالبرمجة ويتحول إلى رقعة الشطرنج عندما يشعر بالملل ، لكنه أيضًا يحب الابتعاد عن الروتين من حين لآخر. يحفزه شغفه بإظهار طريقة حول التكنولوجيا الحديثة للناس على كتابة المزيد.

المزيد من Idowu Omisola

اشترك في نشرتنا الإخبارية

انضم إلى النشرة الإخبارية لدينا للحصول على نصائح تقنية ومراجعات وكتب إلكترونية مجانية وصفقات حصرية!

انقر هنا للاشتراك