تجعل مكتبة الباندا من علم البيانات المستند إلى Python أمرًا سهلاً. إنها مكتبة Python شهيرة لقراءة البيانات ودمجها وفرزها وتنظيفها والمزيد. على الرغم من أن الباندا سهلة الاستخدام والتطبيق على مجموعات البيانات ، إلا أنها تحتوي على العديد من وظائف معالجة البيانات لتعلمها.
قد تستخدم الباندا ، ولكن هناك فرصة جيدة لأنك لا تستخدمها لحل المشكلات المتعلقة بالبيانات. فيما يلي قائمة بالبيانات القيمة التي تتلاعب بوظائف الباندا التي يجب على كل عالم بيانات معرفتها.
قم بتثبيت الباندا في بيئتك الافتراضية
قبل المتابعة ، تأكد من تثبيت الباندا في بيئتك الافتراضية باستخدام النقطة:
نقطة تثبيت الباندا
بعد تثبيته ، قم باستيراد ملفات الباندا في الجزء العلوي من النص الخاص بك ، ودعنا نتابع.
1. الباندا. داتافريم
انت تستخدم الباندا. إطار البيانات () لإنشاء DataFrame في الباندا. هناك طريقتان لاستخدام هذه الوظيفة.
يمكنك تكوين عمود DataFrame من خلال تمرير قاموس إلى ملف الباندا. إطار البيانات () وظيفة. هنا ، كل مفتاح عبارة عن عمود ، بينما القيم هي الصفوف:
استيراد الباندا
DataFrame = الباندا. إطار البيانات ({"أ": [1 ، 3 ، 4] ، "ب": [5 ، 9 ، 12]})
طباعة (DataFrame)
الطريقة الأخرى هي تشكيل DataFrame عبر الصفوف. لكن هنا ، ستفصل القيم (عناصر الصف) عن الأعمدة. يجب أيضًا أن يتوافق عدد البيانات في كل قائمة (بيانات الصف) مع عدد الأعمدة.
استيراد الباندا
DataFrame = الباندا. إطار البيانات ([[1 ، 4 ، 5] ، [7 ، 19 ، 13]] ، الأعمدة = ["J" ، "K" ، "L"])
طباعة (DataFrame)
2. اقرأ من واكتب إلى Excel أو CSV في الباندا
يمكنك القراءة أو الكتابة إلى ملفات Excel أو CSV باستخدام الباندا.
قراءة ملفات Excel أو CSV
لقراءة ملف Excel:
#Replace example.xlsx بمسار ملف Excel
DataFrame = DataFrame.read_excel ("example.xlsx")
إليك كيفية قراءة ملف CSV:
#Replace example.csv بمسار ملف CSV
DataFrame = DataFrame.read_csv ("example.csv")
الكتابة إلى Excel أو CSV
الكتابة إلى Excel أو CSV هي عملية معروفة للباندا. وهو مفيد لحفظ الجداول المحسوبة حديثًا في أوراق بيانات منفصلة.
للكتابة في ورقة Excel:
DataFrame.to_excel ("full_path_of_the_destination_folder / filename.xlsx")
إذا كنت تريد الكتابة إلى CSV:
DataFrame.to_csv ("full_path_of_the_destination_folder / filename.csv")
يمكنك أيضًا حساب الاتجاهات المركزية لكل عمود في DataFrame باستخدام حيوانات الباندا.
فيما يلي كيفية الحصول على متوسط القيمة لكل عمود:
DataFrame.mean ()
لقيمة الوسيط أو الوضع ، استبدل يعني() مع الوسيط() أو الوضع().
4. تحويل البيانات
الباندا DataFrame.transform () يعدل قيم DataFrame. يقبل الوظيفة كوسيطة.
على سبيل المثال ، يضاعف الكود أدناه كل قيمة في DataFrame بثلاثة باستخدام دالة لامدا في بايثون:
DataFrame = DataFrame.transform (lambda y: y * 3)
طباعة (DataFrame)
5. DataFrame.isnull
تقوم هذه الوظيفة بإرجاع قيمة منطقية وتضع علامات على جميع الصفوف التي تحتوي على قيم خالية كـ صحيح:
DataFrame.isnull ()
قد يكون من الصعب قراءة نتيجة الكود أعلاه لمجموعات البيانات الأكبر. لذا يمكنك استخدام ملف isnull (). sum () تعمل بدلا من ذلك. يؤدي هذا إلى إرجاع ملخص لجميع القيم المفقودة لكل عمود:
DataFrame.isnull (). sum ()
6. Dataframe.info
ال معلومات() الوظيفة هي عملية الباندا الأساسية. تقوم بإرجاع ملخص القيم غير المفقودة لكل عمود بدلاً من ذلك:
DataFrame.info ()
7. وصف DataFrame
ال يصف() تمنحك الدالة إحصائية موجزة لإطار DataFrame:
DataFrame.describe ()
8. DataFrame.replace
باستخدام DataFrame.replace () الطريقة في الباندا ، يمكنك استبدال الصفوف المحددة بقيم أخرى.
على سبيل المثال ، لتبديل الصفوف غير الصالحة بـ نان:
# تأكد من تثبيت Pip numpy حتى يعمل هذا
استيراد numpy
استيراد الباندا
# إضافة كلمة رئيسية داخلية وتعيينها على True تجعل التغييرات دائمة:
DataFrame.replace ([غير صحيح_1 ، غير صالح_2] ، numpy.nan ، inplace = True)
طباعة (DataFrame)
9. DataFrame.fillna
تتيح لك هذه الوظيفة ملء الصفوف الفارغة بقيمة معينة. يمكنك ملء كل شيء نان صفوف في مجموعة بيانات ذات قيمة متوسطة ، على سبيل المثال:
DataFrame.fillna (df.mean ()، inplace = True)
طباعة (DataFrame)
يمكنك أيضًا أن تكون خاصًا بالأعمدة:
DataFrame ['اسم_العمود']. fillna (df [اسم_العمود] .mean () ، inplace = صحيح)
طباعة (DataFrame)
10. DataFrame.dropna
ال قطرةنا () الأسلوب يزيل جميع الصفوف التي تحتوي على قيم خالية:
DataFrame.dropna (inplace = True)
طباعة (DataFrame)
11. DataFrame.insert
يمكنك استخدام الباندا إدراج() وظيفة لإضافة عمود جديد إلى DataFrame. يقبل ثلاث كلمات رئيسية ، اسم العمودوقائمة ببياناتها وبياناتها موقعك، وهو فهرس العمود.
إليك كيف يعمل ذلك:
DataFrame.insert (العمود = 'C' ، القيمة = [3 ، 4 ، 6 ، 7] ، loc = 0)
طباعة (DataFrame)
يقوم الكود أعلاه بإدراج العمود الجديد في فهرس العمود الصفري (يصبح العمود الأول).
12. DataFrame.loc
يمكنك استخدام مكان للعثور على العناصر في فهرس معين. لعرض جميع العناصر في الصف الثالث ، على سبيل المثال:
DataFrame.loc [2]
13. DataFrame.pop
تتيح لك هذه الوظيفة إزالة عمود محدد من pandas DataFrame.
يقبل ملف العنصر تقوم الكلمة الأساسية بإرجاع العمود المنبثق وتفصله عن باقي DataFrame:
DataFrame.pop (item = 'column_name')
طباعة (DataFrame)
14. DataFrame.max ، دقيقة
الحصول على القيم القصوى والدنيا باستخدام الباندا أمر سهل:
DataFrame.min ()
يُرجع الرمز أعلاه الحد الأدنى لقيمة كل عمود. للحصول على الحد الأقصى ، استبدل دقيقة مع الأعلى.
15. DataFrame.join
ال انضم() تتيح لك وظيفة الباندا دمج DataFrames بأسماء أعمدة مختلفة. يمكنك استخدام الصلة اليسرى أو اليمنى أو الداخلية أو الخارجية. للانضمام إلى اليسار إلى DataFrame مع اثنين آخرين:
# يسارًا - اربط أعمدة أطول بأخرى أقصر
newDataFrame = df1.join ([df_shorter2، df_shorter3]، how = 'left')
طباعة (newDataFrame)
للانضمام إلى DataFrames بأسماء أعمدة متشابهة ، يمكنك التمييز بينها بتضمين لاحقة إلى اليسار أو اليمين. قم بذلك عن طريق تضمين ملف lsuffix أو rsuffix الكلمة الأساسية:
newDataFrame = df1.join ([df2، rsuffix = '_'، how = 'Outer')
طباعة (newDataFrame)
16. DataFrame.combine
ال يجمع() تأتي الوظيفة في متناول اليد لدمج إطارين من DataFrames يحتويان على أسماء أعمدة متشابهة بناءً على معايير محددة. يقبل أ وظيفة كلمة رئيسية.
على سبيل المثال ، لدمج إطارين من DataFrames بأسماء أعمدة متشابهة بناءً على القيم القصوى فقط:
newDataFrame = df.combine (df2، numpy.minimum)
طباعة (newDataFrame)
ملحوظة: يمكنك أيضًا تحديد وظيفة اختيار مخصصة وإدراجها numpy.minimum.
17. DataFrame.astype
ال أستيب () دالة تغير نوع البيانات لعمود معين أو DataFrame.
لتغيير كل القيم في DataFrame إلى سلسلة ، على سبيل المثال:
DataFrame.astype (str)
18. DataFrame.sum
ال مجموع() دالة في الباندا ترجع مجموع القيم في كل عمود:
DataFrame.sum ()
يمكنك أيضًا العثور على المجموع التراكمي لجميع العناصر التي تستخدم cumsum ():
DataFrame.cumsum ()
19. DataFrame.drop
الباندا قطرة() الدالة تحذف صفوفًا أو أعمدة معينة في DataFrame. يجب عليك توفير أسماء الأعمدة أو فهرس الصفوف ومحور لاستخدامه.
لإزالة أعمدة معينة ، على سبيل المثال:
df.drop (الأعمدة = ['colum1' ، 'عمود 2'] ، المحور = 0)
لإسقاط صفوف في الفهارس 1 و 3 و 4 ، على سبيل المثال:
df.drop ([1 ، 3 ، 4] ، المحور = 0)
20. DataFrame.corr
هل تريد العثور على الارتباط بين الأعمدة الصحيحة أو العائمة؟ يمكن أن تساعدك الباندا في تحقيق ذلك باستخدام كور () وظيفة:
DataFrame.corr ()
ترجع الكود أعلاه DataFrame جديدًا يحتوي على تسلسل الارتباط بين جميع الأعمدة الصحيحة أو العائمة.
21. DataFrame.add
ال يضيف() تتيح لك الوظيفة إضافة رقم محدد لكل قيمة في DataFrame. إنه يعمل عن طريق التكرار من خلال DataFrame والتشغيل على كل عنصر.
متعلق ب:كيفية استخدام For Loops في Python
لإضافة 20 إلى كل من القيم الموجودة في عمود معين يحتوي على أعداد صحيحة أو عوامات ، على سبيل المثال:
DataFrame ['interger_column']. add (20)
22. DataFrame.sub
مثل وظيفة الإضافة ، يمكنك أيضًا طرح رقم من كل قيمة في DataFrame أو عمود محدد:
إطار البيانات ['interger_column']. فرعي (10)
23. DataFrame.mul
هذه نسخة مضاعفة لوظيفة إضافة الباندا:
إطار البيانات ['interger_column']. مول (20)
24. DataFrame.div
وبالمثل ، يمكنك قسمة كل نقطة بيانات في عمود أو DataFrame على رقم معين:
إطار البيانات ['interger_column']. div (20)
25. DataFrame.std
باستخدام الأمراض المنقولة جنسياً () وظيفة ، تتيح لك الباندا أيضًا حساب الانحراف المعياري لكل عمود في DataFrame. يعمل عن طريق التكرار خلال كل عمود في مجموعة بيانات وحساب الانحراف المعياري لكل:
DataFrame.std ()
26. DataFrame.sort_values
يمكنك أيضًا فرز القيم تصاعديًا أو تنازليًا بناءً على عمود معين. لفرز DataFrame بترتيب تنازلي ، على سبيل المثال:
newDataFrame = DataFrame.sort_values (بواسطة = "colmun_name" ، تنازلي = صحيح)
27. DataFrame.melt
ال إنصهار() وظيفة في الباندا تقلب الأعمدة في DataFrame إلى صفوف فردية. إنه مثل كشف تشريح إطار البيانات. لذلك يتيح لك عرض القيمة المخصصة لكل عمود بشكل صريح.
newDataFrame = DataFrame.melt ()
28. DataFrame.count
ترجع هذه الدالة العدد الإجمالي للعناصر في كل عمود:
DataFrame.count ()
29. استعلام DataFrame
الباندا استفسار() يتيح لك استدعاء العناصر باستخدام رقم الفهرس الخاص بهم. للحصول على العناصر في الصف الثالث ، على سبيل المثال:
استعلام DataFrame.query ("4") # استدعاء الاستعلام على الفهرس الرابع
30. DataFrame.where
ال أين() دالة هي استعلام الباندا الذي يقبل شرطا للحصول على قيم محددة في عمود. على سبيل المثال ، للحصول على جميع الأعمار الأقل من 30 عامًا من عمر عمود:
DataFrame.where (DataFrame ['Age'] <30)
ينتج عن الكود أعلاه DataFrame يحتوي على جميع الأعمار الأقل من 30 عامًا ولكن يتم تعيينه نان إلى الصفوف التي لا تلبي الشرط.
تعامل مع البيانات مثل المحترفين مع الباندا
الباندا هي كنز دفين من الوظائف والأساليب للتعامل مع مجموعات البيانات الصغيرة إلى الكبيرة الحجم باستخدام Python. المكتبة مفيدة أيضًا لتنظيف البيانات والتحقق منها وإعدادها للتحليل أو التعلم الآلي.
إن قضاء الوقت في إتقانها يجعل حياتك أسهل بالتأكيد كعالم بيانات ، وهي تستحق الجهد المبذول. لذلك لا تتردد في اختيار جميع الوظائف التي يمكنك التعامل معها.
تحتوي مكتبة Python القياسية على العديد من الوظائف للمساعدة في مهام البرمجة الخاصة بك. تعرف على التعليمات البرمجية الأكثر فائدة وأنشئ أكثر قوة.
اقرأ التالي
- برمجة
- بايثون
- برمجة
- قاعدة البيانات
Idowu شغوف بأي شيء التكنولوجيا الذكية والإنتاجية. في أوقات فراغه ، يلعب بالبرمجة ويتحول إلى رقعة الشطرنج عندما يشعر بالملل ، لكنه أيضًا يحب الابتعاد عن الروتين من حين لآخر. يحفزه شغفه بإظهار طريقة حول التكنولوجيا الحديثة للناس على كتابة المزيد.
اشترك في نشرتنا الإخبارية
انضم إلى النشرة الإخبارية لدينا للحصول على نصائح تقنية ومراجعات وكتب إلكترونية مجانية وصفقات حصرية!
انقر هنا للاشتراك