Pandas هي مكتبة Python مفتوحة المصدر تستخدم بشكل أساسي لمعالجة البيانات وتحليلها. إنه مبني على أعلى مكتبة NumPy ويوفر هياكل بيانات عالية الأداء وسهلة الاستخدام وأدوات تحليل البيانات للغة برمجة Python.
في هذه المقالة ، ستتعلم كيفية إجراء 6 عمليات أساسية باستخدام Pandas.
استخدام أمثلة الباندا
يمكنك تشغيل الأمثلة في هذه المقالة باستخدام دفاتر الملاحظات الحسابية مثل دفتر Jupyter, جوجل كولاب، إلخ. يمكنك أيضًا تشغيل الأمثلة عن طريق إدخال الكود مباشرةً في مترجم Python في الوضع التفاعلي.
إذا كنت تريد إلقاء نظرة على الكود المصدري الكامل المستخدم في هذه المقالة ، فيمكنك الوصول إلى ملف Python Notebook من هذا مستودع جيثب.
1. كيفية استيراد الباندا بتنسيق pd وطباعة رقم الإصدار
أنت بحاجة إلى استخدام يستورد كلمة أساسية لاستيراد أي مكتبة في Python. عادةً ما يتم استيراد الباندا ضمن ملف pd الاسم المستعار. باستخدام هذا النهج ، يمكنك الرجوع إلى حزمة Pandas باسم pd بدلا من الباندا.
استيراد الباندا كما pd
طباعة (نسخة طبق الأصل__)
انتاج:
1.2.4
2. كيفية إنشاء سلسلة في الباندا
سلسلة Pandas عبارة عن مصفوفة أحادية البعد تحتوي على بيانات من أي نوع. إنه مثل عمود في جدول. يمكنك إنشاء سلسلة باستخدام مصفوفات numpy ، وظائف numpy ، قوائم ، قواميس ، قيم عددية ، إلخ.
تتم تسمية قيم السلسلة برقم الفهرس الخاص بها. بشكل افتراضي ، تحتوي القيمة الأولى على فهرس 0 ، وتحتوي القيمة الثانية على فهرس 1 ، وهكذا. لتسمية التصنيفات الخاصة بك ، تحتاج إلى استخدام ملحق فهرس جدال.
كيفية إنشاء سلسلة فارغة
s = pd. السلسلة (dtype = 'float64')
س
انتاج:
سلسلة ([] ، نوع dtype: float64)
في المثال أعلاه ، سلسلة فارغة بامتداد تطفو تم إنشاء نوع البيانات.
كيفية إنشاء سلسلة باستخدام NumPy Array
استيراد الباندا كما pd
استيراد numpy كـ np
د = np.array ([1، 2، 3، 4، 5])
s = pd. السلسلة (د)
س
انتاج:
0 1
1 2
2 3
3 4
4 5
نوع dtype: int32
متعلق ب: عمليات NumPy للمبتدئين
كيفية إنشاء قائمة باستخدام سلسلة
د = [1 ، 2 ، 3 ، 4 ، 5]
s = pd. السلسلة (د)
س
انتاج:
0 1
1 2
2 3
3 4
4 5
نوع dtype: int64
كيفية إنشاء سلسلة مع فهرس
لإنشاء سلسلة مع فهرس ، تحتاج إلى استخدام الامتداد فهرس جدال. يجب أن يكون عدد الفهارس مساويًا لعدد العناصر في السلسلة.
د = [1 ، 2 ، 3 ، 4 ، 5]
s = pd. المتسلسلة (د ، الفهرس = ["واحد" ، "اثنان" ، "ثلاثة" ، "أربعة" ، "خمسة"])
س
انتاج:
واحد 1
اثنان 2
ثلاثة 3
أربعة 4
خمسة 5
نوع dtype: int64
كيفية إنشاء سلسلة باستخدام القاموس
تصبح مفاتيح القاموس تسميات السلسلة.
د = {"واحد": 1 ،
"اثنان": 2 ،
"ثلاثة": 3 ،
"أربعة": 4 ،
"خمسة": 5}
s = pd. السلسلة (د)
س
انتاج:
واحد 1
اثنان 2
ثلاثة 3
أربعة 4
خمسة 5
نوع dtype: int64
كيفية إنشاء سلسلة باستخدام القيمة العددية
إذا كنت تريد إنشاء سلسلة باستخدام قيمة عددية ، فيجب عليك توفير الامتداد فهرس جدال.
s = pd. سلسلة (1 ، الفهرس = ["أ" ، "ب" ، "ج" ، "د"])
س
انتاج:
أ 1
ب 1
ج 1
د 1
نوع dtype: int64
3. كيفية إنشاء Dataframe في Pandas
يعد DataFrame بنية بيانات ثنائية الأبعاد حيث تتم محاذاة البيانات في شكل صفوف وأعمدة. يمكن إنشاء DataFrame باستخدام القواميس والقوائم وقائمة القواميس والمصفوفات غير الدقيقة وما إلى ذلك. في العالم الحقيقي ، يتم إنشاء DataFrames باستخدام التخزين الحالي مثل ملفات CSV وملفات Excel وقواعد بيانات SQL وما إلى ذلك.
يدعم كائن DataFrame عددًا من السمات والطرق. إذا كنت تريد معرفة المزيد عنها ، يمكنك التحقق من الوثائق الرسمية لـ إطار بيانات الباندا.
كيفية إنشاء DataFrame فارغ
df = pd. إطار البيانات ()
طباعة (مدافع)
انتاج:
DataFrame فارغ
الأعمدة: []
فهرس: []
كيفية إنشاء قائمة باستخدام DataFrame
listObj = ["MUO" ، "التكنولوجيا" ، "المبسطة"]
df = pd. DataFrame (listObj)
طباعة (مدافع)
انتاج:
0
0 MUO
1 التكنولوجيا
2 مبسطة
كيفية إنشاء DataFrame باستخدام قاموس ndarray / القوائم
batmanData = {'Movie Name': ['Batman Begins'، 'The Dark Knight'، 'The Dark Knight Rises']،
"سنة الإصدار": [2005 ، 2008 ، 2012]}
df = pd. داتافريم (باتمان داتا)
طباعة (مدافع)
انتاج:
اسم الفيلم سنة الإصدار
0 باتمان يبدأ 2005
1 فارس الظلام 2008
2 The Dark Knight Rises 2012
كيفية إنشاء DataFrame باستخدام قائمة القوائم
البيانات = [['Alex'، 601]، ['Bob'، 602]، ['Cataline'، 603]]
df = pd. DataFrame (البيانات ، الأعمدة = ["الاسم" ، "رقم الملف"])
طباعة (مدافع)
انتاج:
رقم لفة الاسم
0 اليكس 601
1 بوب 602
2 كاتالين 603
كيفية إنشاء DataFrame باستخدام قائمة القواميس
data = [{'Name': 'Alex'، 'Roll No.': 601}،
{'Name': 'Bob'، 'Roll No.': 602}،
{'Name': 'Cataline'، 'Roll No.': 603}]
df = pd. DataFrame (بيانات)
طباعة (مدافع)
انتاج:
رقم لفة الاسم
0 اليكس 601
1 بوب 602
2 كاتالين 603
متعلق ب: كيفية تحويل قائمة إلى قاموس في بايثون
كيفية إنشاء DataFrame باستخدام وظيفة zip ()
استخدم ال أزيز() وظيفة لدمج القوائم في بايثون.
الاسم = ['Alex'، 'Bob'، 'Cataline']
RollNo = [601، 602، 603]
listOfTuples = list (zip (Name، RollNo))
df = pd. DataFrame (listOfTuples ، الأعمدة = ['Name'، 'Roll No.'])
طباعة (مدافع)
انتاج:
رقم لفة الاسم
0 اليكس 601
1 بوب 602
2 كاتالين 603
4. كيف تقرأ بيانات CSV في الباندا
ملف "القيم المفصولة بفواصل" (CSV) هو ملف نصي محدد يستخدم فاصلة لفصل القيم. يمكنك قراءة ملف CSV باستخدام امتداد read_csv () طريقة في الباندا. إذا كنت تريد طباعة DataFrame بالكامل ، فاستخدم ملحق إلى سلسلة() طريقة.
في هذا والمثال التالي ، هذا ملف CSV سيتم استخدامها لأداء العمليات.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
طباعة (df.to_string ())
انتاج:
5. كيفية تحليل إطارات البيانات باستخدام طرق الرأس () والذيل () والمعلومات ()
كيفية عرض البيانات باستخدام طريقة الرأس ()
ال رئيس() الطريقة هي واحدة من أفضل الطرق للحصول على نظرة عامة سريعة على DataFrame. تقوم هذه الطريقة بإرجاع الرأس وعدد الصفوف المحدد ، بدءًا من الأعلى.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
طباعة (df.head (10))
انتاج:
إذا لم تحدد عدد الصفوف ، فسيتم إرجاع أول 5 صفوف.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
طباعة (df.head ())
انتاج:
كيفية عرض البيانات باستخدام طريقة () الذيل
ال ذيل() تقوم الطريقة بإرجاع الرأس وعدد الصفوف المحدد ، بدءًا من الأسفل.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
طباعة (df.tail (10))
انتاج:
إذا لم تحدد عدد الصفوف ، فسيتم إرجاع آخر 5 صفوف.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
طباعة (df.tail ())
انتاج:
كيفية الحصول على معلومات حول البيانات
ال معلومات() تُرجع الطرق ملخصًا موجزًا عن DataFrame بما في ذلك نوع الفهرس وأنواع العمود ، والقيم غير الفارغة ، واستخدام الذاكرة.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
طباعة (df.info ())
انتاج:
6. كيف تقرأ بيانات JSON في Pandas
جسون (يافاسمخطوطة اbject نotation) هو تنسيق تبادل بيانات خفيف الوزن. يمكنك قراءة ملف JSON باستخدام امتداد read_json () طريقة في الباندا. إذا كنت تريد طباعة DataFrame بالكامل ، فاستخدم ملحق إلى سلسلة() طريقة.
في المثال أدناه ، هذا ملف JSON يستخدم لأداء العمليات.
متعلق ب: ما هو JSON؟ نظرة عامة على الشخص العادي
df = pd.read_json (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
طباعة (df.to_string ())
انتاج:
قم بتحديث معرفتك بلغة Python من خلال الوظائف والطرق المدمجة
تساعد الوظائف في تقصير التعليمات البرمجية وتحسين كفاءتها. وظائف وطرق مثل خفض(), الانقسام(), عد (), تقييم (), مستدير()، إلخ. يمكن أن تجعل شفرتك قوية وسهلة الفهم. من الجيد دائمًا معرفة الوظائف والطرق المضمنة حيث يمكنها تبسيط مهام البرمجة الخاصة بك إلى حد كبير.
تحتوي مكتبة Python القياسية على العديد من الوظائف للمساعدة في مهام البرمجة الخاصة بك. تعرف على أكثر الرموز فائدة وأنشئ كودًا أكثر قوة.
اقرأ التالي
- برمجة
- بايثون
- تطوير الشبكة
- برمجة
- تحليل البيانات
يوفراج طالب جامعي في علوم الكمبيوتر بجامعة دلهي بالهند. إنه متحمس لتطوير الويب Full Stack. عندما لا يكتب ، فإنه يستكشف عمق التقنيات المختلفة.
اشترك في نشرتنا الإخبارية
انضم إلى النشرة الإخبارية لدينا للحصول على نصائح تقنية ومراجعات وكتب إلكترونية مجانية وصفقات حصرية!
انقر هنا للاشتراك