تعد قاعدة بيانات الأفلام على الإنترنت (IMDb) أكبر قاعدة بيانات على الإنترنت تحتوي على معلومات تتعلق بالأفلام والمسلسلات التلفزيونية ومقاطع الفيديو المنزلية وألعاب الفيديو ومحتوى البث. تحتوي قاعدة البيانات عبر الإنترنت على ملايين السجلات الدقيقة التي يمكنك استخدامها لإجراء تحليل البيانات.

Cinemagoer (المعروفة سابقًا باسم IMDbPY) هي مكتبة Python لإدارة واسترداد بيانات قاعدة بيانات أفلام IMDb. يمكنك الوصول إلى بيانات حول الأفلام والأشخاص والشركات ، والتي يمكن استخدامها بشكل أكبر للتحليل.

تثبيت المكتبات المطلوبة

تحتاج إلى تثبيت السينما مكتبة Python للوصول إلى ملف شجونه قاعدة البيانات. قم بتشغيل الأمر التالي في موجه الأوامر لتثبيت المكتبة:

نقطة ثَبَّتَ السينما

يجب أن تمتلك نقطة مثبتة على نظامك لتثبيت مكتبات Python الخارجية.

الكود المستخدم في هذا المشروع متاح في ملف مستودع جيثب وهو مجاني لك لاستخدامه بموجب ترخيص MIT.

استخراج بيانات IMDb باستخدام بايثون

تحتاج إلى استيراد مكتبة cinemagoer قبل استخدامها في التعليمات البرمجية الخاصة بك.

من imdb يستورد سينيماغر
ia = صانع السينما ()

يقوم الكود أعلاه باستيراد مكتبة cinemagoer وإنشاء مثيل لفئة cinemagoer.

instagram viewer

البحث في الأفلام

يمكنك البحث عن أفلام بعنوان معين (أو مشابه) باستخدام امتداد search_movie () طريقة. على سبيل المثال ، إذا كنت تريد البحث عن أفلام تحمل العنوان "روك" ، فأنت بحاجة إلى تشغيل الكود التالي:

من imdb يستورد سينيماغر

# إنشاء مثيل لفئة Cinemagoer
ia = صانع السينما ()

# البحث عن الأفلام التي تحتوي على موسيقى الروك في أسمائها
أفلام = ia.search_movie ('صخر')
مطبعة(أفلام[0])

يجب أن يطبع هذا الفيلم الأول الذي يعثر عليه ، على سبيل المثال:

يمكنك الحصول على فيلم من خلال معرف IMDb الخاص به. يمكنك بعد ذلك استخراج مزيد من المعلومات مثل أسماء المخرجين والأنواع. أنت بحاجه إلى حلقة من خلال القائمة للحصول على معلومات فردية.

من imdb يستورد سينيماغر

# إنشاء مثيل لفئة Cinemagoer
ia = صانع السينما ()

# الحصول على فيلم عن طريق معرف IMDb
فيلم = ia.get_movie ('0468569')
مطبعة(فيلم)

# طباعة اسماء مخرجي الفيلم
مطبعة('المدراء:')

للمخرج في الفيلم ['المخرجين']:
طباعة (مخرج ['اسم'])

# طباعة أنواع الفيلم
مطبعة('الأنواع:')

للنوع في الفيلم ['الأنواع']:
مطبعة(النوع)

في الإخراج ، يجب أن ترى اسم الفيلم المحدد ومخرجه (مخرجوه) ونوعه (أنواعه):

البحث عن شخص

يمكنك البحث عن الأشخاص الذين يستخدمون ملف search_person () طريقة. على سبيل المثال ، إذا كنت تريد البحث عن "Heath" ، فأنت بحاجة إلى تشغيل الكود التالي:

من imdb يستورد سينيماغر

# إنشاء مثيل لفئة Cinemagoer
ia = صانع السينما ()

# البحث عن أشخاص لديهم هيث في أسمائهم
الأشخاص = ia.search_person ('هيث')
مطبعة(الأشخاص [0])

سترى اسم أول شخص مطابق يعثر عليه البحث:

البحث عن الشركات

يمكنك البحث عن الشركات باستخدام search_company () طريقة. على سبيل المثال ، إذا كنت تريد البحث عن "Universal" ، فأنت بحاجة إلى تشغيل الكود التالي:

من imdb يستورد سينيماغر

# إنشاء مثيل لفئة Cinemagoer
ia = صانع السينما ()

# البحث عن الشركات التي تحمل اسم Universal في أسمائها
الشركات = ia.search_company ('عالمي')
مطبعة(شركات)

ستحصل على قائمة بجميع الشركات التي لديها Universal في أسمائها.

يمكنك أيضًا استرداد بيانات الشخص والشركة باستخدام المعرف الخاص بها.

من imdb يستورد سينيماغر

# إنشاء مثيل لفئة Cinemagoer
ia = صانع السينما ()

# الحصول على بيانات الشخص عن طريق الهوية
شخص = ia.get_person ('0005132')
طباعة (شخص ['اسم'])
طباعة (شخص ['تاريخ الميلاد'])

# الحصول على بيانات الشركة عن طريق الهوية
الشركة = ia.get_company ('0005073')
print (شركة ['اسم'])

سيُظهر الإخراج تفاصيل الشخص واسم الشركة:

البحث عن الأفلام العلوية والسفلية

يمكنك استرداد البيانات لأفضل 250 فيلمًا وأدنى 100 فيلم باستخدام ملف get_top250_movies () و get_bottom100_movies () الطرق ، على التوالي:

من imdb يستورد سينيماغر

# إنشاء مثيل لفئة Cinemagoer
ia = صانع السينما ()

# العثور على أفضل 250 فيلمًا
أعلى = ia.get_top250_movies ()
مطبعة(قمة[0])

# العثور على أسفل 100 فيلم
أسفل = ia.get_bottom100_movies ()
مطبعة(قاع[0])

ردًا على ذلك ، سترى اسم أفضل فيلم واسم الأسوأ:

توفر مكتبة cinemagoer أيضًا بعض الطرق الأخرى مثل get_top250_tv (), get_popular100_movies ()، و get_top250_indian_movies ().

تحليل البيانات هو تقييم البيانات باستخدام الأدوات التحليلية أو الإحصائية لاستخراج المعلومات. تزداد شعبية تحليل البيانات كل يوم. يتم استخدامه الآن من قبل الشركات وشركات التسويق والفرق الرياضية. تتضمن العملية الكاملة لتحليلات البيانات تحديد الأهداف وطرح الأسئلة وجمع البيانات وتنقية البيانات وتحليل البيانات والنتائج الختامية.

يمكنك الحصول على مجموعات بيانات لمشاريعك باستخدام مكتبات Python مثل Cinemagoer أو عبر منصات الإنترنت مثل Kaggle. إلى جانب اللغات الكاملة مثل Python و R ، يمكنك استخدام أدوات أخرى مثل Microsoft Excel و Tableau و Stata لإجراء تحليل البيانات.