تخيل صباحًا مبكرًا حيث تحتسي فنجانًا ساخنًا من القهوة الطازجة ، ويقرأ جهاز الكمبيوتر الخاص بك آخر العناوين لك - كل ذلك بمفرده. ألا يبدو هذا رائعًا؟

حسنًا ، باستخدام Python ، يمكنك إنشاء قارئ الأخبار المخصص الخاص بك ، والذي سيقرأ جميع العناوين الرئيسية لك ، جنبًا إلى جنب مع مقتطفات من كل عنوان رئيسي. نعم هذا صحيح. باستخدام المكتبات الصحيحة ، يمكنك جعل Python تقوم بجميع روتينك الصباحي ، دون الحاجة إلى قراءة كل كلمة بنفسك.

إليك كيفية كتابة هذا الرمز وتعديله على موقع الويب الإخباري المفضل لديك.

المتطلبات المسبقة لتشغيل الكود

قبل البدء في كتابة الكود والبدء في كتابته ، تحتاج إلى استيفاء بعض المتطلبات المسبقة. هذه بعض المتطلبات الأساسية ، والتي يمكن أن تجعل استخدام بايثون أسهل وأكثر فاعلية.

  1. بايثون: سيكون تثبيت أحدث إصدار من Python قرارًا جيدًا. يمكنك تثبيت أي Python IDE للحصول على أفضل النتائج.
  2. موقع الأخبار / الوصول إلى الإنترنت: نظرًا لأن كود Python يقرأ العناوين الرئيسية من موقع الويب المفضل لديك ، فأنت بحاجة إلى التأكد من أنه يمكنك الوصول إلى موقع الويب أثناء تشغيل هذا الرمز.

تمت كتابة الرمز بالكامل في Jupyter Notebook ، وهو ملف مشهور

instagram viewer
Python IDE لهذا الدليل. بالإضافة إلى ذلك ، يتم ترميز موقع ويب أخبار الهند اليوم ضمن نموذج التعليمات البرمجية.

لتنزيل Jupyter Notebook ، يمكنك إما استخدامه كجزء من حزمة anaconda أو تنزيل إصدار مستقل على نظامك.

تحميل:اناكوندا | دفتر Jupyter

بدون مزيد من اللغط ، دعنا نتعمق أكثر في الشفرة.

كتابة الكود في بايثون

للبدء ، تحتاج إلى استيراد بعض مكتبات Python ، كل منها يخدم أغراضًا مختلفة.

استيراد win32com.client كـ wincl
من urllib.request import urlopen كـ ureq
من bs4 استيراد شوربة جميلة كشوربة
س = وينكل. ديسباتش ("SAPI.spVoice")

أين:

  • win32com.client: تتفاعل هذه المكتبة مع أجهزة Windows وتقوم بتشغيل برامج Python بسلاسة.
  • طلب urllib: تعالج هذه المكتبة قيم URL من وحدة الطلب.
  • BS4: تحتوي مكتبة BS4 على وظيفة Beautiful Soup ، والتي تقوم بكشط البيانات من مواقع الويب التي تستخدم Python.
  • س = وينكل. ديسباتش ("SAPI.spVoice"): قم بتنشيط الأوامر الصوتية في Windows.

سيعمل هذا الرمز على نظام Windows فقط ، حيث ستتصل بمكتبة win32.com.client.

بعد ذلك ، تحتاج إلى تحديد عنوان URL (الرابط) الخاص بالموقع داخل ملف عنوان url متغير مخزّن في ذاكرة بايثون.

url = https://www.indiatoday.in/top-stories

قم بإنشاء عميل متغير جديد لتخزين أمر فتح عنوان URL.

العميل = ureq (url)
طباعة (العميل)

أين:

  • زبون: متغير جديد.
  • ureq: تم استيراد دالة Python من urllib.request ، والتي تفتح عنوان url المخزن.

نظرًا لأنك فتحت عنوان URL في الذاكرة ، فقد حان الوقت للتحقق مما إذا كان موقع الويب المعني يسمح بالاتصالات غير الآمنة عبر Python. يمكنك طباعة متغير العميل والتحقق من الإخراج.

هناك احتمالان باستخدام أمر الطباعة:

  • خطأ HTTP: عندما يكون موقع الويب آمنًا ، لا يمكنك كشط المحتوى باستخدام Python.
  • مقتطف الكود: إذا تم إرجاع مقتطف الشفرة بعد تشغيل موقع الويب ، فافترض أنه يمكنك بسهولة سحب العناوين الرئيسية.

بمجرد تحديد عنوان URL لموقع الويب الإخباري داخل أمر URL ، حان الوقت لاستيراد رمز HTML إلى متغير.

page_html = client.read ()
طباعة (page_html)

تحتاج إلى طباعة كود HTML لموقع الويب الذي تم استيراده إلى Python كخطوة احترازية. يمكنك حتى مطابقة هذا الرمز مع رمز موقع الويب المتاح تحت فحص اختيار.

قبل تحويل الشفرة ، تحتاج إلى إغلاق موقع الويب من ذاكرة Python باستخدام الأمر close.

client.close ()

نظرًا لاستيراد كود HTML إلى متغير Python ، فأنت بحاجة إلى تحويله إلى تنسيق Python قابل للقراءة لتطبيق تجد و جد كل أوامر للبحث عن الكلمات الرئيسية.

يمكنك تمرير الأمر التالي لتحويل كود HTML:

page_soup = soup (page_html، "html.parser")

أين:

  • page_soup: متغير جديد.
  • حساء: الاسم المستعار لـ وحدة حساء جميلة.
  • page_html: المتغير الذي يحتوي على كود HTML من الموقع.
  • html_parser: بناء الجملة الافتراضي لتحويل كود HTML.

بمجرد أن تصبح الشفرة جاهزة للاستخدام ، فقد حان الوقت لفحص كود HTML لموقع الويب لبدء البحث عن الكلمات الرئيسية الرئيسية.

للقيام بذلك ، انقر بزر الماوس الأيمن في أي مكان على موقع الويب ، وانقر فوق فحص. سيؤدي هذا إلى فتح رمز HTML لموقع الويب المعني.

في نافذة كود موقع الويب ، قم بالتمرير ، حتى تحدد مكان علامات الحاوية التي تخزن العناوين الرئيسية.

وترد هذه داخل عرض المحتوى العلامات على موقع India Today. تختلف حاويات كل موقع إخباري ، ولكن يجب أن تكون قادرًا على التنقل عبر الكود بسهولة نسبية.

Articles = page_soup.find ("div"، {"class": "view-content"})

أخيرًا ، تحتاج إلى التقاط العلامات الفرعية ، التي تحتوي على العناوين الرئيسية التي ستقرأها Python لك.

Articles = articles.findAll ("div"، {"class": "catagory-List"})

ستحتوي حاوية محتوى العرض على عدة عناوين رئيسية ، الغلاف الخارجي لعناوينك الرئيسية.

لالتقاط علامات H2 والمقتطفات المدرجة مع كل عنوان ، تحتاج إلى تشغيل حلقة.

أنا = 1
لـ x في المقالات:
العنوان = x.find ("h2"). نص
الفقرة = x.find ("p"). text
طباعة (أنا ، العنوان ، "
", "
"، الفقرة ،"
", "
")
ص. التحدث (العنوان)
ص. تحدث (الفقرة)
أنا = أنا + 1

أين:

  • أنا: متغير عداد جديد ، سيتم زيادته تلقائيًا.
  • لقب: متغير جديد لحفظ العنوان (h2).
  • الفقرة: متغير جديد للاحتفاظ بالفقرات المرتبطة بكل H2.
  • مطبعة: ستتم طباعة عنوان العنوان والفقرة على واجهة Python.
  • ص. التحدث (العنوان): سوف تقرأ Python كل عنوان مخزن.
  • ص. تحدث (الفقرة): سوف تقرأ بايثون كل مقتطف فقرة مخزن.
  • أنا = أنا + 1: يعمل هذا الأمر على زيادة الرقم التسلسلي المرتبط بكل عنوان معروض على واجهة Python تلقائيًا.

استخدام وحدة الحساء الجميلة في Python لقراءة الأخبار اليومية

في كل مرة تقوم فيها بتشغيل الكود ، سيتم تنزيل عناوين جديدة من موقع الأخبار قبل قراءتها بصوت عالٍ. تنفذ Python الشفرة في كل مرة تقوم فيها بتشغيل مجموعة الرموز ، وبالتالي تبقيك على اطلاع دائم بالتغييرات على موقع الويب.

سيستمر عرض العناوين الأقدم وقراءتها بواسطة Python حتى تقوم بتحديث الكود وإعادة تشغيله.

يعد استخدام Python لقراءة العناوين اليومية أمرًا سهلاً

تقدم Python ، كلغة مفتوحة المصدر ، سلسلة من الأدوات مثل Beautiful Soup و Selenium وأطر عمل أخرى - للمبتدئين والمستخدمين المتقدمين على حدٍ سواء.

إذا كنت ترغب في توصيل أخبارك اليومية عن طريق الصوت ، فإن Python تجعل الأمر سهلاً. يمكن أن يساعدك تعلم هذه اللغة المعينة في أن تصبح مبرمجًا أفضل في جميع المجالات.

10 أدوات مفيدة لمطوري بايثون

سواء كنت بحاجة إلى أدوات Python لعلوم البيانات أو التعلم الآلي أو تطوير الويب أو أي شيء بينهما ، فهذه القائمة قد غطتها.

اقرأ التالي

يشاركسقسقةبريد الالكتروني
مواضيع ذات صلة
  • برمجة
  • بايثون
  • أخبار
  • تلميحات الكمبيوتر
  • برمجة
عن المؤلف
غوراف سيال (تم نشر 56 مقالة)

يتمتع Gaurav Siyal بخبرة عامين في الكتابة ، ويكتب لسلسلة من شركات التسويق الرقمي ووثائق دورة حياة البرامج.

المزيد من Gaurav Siyal

اشترك في نشرتنا الإخبارية

انضم إلى النشرة الإخبارية لدينا للحصول على نصائح تقنية ومراجعات وكتب إلكترونية مجانية وصفقات حصرية!

انقر هنا للاشتراك