الإعلانات

هل أنت مؤمن بفكرة أنه بمجرد نشر شيء ما على الإنترنت ، يتم نشره إلى الأبد؟ حسنًا ، سنبدد اليوم هذه الأسطورة.

الحقيقة هي أنه في كثير من الحالات يكون من الممكن تمامًا القضاء على المعلومات من الإنترنت. بالتأكيد ، هناك سجل لصفحات الويب التي تم حذفها إذا بحثت في آلة Wayback، حق؟ نعم ، بالتأكيد. على آلة Wayback ، هناك سجلات لصفحات الويب التي تعود إلى سنوات عديدة - صفحات لن تجدها مع بحث Google لأن صفحة الويب لم تعد موجودة. حذفه شخص ما ، أو تم إغلاق الموقع.

لذا ، لا يوجد حوله ، أليس كذلك؟ المعلومات محفورة إلى الأبد في حجر الإنترنت ، هناك لأجيال لنرى؟ حسنًا ، ليس تمامًا.

الحقيقة هي أنه في حين أنه قد يكون من الصعب أو المستحيل مسح القصص الإخبارية الرئيسية التي انتشرت من موقع إخباري أو مدونة إلى آخر مثل الفيروس ، من السهل جدًا في الواقع التخلص تمامًا من صفحة الويب أو العديد من صفحات الويب من جميع سجلات الوجود - لإزالة هذه الصفحة لكل من محركات البحث وكذلك ال آلة Wayback تتيح لك آلة Wayback الجديدة السفر بصريًا في وقت الإنترنتيبدو أنه منذ إطلاق Wayback Machine في عام 2001 ، قرر مالكو الموقع التخلص من الواجهة الخلفية المستندة إلى Alexa وإعادة تصميمها باستخدام رمز المصدر المفتوح الخاص بهم. بعد إجراء الاختبارات مع ...

instagram viewer
اقرأ أكثر . هناك صيد بالطبع ، لكننا سنصل إلى ذلك.

3 طرق لإزالة صفحات المدونة من الشبكة

الطريقة الأولى هي تلك التي يستخدمها غالبية مالكي مواقع الويب ، لأنهم لا يعرفون أي شيء أفضل - ببساطة حذف صفحات الويب. قد يحدث هذا لأنك أدركت أن لديك محتوى مكررًا على موقعك ، أو لأن لديك صفحة لا تريد عرضها في نتائج البحث.

ما عليك سوى حذف الصفحة

تكمن المشكلة في حذف الصفحات تمامًا من موقع الويب الخاص بك في أنه نظرًا لأنك قمت بالفعل بإنشاء الصفحة على صافي ، من المحتمل أن تكون هناك روابط من موقعك الخاص بالإضافة إلى روابط خارجية من مواقع أخرى إلى ذلك على وجه الخصوص الصفحة. عند حذفها ، يتعرف Google على الفور على صفحتك على أنها صفحة مفقودة.

لم يتم العثور على الملف

لذلك ، عند حذف صفحتك ، لم تنشئ فقط مشكلة تتعلق بأخطاء الزحف "لم يتم العثور عليها" لنفسك ، ولكنك أنشأت أيضًا مشكلة لأي شخص مرتبط بالصفحة. عادةً ، سيرى المستخدمون الذين يصلون إلى موقعك من أحد تلك الروابط الخارجية صفحة 404 ، وهي ليست كذلك مشكلة كبيرة ، إذا كنت تستخدم شيئًا مثل رمز 404 المخصص من Google لإعطاء المستخدمين اقتراحات مفيدة أو البدائل. ولكن ، قد تعتقد أنه يمكن أن تكون هناك طرق أكثر جمالًا لحذف الصفحات من نتائج البحث دون البدء في جميع تلك الصفحات 404 للروابط الواردة الحالية ، أليس كذلك؟

حسنا ، هناك.

إزالة صفحة من نتائج بحث Google

بادئ ذي بدء ، يجب أن تفهم أنه إذا كانت صفحة الويب التي تريد إزالتها من نتائج بحث Google ليست صفحة من موقعك الخاص ، فأنت لست محظوظًا إلا إذا كانت هناك أسباب قانونية أو إذا كان الموقع قد نشر معلوماتك الشخصية عبر الإنترنت بدونك الإذن. إذا كان الأمر كذلك ، فاستخدم Google أداة حل مشكلات الإزالة لإرسال طلب لإزالة الصفحة من نتائج البحث. إذا كانت لديك حالة صالحة ، فقد تجد بعض النجاح بعد إزالة الصفحة - بالطبع قد تحقق نجاحًا أكبر الاتصال بصاحب الموقع كيفية إزالة المعلومات الشخصية الكاذبة على الإنترنتالخصوصية على الإنترنت ليست مضمونة بعد الآن. تعرف على كيفية الإبلاغ عن موقع ويب وإزالة المعلومات الشخصية من الإنترنت. اقرأ أكثر كما وصفت كيفية القيام بذلك في عام 2009.

الآن ، إذا كانت الصفحة التي تريد إزالتها من نتائج البحث موجودة على موقعك ، فأنت محظوظ. كل ما عليك القيام به هو إنشاء ملف robots.txt وتأكد من أنك قد رفضت الصفحة المحددة التي لا تريدها في نتائج البحث ، أو الدليل بأكمله بالمحتويات التي لا تريد فهرستها. إليك ما يبدو عليه حظر صفحة واحدة.

وكيل المستخدم: * Disallow: /my-deleted-article-that-i-want-removed.html

يمكنك منع برامج الزحف من الزحف إلى أدلة كاملة لموقعك على النحو التالي.

وكيل المستخدم: * Disallow: / content-about-personal-stuff /

جوجل لديها ممتاز صفحة الدعم يمكنه مساعدتك في إنشاء ملف robots.txt إذا لم تكن قد أنشأت ملفًا من قبل. هذا يعمل بشكل جيد للغاية ، كما أوضحت مؤخرًا في مقال حول صفقات التنظيم الهيكلي كيفية التفاوض على الصفقات النقابية وحماية تصنيفات البحث الخاصة بكالنقابة هي كل الغضب هذه الأيام. ولكن فجأة قد تجد أن شريك النقابة مدرج أعلى منك في نتائج البحث عن قصة كتبتها في الأصل! حماية تصنيفات البحث الخاصة بك. اقرأ أكثر حتى لا يؤذوك (مطالبة شركاء النقابة بعدم السماح بفهرسة صفحاتهم حيث يتم تجميعك). بمجرد موافقة شريك المشاركة الخاص بي على القيام بذلك ، اختفت تمامًا الصفحات التي كانت محتوى مكررًا من مدونتي من قوائم البحث.

قوائم جوجل

يأتي موقع الويب الرئيسي فقط في المركز الثالث للصفحة حيث يدرجون عنواننا ، لكن مدونتي مدرجة الآن في كل من النقطتين الأولى والثانية ؛ الأمر الذي كان سيكون مستحيلًا تقريبًا لو ترك موقع ويب ذي سلطة أعلى الصفحة المكررة مفهرسة.

ما لا يدركه الكثير من الناس هو أنه من الممكن أيضًا تحقيق ذلك باستخدام أرشيف الإنترنت (آلة Wayback.). إليك الخطوط التي تحتاج إلى إضافتها إلى ملف robots.txt الخاص بك لتحقيق ذلك.

وكيل المستخدم: ia_archiver. Disallow: / sample-category /

في هذا المثال ، أطلب من أرشيف الإنترنت إزالة أي شيء في الدليل الفرعي لفئة العينة على موقعي من Wayback Machine. يوضح أرشيف الإنترنت كيفية القيام بذلك في صفحة تعليمات الاستبعاد الخاصة بهم. هذا هو المكان الذي يوضحون فيه أيضًا أن "أرشيف الإنترنت غير مهتم بتوفير الوصول إلى مواقع الويب أو مستندات الإنترنت الأخرى التي لا يريد مؤلفوها موادهم في المجموعة."

هذا يتعارض مع الاعتقاد الشائع بأن أي شيء يتم نشره على الإنترنت يتم اقتحامه في الأرشيف إلى الأبد. لا - يمكن لمشرفي المواقع الذين يمتلكون المحتوى إزالة المحتوى من الأرشيف على وجه التحديد باستخدام نهج robots.txt.

إزالة صفحة فردية مع العلامات الوصفية

إذا كان لديك فقط عدد قليل من الصفحات الفردية التي تريد إزالتها من نتائج بحث Google ، فليس عليك في الواقع استخدام نهج robots.txt على الإطلاق ، يمكنك ببساطة إضافة العلامة الوصفية "الروبوتات" الصحيحة إلى الصفحات الفردية ، وإخبار الروبوتات بعدم فهرسة أو اتباع الروابط على كامل الصفحة.

روابط خارجية 3

يمكنك استخدام meta "robots" أعلاه لمنع الروبوتات من فهرسة الصفحة ، أو يمكنك إخبار روبوت Google على وجه التحديد عدم الفهرسة حتى تتم إزالة الصفحة فقط من نتائج بحث Google ، ولا يزال بإمكان روبوتات البحث الأخرى الوصول إلى الصفحة المحتوى.

الأمر متروك لك تمامًا كيف تريد إدارة ما تفعله الروبوتات بالصفحة وما إذا كانت الصفحة مدرجة أم لا. بالنسبة لعدد قليل من الصفحات الفردية ، قد يكون هذا هو النهج الأفضل. لإزالة دليل محتوى كامل ، انتقل باستخدام طريقة robots.txt.

فكرة إزالة المحتوى

يقلب هذا النوع فكرة "حذف المحتوى من الإنترنت" رأساً على عقب. من الناحية الفنية ، إذا قمت بإزالة جميع الروابط الخاصة بك إلى صفحة على موقعك ، وقمت بإزالتها من بحث Google و أرشيف الإنترنت باستخدام تقنية robots.txt ، الصفحة مخصصة لجميع الأغراض والأغراض "محذوفة" من الإنترنت. ولكن الشيء الرائع هو أنه إذا كانت هناك روابط حالية للصفحة ، فستستمر هذه الروابط في العمل ولن تسبب أخطاء 404 لهؤلاء الزائرين.

إنها طريقة أكثر "اللطف" لإزالة المحتوى من الإنترنت دون العبث تمامًا بشعبية الرابط الحالي لموقعك عبر الإنترنت. في النهاية ، كيف يمكنك إدارة المحتوى الذي يتم جمعه بواسطة محركات البحث وأرشيف الإنترنت هو أمر متروك لك ، ولكن دائمًا تذكر أنه على الرغم مما يقوله الناس عن عمر الأشياء التي يتم نشرها عبر الإنترنت ، إلا أنها حقًا تقع ضمن نطاقك مراقبة.

ريان حاصل على درجة البكالوريوس في الهندسة الكهربائية. لقد عمل 13 عامًا في هندسة الأتمتة ، و 5 سنوات في مجال تكنولوجيا المعلومات ، وهو الآن مهندس تطبيقات. محرر إداري سابق لـ MakeUseOf ، وقد تحدث في المؤتمرات الوطنية حول تصور البيانات وقد ظهر في التلفزيون والإذاعة الوطنية.