الإعلانات

إذا كنت تريد تحويل أي نص مطبوع إلى نص رقمي يمكنك نسخه ولصقه وتعديله والبحث فيه ، فستحتاج إلى استخدام الماسحات الضوئية للتعرف الضوئي على الأحرف (OCR).

عندما تختار مسح مستند ضوئيًا أو التقاط صورة منه ، سيتم حفظه بتنسيق مثل JPEG أو PDF. برنامج OCR يمكن بعد ذلك التعرف على الحروف والأرقام داخل هذه المستندات وتحويلها إلى ملف PDF قابل للبحث 4 طرق لإنشاء وتحرير ملفات PDF مجانًامن بين جميع أنواع الملفات الشائعة الموجودة في عالم الحوسبة لدينا ، من المحتمل أن يكون PDF واحدًا من أكثر الأنواع تقييدًا ، في حين أنه متاح للجميع للاستخدام (للقراءة في المقام الأول) ... اقرأ أكثر أو في ملف يمكنك تحريره في برامج مثل Microsoft Word.

تكمن المشكلة في أن بعض الماسحات الضوئية OCR تعمل بشكل أفضل بكثير من غيرها ، مع كون أفضلها ثقيلًا جدًا على المحفظة.

Omnipage18 على سبيل المثال ، يكلف 150 دولارًا ، ولكنه جيد بشكل خاص في التعرف على اللغات المختلفة. Adobe Acrobat Pro DC يكلف 400 دولار ولكن لديه دقة لا تصدق. ABBYY FineReader يكلف 150 دولارًا ، ولكنه رائع في تحويل المستندات مثل المجلات والكتيبات إلى نص يمكن البحث فيه. سنقوم باختبار عرض ABBYY عبر الإنترنت لاحقًا في هذه المقالة.

instagram viewer

ومع ذلك ، إذا كنت تبحث عن بدائل مجانية يمكنك ذلك تحميل واستخدامه على Windows أو OS X ، يجب عليك جرب أدوات OCR هذه أفضل 5 أدوات OCR لاستخراج النص من الصورعندما يكون لديك رزم من الورق ، كيف يمكنك تحويل كل هذا النص المطبوع إلى شيء يمكن لبرنامج رقمي التعرف عليه وفهرسته؟ احتفظ ببرنامج OCR جيدًا بالقرب منك. اقرأ أكثر . ولكن إذا كنت تفضل استخدام الإصدار المجاني ، عبر الانترنت أداة OCR ، استمر في القراءة ، كما جربنا أفضل القليل ، مع النتائج أدناه.

الاختبار

يبدو أن معظم الناس يستخدمون الآن الهواتف الذكية للقيام بمسح ضوئي لهم مسح وإدارة الإيصالات الخاصة بك ، وتوفير المساحة والورق والوقتتُفقد إيصالات الورق بسهولة ويصعب العثور عليها عندما تكون في أشد الحاجة إليها. لحسن الحظ ، فإن الانتقال الرقمي يحل هاتين المشكلتين. اقرأ أكثر ، قررت استخدام تطبيق Evernote Scannable (مجانًا على iOS و Android). لقد قمت بمسح الصفحة الأولى من صفحة ريتشارد دوكين تسلق جبل غير محتمل، لمعرفة النتائج التي يمكن أن نحصل عليها بالتنسيق الأساسي للغاية. لقد قمت أيضًا بمسح صفحة من صفحة Tim Ferriss " الشيف 4 ساعات لتجربة الماسحات الضوئية باستخدام تنسيق أكثر تعقيدًا قليلاً. قمت بحفظ كل من هذه الملفات كملف PDF.

اختبار OCRs عبر الإنترنت

ثم تم تشغيل هذه المستندات من خلال بعض أفضل أدوات OCR عبر الإنترنت لمعرفة مدى نجاحها.

Free OCR Online Online [لم يعد متاحًا]

لحسن الحظ ، لا يوجد تسجيل مطلوب لاستخدام OCR المجاني عبر الإنترنت. وقد تأثرت بشكل مضاعف عندما رأيت مطالبتهم بالحفاظ على تنسيق وتخطيط مستندي.

OCR مجاني على الإنترنت

يدعي الموقع أنه قادر على دعم ملفات PDF و GIF و BMP و JPEG و TIFF و PNG كمدخلات. يمكن أن تكون المخرجات إما DOC ووثيقة نصية بتنسيق PDF و RTF و TXT. للأسف ، لم أتمكن من معرفة ما إذا كان لديهم حد لحجم الملف.

الوثيقة الأساسية لقوات الدفاع الشعبي
تحولت تماما تماما. ليس هناك الكثير ليقوله! نحن على وشك الخروج للغاية بداية جيدة.

المستند الأساسي لـ DOC
يبدو أن الكلمات الفعلية قد تحولت بشكل لا تشوبه شائبة ، بصرف النظر عن "ount" من "Mount Rushmore" بطريقة ما. التنسيق قصة مختلفة ، على الرغم من ذلك. تم استبدال العديد من الفواصل بشرطة سفلية ، وتم إدراج مسافات عشوائية عند نقاط في جميع أنحاء المستند. عندما ترى في وقت لاحق كيف كان أداء البرنامج المتميز في هذا الاختبار ، فهذا ليس جهدًا سيئًا على الاطلاق.

مستند معقد إلى PDF
استغرق تحويل الوثيقة 120 ثانية ضخمة! بمجرد اكتماله ، تم تحويل كل النص بدقة 95٪ تقريبًا ، على الرغم من عدم إمكانية البحث عن النص الموجود في المربع المنفصل الموجود في أعلى يمين الصفحة. كانت بعض الشخصيات الأخرى في جميع أنحاء PDF غير صحيحة أيضًا.

مستند معقد لـ DOC
هذه المرة ، استغرق التحويل 10 ثوانٍ فقط ، مع تحويل النص مرة أخرى بدقة حوالي 95٪. كانت هناك بعض المشاكل في التباعد الغريب ، وواجه البرنامج مشكلة في تحويل الخط في أعلى يمين المستند ، وغاب عن بعض الأحرف هنا وهناك.

الحكم
إذا كنت ترغب في تحويل المستندات المنسقة ببساطة إلى PDF ، فهذه أداة رائعة. من حيث التحويل إلى DOC ، لم تكن النتائج شيئًا للكتابة عنها.

تقدم i2OCR بعض الادعاءات المثيرة للإعجاب. تتعرف الأداة على أكثر من 60 لغة ، ويمكنها التعامل مع التخطيطات متعددة الأعمدة (عن طريق إزالة التنسيق) ، وليس لها حدود لحجم الملف ، ويمكن تحويل الملفات التي تم تحميلها و من عناوين URL. ولا تحتاج إلى التسجيل لاستخدام هذه الأداة أيضًا.

تعمل الخدمة بمجرد استخراج النص من صورتك ، ثم إخراج نص غير منسق. يمكنك تصحيح أي أخطاء في العرض جنبًا إلى جنب بسرعة ، قبل نسخ النص إلى برامج أخرى ، أو تنزيله بتنسيق DOC أو PDF أو HTML.

ملاحظة: عندما حاولت تحميل مستندات PDF الخاصة بي ، تم رفضها من قبل i2OCR ، لذلك احتجت إلى تحويلها إلى JPEG (من خلال أخذ لقطة شاشة لها ، ثم تحميل الملفات).

المستند الأساسي للنص العاديلقطة شاشة 2016-02-11 في 12.30.28
نظرًا للطريقة التي تعمل بها هذه الأداة ، يتم فقد جميع التنسيقات ، على الرغم من أن التحويل من الصورة إلى النص كان شبه مثالي. كانت هناك بعض الأخطاء الصغيرة مثل تباعد الفقرات ، وتم استبدال بعض الفواصل بالنقاط ، ولكن هذه هي هزات صغيرة.

مستند معقد إلى نص عاديلقطة شاشة 2016-02-11 في 12.39.48
تم تحويل معظم النص دون أخطاء كثيرة ، بصرف النظر عن العنوان والوصفة في الجزء العلوي الأيمن ، وهو أمر غير قابل للقراءة لهذه الأداة. كانت الطريقة التي تم بها تحويل الأعمدة إلى نص عادي بعيدة عن المثالية. إذا كنت ترغب في جعل هذا التحويل قابلاً للتطبيق ، فستكون هناك حاجة إلى الكثير من الوقت لإعادة ترتيب السطور في جمل متماسكة.

الحكم
بالنسبة للمستندات الأساسية ، يعمل i2OCR بشكل رائع. القدرة على تحرير النص قبل التنزيل هي أيضًا لمسة لطيفة جدًا. بالنسبة إلى المستندات الأكثر تعقيدًا ، لا يزال التحويل دقيقًا جدًا ، ولكن الطريقة التي يتم بها إخراج النص لن تجعل حياتك أسهل كثيرًا.

يدعم OCR عبر الإنترنت حاليًا 46 لغة مختلفة ، ويمكنه تحويل PDF أو JPG أو BMP أو TIFF و GIF إلى تنسيق Word أو Excel أو Plain Text. يدعي الموقع أن "المستندات المحولة تبدو تمامًا مثل الأصل - الجداول والأعمدة والرسومات".

يتيح لك الإصدار الذي يمكنك استخدامه بدون تسجيل تحويل ما يصل إلى 15 صورة في الساعة (بحد أقصى 5 ميجابايت). إذا قمت بالتسجيل للحصول على حساب ، يمكنك شراء المزيد من الصفحات فوق هذا الحد ، بينما يمكنك أيضًا تحويل المستندات متعددة الصفحات وأرشيفات ZIP أيضًا.

نتائج التعرف الضوئي على الحروف عبر الإنترنت

المستند الأساسي لـ DOC
تم تحويل المستند الأساسي بشكل لا تشوبه شائبة إلى جانب الرقم الروماني أنا لا يتم التقاطها. كما وعد الموقع ، كان التنسيق تمامًا كما كان في الكتاب. مجد لهذه الأداة.

مستند معقد لـ DOC
بعد خيبة أملي من أدوات OCR السابقة في تحويل المستند المعقد ، أعجبت بشكل كبير بـ OCR عبر الإنترنت. كان التخطيط قريبًا تمامًا ، كما ترى أعلاه. مرة أخرى ، على الرغم من أن الوصفة لم يتم التقاطها جيدًا ، ولكن أي أخطاء طفيفة أخرى كانت لا تذكر.

الحكم

نتائج رائعة من OCR عبر الإنترنت. الجانب السلبي الوحيد الذي أراه هو أنه لا توجد طريقة لتنزيل المستندات المحولة كملفات PDF لأن تنسيقات الإخراج المذكورة تشمل DOCX و XLSX و TXT فقط.

كما ذكرنا سابقًا ، تعد ABBYY واحدة من الشركات الرائدة في السوق في برامج OCR ، حيث تكلف حوالي 150 دولارًا لبرنامجها الكامل القابل للتنزيل. إنهم يقدمون تجربة مجانية من 10 صفحات لأداتهم عبر الإنترنت ، على الرغم من (التسجيل مطلوب). بالنسبة لاشتراك 5 دولارات ، ستتيح لك أداتهم عبر الإنترنت تحويل 200 صفحة كل شهر.

ABBYY FineReader أون لاين

يمكن أن تصل الملفات المقبولة إلى 100 ميجابايت ، بأي من التنسيقات التالية: PDF و JPG و JPEG و TIF و TIFF و PCX و DCX و BMP و PNG. يتعرف ABBYY أيضًا على ما يقرب من 200 لغة. المخرجات مثيرة للإعجاب بشكل خاص ، مع الاختيار بين DOCX و XLSX و RTF و TXT و PPTX و ODT و PDF و FB2 و EPUB.

يمكنك حتى تجربة اثنين من ميزات BETA أثناء تجربتك. الأول هو خيار ترجمة المستند إلى لغة أخرى. والآخر هو تصدير المستند المحول إلى حساب التخزين السحابي الخاص بك ، سواء كان ذلك Dropbox أو Google Drive أو Evernote أو Microsoft OneDrive أو Box.

المستند الأساسي لـ DOCX
كانت النتائج الإجمالية جيدة ، ولكنها ليست مذهلة نظرًا لأن هذا منتج ممتاز. تم تبديل العديد من الفواصل والنقاط حولها ، وتم استبدال العديد من الفواصل المقلوبة بعلامة النجمة ، وفقدان بعض الأحرف الكبيرة ، وتم تهجئة كلمة واحدة (حرفي) بشكل غير صحيح.

مستند معقد لـ DOCX
بمجرد التحويل ، كان هناك عدد قليل جدًا من الأخطاء في النص داخل المستند (بصرف النظر عن OCR التي تكافح مع خط تلك الوصفة مرة أخرى!) ، ولكن التنسيق ترك الكثير مما هو مرغوب فيه.

نتيجة ABBYY

الأعمدة الثلاثة بطريقة أو بأخرى أخذت صفحتين ، مع العمود المركزي فقط تظهر في الصفحة الثانية. إذا كنت ترغب في الواقع فعل أي شيء مع هذا المستند المحول ، سينتهي بك الأمر بشد شعرك.

الوثيقة الأساسية لقوات الدفاع الشعبي
أثناء مراجعة ملف PDF المحول ، لم أجد أي خطأ على الإطلاق. ربما وجدنا أين يتفوق ABBYY. نتائج رائعة.

مستند معقد إلى PDF
مرة أخرى ، لم أتمكن من العثور على أي أخطاء في هذا الملف المحول. من الواضح أن ABBYY يعرف كيفية التحويل إلى PDF بشكل استثنائي.

الحكم
إذا كنت سعيدًا بدفع بضعة دولارات ، فيبدو أن التحويل إلى PDF يعمل بشكل رائع مع هذه الخدمة والوجود قادر على مزامنة الملفات المحولة إلى التخزين السحابي الخاص بك مفيد بشكل خاص إذا كنت تقوم بمسح حجم كبير من مستندات. كما هو الحال مع الخيارات الأخرى ، لم يكتشف ABBYY حتى الآن كيفية تحويل المستندات إلى DOC بسهولة لتحريرها.

النتيجة النهائية

إذا كنت ، مثل معظم الأشخاص ، تبحث فقط لمسح بعض مقالات المجلات ضوئيًا وبعض فواتير المنازل ، فلن تحتاج إلى تعديل هذه المستندات. لذلك ، فإن التحويل المباشر إلى PDF سيكون مناسبًا لك ، لأنك ستظل قادرًا على البحث في تلك المستندات. لهذا ، كان Free OCR بالتأكيد أفضل أداة مجانية اختبرناها. ومع ذلك ، إذا كنت على استعداد لدفع 5 دولارات شهريًا مقابل الكمال ، برنامج FineReader عبر الإنترنت من ABBYY كان أكثر دقة قليلاً.

عندما يتعلق الأمر بتحويل المستندات إلى DOC ، لم نتمكن من العثور على أي حل مثالي ، ولكن أفضل النتائج جاءت من التعرف الضوئي على الحروف عبر الإنترنت. لم يكن التحويل مثاليًا ، ولكن تم الحفاظ على سلامة التنسيق إلى حد كبير ، وكانت الأخطاء لا تذكر. عند مقارنة هذه النتائج بالعرض "المتميز" من ABBYY ، لا يسعك إلا أن تأثر بشكل كبير.

لم ندرج إمكانات التعرف الضوئي على الحروف في Google Drive في هذا المنصب ؛ القليل من أجل Google ، ولكن أكثر من ذلك لأننا أردنا اختبار بعض خدمات OCR المجانية الأخرى عبر الإنترنت.

الآن دورك: ما هي أدوات التعرف البصري على الحروف (OCR) الأخرى عبر الإنترنت التي توصي بها لقرائنا؟ وأيها حاولت ألا تستخدمه مرة أخرى مطلقًا؟

روب نايتنجيل حاصل على شهادة في الفلسفة من جامعة يورك ، المملكة المتحدة. عمل كمدير واستشاري لوسائل التواصل الاجتماعي لأكثر من خمس سنوات ، في حين قدم ورش عمل في العديد من البلدان. على مدى العامين الماضيين ، كان روب أيضًا كاتبًا تقنيًا ، وهو مدير وسائل التواصل الاجتماعي في MakeUseOf ومحرر النشرة الإخبارية. عادة ما تجده يسافر...