الإعلانات

كان التعرف على الصوت غير دقيق بشكل مروع. عملت فقط لحفنة من الناس حفنة من الأوقات. لكنها الآن جيدة إلى حد ما ، بفضل الجهود المشتركة لـ Nuance و Microsoft و Apple و Google ، الذين ألقوا موارد لا تعد ولا تحصى لتحسينها بالفعل.

من بين جميع هذه الشركات ، قلة قليلة توافقت مع الالتزام بالاعتراف الصوتي بـ Google ، الذي جعلها ركيزة أساسية لاستراتيجيتها للهواتف المحمولة والخدمات.

كان GOOG-411 قصير المدى (أو البحث الصوتي المحلي من Google) أحد أقدم غزوات Google. تم إطلاقه في عام 2008 وسمح للأشخاص بالبحث عن أرقام هواتف الأعمال باستخدام صوتهم. كانت تقنية التعرف على الصوت أيضًا جزءًا رئيسيًا من Android ، ومع إطلاق JellyBean ما هي أكبر التحسينات في Android 4.2 و 4.3؟إذا كنت عالقًا في 4.0 Ice Cream Sandwich أو 4.1 Jelly Bean ، هل يجب عليك الترقية؟ اقرأ أكثر أصبحت متاحة أخيرا حاليا.

في وقت سابق من هذا الأسبوع ، جوجل قدم أخيرا التعرف على الصوت إلى مستندات Google.

يمكن للمستخدمين حرفيا إملاء مستنداتهم (مثلما أفعل مع هذه المقالة) دون الحاجة إلى تثبيت أي برامج أو مكونات إضافية إضافية. إنها قفزة كبيرة إلى الأمام بالنسبة لمجموعة المكتب عبر الإنترنت ، ولكن هل هي جيدة؟

instagram viewer

ابدء

قبل أن نبدأ الغوص في ميزاته ، أود أن أتطرق إلى كيفية الحصول على Google Voice Typing. إذا كان لديك حساب Google ، فلديك هذا بالفعل. ما عليك سوى فتح محرر مستندات Google وفتح مستند جديد أو موجود. بعد ذلك ، ستنبثق نافذة تسألك عما إذا كنت ترغب في تجربة الإملاء الصوتي. انقر جربها.

GoogleVoiceTypingTry

بعد ذلك ، يجب أن تمنح محرر مستندات Google الإذن لاستخدام الميكروفون. هذه مجرد مسألة نقر السماح إلى نافذة منبثقة.

الميكروفون

بعد ذلك ، يجب عليك تحديد اللغة التي تريد استخدامها مع Google Voice Typing. وتتراوح مجموعة اللغات واللهجات المتوفرة بين الإنجليزية والإسبانية والأفريكانية والعربية.

لقطة شاشة 2016-02-25 في 10.14.12

بعد ذلك ، ما عليك سوى النقر على رمز الميكروفون والبدء في التحدث.

ما مدى دقتها؟

واحدة من أكبر العقبات التي تحول دون التعرف على الصوت في الاتجاه السائد ، هو في كثير من الأحيان ليست دقيقة بما يكفي. كان من المعتاد أنه إذا رأيت استخدام التعرف على الصوت ، فسيتعين عليك قضاء ساعات قليلة جيدة في تحرير نصك وتصحيحه. فكيف تقدم Google عرض الأجرة في هذا الصدد؟

بشكل إيجابي ، في الواقع. في الغالب ، فهمت Google Voice Typing ما قلته ، على الرغم من أنني حصلت على لهجة إنجليزية إقليمية (سنتحدث عن اللهجات لاحقًا).

جوجل صوت

لقد تأثرت بشكل خاص بالطريقة التي تعامل بها التعرف على الصوت من Google مع ضجيج الخلفية. عندما كتبت هذا المقال ، كان يوركشاير تيرير ينبح في غرفة المعيشة ، وكانت نافذتي مفتوحة جزئيًا. أعيش في طريق مزدحم حيث تمر السيارات باستمرار. ولكن على الرغم من ذلك ، تمكنت Google من تصفية ذلك والتركيز على ما كنت أقوله.

كانت المشكلة الأكبر هي الكتابة بالصوت من Google غالبًا ما واجهت علامات الترقيم. أود أن أقول "فاصلة" و "نقطة" و "توقف كامل" ، وسوف يفسر ذلك على أنني أريد أن أكتب "فاصلة" و "نقطة" و "توقف كامل". كان هذا محبطًا لسببين.

نقطة

أولاً ، لأنه قد يسخر مني ، أولاً باستخدام علامات الترقيم الصحيحة ، قبل العودة مباشرةً إلى النسخة الإملائية للكلمة. لم يكن هناك طريقة لإيقاف هذا ، وسأضطر إلى تحرير المستند يدويًا لإصلاحه.

ولكن ، ربما أسوأ ، لم أستطع منعه من الحدوث. لا يوجد قاموس حيث يمكنك تجاوز الإملاء. يحدث ذلك فقط ، وعليك التعامل معه.

لا أريد أن أفهم كم هذا محبط. إنه أمر مزعج للغاية. ولكن هذا شيء أنا واثق أنه سيتم تحسينه نظرًا لزيادة عدد الأشخاص الذين يستخدمون هذه الميزة ، ومع تخصيص Google مزيدًا من الموارد لتحسين التعرف على الصوت.

إلى جانب هذا الانزعاج المحدد ، كنت مسرورًا للغاية من دقة التعرف على الصوت من Google.

كيف تتعامل مع اللهجات

لقد دهشت من عدد اللغات واللهجات التي تدعمها Google Voice Typing. في اللغة الإنجليزية وحدها ، يدعم اللهجات النيوزيلندية والأسترالية والهندية وجنوب إفريقيا والأمريكية والبريطانية ، على سبيل المثال لا الحصر. المشكلة هي أنه لا توجد لهجة أمريكية حقًا ، تمامًا مثل عدم وجود لهجة بريطانية. بدلاً من ذلك ، هناك مجموعة من اللهجات واللهجات التي تختلف من مكان إلى آخر.

من البديهي أن المملكة المتحدة لديها لهجة لكل رمز بريدي. يفتخر فريق MakeUseOf بمجموعة من اللهجات المختلفة بين الموظفين البريطانيين. كريستيان كاولي يتحدث بلكنة ميدلسبره واسعة. روب نايتنجيل، الذي ينحدر من ساوثبورت ، لديه تعادل شمالي أكثر. في حين مارك أونيل لديه twang الاسكتلندية.

أنا أعيش في ليفربول ، لذا لديّ لهجة سكوس التي تنجرف قليلاً في المحيط الأطلسي ، وذلك بفضل خطيبتي الأمريكية والوقت الذي أمضيته في سويسرا.

ومن الإنصاف القول إن برامج التعرف على الصوت تكافح غالبًا لفهم اللهجات الإنجليزية الإقليمية. عندما خرج Siri ، على سبيل المثال ، أصبحت عدم قدرته على فهم المستخدمين الاسكتلنديين نكتة جارية.

لكن عروض Google كانت استثنائية. صدقني عندما أقول أنك لن تضطر إلى التدرب يتحدث بلكنة مختلفة ما التطبيقات والمواقع الإلكترونية التي ستساعد في تحسين لهجتي عند التحدث بلغة أخرى؟أريد حقًا أن أجعل نطقي يتطابق مع نطق المتحدث الأصلي. هل هناك أي تطبيقات أو مواقع ويب يمكنها مساعدتي؟ اقرأ أكثر . لقد تحدثت إلى عدد قليل من الأصدقاء الذين لديهم أيضًا لهجات إنجليزية إقليمية ولديهم تجارب إيجابية مماثلة معها. بينما أعترف أن هذه عينة صغيرة وغير علمية تمامًا ، إلا أنها واعدة بالتأكيد.

سرعة الإملاء الصوتي

وقد اعترضت برامج التعرف على الصوت تقليديا عدم القدرة على مواكبة السرعة التي يمليها المستخدم. باعتراف الجميع ، كنت قلقة قليلاً من أن عرض Google لن يكون مختلفًا ، خاصة بالنظر إلى أنها خدمة عبر الإنترنت ، بدلاً من برنامج يعمل على جهاز MacBook Pro الخاص بي.

ولكن أعجبت. تمكنت Google من مواكبة معدل التحدث الذي يحتوي على نسبة عالية من الكافيين ، ولم تكن بمثابة اختناق لإنتاجي. كان العكس تمامًا من تجربتي مع أدوات الإملاء الصوتي الأخرى.

السرعة الصوتية

أنا لا أعرف ما إذا كان ذلك لأن لدي صيام FTTC (الألياف إلى الخزانة) ما الفرق بين FTTC و FTTP ، ولماذا يجب أن تهتم؟لقد كنا جميعًا هناك في وقت أو آخر. مرضت خدمة الإنترنت لدينا ، تبحث عن طريقة جديدة للاتصال بالإنترنت ، ولكن الخلط بين الخيارات المختلفة. اقرأ أكثر اتصال إنترنت منزلي ، أو حقيقة أن Google لديها إمدادات غير محدودة من الخوادم السريعة تحت تصرفها. وفي كلتا الحالتين ، تمكنت من إنجاز المهام.

ملاحظة حول الميكروفونات

تميل الميكروفونات المُدمجة إلى أن تُفقد. في تجربتي ، إما أنهم ممتازون ، كما لو كانوا على أجهزة كمبيوتر Apple المحمولة ، أو أنهم ليسوا كذلك. نادرا ما يوجد أي حل وسط.

كقاعدة عامة، أرخص أجهزة الكمبيوتر المحمولة أفضل أجهزة الكمبيوتر المحمولة أقل من 300 دولار: كل ما تحتاج إلى معرفتهيكاد يكون من المستحيل العثور على كمبيوتر محمول جيد مقابل أقل من 300 دولار في هذه الأيام ، ولكن يمكن القيام به إذا كنت تعرف ما الذي تبحث عنه. إليك كل ما تحتاج إلى معرفته لإجراء عملية شراء لك ... اقرأ أكثر سيحتوي على أسوأ ميكروفونات داخلية. إنها مجرد واحدة من تلك الميزات التي تميل إلى تجاهل الشركات المصنعة للأجهزة.

لقد بدأت في إملاء هذه المقالة باستخدام الميكروفون الداخلي على جهاز MacBook Pro الخاص بي. على الرغم من أن محرر مستندات Google قال مرارًا أنه يواجه مشكلة في سماع صوتي ، إلا أن ذلك لم يترجم إلى إملاء أبطأ أو غير دقيق. كل شيء يعمل بشكل جيد.

لقد جربت أيضًا Google Voice Typing بتكلفة باهظة ميكروفون خارجي يتي أزرق. هذه هي الميكروفونات ذات جودة البودكاست التي يتم بيعها على أمازون بأكثر من 100 دولار.

باعتراف الجميع ، لم ألاحظ أي اختلافات عندما يتعلق الأمر بدقة الإملاء أو سرعتها. ومع ذلك ، كانت أكبر ميزة لاستخدام هذا الميكروفون هي أنني تمكنت من إدخال زوج من سماعات الرأس AKG واستخدامها كشاشة. هذا سمح لي أن أكون أكثر وعياً بضجيج الخلفية ، وأن أضبط نفسي إذا كنت أكون صاخبة جدًا أو هادئة للغاية.

افكار اخيرة

التعرف على صوت Google ليس مثاليًا. لكن هذه ليست مفاجأة ، لأن التعرف على الصوت القوي هو عمل صعب للغاية. هناك الكثير الذي شعرت أنه يمكن تحسينه.

يتركز هذا في الغالب حول كيفية تعامل البرنامج مع بنية علامات الترقيم والجمل. في عالم مثالي ، ستقوم Google تلقائيًا بإدراج علامات الترقيم بناءً على إيقاع وتيرة صوتك ، لكننا طويل بعيدا عن ذلك.

من المؤسف أيضًا أن هذا البرنامج لم يشق بعد طريقه إلى عروض Google الأخرى ، مثل Gmail. من الناحية المثالية ، أود فرصة تنزيل Google Voice Typing كتطبيق ، واستخدامه مع برامج أخرى ، مثل صفحات iWork تتضمن الصفحات 5.0 لنظام التشغيل Mac لوحة المفتش الذكية ، ولكن ميزات أقلهناك الكثير من برامج تحرير النصوص خفيفة الوزن وسهلة الاستخدام لمستخدمي Mac ، ولكن بالنسبة للمشاريع التي تتطلب ميزات النشر المكتبي ، لا تزال صفحات Apple التي تم إصلاحها مؤخرًا حلاً جيدًا. اقرأ أكثر أو محرر تخفيض السعر كاتب IA كاتب iA لنظام التشغيل Mac و iOS: أفضل معالج كلمات لم تستخدمه من قبلسواء كانت ورقة مدرسية أو منشور مدونة ، كلنا نجد أنفسنا في مرحلة ما في وضع يضطر إلى إلقاء مجموعة من الشخصيات في ملف نصي. بينما الهاتف الخليوي ... اقرأ أكثر .

لكن هذين النوعين من الإزعاج البسيط ، فإن Google Voice Typing جيدة بقدر ما تحصل. على النقيض من ذلك ، كتبت هذا القسم من المقالة باستخدام التعرف الصوتي المدمج لـ OS X ، ولم يكن قريبًا من الدقة أو بالسرعة.

إذا لم يقنع هذا الأشخاص بالتبديل إلى Google Drive ، فأنا لا أعرف ماذا سيفعل.

الآن لك! هل تم إغرائك من خلال التعرف على الكلام في Google Drive؟ هل حاولت بها حتى الآن؟ أخبرني عن كل شيء في التعليقات أدناه.

ماثيو هيوز مطور برامج وكاتب من ليفربول بإنجلترا. نادرًا ما يتم العثور عليه بدون كوب من القهوة السوداء القوية في يده ويعشق جهاز Macbook Pro والكاميرا الخاصة به. يمكنك قراءة مدونته على http://www.matthewhughes.co.uk ومتابعته على تويتر علىmatthewhughes.