لدى صانعي ChatGPT أداة أخرى تهدف إلى إزالة العبء عن أصابعك.

لقد أنشأ نفس الأشخاص الذين يقفون وراء ChatGPT أداة أخرى قائمة على الذكاء الاصطناعي يمكنك استخدامها اليوم لزيادة إنتاجيتك. نحن نشير إلى Whisper ، وهو حل لتحويل الصوت إلى نص تجاوز جميع الحلول المماثلة التي جاءت قبله.

يمكنك استخدام Whisper في برامجك أو في سطر الأوامر. ومع ذلك ، فإن هذا يتعارض مع الغرض الأساسي منه: الكتابة بدون لوحة مفاتيح. إذا كنت تريد الكتابة لاستخدامها ، فلماذا تستخدمها لتجنب الكتابة؟ لحسن الحظ ، يمكنك الآن استخدام Whisper من خلال واجهة المستخدم الرسومية لسطح المكتب. والأفضل من ذلك ، يمكنه أيضًا نسخ صوتك في الوقت الفعلي تقريبًا. دعونا نرى كيف يمكنك الكتابة بصوتك باستخدام Whisper Desktop.

ما هو الهمس OpenAI؟

Whisper من OpenAI هو نظام التعرف التلقائي على الكلام (ASR للاختصار) أو ، ببساطة ، هو حل لتحويل اللغة المنطوقة إلى نص.

ومع ذلك ، على عكس أنظمة الإملاء والنسخ القديمة ، فإن Whisper هو حل ذكاء اصطناعي تم تدريبه على أكثر من 680،000 ساعة من الكلام بلغات مختلفة. يوفر Whisper دقة لا مثيل لها ، ومثير للإعجاب أنه ليس فقط متعدد اللغات ، ولكن يمكنه أيضًا الترجمة بين اللغات.

instagram viewer

والأهم من ذلك ، أنه مجاني ومتاح كمصدر مفتوح. بفضل ذلك ، قام العديد من المطورين بتقسيم التعليمات البرمجية الخاصة بهم إلى مشاريعهم الخاصة أو إنشاء تطبيقات تعتمد عليها ، مثل Whisper Desktop.

إذا كنت تفضل إصدار "الفانيليا" من Whisper وتعدد استخدامات الجهاز بدلاً من واجهات المستخدم الرسومية القديمة ، فتحقق من مقالتنا على كيفية تحويل صوتك إلى نص باستخدام برنامج Whisper لنظام التشغيل Windows من OpenAI.

هل Whisper و Whisper Desktop هما نفس الشيء؟

على الرغم من اسمها الرسمي ، فإن Whisper Desktop هي واجهة مستخدم رسومية لجهة خارجية لـ Whisper ، وهي مصممة لكل من يفضل النقر فوق الأزرار بدلاً من كتابة الأوامر.

Whisper Desktop هو حل مستقل لا يعتمد على تثبيت Whisper موجود. كمكافأة ، فإنه يستخدم إصدارًا بديلًا ومحسّنًا من Whisper ، لذلك يجب أن يعمل بشكل أفضل من الإصدار المستقل.

أنت على الطرف الآخر من الطيف ، وبدلاً من البحث عن طريقة أسهل لاستخدام Whisper من الجهاز الطرفي ، فأنت تبحث عن طرق لتنفيذه في الحلول الخاصة بك؟ افرحوا ل فتح OpenAI الوصول إلى واجهات برمجة تطبيقات ChatGPT و Whisper.

قم بتنزيل وتثبيت Whisper Desktop

على الرغم من أن Whisper Desktop أسهل في الاستخدام من Whisper المستقل ، إلا أن تثبيته أكثر تعقيدًا من النقر المتكرر على التالي في المعالج.

  1. يزور صفحة جيثب الرسمية لـ Whisper Desktop. انظر إلى اليمين ، وانقر على أحدث إصدار أسفل إطلاق.
  2. تحت أصول، انقر WhisperDesktop.zip وتنزيله على جهاز الكمبيوتر الخاص بك.
  3. قم باستخراج الأرشيف الذي تم تنزيله إلى مجلد واستخدم مدير الملفات لزيارته. في الداخل ستجد تطبيق Whisper Desktop. انقر نقرًا مزدوجًا فوقه لتشغيله.
  4. تحتاج أيضًا إلى نموذج لغة Whisper بتنسيق GCML تنسيق ثنائي. سيوفر لك Whisper Desktop رابطين للحصول على أحدهما. تخطي الارتباط الثاني لإنشاء النموذج الخاص بك حيث إنها عملية أكثر تعقيدًا. انقر فوق تعانق الوجه لفتح تلك الصفحة في متصفحك الافتراضي ، حيث يمكنك تنزيل ملف جاهز للاستخدام.
  5. قدم إصدار Whisper Desktop الذي استخدمناه أثناء كتابة هذه المقالة رابطًا إلى مستودع قديم في Hugging Face. إذا واجهت نفس المشكلة ، فلاحظ ارتباطًا بملف موقع جديد. اضغط عليها لزيارة المستودع الجديد.
  6. انقر فوق الارتباط الذي سينقلك إلى المتاح عارضات ازياء.
  7. من تلك القائمة ، انقر فوق أحد ملفات ggml-medium.bin أو ggml-medium.en.bin، اعتمادًا على ما إذا كنت تريد دعمًا متعدد اللغات أو باللغة الإنجليزية فقط في Whisper.
  8. أخيرًا ، يجب أن تكون قد وصلت إلى وجهتك. لاحظ السطر الذي يشير إلى أن هذا الملف مخزن مع Git LFS وأنه كبير جدًا بحيث لا يمكن عرضه ، ولكن لا يزال بإمكانك تنزيله. انقر فوق تحميل للقيام بذلك على وجه التحديد.
  9. عند اكتمال تنزيل الملف ، استخدم مدير الملفات المفضل لديك (سيفعله مستكشف الملفات) لنقل ملف نموذج اللغة الذي تم تنزيله إلى نفس المجلد مثل Whisper Desktop.

الكتابة باستخدام Whisper Desktop

يعد النسخ باستخدام Whisper Desktop أمرًا سهلاً ، ولكن قد لا تزال بحاجة إلى نقرة واحدة أو نقرتين لاستخدام التطبيق.

أعد تشغيل Whisper Desktop. هل (لا يزال) يفتقد المسار الصحيح لنموذج اللغة الذي تم تنزيله؟ اضغط على زر بالنقاط الثلاث على يمين الحقل وحدد يدويًا الملف الذي قمت بتنزيله من Hugging Face.

من هذا المكان ، يمكنك أيضًا استخدام القائمة المنسدلة بجوار تنفيذ النموذج لاختيار ما إذا كنت تريد تشغيل Whisper على وحدة معالجة الرسومات الخاصة بك (GPU) ، على كل من وحدة المعالجة المركزية ووحدة معالجة الرسومات (هجين) ، أو فقط على وحدة المعالجة المركزية (مرجع).

ال متقدم يؤدي الزر إلى مزيد من الخيارات التي تؤثر على كيفية تشغيل Whisper على أجهزتك. ومع ذلك ، نظرًا لأن الزر يشير بوضوح إلى أنها متقدمة ، فإننا نقترح عليك تعديلها فقط إذا كنت تقوم باستكشاف الأخطاء وإصلاحها أو تعرف ما تفعله. قد يؤدي تعيين قيم الخيارات الخاطئة هنا إلى فرض عقوبة على الأداء أو جعل التطبيق غير قابل للاستخدام.

انقر فوق "موافق" للانتقال إلى الواجهة الرئيسية للتطبيق.

إذا كان لديك بالفعل تسجيل لصوتك تريد تحويله إلى نص مكتوب ، فانقر فوق نسخ ملف وحدده. ومع ذلك ، سنستخدم Whisper Desktop للنسخ المباشر لهذه المقالة.

الخيارات المعروضة واضحة ومباشرة. يمكنك تحديد ملف لغة سوف يستخدم Whisper ، اختر ما إذا كنت تريد ذلك يترجم بين اللغات وتمكين التطبيق وحدة التصحيح.

يمكن لمعظم المستخدمين الناطقين باللغة الإنجليزية تخطي هذه الخيارات بأمان والتأكد فقط من تحديد إدخال الصوت الصحيح من القائمة المنسدلة بجوار جهاز الإلتقاط.

تأكد حفظ إلى ملف نصي و إلحاق هذا الملف لجعل Whisper Desktop يحفظ مخرجاته في ملف دون الكتابة فوق محتواه. استخدم ال زر بالنقاط الثلاث على يمين حقل مسار الملف لتحديد الملف النصي المذكور.

انقر فوق يأسر لبدء تحويل كلامك إلى نص.

سيعرض لك Whisper Desktop ثلاثة مؤشرات عندما يكتشف نشاطًا صوتيًا ، ومتى يتم نسخه بنشاط ، ومتى تتوقف العملية.

يمكنك الاستمرار في التحدث للمدة التي تريدها ، ويجب أن ترى أحيانًا أول مؤشرين يومضان بينما يحول التطبيق صوتك إلى نص. انقر قف عند الانتهاء.

يجب فتح الملف النصي الذي حددته في محرر النصوص الافتراضي الخاص بك ، ويحتوي في شكل مكتوب على كل ما قلته حتى تنقر عليه قف.

يجب أن نلاحظ أنه يمكنك أيضًا القيام بعكس ما رأيناه هنا: تحويل أي نص إلى كلام. بهذه الطريقة يمكنك الاستماع إلى أي شيء كما لو كان بودكاست بدلاً من إجهاد عينيك والتحديق في الشاشات. لمزيد من المعلومات حول ذلك ، تحقق من مقالتنا على بعض من أفضل الأدوات المجانية عبر الإنترنت لتنزيل تحويل النص إلى كلام على هيئة صوت MP3.

نصائح لكتابة صوت Whisper Desktop

على الرغم من أن Whisper Desktop يمكن أن يكون منقذًا ، حيث يتيح لك الكتابة بصوتك أسرع بكثير مما يمكنك كتابته ، إلا أنه بعيد عن الكمال.

أثناء الاختبار ، وجدنا أنه قد يتلعثم في بعض الأحيان ، ويتخطى بعض الكلمات ، ويفشل في النسخ حتى أنت أوقف العملية وأعد تشغيلها يدويًا ، أو تعثر في حلقة واستمر في إعادة نسخ نفس العبارة مرارا وتكرارا.

نعتقد أن هذه مواطن الخلل المؤقتة التي سيتم إصلاحها لأن Whisper المستقل لا يواجه نفس المشكلات.

بصرف النظر عن تلك المطبات الصغيرة ، فإن تحويل صوتك إلى نص يجب أن يكون سهلاً مع Whisper Desktop. ومع ذلك ، وجدنا خلال اختباراتنا أنه يمكن أن يؤدي بشكل أفضل إذا ...

  1. بدلاً من نطق كلمتين أو ثلاث كلمات فقط ثم التوقف مؤقتًا ، يمكن لـ Whisper فهمك بشكل أفضل إذا استمررت لفترة أطول. حاول على الأقل أن تعطيه جملة كاملة في كل مرة.
  2. للسبب نفسه ، تجنب تكرار بدء عملية النسخ وإيقافها.
  3. عندما تدرك أنك ارتكبت خطأ ، تجاهله واستمر في ذلك. يبدو أن تحميل وتفريغ نموذج اللغة هو الجزء الأكثر استهلاكا للوقت في العملية مع الحالة الحالية لـ Whisper والأجهزة المتاحة لدينا. لذلك ، من الأسرع الاستمرار في الحديث ثم تعديل أخطائك بعد ذلك.
  4. كما هو الحال مع الإصدار المستقل من Whisper ، من الأفضل استخدام نموذج اللغة الأمثل لجهازك المتاح. يمكنك استخدام ما يصل إلى واسطة الطراز إذا كانت وحدة معالجة الرسومات لديك بها ذاكرة وصول عشوائي (VRAM) بسعة 8 جيجابايت. لتقليل VRAM ، اختر الموديلات الأصغر. اختر فقط الأكثر دقة قليلاً ولكن أيضًا الأكثر تطلبًا كبير الطراز إذا كنت تستخدم وحدة معالجة الرسومات بسعة 16 جيجابايت من VRAM أو أكثر.
  5. تذكر أنه كلما كان نموذج اللغة أكبر ، كانت عملية النسخ أبطأ. لا تذهب لطراز أكبر من المطلوب. ستجد على الأرجح أن Whisper Desktop يمكنه بالفعل "فهمك" في معظم الأوقات باستخدام النماذج المتوسطة أو الأصغر ، مع وجود خطأ واحد أو خطأين فقط في كل فقرة.

هل ما زلت تكتب؟ استخدم صوتك مع الهمس

على الرغم من أنه يتطلب بعض الوقت للإعداد ، كما سترى عند تجربته ، فإن Whisper Desktop يعمل بشكل أفضل بكثير من معظم البدائل ، مع دقة أعلى بكثير وسرعة أفضل.

بعد أن تبدأ في استخدامه للكتابة بصوتك ، قد تبدو لوحة المفاتيح الخاصة بك وكأنها من بقايا العصور القديمة.