هوش مصنوعی آفلاین تبدیل گفتار به نوشتار Handy
یک پروژه متنباز (open source) است که به عنوان یک هوش مصنوعی آفلاین تبدیل گفتار به نوشتار (speech-to-text) طراحی شده که بهطور کامل آفلاین کار میکند.
این هوش مصنوعی آفلاین تبدیل گفتار به نوشتار با فناوریهایی مثل Whisper (مدل تبدیل گفتار به متن) کار میکند و امکان انتخاب مدلهای مختلف برای transcription (رونوشت گفتار) را دارد که برای شما در زیر نمونه های کامل مدل های هوش مصنوعی آفلاین تبدیل گفتار به نوشتار را در تصویر نشان داده ام.
مدلی نیز به نام Parakeet V3 وجود دارد که برای پردازنده غیرگرافیکی یعنی پردازش ها روی (CPU) بهینه شده است.
این نرمافزار برای سیستمهای مختلف دسکتاپ طراحی شده: ویندوز، مک، لینوکس.
روند کار آن به این صورت است که کاربر کلیدی را فشار میدهد، صحبت میکند، و نرمافزار صدا را ضبط میکند و سپس صدای ضبط شده به متن تبدیل می شود و آن متن را در هر قسمتی که از قبل فعال باشد(مثلاً یک برنامه ای مثل ورد یا نوتپد) وارد میکند، همه اینها بدون فرستادن صدای شما به اینترنت یا هیچ ابزار آنلاینی انجام می شود ، برای همین به آن هوش مصنوعی آفلاین تبدیل گفتار به نوشتار Handy گفته می شود.
توضیح را زیاد نمی کنم و یک راست میریم سمت دانلود کردن و استفاده از آن:
مرحله 1:
اول از همه وارد سایت به آدرس دانلود هوش مصنوعی Handy میشویم و نرم افزار را نسبت به نوع سیستم عامل خود انتخاب می کنیم، مثلا من برای سیستم خودم از نسخه اولی که در صفحه نمایش داده شده است استفاده می کنم Download Handy For Windows
مرحله 2:
پس از نصب آن روی سیستم خود که بسیار ساده است، برنامه را اجرا کرده و با این محیط روبرو می شویم
مرحله 3:
حالا باید یکی از مدل های زبانی هوش مصنوعی آفلاین تبدیل گفتار به نوشتار را از قسمت زیرین نرم افزار دانلود کنیم.
نکته: فقط مدل های زبانی Whisper از زبان شیرین فارسی پشتیبانی می کنند که 4 مدل دارد، که به ترتیب دقت تبدیل اینگونه هست:
Whisper Large
Whisper Medium
Whisper Small
Whisper Turbo
هر چقدر دقت بالاتر رود، سرعت انجام ابزار Handy برای تبدیل گفتار به نوشتار بدون اینترنت کندتر می شود ( بخاطر بزرگتر و سنگینتر بودن مدل )
من با مدل Turbo کار کردم و نتیجه مورد پسند بود.
کافیه روی یکی از مدل ها کلیک کنید و دانلود را بزنید و کمی صبر کنید تا مراحل نصب پایان یابد.
مراحل نصب مدل زبانی بصورت اوتومات انجام می شود و شما کافیه بعد از نصب شدن، روی آن کلیک کرده تا کلمه Active در مقابل آن نمایان شود.
مرحله 4:
حالا وقت کار کردن با آن رسیده، برای کار کردن با این نرمافزار آفلاین هوش مصنوعی تبدیل گفتار به متن کافیه وارد بخش General شده و یک کلیک میانبر برای آن در نظر بگیرید، بصورت پیشفرض Ctrl+T هست که من دوست داشتم آن را به Ctrl+Alt+T تغییر بدم، برای اینکار کافیه روی قسمت کلید ترکیبی نوشته شده کلیک کرده و از روی صفحه کلید، کلیدهای میانبر ترکیبی خود را فشار دهید تا اعمال شوند.
در قسمت Language نیز میتوانید زبان خود را انتخاب کنید که پیشنهاد می کنم رو حالت Auto Detect پیش فرض بزارید باشه و تغییر ندهید.
مرحله 5:
برای اجرا کردن آن به یک محیط نوشت ابزار مثل Word، Powerpoint و یا Notepad بروید و آماده نوشتن باشید.
حالا کافیه کلید ترکیبی ای که در مرحله قبل مشخص کرده بودید را فشار دهید تا پنجره کوچکی که نشان دهنده فعال شده نرم افزار هست در پایین صفحه باز بشه.
حالا می تونید هر چیزی بگویید تا این هوش مصنوعی آفلاین برای تبدیل صدا به متن برای شما کار را انجام دهد.
توجه داشته باشید که بعد از تمام شدن صحبت کردن، دوباره باید دکمه ترکیبی را فشار دهید تا عملیات تبدیل گفتار به نوشتار با هوش مصنوعی برای شما انجام شود.
در نهایت Handy یکی از بهترین گزینهها برای کسانی است که میخواهند بدون نیاز به اینترنت، گفتار خود را سریع و دقیق به متن تبدیل کنند. اگر با این ابزار کار کردید، تجربه خود را در بخش نظرات بنویسید تا به دیگران کمک کنید.
امیدوارم از این آموزش لذت برده باشید و نهایت استفاده را بکنید، باید خاطر نشان کنم که هوش مصنوعی هیچوقت دقت 100 درصدی نداره و شما بعد از انجام تبدیل گفتار به نوشتاربا هوش مصنوعی حتما بررسی مجدد انجام دهید.
نویسنده: دکتر امیرفربد رخشانی مقدم – تمام حقوق مادی و معنوی این مطلب محفوظ است.