【Python】本地版 Whisper 自动转录器(附源码网址)

【Python】本地版 Whisper 自动转录器(附源码网址)

    正在检查是否收录...

目   录

一、实时自动语音转录器简介             

二、开源Whisper实时转录器             

三、pyinstaller 打包发布exe应用程序

四、修改版源代码                             

一、实时自动语音转录器简介

实时自动语音转录器是一种能够自动将语音信号转换为文字的应用程序。它通常具有以下几个主要功能:1. 语音检测与采集实时监测麦克风或其他输入信号,检测并录制用户的语音输入。要求具有较低延迟,以进行实时转录。2. 语音识别与转录使用语音识别技术对录制的语音信号进行识别与转录,将语音转换为文本。需要选择合适的语音识别模型,如神经网络模型等。3. 自动修正分析语音识别的结果,自动检测并修正一些常见错误,如将数字“13”识别为“30”等情况。这需要制定一定的修正规则和算法。4. 格式化与输出对转录结果进行必要的格式化,如加工标点符号、大写等,然后将结果实时显示给用户或导出为文本文档等格式。5. 操作交互提供一定的交互操作,如暂停/继续转录、修改转录结果、选择语音识别模型等。可以通过图形界面实现交互,也可以通过自定义语音指令等方式实现。6. 支持多种语言理想的实时自动语音转录器应支持多种常用语言,以满足不同用户的需求。这需要准备不同语言的语音识别模型与修正规则。总体来说,实时自动语音转录器是一款功能较为复杂的应用程序。要想开发出一款实用的自动转录器,需要具备一定的语音识别与人工智能技术,并投入大量时间用于测试、修订与改进。但随着语音识别技术的不断发展,以及许多开源工具的出现,开发一款基本的自动语音转录器已经变得更加简单和可行。有一定技术基础的开发者,都可以尝试完成这样一个项目,以增进自己的技能与丰富项目经验。

二、开源Whisper实时转录器

主界面

视频演示(播放youtube视频,实时语音转录)

三、pyinstaller 打包发布exe应用程序

claude指导

pip install PyInstaller pyinstaller WAT.py

打包完成,会在dist文件夹下有个WAT的文件夹,所有程序都在这里。

记得把图标 icon.ico手动拷贝进去。 运行时,提示缺少whisper文件夹下的内容(可能是因为没有添加 PYTHONPATH 环境变量导致),检查发现WAT文件夹下没有whisper文件夹,于是找到下面路径

C:\Users\cxy\AppData\Local\Programs\Python\Python310\Lib\site-packages\whisper

将whisper文件夹拷贝到WAT目录下。运行WAT.exe 即可。

注:设置全局变量 用于下载和读取 语音识别模型 (medium.pt)。

XDG_CACHE_HOME=V:\learn\AI\SpeechToText\WhisperAutoTranscriber-main\models

四、修改版源代码

语音识别whisper语音转录文件夹code应用程序python实时转录格式化图形界面medium标点符号icon网络模型url实时监测自动检测人工智能智能技术app开源工具claude人工智能技术自动转录语音输入自定义开发者语音转换神经网络youtubeyoutube视频
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-3883.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

11 位作家加入针对 OpenAI 和微软的诉讼

上一篇

研究:大模型在回答中会重复有害的错误信息

下一篇
  • 复制图片
按住ctrl可打开默认菜单