OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】

    正在检查是否收录...

目录

环境配置

代码实现

******  实现 .mp4转换为 .wav文件,识别后进行关键词匹配并输出关键词出现的次数

******  完整代码实现请私信

环境配置

安装 ffmpeg

打开网址   https://github.com/BtbN/FFmpeg-Builds/releases 下载如下图所示的文件 下载后解压

 我的路径是G:\ffmpeg-master-latest-win64-gpl-shared\bin

找到自己的安装路径,进入到 bin 目录,复制这个路径

在我的电脑中添加环境变量

右击 ---> 属性

 高级系统设置

 环境变量

 找到 path,双击

新建 --->  把刚刚的路径粘贴进来,确定

在搜索框中输入 cmd ,打开终端,输入 ffmpeg -version,显示如下则表示安装成功

安装 opencc库

pip install opencc -i https://pypi.tuna.tsinghua.edu.cn/simple

安装 torch

pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

注:若运行时报关于 numpy 的错误,需要执行下面这个命令,更新 numpy 库

pip install numpy --upgrade

代码实现

只展示核心,完整的请关注并私信

# 利用训练好的模型进行识别 result = whisper_model.transcribe('录音.wav')

numpy关键词githubwhispergitshare关键词匹配
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-8298.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

Karpathy新视频又火了:从头构建GPT Tokenizer

上一篇

FreeControl官网体验入口 AI文本到图像生成工具免费在线使用地址

下一篇
  • 复制图片
按住ctrl可打开默认菜单