深度学习系列56:使用whisper进行语音转文字

深度学习系列56:使用whisper进行语音转文字

    正在检查是否收录...

1. openai-whisper

这应该是最快的使用方式了。安装pip install -U openai-whisper,接着安装ffmpeg,随后就可以使用了。模型清单如下:

第一种方式,使用命令行:

whisper japanese.wav --language Japanese --model medium 

另一种方式,使用python调用:

import whisper model = whisper.load_model("base") result = model.transcribe("audio.mp3",initial_prompt='以下是普通话的句子。') print(result["text"]) 

2. faster-whisper

安装也一样:pip install -U faster-whisper,速度对比:

3. whisper-jax

在GPU上的加速版本
首先安装库:
pip install jax jaxlib git+https://github.com/sanchit-gandhi/whisper-jax.git datasets soundfile librosa

调用代码为:

from whisper_jax import FlaxWhisperPipline import jax.numpy as jnp pipeline = FlaxWhisperPipline("openai/whisper-tiny", dtype=jnp.bfloat16, batch_size=16) %time text = pipeline('test.mp3') 

4. whisper-openvino

在intel系列的cpu上加速的版本:
安装库:pip install git+https://github.com/zhuzilin/whisper-openvino.git
调用方法:whisper carmack.mp3 --model tiny.en --beam_size 3

whispercodegitjaxmp3openaigithuberp命令行gpuganpromptnumpymacmediumpythoncpuintelurl
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-7814.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

引领AI创意教育新浪潮,瑞云AIGC实训平台解决方案来了

上一篇

利用python+whisper生成视频字幕文件

下一篇
  • 复制图片
按住ctrl可打开默认菜单