WAP站长网

2025年6月24日

字数：884，阅读约3分钟

全屏显示

深度学习系列56：使用whisper进行语音转文字

SEO教程

正在检查是否收录...

1. openai-whisper

这应该是最快的使用方式了。安装pip install -U openai-whisper，接着安装ffmpeg，随后就可以使用了。模型清单如下：

第一种方式，使用命令行：

whisper japanese.wav --language Japanese --model medium

另一种方式，使用python调用：

import whisper model = whisper.load_model("base") result = model.transcribe("audio.mp3",initial_prompt='以下是普通话的句子。') print(result["text"])

2. faster-whisper

安装也一样：pip install -U faster-whisper，速度对比：

3. whisper-jax

在GPU上的加速版本
首先安装库：
pip install jax jaxlib git+https://github.com/sanchit-gandhi/whisper-jax.git datasets soundfile librosa

调用代码为：

from whisper_jax import FlaxWhisperPipline import jax.numpy as jnp pipeline = FlaxWhisperPipline("openai/whisper-tiny", dtype=jnp.bfloat16, batch_size=16) %time text = pipeline('test.mp3')

4. whisper-openvino

在intel系列的cpu上加速的版本：
安装库：pip install git+https://github.com/zhuzilin/whisper-openvino.git
调用方法：whisper carmack.mp3 --model tiny.en --beam_size 3

whispercodegitjaxmp3openaigithuberp命令行gpuganpromptnumpymacmediumpythoncpuintelurl

本文作者：WAP站长网
本文链接： https://wapzz.net/post-7814.html
版权声明：本博客所有文章除特别声明外，均默认采用 CC BY-NC-SA 4.0 许可协议。

本站部分内容来源于网络转载，仅供学习交流使用。如涉及版权问题，请及时联系我们，我们将第一时间处理。

文章很赞！支持一下吧还没有人为TA充电

为TA充电

还没有人为TA充电

支付宝扫一扫
微信扫一扫

感谢支持

文章很赞！支持一下吧

关于作者

WAP站长网

2.8W+

WAP站长官方

最近签到
签到排行

WAP站长网
1个月前
+20
kbx991
1个月前
+30
vPNpL7l4
1个月前
+10

WAP站长网
WAP站长官方
57
kbx991
内卷太严重，已躺平...
6
Cr8M6e32
内卷太严重，已躺平...
5

日均播放量超过25亿，为什么“最流行”的美妆趋势诞生于抖音？

TOP3

TOP4

超百万人围观，带动1.1万单交易，抖音后厨直播大战带飞线下消费

TOP5

标签云

吃喝玩乐一卡通 1

小红卡用户 1

小红卡 1

森贝儿IP 1

小鼻嘎玩具 1

萌粒 1

迷你玩具 1

森贝儿家族 1

小鼻嘎 1

电商工具优化 1

商家运营压力 1

商家工具 1

双11大促 1

电商运营 1

马斯克财富 1

特斯拉市值 1

马斯克 1

科技股 1

美股 1

新车交付量 1

鸿蒙智行销量 1

国庆服务 1

新车交付 1

销量增长 1

麒麟9020A性能 1

华为Mate70优享版 1

性能提升 1

麒麟9020A 1

Mate70优享版 1

K90 1

Gen5芯片 1

K90系列 1

X9系列 1

荣耀Magic8系列 1

X300系列 1

小米员工处分 1

王腾被辞退 1

泄露公司机密 1

小米员工违规 1

王腾账号注销 1

YU7防护措施 1

小米YU7电池安全 1

防护措施 1

上市咨询 1

电池安全 1

合约机 1

中国联通 1

小米汽车技术解释 1

小米超强钢项目 1

东北大学 1