whisper-v3模型部署环境执行

whisper-v3模型部署环境执行

    正在检查是否收录...

1. 安装whisperV3

github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-rust
这些都没有安装 但是github下载的版本是能执行成功的 pip install accelerate pip install soundfile pip install librosa pip install torchaudio

requirements.txt

numba numpy torch tqdm more-itertools tiktoken triton>=2.0.0,<3;platform_machine=="x86_64" and sys_platform=="linux" or sys_platform=="linux2" 

github官方版本

要进到whisper目录里面, 执行脚本要和whisper/whisper目录同级。这样就执行成功了。

import whisper model = whisper.load_model("base") result = model.transcribe("audio.mp3") print(result["text"]) 

遇到的名词解释

1. 大模型的弱标签

在大模型中,弱标签(Weak Labels)通常指的是相对于强标签(Strong Labels)而言的标签类型。强标签是指对每个样本都有明确、准确的标签,可以直接用于训练模型的监督学习任务。而弱标签则指的是对样本的标签信息不够准确或完整,可能存在噪声、不确定性或模糊性。

弱标签可以是多种形式,常见的包括但不限于:

部分标签(Partial Labels):只对样本的部分特征或属性进行标记,而不是对整个样本进行标记。 噪声标签(Noisy Labels):由于标注过程中的错误或不确定性而产生的标签。 不确定标签(Uncertain Labels):对于某些样本标签的确定性不高,存在一定程度的不确定性。 模糊标签(Ambiguous Labels):标签含义不明确或模糊,可能存在多种解释或理解。

在使用弱标签进行训练时,通常需要采取一些特殊的处理方法来处理标签的不确定性和噪声,以提高模型的鲁棒性和泛化能力。这包括使用弱标签推理(Weak Label Inference)、噪声过滤(Noise Filtering)、半监督学习(Semi-Supervised Learning)等技术来充分利用弱标签信息进行模型训练。

参考文档

论文: https://cdn.openai.com/papers/whisper.pdf
whisper-v3 model-card https://huggingface.co/openai/whisper-large-v3
知乎胡儿 v3介绍 https://zhuanlan.zhihu.com/p/662906303
安装参考 https://zhuanlan.zhihu.com/p/666969310
github https://github.com/openai/whisper/blob/main/model-card.md
根据官方文档安装就可以了 https://github.com/openai/whisper/blob/main/README.md
官网 https://openai.com/research/whisper

whispergitopenaigithublinux大模型mac模型训练泛化能力tiktokcdnhuggingfacenumpypdfmp3mbatokensemclone
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-15785.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

大型科技公司拥才有承担 AI 训练数据成本的能力

上一篇

英伟达推AI游戏助手G-Assist:可指导玩家玩游戏并优化设置

下一篇
  • 复制图片
按住ctrl可打开默认菜单