Whisper是 OpenAI 2022年发布的一款语音预训练大模型,集成了多语种ASR、语音翻译、语种识别的功能。
Whisper使用弱监督训练的方法,可以直接进行多任务的学习
1. 安装ffmpeg
1.1 更新yum
yum update
1.2 安装gcc
yum install gcc
1.3 在线安装ffmpeg
1.3.1 Install the EPEL repository
yum install epel-release
1.3.2 install ffmpeg
yum install ffmpeg
1.4 离线安装ffmpeg
1.4.1 安装yasm
# 下载 wget -c http://www.tortall.net/projects/yasm/releases/yasm-1.3.0.tar.gz # 解压 tar -zxvf yasm-1.3.0.tar.gz # 切换目录 cd yasm-1.3.0 # 执行配置 ./configure # 编译并安装 make && make install 1.4.2 安装FFmpeg # 下载源码 git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg
gitwhisper大模型openai语音翻译多语种预训练asr多任务clone