记一次训练模型踩坑经历(附ai整理版)

记一次训练模型踩坑经历(附ai整理版)

    正在检查是否收录...
一言准备中...

记一次训练模型踩坑经历(附ai整理版)

@

目录
  • 项目背景
  • 小结
    • 为安卓项目训练 “小爱同学” 唤醒词的探索与解决过程

    • 核心要点总结

项目背景

公司要做个语音助手,类似于“小爱同学”那种,然后安卓小伙伴跟我交代需要换个唤醒词,重新训练个模型才行,so这个重任落到了我的身上,对于一个从来没有训练过模型的人,只能硬着头皮上了,踩坑用时3天

首先安卓小伙伴发给我的链接是这个https://github.com/hasanatlodhi/OpenwakewordforAndroid,这个是专门针对android开发的唤醒词项目,其中他说他要的就是一个onnx格式的模型文件,然后我找到这个项目的源项目地址https://github.com/dscripka/openWakeWord,ok下载下来自己跑试试吧,先创建个虚拟的运行环境,而且要python3.9以上,好的,那我切换到3.11,然后看到他没有requirments.txt,又看不到需要安装的扩展包清单,那我就复制运行代码直接执行吧,遇到要安装的扩展包再挨个安装,其中直接pip install安装太慢了,要在后面加上-i https://pypi.tuna.tsinghua.edu.cn/simple,经过用cursor一顿折腾总算安装完了,再执行运行语句吧,还是报错,于是我复制报错语句去问ai解决,一会报说配置不够完整一会说配置错了是个二维数组配置,还有说模型文件未找到我再去github上找,还有报执行命令要去openwakeword文件夹里面执行,各种解决了最后执行pip install openwakeword-train就是这句话,我一直执行报没有找到对应版本,不管是加了国内镜像地址还是直接拉都找不到,行,是不是3.11版本太高了里面没有,那我切换3.9吧,再重新拉项目检查python版本重新挨个拉依赖包,但是还是显示没有找到,然后我把这个报错信息给gemini给我回复是他能找到,他也自己到虚拟环境中执行了能拉下来。好吧怎么就我不行,我去问问通义千问,再走了一遍给的教程还是没有,我就奇怪了,是不是我的电脑本地环境有问题,然后我想用docker跑个环境运行吧,再问了gemini要了教程,走了一波,还是没有找到,此刻我很怀疑是不是真的有这个包了,然后我找了可不可以直接下载这个包再装载到我的pip里面,不行。好吧,我去FAQ里面找找,看了有好多人提过issue但是没有找到跟我这个类似的问题,行吧那我继续看看readme里面作者有个推荐的docker环境,我拉下来,但是看到里面很多配置mqtt,我用不上啊,我只是想跑个新模型出来,而且具体怎么跑这个项目还要花一定时间才能搞定,算了我继续找别的办法吧,想起最近kimi k2据说现在是最强ai,好,我好好描述下问题给他
我是名安卓开发人员,想使用“小爱同学”这个唤醒词,会简单的python,如果用github上openwakeword这个项目该如何训练,具体一些的操作
给我建议是用一个google colab的工具,这个其实就是google提供的一个虚拟机环境,然后在这个里面运行你的项目,看的也行耶,然后我把我要拉的项目和要下载的依赖全部在里面执行了,不出意外的话就有意外了,还是没有拉到openwakeword-train这个包,行吧就是没有这个包。再去看看readme吧,找到了readme里面怎么也有colab,行啊,我算熟悉了一点这个平台,就去试试,直接点进了链接,然后在里面执行每个单元格里面的代码,时间有点长一步步的最后出来了,叫我直接下载onnx和tflite格式文件,再拿去给安卓测试下,ok了。

小结

ai不一定都是对的,如果出问题一直解决不了,要学会保持怀疑的心态与之交流。同时官方readme很重要,一定要看完!

---以下是gemini整理了一下---


好的,这段曲折但最终成功的技术探索经历,可以整理成一个更清晰、有条理的复盘记录。


为安卓项目训练 “小爱同学” 唤醒词的探索与解决过程

这是一个关于如何使用 openWakeWord 开源项目,为安卓应用制作一个“小爱同学”唤醒词模型的全过程记录。整个过程充满了挑战,最终通过官方推荐的工具成功解决。

一、 目标与起点

  • 核心需求:

    为安卓App生成一个“小爱同学”唤醒词的 .onnx 格式模型文件。
  • 项目来源:

    1. 安卓同事提供了针对安卓的唤醒词项目 OpenwakewordforAndroid
    2. 根据指引,找到了其核心源项目 openWakeWord,并决定基于此项目进行模型训练。

二、 本地环境搭建的坎坷之路

  1. 环境初始化:

    • 创建了 Python 虚拟环境,并根据项目要求选择了 Python 3.9 以上版本(初选 3.11)。
    • 项目缺少 requirements.txt 文件,只能在代码运行时“缺啥补啥”,逐一手动安装依赖包。
    • 为解决 pip install 速度过慢的问题,使用了清华镜像源 (-i https://pypi.tuna.tsinghua.edu.cn/simple)。
  2. 遇到的主要障碍:

    • 反复报错:

      即使依赖安装完毕,运行时仍遇到各种错误,如配置不完整、数据格式错误(二维数组)、模型文件未找到、执行路径不正确等。
    • 关键包安装失败:

      在尝试训练模型时,最关键的一步 pip install openwakeword-train 始终失败,提示“找不到匹配的版本”。

三、 多方求助与尝试

为解决 openwakeword-train 的安装问题,进行了多轮尝试:

  1. 更换 Python 版本:

    怀疑是 Python 3.11 版本过高不兼容,降级到 3.9,并重复了所有安装步骤,但问题依旧。
  2. 求助 AI 模型:

    • 向 Gemini 求助,对方反馈在其虚拟环境中可以成功安装该包,这让我一度怀疑是自己的本地环境有问题。
    • 向通义千问求助,按照其教程操作,依然失败。
  3. 使用 Docker 隔离环境:

    • 为了彻底排除本地环境的干扰,尝试使用 Docker 构建一个干净的运行环境。
    • 根据 Gemini 提供的教程进行操作,但在 Docker 容器内,openwakeword-train 仍然无法安装。
  4. 研究官方 Docker 镜像:

    • 发现项目作者提供了一个推荐的 Docker 环境,但拉取后发现其配置复杂(包含 MQTT 等),不适合只想快速训练模型的简单需求,故放弃。
  5. 尝试 Kimi 与 Google Colab:

    • 向 Kimi AI 详细描述了问题和目标,它建议使用

      Google Colab

      (一个在线的虚拟环境)。
    • 在 Colab 中手动执行项目拉取和依赖安装,但 openwakeword-train 这个包依然无法安装。至此,基本确认这个包可能无法通过 pip 直接获取。

四、 柳暗花明:找到官方推荐的正确路径

在几乎所有方法都失败后,再次回到项目的 README 文档中寻找线索,终于发现了突破口:

  • 官方 Colab 链接:

    作者在文档中提供了一个

    直接用于模型训练的 Google Colab 笔记本链接

  • 一键式操作:

    点击该链接进入预设好的 Colab 环境,只需按顺序执行每个单元格的代码即可。这个环境已经处理好了所有复杂的依赖和配置问题。

五、 最终成果

  • 通过执行官方提供的 Colab 笔记本,整个训练流程顺利完成。
  • 最终,

    直接生成并下载了所需的 .onnx.tflite 格式的模型文件

    ,成功交付给安卓同事进行测试。

核心要点总结

  1. 直面核心问题:

    整个过程的卡点在于 openwakeword-train 这个包无法通过常规 pip 方式安装,所有围绕本地环境的折腾都是徒劳。
  2. 官方文档是关键:

    在遇到难以解决的问题时,最可靠的方案往往隐藏在项目的官方 READMEFAQ 中。作者推荐的工具和流程(如本例中的 Colab 笔记本)是最高效的路径。
  3. 善用云端工具:

    对于有复杂环境依赖的项目,使用 Google Colab 或类似的云端开发环境可以避免大量本地配置问题,尤其适合只想快速验证和使用项目核心功能的用户。


  • 本文作者:WAP站长网
  • 本文链接: https://wapzz.net/post-26922.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.7W+
8
1
1
WAP站长官方

【VMware vSphere】借助 Live Patch 无停机修补 vSphere 9 集群。

上一篇

.NET SDK 9.0.200引入对SLNX解决方案文件的支持

下一篇
评论区
内容为空

这一切,似未曾拥有

  • 复制图片
按住ctrl可打开默认菜单