有人私信说要想要海南鸡饭大佬的3500小时whisper微调模型的colab懒人包
就粗浅地改了一个。
仅供个人AI学习使用, 请勿用于商业用途
用法就是首先下载海南鸡饭提供的文件到本地,然后上传其中的模型文件夹(叫model的那个)到google drive里,然后转存这个notebook文件到相同位置,启动,免费版就连接T4,如果pro就可以用V100,L4啊什么的。然后在对应位置修改参数,挨个运行就行按说明操作就行,就是要提前上传音声文件放到设置的输入文件夹,运行一遍notebook,最后去输出文件夹下载处理好的lrc。
除了第一次操作需要修改参数,后续就只需要运行完整个notebook就行了.
*:捉个虫,之前没考虑到超过一小时的长音频,whisper会生成为 【小时:分钟:秒数】格式时间戳。但lrc并不是为超过一小时的长音频设计的,所以并不支持【小时:分钟:秒数】而是继续以【分钟:秒数】的格式累加60以上分钟数。原来会导致一小时后的字幕无法识别,现在已经修正。重新保存一下新版colab notebook即可。运行方式不变。
**:捉个临时虫,根据反馈说-依赖的一个主要库更新出现兼容问题,等待库修复前请手动在第一栏代码中添加一行:
复制代码- !pip install ctranslate2==4.4
|
来暂时修复。
*新增了在全部翻译完后自动断开colab连接时的一个开关。用来节省colab额度。
此帖售价 0 SP币,已有 533 人购买
若发现会员采用欺骗的方法获取财富,请立刻举报,我们会对会员处以2-N倍的罚金,严重者封掉ID!