查看: 1554|回复: 0

视频硬字幕提取,自动生成对应srt和带有关键帧的docx文件...

[复制链接]

48

主题

4

回帖

211

积分

高级会员

Rank: 2

积分
211
发表于 2022-7-16 11:38:55 | 显示全部楼层 |阅读模式
本帖最后由 同和1 于 2022-7-16 11:46 编辑

视频直接一键转文档,很方便,非常nice

仓库链接在文末,感兴趣的小伙伴可以自己跑一下,市面是这种工具都是付费的

来源:https://github.com/SWHL/RapidVideOCR

支持字幕语言:中文 | 英文 | 日文 (其他可以支持的语言参见:支持语种列表)


更快更准确地提取内嵌在视频的字幕,并提供txt|SRT|docx三种格式


更快:
采用Decord作为读取视频的库,更快;对于整个输入的视频,并不全部提取,因为存在大量重复字幕内容;
这里采用预先找到出现不同字幕的关键帧,再送入OCR部分,因此更快
更准:整个项目完全为全离线CPU运行,OCR部分采用的是RapidOCR,模型均来自PaddleOCR。
当然也可以在GPU运行,只要根据机器配置,安装对应版本的onnxruntime-gpu,即可自动在英伟达显卡上运行。具体教程参见:onnxruntime-gpu版推理配置
更方便:采用大小仅为2M左右的ONNXRuntime推理引擎,不安装PaddlePaddle框架,部署更加方便

62d231ce3952e.png
interactive_select_threshold.gif
物欲横流,谁主沉浮?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表