视频硬字幕提取，自动生成对应srt和带有关键帧的docx文件...

同和1 · 发表于 2022-7-16 11:38:55

本帖最后由同和1 于 2022-7-16 11:46 编辑

视频直接一键转文档，很方便，非常nice

仓库链接在文末，感兴趣的小伙伴可以自己跑一下，市面是这种工具都是付费的

来源：https://github.com/SWHL/RapidVideOCR

支持字幕语言：中文 | 英文 | 日文（其他可以支持的语言参见：支持语种列表)

更快更准确地提取内嵌在视频的字幕，并提供txt|SRT|docx三种格式

更快：
采用Decord作为读取视频的库，更快;对于整个输入的视频，并不全部提取，因为存在大量重复字幕内容；
这里采用预先找到出现不同字幕的关键帧，再送入OCR部分，因此更快
更准：整个项目完全为全离线CPU运行，OCR部分采用的是RapidOCR，模型均来自PaddleOCR。
当然也可以在GPU运行，只要根据机器配置，安装对应版本的onnxruntime-gpu，即可自动在英伟达显卡上运行。具体教程参见：onnxruntime-gpu版推理配置
更方便：采用大小仅为2M左右的ONNXRuntime推理引擎，不安装PaddlePaddle框架，部署更加方便