|
本帖最后由 同和1 于 2022-7-16 11:46 编辑
视频直接一键转文档,很方便,非常nice
仓库链接在文末,感兴趣的小伙伴可以自己跑一下,市面是这种工具都是付费的
来源:https://github.com/SWHL/RapidVideOCR
支持字幕语言:中文 | 英文 | 日文 (其他可以支持的语言参见:支持语种列表)
更快更准确地提取内嵌在视频的字幕,并提供txt|SRT|docx三种格式
更快:
采用Decord作为读取视频的库,更快;对于整个输入的视频,并不全部提取,因为存在大量重复字幕内容;
这里采用预先找到出现不同字幕的关键帧,再送入OCR部分,因此更快
更准:整个项目完全为全离线CPU运行,OCR部分采用的是RapidOCR,模型均来自PaddleOCR。
当然也可以在GPU运行,只要根据机器配置,安装对应版本的onnxruntime-gpu,即可自动在英伟达显卡上运行。具体教程参见:onnxruntime-gpu版推理配置
更方便:采用大小仅为2M左右的ONNXRuntime推理引擎,不安装PaddlePaddle框架,部署更加方便
|
|