免费OCR视频字幕批量提取:90分钟视频,3分钟提取全部文案(最强PaddleOCR自媒体人也能用上了)
火爆的 PaddleOCR 如何让普通小白也能用上?
你好,我是大圆。
欢迎来到「AI 内容提效工具箱」系列,本期要介绍的是一款在内容生产方面非常实用的工具:本地视频字幕文案提取器。
如果视频在咱们本地,想提取它的文案,现阶段最实用的两种方法:一种是基于音频提取字幕,另一种是直接提取视频画面里的字幕来获取文案。
最近,DeepSeek 的 DeepSeek-OCR 热度非常高,同时百度的飞桨 PaddleOCR 也备受关注。
虽然 DeepSeek-OCR 和飞桨 PaddleOC 并不是同一个产品,但今天要推荐的这款工具,正是基于百度飞桨开源的 PaddleOCR 模型开发的,因此在性能和效率方面都相当出色。
飞桨 PaddleOCR 是百度早在2020年就开源的一款 OCR 模型,也是目前 OCR 领域最受欢迎的开源项目之一,在 GitHub 上已经拥有超过 60k 的 star 数。

不过,对于大多数普通用户来说,直接使用代码和模型还是有一定门槛的。
而今天介绍的这款工具,正是借助飞桨 PaddleOCR 模型,封装成了一款真正可用的视频字幕文案提取工具。
它的核心卖点在于:速度快、效率高。
虽然它在 GitHub 上目前只有 500 多个 star,但实际使用下来,效果确实不错。
当然,如果你使用的是 M 芯片的 Mac 电脑,或者拥有 30 系显卡的 Windows 电脑,提取效果和效率会更佳。
举个例子,在 30 系显卡的电脑上,字幕提取速度可以达到视频播放速度的 15 到 30 倍。
也就是说,一段 10 分钟的视频,只需要 20 到 40 秒左右就能完成字幕提取。
使用教程
工具地址: https://github.com/nhjydywd/SubtitleOCR
作者已经贴心地打包好了安装包,我们只需在 GitHub 上下载即可直接使用。
如果你访问 GitHub 有困难,也可以加我微信,我直接发安装包给你。
使用方法也非常简单:
- 将多个视频批量拖进工具界面,它会自动识别视频中所有的文字区域;
- 点击“添加字幕行”,开始提取;
- 提取完成后,在任务列表中可以看到所有已完成的任务,选择导出即可。
支持导出的格式很丰富,包括字幕文件、srt、txt 等多种格式。
我们以一个画面文本比较复杂的视频为例来进行操作,普通视频会简单更多。
我们把工具安装包下载下来,解压到文件夹里就行,不用安装,直接双击运行 subocr.exe 文件就好。

启动软件后,咱们把需要提取文案的视频拖到窗口界面里,工具就会自动分析视频,把所有文字模块都提取出来。

下一步我们点击「添加字幕行」按钮。
要是普通视频,这里只会出现一个字幕行,无需过多操作,直接下一步「开始提取」即可。
但咱们选的是文字块特别多的视频来做演示教学,它会自动把视频里所有的字幕模块都分析提取出来。这时候咱们不用额外操作,只要删掉不需要的字幕模块,留下真正需要的那一行就行。

这里我们删除其余不需要的字幕,只保留唯一的一行就可以了。

下一步,我们点击开始提取工具,会自动把字幕提取展示到右侧与视频的下方。

提取完成之后,我们点击导出字幕就行。这个工具支持导出 SRT、ASS、TXT 格式的字幕,也能把图片和临时文件一起导出来。

这里以一个短视频为例进行提取,没做任何修改,正确率一般没什么问题。

在设置里也支持多种语言的分析和提取。

科技的意义,不在于替代人,而在于把时间还给我们自己。感谢开源~~
用好工具,专注创作。
结束
我是大圆,专注 AI 内容提效 的实操经验与工具分享。
加微信 dayuanlog 回复“知识库”,送你一份我正在更新的 AI 内容自动化知识库。
前SEO站长
RPA高级工程师
自动化流程产品经理
我能为你提供:
① 团队RPA提效流程设计
② 新媒体 AI自动化落地
③ 视频自动剪辑 AI工具
