
开源AI视频转写助手:支持多平台,一键生成摘要
AI Video Transcriber是一款开源AI视频转录与摘要工具,支持YouTube、B站、抖音等30+平台,提供自动纠错、智能分段、多语言摘要等功能,助力内容创作者快速生成多语言摘要与文稿。
AI Video Transcriber概览
AI Video Transcriber是一款基于开源技术的AI视频转录与摘要工具,它利用Faster-Whisper进行高精度语音转写,结合yt-dlp抓取主流视频内容,覆盖YouTube、Bilibili、抖音等30多个平台。它具备自动纠错、句子补全、智能分段和多语言摘要能力,当摘要语言与检测语言不一致时,还能调用GPT-4o进行条件式翻译。
AI Video Transcriber核心功能
- 多平台支持:依托yt-dlp,适配YouTube、抖音、B站等大量站点。
- 智能转录:采用Faster-Whisper,速度与内存占用更优,保持与原版Whisper相近的准确率。
- 文本优化:自动错别字修正、句子完整化与智能分段,便于直接发布与检索。
- 多语言摘要与条件式翻译:当摘要语言与检测语言不一致时,自动用GPT-4o生成翻译与总结。
- 移动适配:前端界面适配移动端,支持Markdown渲染。
快速上手
环境要求:

- Python 3.8+
- FFmpeg(音视频处理必备)
- 可选:OpenAI API Key(启用AI摘要/翻译)
使用步骤:
- 粘贴视频链接(支持YouTube、B站、抖音等)。
- 选择输出摘要语言。
- 点击「开始」,系统执行以下流水线:下载与解析 → Faster-Whisper转写 → AI优化(纠错、补全、分段)→ 生成所选语言摘要/翻译。
- 查看转写与摘要结果,可下载Markdown文件保存。
技术架构
- 后端:FastAPI提供接口;yt-dlp负责下载与解析;Faster-Whisper负责转写;OpenAI API用于摘要/翻译。
- 前端:HTML5/CSS3 + 原生JavaScript,使用Marked.js渲染Markdown;图标库使用Font Awesome。
常见问题
- 转录速度偏慢? 与视频时长、模型大小与硬件性能相关。选择tiny或base等较小模型可提速。
- 平台覆盖面? 以yt-dlp支持的站点为准,覆盖数千网站与变体。
- AI优化不可用? 未配置OpenAI API Key时,仅输出Whisper原始转写与简化摘要。
- 环境报错/白屏? 按README检查虚拟环境、依赖、OPENAI_API_KEY/OPENAI_BASE_URL、FFmpeg安装与端口占用。
适用人群与场景
- 内容创作者、运营与新媒体团队:批量转写口播与长视频,快速生成多语言摘要与文稿。
- 教育与会议记录:课程、讲座、访谈转写与要点提炼。
- 知识整理:剪辑脚本、字幕草稿、SEO素材沉淀与复用。