开源AI视频转写助手:支持多平台,一键生成摘要

AI Video Transcriber是一款开源AI视频转录与摘要工具,支持YouTube、B站、抖音等30+平台,提供自动纠错、智能分段、多语言摘要等功能,助力内容创作者快速生成多语言摘要与文稿。

5AI工具AI转录视频摘要多平台支持开源工具

AI Video Transcriber概览

AI Video Transcriber是一款基于开源技术的AI视频转录与摘要工具,它利用Faster-Whisper进行高精度语音转写,结合yt-dlp抓取主流视频内容,覆盖YouTube、Bilibili、抖音等30多个平台。它具备自动纠错、句子补全、智能分段和多语言摘要能力,当摘要语言与检测语言不一致时,还能调用GPT-4o进行条件式翻译。

AI Video Transcriber核心功能

  • 多平台支持:依托yt-dlp,适配YouTube、抖音、B站等大量站点。
  • 智能转录:采用Faster-Whisper,速度与内存占用更优,保持与原版Whisper相近的准确率。
  • 文本优化:自动错别字修正、句子完整化与智能分段,便于直接发布与检索。
  • 多语言摘要与条件式翻译:当摘要语言与检测语言不一致时,自动用GPT-4o生成翻译与总结。
  • 移动适配:前端界面适配移动端,支持Markdown渲染。

快速上手

环境要求

AI Video Transcriber:AI视频转录器 支持YouTube/B站/抖音的开源多平台转写与AI摘要工具

  • Python 3.8+
  • FFmpeg(音视频处理必备)
  • 可选:OpenAI API Key(启用AI摘要/翻译)

使用步骤

  1. 粘贴视频链接(支持YouTube、B站、抖音等)。
  2. 选择输出摘要语言。
  3. 点击「开始」,系统执行以下流水线:下载与解析 → Faster-Whisper转写 → AI优化(纠错、补全、分段)→ 生成所选语言摘要/翻译。
  4. 查看转写与摘要结果,可下载Markdown文件保存。

技术架构

  • 后端:FastAPI提供接口;yt-dlp负责下载与解析;Faster-Whisper负责转写;OpenAI API用于摘要/翻译。
  • 前端:HTML5/CSS3 + 原生JavaScript,使用Marked.js渲染Markdown;图标库使用Font Awesome。

常见问题

  • 转录速度偏慢? 与视频时长、模型大小与硬件性能相关。选择tiny或base等较小模型可提速。
  • 平台覆盖面? 以yt-dlp支持的站点为准,覆盖数千网站与变体。
  • AI优化不可用? 未配置OpenAI API Key时,仅输出Whisper原始转写与简化摘要。
  • 环境报错/白屏? 按README检查虚拟环境、依赖、OPENAI_API_KEY/OPENAI_BASE_URL、FFmpeg安装与端口占用。

适用人群与场景

  • 内容创作者、运营与新媒体团队:批量转写口播与长视频,快速生成多语言摘要与文稿。
  • 教育与会议记录:课程、讲座、访谈转写与要点提炼。
  • 知识整理:剪辑脚本、字幕草稿、SEO素材沉淀与复用。

AI Video Transcriber项目地址

GitHub地址:https://github.com/wendy7756/AI-Video-Transcriber