AI音频转文字神器:AudioNotes助您高效提取笔记
AudioNotes是一款基于AI的音频转文字工具,通过自动语音识别技术,快速提取音视频内容,生成Markdown笔记,方便用户高效整理信息。
AudioNotes是什么
AudioNotes是一款基于AI的音频转文字工具,它基于FunASR和Qwen2构建,能够快速提取音视频内容,并调用大模型进行整理,生成结构化的Markdown笔记,便于快速阅读。AudioNotes的核心功能是利用先进的自动语音识别技术,精准提取音视频中的文本内容,并通过大模型整理生成清晰易读的Markdown笔记,支持用户与音视频内容进行交互式对话以获取更多信息。目前AudioNotes支持Docker部署和本地部署两种方式,推荐使用Docker部署。
效果展示
音视频识别和整理
音视频识别和整理示例

与音视频内容对话
与音视频内容对话示例
如何使用AudioNotes
① 安装Ollama
下载对应系统的Ollama安装包进行安装。

② 拉取模型
以阿里的千问2 7b为例,可以访问https://ollama.com/library/qwen2获取模型。
③ 部署服务
AudioNotes支持Docker部署和本地部署两种方式,推荐使用Docker部署。

Docker部署(推荐)🐳
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml docker-compose up
docker启动后,访问http://localhost:15433/
登录账号为admin,密码为admin(可以在docker-compose.yml文件里面修改)
本地部署 📦
需要有可访问的postgresql数据库。
conda create -n AudioNotes python=3.10 -y conda activate AudioNotes git clone https://github.com/harry0703/AudioNotes.git cd AudioNotes pip install -r requirements.txt
将.env.example重命名为.env,修改相关配置信息。

chainlit run main.py
服务启动后,访问http://localhost:8000/
登录账号为admin,密码为admin(可以在.env文件里面修改)