文章目录
显示
AudioNotes是什么
AudioNotes 是一款 AI 音频转文字工具,基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统,能够快速提取音视频内容,并调用大模型进行整理,生成结构化的 Markdown 笔记,便于快速阅读。AudioNotes核心功能是利用先进的自动语音识别(ASR)技术,能够精准提取音视频中的文本内容,通过大模型整理生成清晰易读的 Markdown 笔记,并支持用户与音视频内容进行交互式对话以获取更多信息。目前AudioNotes有两种部署方式,一种是使用 Docker 部署,另一种是本地部署,推荐使用Docker部署。
AudioNotes效果展示
音视频识别和整理
与音视频内容对话
AudioNotes如何使用
① 安装 Ollama
下载对应系统的 Ollama 安装包进行安装
② 拉取模型
以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2
ollama pull qwen2:7b
③ 部署服务
有两种部署方式,一种是使用 Docker 部署,另一种是本地部署
Docker部署(推荐)🐳
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up
docker 启动后,访问 http://localhost:15433/
登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)
本地部署 📦
需要有可访问的 postgresql 数据库
conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt
将 .env.example 重命名为 .env,修改相关配置信息
chainlit run main.py
服务启动后,访问 http://localhost:8000/
登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)
AudioNotes GitHub地址
网站:https://github.com/harry0703/AudioNotes
- 转载或引用本文内容,请保留原文链接并注明来源。
- 本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。
- 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过下方联系方式与我们联系,我们将在核实后及时处理。
- 本文所提及的工具、项目或解决方案仅供学习与研究参考。如涉及商业使用,请自行确认并遵守相关软件、平台或服务的授权条款。
- 反馈与联系(# 替换为 @):feedback#abskoop.com



评论(0)