AI Skill Hub 强烈推荐:数字调音师 是一款优质的Agent工作流。AI 综合评分 8.0 分,在同类工具中表现稳健。如果你正在寻找可靠的Agent工作流解决方案,这是一个值得深入了解的选择。
数字调音师 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
数字调音师 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
# 方式一:pip 安装(推荐)
pip install soultuner-agent
# 方式二:虚拟环境安装(推荐生产环境)
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install soultuner-agent
# 方式三:从源码安装(获取最新功能)
git clone https://github.com/hgsanyang/SoulTuner-Agent
cd SoulTuner-Agent
pip install -e .
# 验证安装
python -c "import soultuner_agent; print('安装成功')"
# 命令行使用
soultuner-agent --help
# 基本用法
soultuner-agent input_file -o output_file
# Python 代码中调用
import soultuner_agent
# 示例
result = soultuner_agent.process("input")
print(result)
# soultuner-agent 配置文件示例(config.yml) app: name: "soultuner-agent" debug: false log_level: "INFO" # 运行时指定配置文件 soultuner-agent --config config.yml # 或通过环境变量配置 export SOULTUNER_AGENT_API_KEY="your-key" export SOULTUNER_AGENT_OUTPUT_DIR="./output"
<p align="center"> <img src="assets/logo.png" alt="logo" width="200" /> </p>
<p align="center"> <strong>多模态音乐推荐智能体 — Hybrid RAG × Knowledge Graph × Long-term Memory</strong> </p>
<p align="center"> <img src="https://img.shields.io/badge/Python-3.11+-blue?logo=python" alt="Python" /> <img src="https://img.shields.io/badge/LangGraph-Agent_Framework-orange?logo=langchain" alt="LangGraph" /> <img src="https://img.shields.io/badge/Neo4j-Graph_Database-008CC1?logo=neo4j" alt="Neo4j" /> <img src="https://img.shields.io/badge/Next.js_14-Frontend-black?logo=next.js" alt="Next.js" /> <img src="https://img.shields.io/badge/Docker-Compose-2496ED?logo=docker" alt="Docker" /> <img src="https://img.shields.io/badge/License-MIT-green" alt="License" /> <br/> <img src="https://github.com/hgsanyang/SoulTuner-Agent/actions/workflows/ci.yml/badge.svg" alt="CI" /> <img src="https://img.shields.io/badge/tests-51_passed-brightgreen?logo=pytest" alt="Tests" /> <img src="https://img.shields.io/badge/code_style-ruff-261230?logo=ruff" alt="Ruff" /> </p>
<p align="center"> <a href="README.md">中文</a> | <a href="README_EN.md">English</a> </p>
| 特性 | 说明 |
|---|---|
| 🔀**Hybrid RAG** | GraphRAG + Semantic Search 并发检索,平等合并去重 + 三锚归一化精排 |
| 🎵**双模型音频向量** | M2D-CLAP 跨模态语义 + OMAR-RQ 声学特征,三锚归一化融合(权重可调) |
| 🧠**长期记忆** | GraphZep 双阶段召回,跨会话保留用户偏好 |
| 📊**粗排+探索** | Graph Affinity 粗排截断 + Thompson Sampling 冷门探索槽 |
| 🤖**智能意图识别** | 7 类意图分类 + DST 多轮标签继承,支持 API 大模型 + 本地 Qwen3-4B |
| 👤**用户画像** | 前端可视化画像面板,流派/情绪/场景/语言偏好 → Neo4j + GraphZep 双写 |
| 🌐**联网搜索回退** | 本地库不足时自动触发 SearxNG 联邦搜索 + LLM 摘要 |
| 🎼**音乐旅程** | LLM 故事→情绪拆解→逐段检索,SSE 实时推送 |
| ♻️**数据飞轮** | 下载→暂存→试听→确认入库→标签提取→向量编码→Neo4j |
| 📋**曲库管理** | 待入库暂存区 + 我的曲库全图谱管理(搜索/播放/删除) |
| 📡**SSE 流式** | 前端实时渲染 thinking → 歌曲卡片 → 推荐理由 |
| 🐳**Docker 部署** | docker compose up 一键启动全栈 |
---
conda create -n music_agent python=3.11 && conda activate music_agent pip install -r requirements.txt
cd web && npm install && cd ..
Windows 推荐使用统一入口:
.\soultuner.ps1 doctor
.\soultuner.ps1 up lite # 无 GPU:Neo4j + API + 前端
.\soultuner.ps1 up standard # 加 GraphZep + SearxNG
.\soultuner.ps1 up full # 加独立音乐入库 Worker
无外部服务自测:
.\soultuner.ps1 mock
部署档位、端口和在线新歌入库流程见 DEPLOYMENT_PROFILES.md。
部署分为三步:① 前置准备 → ② 选择部署方式启动服务 → ③ 数据导入。
---
1.1 音乐数据:将 MP3 文件放入 data/processed_audio/audio/ 目录(路径可在 .env 中自定义)。
1.2 环境变量:
```bash cp .env.example .env
| 方式 A:Docker Compose(推荐) | 方式 B:本地开发(Conda) | |
|---|---|---|
| 适用场景 | 快速体验、演示部署 | 日常开发、调试代码 |
| Neo4j | 容器自带,自动启动 | 需手动安装 Neo4j Desktop 并启动 |
| GraphZep | 容器自带,自动启动 | 由 startup_all.py 自动启动 |
后端镜像约 11 GB(含 PyTorch + M2D-CLAP 运行库)。模型权重通过 volume 挂载宿主机缓存,不打包进镜像。 ⚠️ GPU 要求:docker-compose.yml默认开启 NVIDIA GPU 加速(用于 M2D-CLAP 跨模态推理)。需要宿主机已安装 NVIDIA Container Toolkit。如无 GPU,请注释掉deploy.resources段。
```bash
针对 8GB 显存(如 RTX 4070)设备的优化部署方案,支持本地运行 Qwen3-4B 模型辅助意图识别。
wsl
bash /path/to/SoulTuner-Agent/scripts/start_sglang.sh
python startup_all.pysglang → 保存---
docker compose up -d
docker logs -f soultuner-backend
python startup_all.py
**1.3 模型权重下载**(首次必须,约 **2.4 GB**):
bash
| 变量 | 说明 | 默认值 |
|---|---|---|
OPENAI_BASE_URL | LLM API 地址 | https://api.siliconflow.cn/v1 |
OPENAI_API_KEY | LLM API 密钥 | — |
MODEL_NAME | 主推理模型 | deepseek-ai/DeepSeek-V3.2 |
VOLCENGINE_BASE_URL | 火山引擎 API 地址 | https://ark.cn-beijing.volces.com/api/v3 |
VOLCENGINE_API_KEY | 火山引擎 API 密钥 | 可选 |
NEO4J_URI | Neo4j 连接 | neo4j://127.0.0.1:7687 |
NEO4J_PASSWORD | Neo4j 密码 | — |
TAVILY_API_KEY | 联网搜索 | 可选 |
GOOGLE_API_KEY | Gemini API | 可选 |
📖 运行时设置面板(LLM 切换 / 检索参数 / RRF 权重等)及 API 端点文档详见 Technical_Report.md
---
<details>
<summary>Docker 常用运维命令</summary>
| 命令 | 说明 |
| ------------------------------------------- | ---------------------------------------------- |
| `docker logs -f soultuner-backend` | 实时跟踪后端日志 |
| `docker logs --tail 50 soultuner-backend` | 查看最后 50 行日志 |
| `docker compose up -d --build backend` | 代码修改后重新构建并启动后端 |
| `docker compose restart backend` | 重启后端(不重新构建) |
| `docker compose down` | 停止并移除所有容器 |
| `docker compose down -v` | 停止并清除所有数据卷(⚠️ 会删除 Neo4j 数据) |
</details>
#### 方式 B:本地开发(Conda)
> ⚠️ 需先安装并启动 [Neo4j Desktop](https://neo4j.com/download/),在 `.env` 中配置对应的 `NEO4J_URI` 和 `NEO4J_PASSWORD`。
bash
意图识别支持 API 大模型(DeepSeek-V3.2 等)和本地 Qwen3-4B(SGLang 部署)双模式。本地模式下 HyDE 声学描述由独立模块生成。
web_search意图现在直接路由到web_fallback节点(在线音乐 API 实时搜索),不再经过 HybridRetrieval。支持中文原文优先、多级查询词提取和 30s 试听版本检测。
偏好提取为独立 LangGraph 节点 extract_preferences,闲聊意图自动跳过。
python scripts/download_models.py ```
| 模型 | 大小 | 用途 | 存放位置 |
|---|---|---|---|
| M2D-CLAP 2025 | ~1.6 GB | 运行时文本↔音频跨模态编码 + 双锚精排 | ~/.cache/m2d_clap/ |
| BERT-base-uncased | ~440 MB | M2D-CLAP 内部文本编码器 | ~/.cache/huggingface/ |
| OMAR-RQ multicodebook | ~400 MB | 数据入库时提取音频特征向量 | ~/.cache/huggingface/ |
💡 GraphZep 嵌入直接调用 SiliconFlow API (BAAI/bge-m3),无需预下载。
---
创新性的AI音乐推荐系统
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。
总体来看,数字调音师 是一款质量优秀的Agent工作流,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | SoulTuner-Agent |
| Topics | ai-agentaudio-embeddinghybrid-retrievalknowledge-graph |
| GitHub | https://github.com/hgsanyang/SoulTuner-Agent |
| License | MIT |
| 语言 | Python |
收录时间:2026-06-19 · 更新时间:2026-06-19 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。
选择 Agent 类型,复制安装指令后粘贴到对应客户端