能力标签
⚙️
Agent工作流

数字调音师

基于 Python · 无代码搭建完整 AI 自动化流程
英文名:SoulTuner-Agent
⭐ 12 Stars 🍴 3 Forks 💻 Python 📄 MIT 🏷 AI 8.0分
8.0AI 综合评分
ai-agentaudio-embeddinghybrid-retrievalknowledge-graph
✦ AI Skill Hub 推荐

AI Skill Hub 强烈推荐:数字调音师 是一款优质的Agent工作流。AI 综合评分 8.0 分,在同类工具中表现稳健。如果你正在寻找可靠的Agent工作流解决方案,这是一个值得深入了解的选择。

📚 深度解析

数字调音师 是一套完整的 AI Agent 自动化工作流方案。随着 AI 能力的不断提升,基于 Agent 的自动化工作流正在成为提升个人和团队效率的核心方式。区别于传统的 RPA 自动化(模拟鼠标键盘操作),AI Agent 工作流通过理解任务意图、动态规划执行路径,能够处理更复杂的非结构化任务。

数字调音师 工作流的设计遵循"最小配置,最大复用"原则:核心逻辑已经封装好,用户只需配置自己的 API Key 和业务参数即可快速上手。工作流内置错误处理和重试机制,在网络波动或 API 限速等情况下仍能稳定运行,适合作为生产环境的自动化基础设施。

在实际部署时,建议先在测试环境中运行 3-5 次,验证各个环节的输出结果符合预期,再部署到生产环境。AI Skill Hub 评分 8.0 分,是同类 Agent 工作流中的精选推荐。

📋 工具概览

数字调音师 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。

GitHub Stars
⭐ 12
开发语言
Python
支持平台
Windows / macOS / Linux
维护状态
轻量级项目,按需更新
开源协议
MIT
AI 综合评分
8.0 分
工具类型
Agent工作流
Forks
3

📖 中文文档

以下内容由 AI Skill Hub 根据项目信息自动整理,如需查看完整原始文档请访问底部「原始来源」。

数字调音师 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。

📌 核心特色
  • 可视化 Agent 工作流编排,无需编写复杂代码
  • 支持多步骤自动化任务链,实现全流程无人值守
  • 与外部 API、数据库和第三方服务无缝集成
  • 内置错误处理与自动重试机制,保障稳定运行
  • 提供可复用的自动化模板,快速在同类场景部署
🎯 主要使用场景
  • 自动化日常重复性工作,将精力集中于创造性任务
  • 构建数据采集 → 处理 → 输出的完整自动化管线
  • 实现跨平台、跨系统的数据流转和业务协同
以下安装命令基于项目开发语言和类型自动生成,实际以官方 README 为准。
安装命令
# 方式一:pip 安装(推荐)
pip install soultuner-agent

# 方式二:虚拟环境安装(推荐生产环境)
python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install soultuner-agent

# 方式三:从源码安装(获取最新功能)
git clone https://github.com/hgsanyang/SoulTuner-Agent
cd SoulTuner-Agent
pip install -e .

# 验证安装
python -c "import soultuner_agent; print('安装成功')"
📋 安装步骤说明
  1. 访问 GitHub 仓库获取工作流文件
  2. 在对应平台(Dify / Flowise / Make 等)中找到「导入工作流」功能
  3. 上传工作流文件
  4. 按照提示配置必要的环境变量和 API Key
  5. 运行测试确认流程正常后投入使用
以下用法示例由 AI Skill Hub 整理,涵盖最常见的使用场景。
常用命令 / 代码示例
# 命令行使用
soultuner-agent --help

# 基本用法
soultuner-agent input_file -o output_file

# Python 代码中调用
import soultuner_agent

# 示例
result = soultuner_agent.process("input")
print(result)
以下配置示例基于典型使用场景生成,具体参数请参照官方文档调整。
配置示例
# soultuner-agent 配置文件示例(config.yml)
app:
  name: "soultuner-agent"
  debug: false
  log_level: "INFO"

# 运行时指定配置文件
soultuner-agent --config config.yml

# 或通过环境变量配置
export SOULTUNER_AGENT_API_KEY="your-key"
export SOULTUNER_AGENT_OUTPUT_DIR="./output"
📑 README 深度解析 真实文档 完整度 82/100 含工作流图 查看 GitHub 原文 →
以下内容由系统直接从 GitHub README 解析整理,保留代码块、表格与列表结构。

🎵 SoulTuner Agent

<p align="center"> <img src="assets/logo.png" alt="logo" width="200" /> </p>

<p align="center"> <strong>多模态音乐推荐智能体 — Hybrid RAG × Knowledge Graph × Long-term Memory</strong> </p>

<p align="center"> <img src="https://img.shields.io/badge/Python-3.11+-blue?logo=python" alt="Python" /> <img src="https://img.shields.io/badge/LangGraph-Agent_Framework-orange?logo=langchain" alt="LangGraph" /> <img src="https://img.shields.io/badge/Neo4j-Graph_Database-008CC1?logo=neo4j" alt="Neo4j" /> <img src="https://img.shields.io/badge/Next.js_14-Frontend-black?logo=next.js" alt="Next.js" /> <img src="https://img.shields.io/badge/Docker-Compose-2496ED?logo=docker" alt="Docker" /> <img src="https://img.shields.io/badge/License-MIT-green" alt="License" /> <br/> <img src="https://github.com/hgsanyang/SoulTuner-Agent/actions/workflows/ci.yml/badge.svg" alt="CI" /> <img src="https://img.shields.io/badge/tests-51_passed-brightgreen?logo=pytest" alt="Tests" /> <img src="https://img.shields.io/badge/code_style-ruff-261230?logo=ruff" alt="Ruff" /> </p>

<p align="center"> <a href="README.md">中文</a> | <a href="README_EN.md">English</a> </p>

✨ 核心特性

特性说明
🔀**Hybrid RAG**GraphRAG + Semantic Search 并发检索,平等合并去重 + 三锚归一化精排
🎵**双模型音频向量**M2D-CLAP 跨模态语义 + OMAR-RQ 声学特征,三锚归一化融合(权重可调)
🧠**长期记忆**GraphZep 双阶段召回,跨会话保留用户偏好
📊**粗排+探索**Graph Affinity 粗排截断 + Thompson Sampling 冷门探索槽
🤖**智能意图识别**7 类意图分类 + DST 多轮标签继承,支持 API 大模型 + 本地 Qwen3-4B
👤**用户画像**前端可视化画像面板,流派/情绪/场景/语言偏好 → Neo4j + GraphZep 双写
🌐**联网搜索回退**本地库不足时自动触发 SearxNG 联邦搜索 + LLM 摘要
🎼**音乐旅程**LLM 故事→情绪拆解→逐段检索,SSE 实时推送
♻️**数据飞轮**下载→暂存→试听→确认入库→标签提取→向量编码→Neo4j
📋**曲库管理**待入库暂存区 + 我的曲库全图谱管理(搜索/播放/删除)
📡**SSE 流式**前端实时渲染 thinking → 歌曲卡片 → 推荐理由
🐳**Docker 部署**docker compose up 一键启动全栈

---

🖼️ 功能预览

🎬 快速了解 SoulTuner 的功能

Demo Video

需要先安装 Python 依赖(后续 Step 3 数据导入也需要此环境)

conda create -n music_agent python=3.11 && conda activate music_agent pip install -r requirements.txt

Step 1 中已创建 Conda 环境,安装前端依赖

cd web && npm install && cd ..

🚀 快速开始

Windows 推荐使用统一入口:

.\soultuner.ps1 doctor
.\soultuner.ps1 up lite       # 无 GPU:Neo4j + API + 前端
.\soultuner.ps1 up standard   # 加 GraphZep + SearxNG
.\soultuner.ps1 up full       # 加独立音乐入库 Worker

无外部服务自测:

.\soultuner.ps1 mock

部署档位、端口和在线新歌入库流程见 DEPLOYMENT_PROFILES.md

部署分为三步:① 前置准备② 选择部署方式启动服务③ 数据导入

---

Step 1:前置准备(两种部署方式共用)

1.1 音乐数据:将 MP3 文件放入 data/processed_audio/audio/ 目录(路径可在 .env 中自定义)。

1.2 环境变量

```bash cp .env.example .env

Step 2:选择部署方式

方式 A:Docker Compose(推荐)方式 B:本地开发(Conda)
适用场景快速体验、演示部署日常开发、调试代码
Neo4j容器自带,自动启动需手动安装 Neo4j Desktop 并启动
GraphZep容器自带,自动启动startup_all.py 自动启动

方式 A:Docker Compose(推荐)

后端镜像约 11 GB(含 PyTorch + M2D-CLAP 运行库)。模型权重通过 volume 挂载宿主机缓存,不打包进镜像。 ⚠️ GPU 要求docker-compose.yml 默认开启 NVIDIA GPU 加速(用于 M2D-CLAP 跨模态推理)。需要宿主机已安装 NVIDIA Container Toolkit。如无 GPU,请注释掉 deploy.resources 段。

```bash

编辑 .env 中的 Docker 专用路径(download_models.py 运行后会输出):

── Docker 部署需要显式指定 Neo4j 连接地址 ──

── 本地部署已在 .env 中配置,无需额外设置 ──

可选:本地大模型部署(WSL + SGLang)

针对 8GB 显存(如 RTX 4070)设备的优化部署方案,支持本地运行 Qwen3-4B 模型辅助意图识别。

  1. 终端A (WSL):启动大模型推理引擎
   wsl
   bash /path/to/SoulTuner-Agent/scripts/start_sglang.sh
   
  1. 终端B (Windows):在前端设置面板切换为本地模型
  • 正常运行 python startup_all.py
  • 打开系统设置 ⚙️ → 主提供商选择 sglang → 保存

---

一键启动(Neo4j + GraphZep + Backend + Frontend)

docker compose up -d

★ 实时跟踪后端启动日志(推荐首次启动时使用,可看到预热进度)

docker logs -f soultuner-backend

一键启动所有服务(后端 + 前端 + GraphZep + SearxNG)

python startup_all.py

编辑 .env:至少填入 SiliconFlow_API_KEY 和 NEO4J_PASSWORD


**1.3 模型权重下载**(首次必须,约 **2.4 GB**):
bash

⚙️ 配置

环境变量

变量说明默认值
OPENAI_BASE_URLLLM API 地址https://api.siliconflow.cn/v1
OPENAI_API_KEYLLM API 密钥
MODEL_NAME主推理模型deepseek-ai/DeepSeek-V3.2
VOLCENGINE_BASE_URL火山引擎 API 地址https://ark.cn-beijing.volces.com/api/v3
VOLCENGINE_API_KEY火山引擎 API 密钥可选
NEO4J_URINeo4j 连接neo4j://127.0.0.1:7687
NEO4J_PASSWORDNeo4j 密码
TAVILY_API_KEY联网搜索可选
GOOGLE_API_KEYGemini API可选
📖 运行时设置面板(LLM 切换 / 检索参数 / RRF 权重等)及 API 端点文档详见 Technical_Report.md

---

前端: http://localhost:3003 | 后端 API: http://localhost:8501 | Neo4j: http://localhost:7474


<details>
<summary>Docker 常用运维命令</summary>

| 命令                                        | 说明                                           |
| ------------------------------------------- | ---------------------------------------------- |
| `docker logs -f soultuner-backend`        | 实时跟踪后端日志                               |
| `docker logs --tail 50 soultuner-backend` | 查看最后 50 行日志                             |
| `docker compose up -d --build backend`    | 代码修改后重新构建并启动后端                   |
| `docker compose restart backend`          | 重启后端(不重新构建)                         |
| `docker compose down`                     | 停止并移除所有容器                             |
| `docker compose down -v`                  | 停止并清除所有数据卷(⚠️ 会删除 Neo4j 数据) |

</details>

#### 方式 B:本地开发(Conda)

> ⚠️ 需先安装并启动 [Neo4j Desktop](https://neo4j.com/download/),在 `.env` 中配置对应的 `NEO4J_URI` 和 `NEO4J_PASSWORD`。
bash

Agent 工作流

stateDiagram-v2 [*] --> recall_memory: 入口 recall_memory --> plan_query: GraphZep 粗/精召回 plan_query --> route_intent: LLM Structured Output (7 类意图) route_intent --> search_songs: graph_search / hybrid_search / vector_search route_intent --> web_fallback: web_search(直达联网搜索) route_intent --> chat_response: general_chat route_intent --> acquire_music: acquire_music route_intent --> gen_recommendations: recommend_by_favorites search_songs --> web_fallback: 本地库未命中时自动降级 search_songs --> explain_results: 命中时直接进入解释 web_fallback --> explain_results: 在线音乐 API 实时搜索 acquire_music --> explain_results gen_recommendations --> explain_results explain_results --> extract_preferences: LLM 推荐解释 extract_preferences --> persist_memory: LLM 偏好提取(异步) chat_response --> persist_memory: 闲聊无推荐,跳过偏好提取 persist_memory --> [*]: GraphZep 异步写入
意图识别支持 API 大模型(DeepSeek-V3.2 等)和本地 Qwen3-4B(SGLang 部署)双模式。本地模式下 HyDE 声学描述由独立模块生成。
web_search 意图现在直接路由到 web_fallback 节点(在线音乐 API 实时搜索),不再经过 HybridRetrieval。支持中文原文优先、多级查询词提取和 30s 试听版本检测。
偏好提取为独立 LangGraph 节点 extract_preferences,闲聊意图自动跳过。

下载模型权重(自动检测已有文件并跳过)

python scripts/download_models.py ```

模型大小用途存放位置
M2D-CLAP 2025~1.6 GB运行时文本↔音频跨模态编码 + 双锚精排~/.cache/m2d_clap/
BERT-base-uncased~440 MBM2D-CLAP 内部文本编码器~/.cache/huggingface/
OMAR-RQ multicodebook~400 MB数据入库时提取音频特征向量~/.cache/huggingface/
💡 GraphZep 嵌入直接调用 SiliconFlow API (BAAI/bge-m3),无需预下载。

---

M2D_CLAP_CACHE = M2D-CLAP 模型权重目录

HF_HOME = HuggingFace 模型缓存目录

🚀 开始预加载关键组件...

✅ M2D-CLAP 模型预加载完成 (14.9s)

🎯 aiskill88 AI 点评 A 级 2026-06-19

创新性的AI音乐推荐系统

⚡ 核心功能

👥 适合人群

自动化工程师和运维人员项目经理和业务分析师希望减少重复性工作的专业人士数字化转型团队

🎯 使用场景

  • 自动化日常重复性工作,将精力集中于创造性任务
  • 构建数据采集 → 处理 → 输出的完整自动化管线
  • 实现跨平台、跨系统的数据流转和业务协同

⚖️ 优点与不足

✅ 优点
  • +MIT 协议,可免费商用
  • +大幅减少重复性人工操作
  • +可视化流程,清晰直观
  • +可扩展性强,支持复杂场景
⚠️ 不足
  • 初始配置和调试需投入一定时间
  • 强依赖外部服务的稳定性
  • 复杂场景需具备一定技术基础
⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。

📄 License 说明

✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。

🔗 相关工具推荐

🧩 你可能还需要
基于当前 Skill 的能力图谱,自动补全的工具组合

❓ 常见问题 FAQ

参考README文档
💡 AI Skill Hub 点评

总体来看,数字调音师 是一款质量优秀的Agent工作流,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。

⬇️ 获取与下载
⬇ 下载源码 ZIP

✅ MIT 协议 · 可免费商用 · 直接从 aiskill88 服务器下载,无需跳转 GitHub

📚 深入学习 数字调音师
查看分步骤安装教程和完整使用指南,快速上手这款工具
🌐 原始信息
原始名称 SoulTuner-Agent
Topics ai-agentaudio-embeddinghybrid-retrievalknowledge-graph
GitHub https://github.com/hgsanyang/SoulTuner-Agent
License MIT
语言 Python
🔗 原始来源
🐙 GitHub 仓库  https://github.com/hgsanyang/SoulTuner-Agent

收录时间:2026-06-19 · 更新时间:2026-06-19 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。

📺 订阅 AI Skill Hub Daily Telegram 频道
每天 8 条精选 AI Skill、MCP、Agent 与自动化工具推送
加入频道 →