能力标签

🤖 Agent 🔄 工作流 🌐 翻译 🐳 Docker 💻 CLI 🔗 REST API 🧬 Embedding 📚 RAG ✨ GPT 🖥 本地 LLM

⚙️

Agent工作流

数字调音师

基于 Python · 无代码搭建完整 AI 自动化流程

英文名：SoulTuner-Agent

⭐ 12 Stars 🍴 3 Forks 💻 Python 📄 MIT 🏷 AI 8.0分

8.0AI 综合评分

ai-agentaudio-embeddinghybrid-retrievalknowledge-graph

⬇ 下载源码 ZIP ⚙️ 配置说明 📺 TG 频道

✦ AI Skill Hub 推荐

AI Skill Hub 强烈推荐：数字调音师是一款优质的Agent工作流。AI 综合评分 8.0 分，在同类工具中表现稳健。如果你正在寻找可靠的Agent工作流解决方案，这是一个值得深入了解的选择。

📚 深度解析

数字调音师是一套完整的 AI Agent 自动化工作流方案。随着 AI 能力的不断提升，基于 Agent 的自动化工作流正在成为提升个人和团队效率的核心方式。区别于传统的 RPA 自动化（模拟鼠标键盘操作），AI Agent 工作流通过理解任务意图、动态规划执行路径，能够处理更复杂的非结构化任务。

数字调音师工作流的设计遵循"最小配置，最大复用"原则：核心逻辑已经封装好，用户只需配置自己的 API Key 和业务参数即可快速上手。工作流内置错误处理和重试机制，在网络波动或 API 限速等情况下仍能稳定运行，适合作为生产环境的自动化基础设施。

在实际部署时，建议先在测试环境中运行 3-5 次，验证各个环节的输出结果符合预期，再部署到生产环境。AI Skill Hub 评分 8.0 分，是同类 Agent 工作流中的精选推荐。

📋 工具概览

数字调音师是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排，将复杂的多步骤任务拆解为清晰的自动化流程，实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成，适合构建数据处理管线、业务自动化和 AI 辅助决策系统。

GitHub Stars

⭐ 12

开发语言

Python

支持平台

Windows / macOS / Linux

维护状态

轻量级项目，按需更新

开源协议

MIT

AI 综合评分

8.0 分

工具类型

Agent工作流

Forks

📖 中文文档

以下内容由 AI Skill Hub 根据项目信息自动整理，如需查看完整原始文档请访问底部「原始来源」。

📌 核心特色

可视化 Agent 工作流编排，无需编写复杂代码
支持多步骤自动化任务链，实现全流程无人值守
与外部 API、数据库和第三方服务无缝集成
内置错误处理与自动重试机制，保障稳定运行
提供可复用的自动化模板，快速在同类场景部署

🎯 主要使用场景

自动化日常重复性工作，将精力集中于创造性任务
构建数据采集 → 处理 → 输出的完整自动化管线
实现跨平台、跨系统的数据流转和业务协同

以下安装命令基于项目开发语言和类型自动生成，实际以官方 README 为准。

安装命令

# 方式一：pip 安装（推荐）
pip install soultuner-agent

# 方式二：虚拟环境安装（推荐生产环境）
python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install soultuner-agent

# 方式三：从源码安装（获取最新功能）
git clone https://github.com/hgsanyang/SoulTuner-Agent
cd SoulTuner-Agent
pip install -e .

# 验证安装
python -c "import soultuner_agent; print('安装成功')"

📋 安装步骤说明

访问 GitHub 仓库获取工作流文件
在对应平台（Dify / Flowise / Make 等）中找到「导入工作流」功能
上传工作流文件
按照提示配置必要的环境变量和 API Key
运行测试确认流程正常后投入使用

以下用法示例由 AI Skill Hub 整理，涵盖最常见的使用场景。

常用命令 / 代码示例

# 命令行使用
soultuner-agent --help

# 基本用法
soultuner-agent input_file -o output_file

# Python 代码中调用
import soultuner_agent

# 示例
result = soultuner_agent.process("input")
print(result)

以下配置示例基于典型使用场景生成，具体参数请参照官方文档调整。

配置示例

# soultuner-agent 配置文件示例（config.yml）
app:
  name: "soultuner-agent"
  debug: false
  log_level: "INFO"

# 运行时指定配置文件
soultuner-agent --config config.yml

# 或通过环境变量配置
export SOULTUNER_AGENT_API_KEY="your-key"
export SOULTUNER_AGENT_OUTPUT_DIR="./output"

📑 README 深度解析真实文档完整度 82/100 含工作流图查看 GitHub 原文 →

以下内容由系统直接从 GitHub README 解析整理，保留代码块、表格与列表结构。

🎵 SoulTuner Agent

多模态音乐推荐智能体 — Hybrid RAG × Knowledge Graph × Long-term Memory

<a href="README.md">中文</a> | <a href="README_EN.md">English</a>

✨ 核心特性

特性	说明
🔀Hybrid RAG	GraphRAG + Semantic Search 并发检索，平等合并去重 + 三锚归一化精排
🎵双模型音频向量	M2D-CLAP 跨模态语义 + OMAR-RQ 声学特征，三锚归一化融合（权重可调）
🧠长期记忆	GraphZep 双阶段召回，跨会话保留用户偏好
📊粗排+探索	Graph Affinity 粗排截断 + Thompson Sampling 冷门探索槽
🤖智能意图识别	7 类意图分类 + DST 多轮标签继承，支持 API 大模型 + 本地 Qwen3-4B
👤用户画像	前端可视化画像面板，流派/情绪/场景/语言偏好 → Neo4j + GraphZep 双写
🌐联网搜索回退	本地库不足时自动触发 SearxNG 联邦搜索 + LLM 摘要
🎼音乐旅程	LLM 故事→情绪拆解→逐段检索，SSE 实时推送
♻️数据飞轮	下载→暂存→试听→确认入库→标签提取→向量编码→Neo4j
📋曲库管理	待入库暂存区 + 我的曲库全图谱管理（搜索/播放/删除）
📡SSE 流式	前端实时渲染 thinking → 歌曲卡片 → 推荐理由
🐳Docker 部署	`docker compose up` 一键启动全栈

---

🖼️ 功能预览

🎬 快速了解 SoulTuner 的功能

需要先安装 Python 依赖（后续 Step 3 数据导入也需要此环境）

conda create -n music_agent python=3.11 && conda activate music_agent pip install -r requirements.txt

Step 1 中已创建 Conda 环境，安装前端依赖

cd web && npm install && cd ..

🚀 快速开始

Windows 推荐使用统一入口：

.\soultuner.ps1 doctor
.\soultuner.ps1 up lite       # 无 GPU：Neo4j + API + 前端
.\soultuner.ps1 up standard   # 加 GraphZep + SearxNG
.\soultuner.ps1 up full       # 加独立音乐入库 Worker

无外部服务自测：

.\soultuner.ps1 mock

部署档位、端口和在线新歌入库流程见 DEPLOYMENT_PROFILES.md。

部署分为三步：① 前置准备 → ② 选择部署方式启动服务 → ③ 数据导入。

---

Step 1：前置准备（两种部署方式共用）

1.1 音乐数据：将 MP3 文件放入 data/processed_audio/audio/ 目录（路径可在 .env 中自定义）。

1.2 环境变量：

```bash cp .env.example .env

Step 2：选择部署方式

	方式 A：Docker Compose（推荐）	方式 B：本地开发（Conda）
适用场景	快速体验、演示部署	日常开发、调试代码
Neo4j	容器自带，自动启动	需手动安装 Neo4j Desktop 并启动
GraphZep	容器自带，自动启动	由 `startup_all.py` 自动启动

方式 A：Docker Compose（推荐）

后端镜像约 11 GB（含 PyTorch + M2D-CLAP 运行库）。模型权重通过 volume 挂载宿主机缓存，不打包进镜像。 ⚠️ GPU 要求：docker-compose.yml 默认开启 NVIDIA GPU 加速（用于 M2D-CLAP 跨模态推理）。需要宿主机已安装 NVIDIA Container Toolkit。如无 GPU，请注释掉 deploy.resources 段。

```bash

编辑 .env 中的 Docker 专用路径（download_models.py 运行后会输出）：

── Docker 部署需要显式指定 Neo4j 连接地址 ──

── 本地部署已在 .env 中配置，无需额外设置 ──

可选：本地大模型部署（WSL + SGLang）

针对 8GB 显存（如 RTX 4070）设备的优化部署方案，支持本地运行 Qwen3-4B 模型辅助意图识别。

终端A (WSL)：启动大模型推理引擎

   wsl
   bash /path/to/SoulTuner-Agent/scripts/start_sglang.sh

终端B (Windows)：在前端设置面板切换为本地模型

正常运行 python startup_all.py
打开系统设置 ⚙️ → 主提供商选择 sglang → 保存

---

一键启动（Neo4j + GraphZep + Backend + Frontend）

docker compose up -d

★ 实时跟踪后端启动日志（推荐首次启动时使用，可看到预热进度）

docker logs -f soultuner-backend

一键启动所有服务（后端 + 前端 + GraphZep + SearxNG）

python startup_all.py

编辑 .env：至少填入 SiliconFlow_API_KEY 和 NEO4J_PASSWORD


**1.3 模型权重下载**（首次必须，约 **2.4 GB**）：

bash

⚙️ 配置

环境变量

变量	说明	默认值
`OPENAI_BASE_URL`	LLM API 地址	`https://api.siliconflow.cn/v1`
`OPENAI_API_KEY`	LLM API 密钥	—
`MODEL_NAME`	主推理模型	`deepseek-ai/DeepSeek-V3.2`
`VOLCENGINE_BASE_URL`	火山引擎 API 地址	`https://ark.cn-beijing.volces.com/api/v3`
`VOLCENGINE_API_KEY`	火山引擎 API 密钥	可选
`NEO4J_URI`	Neo4j 连接	`neo4j://127.0.0.1:7687`
`NEO4J_PASSWORD`	Neo4j 密码	—
`TAVILY_API_KEY`	联网搜索	可选
`GOOGLE_API_KEY`	Gemini API	可选

📖 运行时设置面板（LLM 切换 / 检索参数 / RRF 权重等）及 API 端点文档详见 Technical_Report.md

---

前端: http://localhost:3003 | 后端 API: http://localhost:8501 | Neo4j: http://localhost:7474


<details>
<summary>Docker 常用运维命令</summary>

| 命令                                        | 说明                                           |
| ------------------------------------------- | ---------------------------------------------- |
| `docker logs -f soultuner-backend`        | 实时跟踪后端日志                               |
| `docker logs --tail 50 soultuner-backend` | 查看最后 50 行日志                             |
| `docker compose up -d --build backend`    | 代码修改后重新构建并启动后端                   |
| `docker compose restart backend`          | 重启后端（不重新构建）                         |
| `docker compose down`                     | 停止并移除所有容器                             |
| `docker compose down -v`                  | 停止并清除所有数据卷（⚠️ 会删除 Neo4j 数据） |

</details>

#### 方式 B：本地开发（Conda）

> ⚠️ 需先安装并启动 [Neo4j Desktop](https://neo4j.com/download/)，在 `.env` 中配置对应的 `NEO4J_URI` 和 `NEO4J_PASSWORD`。

bash

Agent 工作流

stateDiagram-v2 [*] --> recall_memory: 入口 recall_memory --> plan_query: GraphZep 粗/精召回 plan_query --> route_intent: LLM Structured Output (7 类意图) route_intent --> search_songs: graph_search / hybrid_search / vector_search route_intent --> web_fallback: web_search（直达联网搜索） route_intent --> chat_response: general_chat route_intent --> acquire_music: acquire_music route_intent --> gen_recommendations: recommend_by_favorites search_songs --> web_fallback: 本地库未命中时自动降级 search_songs --> explain_results: 命中时直接进入解释 web_fallback --> explain_results: 在线音乐 API 实时搜索 acquire_music --> explain_results gen_recommendations --> explain_results explain_results --> extract_preferences: LLM 推荐解释 extract_preferences --> persist_memory: LLM 偏好提取（异步） chat_response --> persist_memory: 闲聊无推荐，跳过偏好提取 persist_memory --> [*]: GraphZep 异步写入

意图识别支持 API 大模型（DeepSeek-V3.2 等）和本地 Qwen3-4B（SGLang 部署）双模式。本地模式下 HyDE 声学描述由独立模块生成。

web_search 意图现在直接路由到 web_fallback 节点（在线音乐 API 实时搜索），不再经过 HybridRetrieval。支持中文原文优先、多级查询词提取和 30s 试听版本检测。

偏好提取为独立 LangGraph 节点 extract_preferences，闲聊意图自动跳过。

下载模型权重（自动检测已有文件并跳过）

python scripts/download_models.py ```

模型	大小	用途	存放位置
M2D-CLAP 2025	~1.6 GB	运行时文本↔音频跨模态编码 + 双锚精排	`~/.cache/m2d_clap/`
BERT-base-uncased	~440 MB	M2D-CLAP 内部文本编码器	`~/.cache/huggingface/`
OMAR-RQ multicodebook	~400 MB	数据入库时提取音频特征向量	`~/.cache/huggingface/`

💡 GraphZep 嵌入直接调用 SiliconFlow API (BAAI/bge-m3)，无需预下载。

---

M2D_CLAP_CACHE = M2D-CLAP 模型权重目录

HF_HOME = HuggingFace 模型缓存目录

🚀 开始预加载关键组件...

✅ M2D-CLAP 模型预加载完成 (14.9s)

🎯 aiskill88 AI 点评 A 级 2026-06-19

创新性的AI音乐推荐系统

⚡ 核心功能

可视化 Agent 工作流编排，无需编写复杂代码
支持多步骤自动化任务链，实现全流程无人值守
与外部 API、数据库和第三方服务无缝集成
内置错误处理与自动重试机制，保障稳定运行
提供可复用的自动化模板，快速在同类场景部署

👥 适合人群

自动化工程师和运维人员项目经理和业务分析师希望减少重复性工作的专业人士数字化转型团队

🎯 使用场景

自动化日常重复性工作，将精力集中于创造性任务
构建数据采集 → 处理 → 输出的完整自动化管线
实现跨平台、跨系统的数据流转和业务协同

⚖️ 优点与不足

✅ 优点

+MIT 协议，可免费商用
+大幅减少重复性人工操作
+可视化流程，清晰直观
+可扩展性强，支持复杂场景

⚠️ 不足

−初始配置和调试需投入一定时间
−强依赖外部服务的稳定性
−复杂场景需具备一定技术基础

⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台，本页面信息基于公开数据整理，不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后，再部署至生产环境，并做好必要的安全评估。

📄 License 说明

🔗 相关工具推荐

LangChain AI开发框架

Agent工作流

ai-agents-for-beginners Agent工作流

微软官方开源项目，提供12堂系统课程学习AI智能体框架。涵盖工作流设计、RAG检索增强、多智能体协作等核心技能。适合AI

🧩 你可能还需要

基于当前 Skill 的能力图谱，自动补全的工具组合

为Claude Code设计的开源MCP工具集，包含108个MCP工具和40+智能体模板。支持多智能体协作编排，提供完整的自主代理框架。适合

❓ 常见问题 FAQ

如何使用数字调音师−

参考README文档

什么是 Agent 工作流？和普通自动化有什么区别？+

导入工作流后，我需要修改哪些配置？+

工作流运行失败了，如何排查问题？+

这个工作流每次运行会产生哪些费用？+

工作流可以定时自动运行吗？+

💡 AI Skill Hub 点评

总体来看，数字调音师是一款质量优秀的Agent工作流，在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态，建议收藏备用，结合自身场景选择合适时机引入使用。

⬇️ 获取与下载

⬇ 下载源码 ZIP

✅ MIT 协议 · 可免费商用 · 直接从 aiskill88 服务器下载，无需跳转 GitHub

📚 深入学习数字调音师

查看分步骤安装教程和完整使用指南，快速上手这款工具

⚙️ 安装教程 📚 使用教程

🌐 原始信息

原始名称	`SoulTuner-Agent`
Topics	`ai-agentaudio-embeddinghybrid-retrievalknowledge-graph`
GitHub	https://github.com/hgsanyang/SoulTuner-Agent
License	MIT
语言	Python

🔗 原始来源

🐙 GitHub 仓库 https://github.com/hgsanyang/SoulTuner-Agent

收录时间：2026-06-19 · 更新时间：2026-06-19 · License：MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。

📺 订阅 AI Skill Hub Daily Telegram 频道

每天 8 条精选 AI Skill、MCP、Agent 与自动化工具推送

加入频道 →

数字调音师

📚 深度解析

📋 工具概览

📖 中文文档

🎵 SoulTuner Agent

✨ 核心特性

🖼️ 功能预览

🎬 快速了解 SoulTuner 的功能

需要先安装 Python 依赖（后续 Step 3 数据导入也需要此环境）

Step 1 中已创建 Conda 环境，安装前端依赖

🚀 快速开始

Step 1：前置准备（两种部署方式共用）

Step 2：选择部署方式

方式 A：Docker Compose（推荐）

编辑 .env 中的 Docker 专用路径（download_models.py 运行后会输出）：

── Docker 部署需要显式指定 Neo4j 连接地址 ──

── 本地部署已在 .env 中配置，无需额外设置 ──

可选：本地大模型部署（WSL + SGLang）

一键启动（Neo4j + GraphZep + Backend + Frontend）

★ 实时跟踪后端启动日志（推荐首次启动时使用，可看到预热进度）

一键启动所有服务（后端 + 前端 + GraphZep + SearxNG）

编辑 .env：至少填入 SiliconFlow_API_KEY 和 NEO4J_PASSWORD

⚙️ 配置

环境变量

前端: http://localhost:3003 | 后端 API: http://localhost:8501 | Neo4j: http://localhost:7474

Agent 工作流

下载模型权重（自动检测已有文件并跳过）

M2D_CLAP_CACHE = M2D-CLAP 模型权重目录

HF_HOME = HuggingFace 模型缓存目录

🚀 开始预加载关键组件...

✅ M2D-CLAP 模型预加载完成 (14.9s)

⚡ 核心功能

👥 适合人群

🎯 使用场景

⚖️ 优点与不足

🔗 相关工具推荐

❓ 常见问题 FAQ

🤖 交给 Agent 安装 · 数字调音师