能力标签
⚙️
Agent工作流

Xinfer

基于 Rust · 无代码搭建完整 AI 自动化流程
英文名:xinfer
⭐ 221 Stars 🍴 31 Forks 💻 Rust 📄 MIT 🏷 AI 8.0分
8.0AI 综合评分
LLMRustAI
✦ AI Skill Hub 推荐

Xinfer 是 AI Skill Hub 本期精选Agent工作流之一。综合评分 8.0 分,整体质量较高。我们强烈推荐将其纳入你的 AI 工具库,帮助提升工作效率。

📚 深度解析
Xinfer 是一套完整的 AI Agent 自动化工作流方案。随着 AI 能力的不断提升,基于 Agent 的自动化工作流正在成为提升个人和团队效率的核心方式。区别于传统的 RPA 自动化(模拟鼠标键盘操作),AI Agent 工作流通过理解任务意图、动态规划执行路径,能够处理更复杂的非结构化任务。

Xinfer 工作流的设计遵循"最小配置,最大复用"原则:核心逻辑已经封装好,用户只需配置自己的 API Key 和业务参数即可快速上手。工作流内置错误处理和重试机制,在网络波动或 API 限速等情况下仍能稳定运行,适合作为生产环境的自动化基础设施。

在实际部署时,建议先在测试环境中运行 3-5 次,验证各个环节的输出结果符合预期,再部署到生产环境。AI Skill Hub 评分 8.0 分,是同类 Agent 工作流中的精选推荐。
📋 工具概览

Xinfer 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。

GitHub Stars
⭐ 221
开发语言
Rust
支持平台
Windows / macOS / Linux
维护状态
轻量级项目,按需更新
开源协议
MIT
AI 综合评分
8.0 分
工具类型
Agent工作流
Forks
31
📖 中文文档
以下内容由 AI Skill Hub 根据项目信息自动整理,如需查看完整原始文档请访问底部「原始来源」。

Xinfer 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。

📌 核心特色
  • 可视化 Agent 工作流编排,无需编写复杂代码
  • 支持多步骤自动化任务链,实现全流程无人值守
  • 与外部 API、数据库和第三方服务无缝集成
  • 内置错误处理与自动重试机制,保障稳定运行
  • 提供可复用的自动化模板,快速在同类场景部署
🎯 主要使用场景
  • 自动化日常重复性工作,将精力集中于创造性任务
  • 构建数据采集 → 处理 → 输出的完整自动化管线
  • 实现跨平台、跨系统的数据流转和业务协同
以下安装命令基于项目开发语言和类型自动生成,实际以官方 README 为准。
安装命令
# 方式一:cargo install(推荐)
cargo install xinfer

# 方式二:从源码编译
git clone https://github.com/guoqingbao/xinfer
cd xinfer
cargo build --release
# 二进制在 ./target/release/xinfer
📋 安装步骤说明
  1. 访问 GitHub 仓库获取工作流文件
  2. 在对应平台(Dify / Flowise / Make 等)中找到「导入工作流」功能
  3. 上传工作流文件
  4. 按照提示配置必要的环境变量和 API Key
  5. 运行测试确认流程正常后投入使用
以下用法示例由 AI Skill Hub 整理,涵盖最常见的使用场景。
常用命令 / 代码示例
# 查看帮助
xinfer --help

# 基本运行
xinfer [options] <input>

# 详细使用说明请查阅文档
# https://github.com/guoqingbao/xinfer
以下配置示例基于典型使用场景生成,具体参数请参照官方文档调整。
配置示例
# xinfer 配置说明
# 查看配置选项
xinfer --config-example > config.yml

# 常见配置项
# output_dir: ./output
# log_level: info
# workers: 4

# 环境变量(覆盖配置文件)
export XINFER_CONFIG="/path/to/config.yml"
📑 README 深度解析 真实文档 完整度 75/100 查看 GitHub 原文 →
以下内容由系统直接从 GitHub README 解析整理,保留代码块、表格与列表结构。

简介

<p align="center"> <img src="logo.svg" alt="xInfer" width="400"><br> <b>Blazing-fast LLM inference in pure Rust.</b> No PyTorch. No Python runtime. Just fast, portable, production-ready inference.<br> <a href="./ReadMe.md">English</a> | <a href="./ReadMe-CN.md">简体中文</a> </p>

---

MacOS/Metal: replace features to `metal`

SM_70/SM_75 (e.g., V100): remove `flashinfer` and `cutlass` features

cargo install --git $XINFER_REPO xinfer --features cuda,nccl,flashinfer,cutlass


**Option 2 — Docker**
bash

Turing/V100 (sm_70/sm_75): remove `flashinfer` and `cutlass` features

./build_docker.sh "cuda,nccl,flashinfer,cutlass"


See [Docker guide →](docs/docker.md)


<details>
<summary><b>Build Python wheel from source</b></summary>
bash pip install maturin maturin[patchelf]

Prerequisites: Rust compiler, CUDA Toolkit (optional) or Metal Xcode command line tool

curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh sudo apt-get install -y git build-essential libssl-dev pkg-config

export XINFER_REPO="https://github.com/guoqingbao/xinfer"

📦 Install

Option 1 — Install DEB or Python package

curl -sSL https://guoqingbao.github.io/xinfer/install.sh | bash

Option 2 — npm

npm install -g xinfer-ai

---

📘 Build from source code

Option 1 — Cargo ```bash

Install

pip install target/wheels/xinfer*.whl --force-reinstall ```

</details>

See more Python examples →

---

🚀 Quick Start

📘 Usage

For Python installaion, running model with python3 -m xinfer.server
For Docker builds, refer to Run xInfer in Docker →

📽️ Demo

<video src="https://github.com/user-attachments/assets/7fc6aa0b-78ac-4323-923f-d761dd12857f" width="1000px"></video>

---

Interactive CLI chat

xinfer --i --m unsloth/Qwen3.5-27B-GGUF --f Qwen3.5-27B-Q4_K_M.gguf


<details>
<summary><b>ISQ (on-the-fly quantization) + KV cache compression</b></summary>
bash

Upload images via built-in Chat UI or send image_url in API requests

PD Client (decode GPU + API)

xinfer --d 2,3 --w /path/Qwen3-30B-A3B-Instruct-2507 --isq q4k --ui-server --port 8000 --pd-client


**Multinode** (tcp mode)
bash

⚙️ CLI Reference

FlagDescription
--mHuggingFace model ID (auto-download)
--wLocal Safetensors model path
--fGGUF file path (or filename when --m is given)
--dDevice IDs (e.g. --d 0,1)
--ui-serverAPI server + built-in ChatGPT-style web UI
--serverAPI server only (no web UI)
--iInteractive CLI chat
--isqOn-the-fly quantization: q2k, q3k, q4k, q5k, q6k, q8_0
--kvcache-dtypeKV cache quantization: fp8, turbo8, turbo4, turbo3
--max-num-seqsMax concurrent requests (default: 32, macOS: 8)
--max-tokensMax tokens per response (default: 16384)
--kv-fractionGPU memory fraction for KV cache
--cpu-mem-foldCPU swap memory ratio (default: 0.2)
--pd-serverRun as PD prefill server
--pd-clientRun as PD decode client
--pd-urlPD connection URL (tcp://, http://, file://)
--disable-prefix-cacheDisable prefix caching
--prefix-cache-max-tokensCap prefix cache size
--disable-cuda-graphDisable CUDA graph capture
--yarn-scaling-factorYARN RoPE context extension factor
--temperatureSampling temperature (0–1)
--top-k / --top-pTop-k / nucleus sampling
--presence-penaltyPenalize repeated tokens (−2 to 2)
--frequency-penaltyPenalize frequent tokens (−2 to 2)
--mcp-configMCP servers JSON config
--mcp-command / --mcp-argsSingle MCP server command + args

---

📚 References

🧠 Supported Models

  • ✅ LLaMa (LLaMa2, LLaMa3, LLaMa4, IQuest-Coder)
  • ✅ Qwen (Qwen2, Qwen3)
  • ✅ Qwen2/Qwen3 MoE
  • ✅ Qwen3 Next
  • ✅ Qwen3.5/3.6 Dense/MoE (27B, 35B, 122B, 397B, Multimodal model)
  • ✅ Mistral v1, v2
  • ✅ Mistral-3-VL Reasoning (3B, 8B, 14B, Multimodal model)
  • ✅ GLM4 (0414, Not ChatGLM)
  • ✅ GLM4 MoE (4.6/4.7)
  • ✅ GLM4.7 Flash
  • ✅ DeepSeek V3/R1/V3.2
  • ✅ Phi3 / Phi4 (Phi-3, Phi-4, Phi-4-mini, etc.)
  • ✅ Gemma3/Gemma4 (Multimodal model)
  • ✅ Qwen3-VL (Dense, Multimodal model)
  • ✅ MiroThinker-v1.5 (30B, 235B)

Formats: Safetensors (BF16, FP8-blockwise, GPTQ, AWQ, MXFP4, NVFP4) | GGUF (all quant types) | ISQ (on-the-fly quantization)

---

⚡ 核心功能
👥 适合人群
自动化工程师和运维人员项目经理和业务分析师希望减少重复性工作的专业人士数字化转型团队
🎯 使用场景
  • 自动化日常重复性工作,将精力集中于创造性任务
  • 构建数据采集 → 处理 → 输出的完整自动化管线
  • 实现跨平台、跨系统的数据流转和业务协同
⚖️ 优点与不足
✅ 优点
  • +MIT 协议,可免费商用
  • +大幅减少重复性人工操作
  • +可视化流程,清晰直观
  • +可扩展性强,支持复杂场景
⚠️ 不足
  • 初始配置和调试需投入一定时间
  • 强依赖外部服务的稳定性
  • 复杂场景需具备一定技术基础
⚠️ 使用须知

AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。

建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。

📄 License 说明

✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。

🔗 相关工具推荐
🧩 你可能还需要
基于当前 Skill 的能力图谱,自动补全的工具组合
❓ 常见问题 FAQ
Xinfer是一个开源的AI工作流项目
💡 AI Skill Hub 点评

经综合评估,Xinfer 在Agent工作流赛道中表现稳健,质量优秀。如果你已有明确的使用需求,可以直接上手体验;如果还在评估阶段,建议对比同类工具后再做决策。

⬇️ 获取与下载
⬇ 下载源码 ZIP

✅ MIT 协议 · 可免费商用 · 直接从 aiskill88 服务器下载,无需跳转 GitHub

📚 深入学习 Xinfer
查看分步骤安装教程和完整使用指南,快速上手这款工具
🌐 原始信息
原始名称 xinfer
原始描述 开源AI工作流:Blazing-fast LLM inference in pure Rust. No PyTorch and Python runtime.。⭐221 · Rust
Topics LLMRustAI
GitHub https://github.com/guoqingbao/xinfer
License MIT
语言 Rust
🔗 原始来源
🐙 GitHub 仓库  https://github.com/guoqingbao/xinfer 🌐 官方网站  http://guoqingbao.github.io/xinfer/

收录时间:2026-05-25 · 更新时间:2026-05-25 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。