AI Skill Hub 强烈推荐:Sparkinfer 是一款优质的Agent工作流。AI 综合评分 8.0 分,在同类工具中表现稳健。如果你正在寻找可靠的Agent工作流解决方案,这是一个值得深入了解的选择。
Blackwell-native MoE/LLM推理运行时
Sparkinfer 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
Blackwell-native MoE/LLM推理运行时
Sparkinfer 是一套完整的 AI Agent 自动化工作流方案。通过可视化的节点编排,将复杂的多步骤任务拆解为清晰的自动化流程,实现全程无人值守的智能处理。支持与数百种外部服务和 API 无缝集成,适合构建数据处理管线、业务自动化和 AI 辅助决策系统。
# 克隆仓库 git clone https://github.com/gittensor-ai-lab/sparkinfer cd sparkinfer # 查看安装说明 cat README.md # 按 README 完成环境依赖安装后即可使用
# 查看帮助 sparkinfer --help # 基本运行 sparkinfer [options] <input> # 详细使用说明请查阅文档 # https://github.com/gittensor-ai-lab/sparkinfer
# sparkinfer 配置说明 # 查看配置选项 sparkinfer --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export SPARKINFER_CONFIG="/path/to/config.yml"
Blackwell-native MoE/LLM inference runtime for SN74 on Gittensor.
sparkinfer is the engineering loop for moving inference speed fast on consumer Blackwell GPUs: small CUDA changes, source-built PRs, same-box RTX 5090 evals, correctness gates against llama.cpp, and public dashboard updates when a frontier PR lands.
The first target is Qwen3-30B-A3B / 35B-A3B Q4_K_M GGUF on sm_120 / sm_121. The current work is not broad framework coverage; it is a focused sprint to make one real MoE decode path fast, measurable, and reproducible.
Requires CUDA Toolkit 12.8+ (first toolkit with sm_120 / sm_121 codegen).
cmake -B build -DCMAKE_CUDA_ARCHITECTURES=120 # or 121 for RTX Spark / Jetson Thor
cmake --build build -j
ctest --test-dir build
The top-level CMakeLists.txt is a superbuild (kernels → moe → runtime); each subsystem also builds standalone (the sibling ../kernels references resolve within the monorepo). A direct nvcc build from the repo root works too — see bench/scripts.
On an NVIDIA Blackwell box (CUDA 12.8+) — the scripts auto-detect your GPU arch, fetch prebuilt binaries (or build from source if incompatible), and download the model:
```bash
bench/scripts/bench.sh --download --compare
bench/scripts/accuracy.sh --download ```
Your own model: bench/scripts/bench.sh /path/to/model.gguf --tokens 256. All options: bench/scripts/README.md.
高性能AI工作流推理引擎,支持Blackwell-native和Cuda
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。
总体来看,Sparkinfer 是一款质量优秀的Agent工作流,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | sparkinfer |
| 原始描述 | 开源AI工作流:Blackwell-native MoE/LLM inference runtime — kernels, MoE engine, runtime & benc。⭐6 · Cuda |
| Topics | agentic-aibittensorblackwellcudaedge-ai |
| GitHub | https://github.com/gittensor-ai-lab/sparkinfer |
| License | MIT |
| 语言 | Cuda |
收录时间:2026-07-02 · 更新时间:2026-07-02 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。
选择 Agent 类型,复制安装指令后粘贴到对应客户端