AI Skill Hub 强烈推荐:LLM分布式推理加速 是一款优质的AI工具。已获得 3.2k 颗 GitHub Star,AI 综合评分 8.0 分,在同类工具中表现稳健。如果你正在寻找可靠的AI工具解决方案,这是一个值得深入了解的选择。
LLM分布式推理加速 是一款基于 Shell 开发的开源工具,专注于 分布式推理、Kubernetes、GPU加速 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
LLM分布式推理加速 是一款基于 Shell 开发的开源工具,专注于 分布式推理、Kubernetes、GPU加速 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 克隆仓库 git clone https://github.com/llm-d/llm-d cd llm-d # 查看安装说明 cat README.md # 按 README 完成环境依赖安装后即可使用
# 查看帮助 llm-d --help # 基本运行 llm-d [options] <input> # 详细使用说明请查阅文档 # https://github.com/llm-d/llm-d
# llm-d 配置说明 # 查看配置选项 llm-d --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export LLM_D_CONFIG="/path/to/config.yml"
<p align="center"> <picture> <source media="(prefers-color-scheme: dark)"> <img alt="llm-d Logo" src="./docs/assets/images/llm-d-logo.png" width=37%> </picture> </p>
llm-d is a high-performance distributed inference serving stack optimized for production deployments on Kubernetes. We help you achieve the fastest "time to state-of-the-art (SOTA) performance" for key OSS large language models across most hardware accelerators and infrastructure providers with well-tested guides and real-world benchmarks.
llm-d is a Cloud Native Computing Foundation (CNCF) sandbox project, founded by Red Hat, Google Cloud, IBM Research, CoreWeave, and NVIDIA.
Validated performance gains from production deployments and partner benchmarks:
Explore detailed, reproducible benchmarks on Prism.
实用的K8s推理部署方案,填补云原生LLM推理空白。代码活跃度好,社区关注度高,值得关注。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ Apache 2.0 — 宽松开源协议,可商用,需保留版权声明和 NOTICE 文件,含专利授权条款。
总体来看,LLM分布式推理加速 是一款质量优秀的AI工具,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | llm-d |
| 原始描述 | 开源AI工具:Achieve state of the art inference performance with modern accelerators on Kuber。⭐3.2k · Shell |
| Topics | 分布式推理KubernetesGPU加速推理优化云原生 |
| GitHub | https://github.com/llm-d/llm-d |
| License | Apache-2.0 |
| 语言 | Shell |
收录时间:2026-05-19 · 更新时间:2026-05-30 · License:Apache-2.0 · AI Skill Hub 不对第三方内容的准确性作法律背书。