Mistral-RS 是 AI Skill Hub 本期精选AI工具之一。已获得 7.2k 颗 GitHub Star,综合评分 8.2 分,整体质量较高。我们强烈推荐将其纳入你的 AI 工具库,帮助提升工作效率。
基于Rust开发的高性能LLM推理引擎,提供快速灵活的大模型推理能力。支持多种模型格式,优化了CPU和GPU推理性能,适合需要部署本地LLM服务的开发者和企业用户。
Mistral-RS 是一款基于 Rust 开发的开源工具,专注于 LLM推理、Rust引擎、高性能 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
基于Rust开发的高性能LLM推理引擎,提供快速灵活的大模型推理能力。支持多种模型格式,优化了CPU和GPU推理性能,适合需要部署本地LLM服务的开发者和企业用户。
Mistral-RS 是一款基于 Rust 开发的开源工具,专注于 LLM推理、Rust引擎、高性能 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 方式一:cargo install(推荐) cargo install mistral.rs # 方式二:从源码编译 git clone https://github.com/EricLBuehler/mistral.rs cd mistral.rs cargo build --release # 二进制在 ./target/release/mistral.rs
# 查看帮助 mistral.rs --help # 基本运行 mistral.rs [options] <input> # 详细使用说明请查阅文档 # https://github.com/EricLBuehler/mistral.rs
# mistral.rs 配置说明 # 查看配置选项 mistral.rs --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export MISTRAL.RS_CONFIG="/path/to/config.yml"
<a name="top"></a>
<p align="center"> | <a href="https://ericlbuehler.github.io/mistral.rs/"><b>Documentation</b></a> | <a href="https://crates.io/crates/mistralrs"><b>Rust SDK</b></a> | <a href="https://ericlbuehler.github.io/mistral.rs/tutorials/03-python-sdk/"><b>Python SDK</b></a> | <a href="https://discord.gg/SZrecqK8qw"><b>Discord</b></a> | </p>
<p align="center"> <a href="https://github.com/EricLBuehler/mistral.rs/stargazers"> <img src="https://img.shields.io/github/stars/EricLBuehler/mistral.rs?style=social&label=Star" alt="GitHub stars"> </a> </p>
Linux/macOS:
curl --proto '=https' --tlsv1.2 -sSf https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.sh | sh
Windows (PowerShell):
irm https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.ps1 | iex
For quick containerized deployment:
docker pull ghcr.io/ericlbuehler/mistral.rs:latest
docker run --gpus all -p 1234:1234 ghcr.io/ericlbuehler/mistral.rs:latest \
serve -m Qwen/Qwen3-4B
For production use, we recommend installing the CLI directly for maximum flexibility.
mistralrs tune -m Qwen/Qwen3-4B --emit-config config.toml
mistralrs from-config -f config.toml
mistralrs serve -m google/gemma-4-E4B-it ```
For the server command, visit http://localhost:1234/ui for the web chat interface.
pip install mistralrs # or mistralrs-cuda, mistralrs-metal, mistralrs-mkl, mistralrs-accelerate
from mistralrs import Runner, Which, ChatCompletionRequest
runner = Runner(
which=Which.Plain(model_id="Qwen/Qwen3-4B"),
in_situ_quant="4",
)
res = runner.send_chat_completion_request(
ChatCompletionRequest(
model="default",
messages=[{"role": "user", "content": "Hello!"}],
max_tokens=256,
)
)
print(res.choices[0].message.content)
cargo add mistralrs
use anyhow::Result;
use mistralrs::{IsqType, TextMessageRole, TextMessages, MultimodalModelBuilder};
#[tokio::main]
async fn main() -> Result<()> {
let model = MultimodalModelBuilder::new("google/gemma-4-E4B-it")
.with_isq(IsqType::Q4K)
.with_logging()
.build()
.await?;
let messages = TextMessages::new().add_message(
TextMessageRole::User,
"Hello!",
);
let response = model.send_chat_request(messages).await?;
println!("{:?}", response.choices[0].message.content);
Ok(())
}
<details> <summary><b>Text Models</b></summary>
- Granite 4.0 - SmolLM 3 - DeepSeek V3 - GPT-OSS - DeepSeek V2 - Qwen 3 Next - Qwen 3 MoE - Phi 3.5 MoE - Qwen 3 - GLM 4 - GLM-4.7-Flash - GLM-4.7 (MoE) - Gemma 2 - Qwen 2 - Starcoder 2 - Phi 3 - Mixtral - Phi 2 - Gemma - Llama - Mistral </details>
<details> <summary><b>Multimodal Models</b></summary>
- Qwen 3.5 - Qwen 3.5 MoE - Qwen 3-VL - Qwen 3-VL MoE - Gemma 3n - Llama 4 - Gemma 3 - Mistral 3 - Phi 4 multimodal - Qwen 2.5-VL - MiniCPM-O - Llama 3.2 Vision - Qwen 2-VL - Idefics 3 - Idefics 2 - LLaVA Next - LLaVA - Phi 3V </details>
<details> <summary><b>Speech Models</b></summary>
- Voxtral (ASR/speech-to-text) - Dia </details>
<details> <summary><b>Image Generation Models</b></summary>
- FLUX </details>
<details> <summary><b>Embedding Models</b></summary>
- Embedding Gemma - Qwen 3 Embedding </details>
Rust实现的LLM推理引擎,性能优异且内存安全。活跃维护,社区认可度高,是生产级推理方案的优选。
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。
经综合评估,Mistral-RS 在AI工具赛道中表现稳健,质量优秀。如果你已有明确的使用需求,可以直接上手体验;如果还在评估阶段,建议对比同类工具后再做决策。
| 原始名称 | mistral-rs |
| Topics | LLM推理Rust引擎高性能本地部署 |
| GitHub | https://github.com/EricLBuehler/mistral.rs |
| License | MIT |
| 语言 | Rust |
收录时间:2026-06-01 · 更新时间:2026-06-01 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。