免费 · 本地运行 · 开箱即用

让多个 LLM
同时竞速

一次提问，同时向任意数量的模型发送请求，实时对比速度、质量与 Token 消耗。

免费下载了解功能 →

Windows x64 · v0.1.0 · 2.8 MB

LLM Runner

请解释快速排序算法并给出 Python 实现

GPT-4o

gpt-4o

流式输出

快速排序是一种分治算法，通过选取基准元素将数组分为两部分...

Claude 3.5

claude-3-5-sonnet

完成

快速排序（Quicksort）的核心思想：选一个基准，小于基准的放左边，大于基准的放右边，然后递归处理。

DeepSeek

deepseek-chat

流式输出

快速排序...

功能特性

专为模型对比而生

无论是选型、测速还是质量评测，LLM Runner 让你一眼看清差距。

⚡

并行流式输出

同时向所有模型发送请求，响应实时流式呈现，首 Token 延迟、生成速度一目了然。

📊

速度可视化网格

每个 Token 对应一个彩色方格，颜色映射当前 TPS（Token/s），速度快慢用颜色说话。

🏆

实时排名

按实时生成速度为模型自动排名，帮你找到最快的那个，而不是只看广告。

🔗

万能接口兼容

支持 OpenAI 兼容格式和 Anthropic 原生格式，配置 Base URL + API Key 即可使用任意模型。

🔒

本地安全存储

API Key 仅存储在你本机，不经过任何第三方服务器，完全掌控数据安全。

💬

多轮上下文对话

每个模型独立维护自己的对话历史，可配置携带的上下文轮数（0-10 轮）。

上手流程

三步开始对比

下载即用，无需注册账号，无需服务器。

下载安装

下载 Windows 安装包，一键安装，启动即用。

添加模型

在模型配置中填入 Base URL 和 API Key，支持所有主流提供商。

开始对比

输入问题，所有模型同时响应，速度与质量实时可见。

速度可视化

颜色就是速度

每次生成都留下一格颜色记录，TPS 越高颜色越亮。

GPT-4o

98 t/s

极快

Claude 3.5

72 t/s

快

DeepSeek

38 t/s

中等

本地 Ollama

18 t/s

慢

极快 >80 t/s

快 >50 t/s

中等 >25 t/s

慢 ≤25 t/s

支持的提供商

连接你用过的所有模型

任何支持 OpenAI 兼容接口或 Anthropic 接口的服务都可接入。

OpenAI · GPT-4o

Anthropic · Claude

DeepSeek

Groq

SiliconFlow

Together AI

Ollama（本地）

任意兼容接口

立即开始

免费下载

本地桌面应用，一次安装，永久使用。

⚡

LLM Runner

多模型并行对比工具 · 适用于 Windows 10/11

下载 Windows 安装包

下载 MSI 版本

Windows x64

v0.1.0 · 2.8 MB

API Key 本地存储

让多个 LLM同时竞速

专为模型对比而生

三步开始对比

颜色就是速度

连接你用过的所有模型

免费下载

LLM Runner

让多个 LLM
同时竞速