免费 · 本地运行 · 开箱即用

让多个 LLM
同时竞速

一次提问,同时向任意数量的模型发送请求,实时对比速度、质量与 Token 消耗。

免费下载 了解功能 →

Windows x64 · v0.1.0 · 2.8 MB

LLM Runner
对话
比较 GPT-4o vs Claude
模型速度测试
代码生成对比
请解释快速排序算法并给出 Python 实现
GPT-4o
gpt-4o
流式输出
快速排序是一种分治算法,通过选取基准元素将数组分为两部分...
Claude 3.5
claude-3-5-sonnet
完成
快速排序(Quicksort)的核心思想:选一个基准,小于基准的放左边,大于基准的放右边,然后递归处理。
DeepSeek
deepseek-chat
流式输出
快速排序...
功能特性

专为模型对比而生

无论是选型、测速还是质量评测,LLM Runner 让你一眼看清差距。

并行流式输出
同时向所有模型发送请求,响应实时流式呈现,首 Token 延迟、生成速度一目了然。
📊
速度可视化网格
每个 Token 对应一个彩色方格,颜色映射当前 TPS(Token/s),速度快慢用颜色说话。
🏆
实时排名
按实时生成速度为模型自动排名,帮你找到最快的那个,而不是只看广告。
🔗
万能接口兼容
支持 OpenAI 兼容格式和 Anthropic 原生格式,配置 Base URL + API Key 即可使用任意模型。
🔒
本地安全存储
API Key 仅存储在你本机,不经过任何第三方服务器,完全掌控数据安全。
💬
多轮上下文对话
每个模型独立维护自己的对话历史,可配置携带的上下文轮数(0-10 轮)。
上手流程

三步开始对比

下载即用,无需注册账号,无需服务器。

1
下载安装
下载 Windows 安装包,一键安装,启动即用。
2
添加模型
在模型配置中填入 Base URL 和 API Key,支持所有主流提供商。
3
开始对比
输入问题,所有模型同时响应,速度与质量实时可见。
速度可视化

颜色就是速度

每次生成都留下一格颜色记录,TPS 越高颜色越亮。

GPT-4o
98 t/s
极快
Claude 3.5
72 t/s
DeepSeek
38 t/s
中等
本地 Ollama
18 t/s
极快 >80 t/s
快 >50 t/s
中等 >25 t/s
慢 ≤25 t/s
支持的提供商

连接你用过的所有模型

任何支持 OpenAI 兼容接口或 Anthropic 接口的服务都可接入。

OpenAI · GPT-4o
Anthropic · Claude
DeepSeek
Groq
SiliconFlow
Together AI
Ollama(本地)
任意兼容接口
立即开始

免费下载

本地桌面应用,一次安装,永久使用。

LLM Runner

多模型并行对比工具 · 适用于 Windows 10/11

下载 Windows 安装包
Windows x64
v0.1.0 · 2.8 MB
API Key 本地存储