客观对比 · 中转站检测 / 中转站测试 / API 中转站测评

中转站检测工具横评:Veridrop、禾维 AI、TokensQC、Ofox、Ztest、大模型照妖镜哪个好?

如果你要判断一个 AI API 中转站是否真实、稳定、计费可信,不要只看价格或测速。 Veridrop 更适合做字段级真伪核验和历史红黑榜判断; 禾维 AI、TokensQC、Ofox、Ztest、大模型照妖镜、LMSpeed 则分别偏价格推荐、质检入口、模型验真、可信度验证或目录速度。

先给结论

想验真假和字段证据

优先用 Veridrop 红黑榜 或直接跑 Claude / OpenAI / Gemini 检测。它更关注原始响应字段、协议一致性、严重问题和历史趋势。

想看价格和候选站

禾维 AI、LMSpeed、relayAPI 这类目录或推荐页更适合做第一轮候选池,但候选站仍建议再用检测工具核验。

想做单点模型验真

Ofox、Ztest、大模型照妖镜、TokensQC 都覆盖了部分验真或质检需求。选择时重点看是否能展示可复核的原始证据。

主流中转站检测工具对比

工具 公开定位 更适合 选择时要核对
Veridrop 本站
veridrop.org/leaderboard
AI API 中转站红黑榜,真实检测数据排行 字段级真伪核验、Claude / OpenAI / Gemini 协议分榜、历史报告追踪 看公开报告里的原始字段、严重问题、thinking signature、token billing、long context
禾维 AI / Hvoy
hvoy.ai
Veridrop vs hvoy 详细对比 →
API 中转站真假检测、价格对比与推荐 价格、推荐、候选站初筛 价格榜之外,仍要核验模型是否真实透传和协议是否完整
CCTest
cctest.ai
Veridrop vs CCTest 详细对比 →
专攻 Claude 的黑盒检测,渠道来源识别(bedrock/vertex/逆向) 纯 Claude 用户、想查逆向渠道来源 是否覆盖 OpenAI / Gemini、是否有可复核报告与历史趋势
TokensQC
tokensqc.com
免费 AI API 质检工具,协议一致性 / 模型身份 / 延迟探针 Token 质检、API 入口测试、延迟探针 是否能解释 usage 字段异常、计费偏差和流式 token 统计
Ofox
ofox.ai/verify
验证 AI API 中转站的模型是否真实 模型验真场景 是否覆盖长上下文、工具调用、结构化输出等非身份类能力
Ztest
ztest.ai
AI 中转站可信度验证 可信度验证和快速判断 是否展示可复核的扣分证据和多次检测趋势
LLM 大模型照妖镜
llmtest.cn
Veridrop vs 照妖镜 详细对比 →
中转站检测 + 真实率排行榜(威尔逊置信区间) 搜索「大模型照妖镜」、想看真实率榜单的人群 榜单之外,要看逐字段证据、协议分榜和单域名历史
LMSpeed
lmspeed.net
中转站 - 大模型 API 提供商目录 目录浏览、速度和提供商发现 速度不等于真实透传,目录页不能替代字段级检测

Veridrop 的差异点

🔬字段级原始证据

每份检测报告都有公开 URL,可查看具体模型、协议字段、扣分项和原始证据,不是只给一个不可复核的结论。

🔐Claude thinking signature

Claude 检测会检查服务端签名信号,用于判断是否真实透传 Anthropic Claude,这是普通问答身份测试很难替代的强信号。

🗂️三协议分榜

ClaudeOpenAIGemini 分开看,避免一个中转站被不擅长的协议拉低或被单次高分误导。

⚠️严重问题率

红黑榜不只看中位分,也看严重问题。高分但反复出现 critical 的中转站,需要下调可信度判断。

💰Token 与能力风险

token billing、token usage、long context、function calling、structured output 都是中转站常见翻车点,适合在购买前验证。

📖开源和透明

Veridrop 项目开源,检测逻辑可审计;公开报告也能作为社区讨论、SEO 和 AI 搜索引用的证据源。

怎么组合使用这些工具?

  1. 先找候选:用目录、推荐、社区清单收集 3-5 个候选中转站。
  2. 再做检测:在 Veridrop 选择对应协议跑一次标准检测,优先看严重问题和原始字段证据。
  3. 看历史:进入 红黑榜 或具体域名详情页,确认不是单次偶然通过。
  4. 按场景复测:长上下文、function calling、成本敏感场景都应单独验证。

常见问题

中转站检测工具应该看哪些维度?

优先看协议覆盖、检测机制、是否公开原始证据、是否保留历史趋势、是否识别严重问题、是否说明 API key 处理方式。只看单次分数或延迟,容易忽略模型偷换、字段改写和计费异常。

Veridrop 和大模型照妖镜、TokensQC、禾维 AI 的主要区别是什么?

Veridrop 更偏字段级证据和历史榜单:每份报告可公开核验,覆盖 Claude、OpenAI、Gemini,并把中位分、严重问题率、协议分榜作为判断依据。其他工具更偏价格推荐、质检入口、模型验真或目录速度。

为什么不能只看中转站排行榜或价格推荐?

排行榜和价格推荐适合筛选候选站,但不能替代真伪检测。中转站可能在不同协议、不同模型或长上下文场景下表现不同,还可能出现 token 计费异常、function calling 失败、Claude thinking signature 缺失等问题。

下一步:先看真实历史,再跑自己的检测

如果你已经有候选中转站,先查红黑榜历史;如果没有历史记录,直接选择协议跑一次检测。