客观对比 · 中转站检测 / 中转站测试 / API 中转站测评

中转站检测工具横评:Veridrop、禾维 AI、TokensQC、Ofox、Ztest、大模型照妖镜哪个好?

如果你要判断一个 AI API 中转站是否真实、稳定、计费可信,不要只看价格或测速。 Veridrop 更适合做字段级真伪核验和历史红黑榜判断; 禾维 AI、TokensQC、Ofox、Ztest、大模型照妖镜、LMSpeed 则分别偏价格推荐、质检入口、模型验真、可信度验证或目录速度。

先给结论

想验真假和字段证据

优先用 Veridrop 红黑榜或直接跑 Claude / OpenAI / Gemini 检测。它更关注原始响应字段、协议一致性、严重问题和历史趋势。

想看价格和候选站

禾维 AI、LMSpeed、relayAPI 这类目录或推荐页更适合做第一轮候选池,但候选站仍建议再用检测工具核验。

想做单点模型验真

Ofox、Ztest、大模型照妖镜、TokensQC 都覆盖了部分验真或质检需求。选择时重点看是否能展示可复核的原始证据。

主流中转站检测工具对比

工具	公开定位	更适合	选择时要核对
Veridrop 本站 veridrop.org/leaderboard	AI API 中转站红黑榜,真实检测数据排行	字段级真伪核验、Claude / OpenAI / Gemini 协议分榜、历史报告追踪	看公开报告里的原始字段、严重问题、thinking signature、token billing、long context
禾维 AI / Hvoy hvoy.ai Veridrop vs hvoy 详细对比 →	API 中转站真假检测、价格对比与推荐	价格、推荐、候选站初筛	价格榜之外,仍要核验模型是否真实透传和协议是否完整
CCTest cctest.ai Veridrop vs CCTest 详细对比 →	专攻 Claude 的黑盒检测,渠道来源识别(bedrock/vertex/逆向)	纯 Claude 用户、想查逆向渠道来源	是否覆盖 OpenAI / Gemini、是否有可复核报告与历史趋势
TokensQC tokensqc.com	免费 AI API 质检工具,协议一致性 / 模型身份 / 延迟探针	Token 质检、API 入口测试、延迟探针	是否能解释 usage 字段异常、计费偏差和流式 token 统计
Ofox ofox.ai/verify	验证 AI API 中转站的模型是否真实	模型验真场景	是否覆盖长上下文、工具调用、结构化输出等非身份类能力
Ztest ztest.ai	AI 中转站可信度验证	可信度验证和快速判断	是否展示可复核的扣分证据和多次检测趋势
LLM 大模型照妖镜 llmtest.cn Veridrop vs 照妖镜详细对比 →	中转站检测 + 真实率排行榜(威尔逊置信区间)	搜索「大模型照妖镜」、想看真实率榜单的人群	榜单之外,要看逐字段证据、协议分榜和单域名历史
LMSpeed lmspeed.net	中转站 - 大模型 API 提供商目录	目录浏览、速度和提供商发现	速度不等于真实透传,目录页不能替代字段级检测

Veridrop 的差异点

🔬字段级原始证据

每份检测报告都有公开 URL,可查看具体模型、协议字段、扣分项和原始证据,不是只给一个不可复核的结论。

🔐Claude thinking signature

Claude 检测会检查服务端签名信号,用于判断是否真实透传 Anthropic Claude,这是普通问答身份测试很难替代的强信号。

🗂️三协议分榜

Claude、OpenAI、Gemini 分开看,避免一个中转站被不擅长的协议拉低或被单次高分误导。

⚠️严重问题率

红黑榜不只看中位分,也看严重问题。高分但反复出现 critical 的中转站,需要下调可信度判断。

💰Token 与能力风险

token billing、token usage、long context、function calling、structured output 都是中转站常见翻车点,适合在购买前验证。

📖开源和透明

Veridrop 项目开源,检测逻辑可审计;公开报告也能作为社区讨论、SEO 和 AI 搜索引用的证据源。

怎么组合使用这些工具?

先找候选:用目录、推荐、社区清单收集 3-5 个候选中转站。
再做检测:在 Veridrop 选择对应协议跑一次标准检测,优先看严重问题和原始字段证据。
看历史:进入红黑榜或具体域名详情页,确认不是单次偶然通过。
按场景复测:长上下文、function calling、成本敏感场景都应单独验证。

常见问题

中转站检测工具应该看哪些维度?

优先看协议覆盖、检测机制、是否公开原始证据、是否保留历史趋势、是否识别严重问题、是否说明 API key 处理方式。只看单次分数或延迟,容易忽略模型偷换、字段改写和计费异常。

Veridrop 和大模型照妖镜、TokensQC、禾维 AI 的主要区别是什么?

Veridrop 更偏字段级证据和历史榜单:每份报告可公开核验,覆盖 Claude、OpenAI、Gemini,并把中位分、严重问题率、协议分榜作为判断依据。其他工具更偏价格推荐、质检入口、模型验真或目录速度。

为什么不能只看中转站排行榜或价格推荐?

排行榜和价格推荐适合筛选候选站,但不能替代真伪检测。中转站可能在不同协议、不同模型或长上下文场景下表现不同,还可能出现 token 计费异常、function calling 失败、Claude thinking signature 缺失等问题。

下一步:先看真实历史,再跑自己的检测

如果你已经有候选中转站,先查红黑榜历史;如果没有历史记录,直接选择协议跑一次检测。

查看红黑榜浏览中转站导航检测 Claude 检测 OpenAI 检测 Gemini