数据更新时间:2026-06-03 · 数据仅供参考
数据来源与说明
- 综合智能:基于 LMArena Elo 分数与独立评估加权。
- 质量:参考 MMLU-Pro、GPQA 等学术 benchmark。
- 速度:国内渠道实测 tokens/秒。
- 成本效率:分数越高代表单位成本产出越高(含免费额度)。
- 评分仅供参考,实际效果受 prompt、任务类型、网络环境等因素影响。
常见问题
这个排行榜的数据来源是什么?
综合智能参考 LMArena Elo,质量参考 MMLU-Pro、GPQA 等学术 benchmark,速度、成本等维度来自本站实测与公开评测整理。
我应该看哪个维度选模型?
写长文/读论文看「上下文」和「质量」;写代码看「代码能力」;做图/视频看「图像视频」;想省钱看「成本效率」。
Kimi 和 豆包 哪个更适合我?
需要处理长文档、PDF 综述 → 选 Kimi;需要联网追热点、做短视频文案/配音 → 选豆包。
免费额度会影响选择吗?
会。对新手来说,先选免费额度充足、中文体验好的工具练手更重要。可以去免费Token汇总页先领额度。
还是不确定选哪个?
做 3 分钟 AI 物种鉴定,根据你的场景直接给出推荐。
🔧
AI工具评测
多维度评测 AI 工具,帮你找到最适合的工具。正在开发中,敬请期待。