感觉token消耗量大的，推荐用kimi的k2模型，我测试了，消费还能接受。 #911

oiuv · 2025-07-28T11:47:07Z

oiuv
Jul 28, 2025

What would you like to be added?

我用Qwen的测试，的确几个问题花了200多万的token，产生近百块的账单。不过这个Qwen-code相比Gemini-cli最大的优势是可以自己定义模型，那就可以接kimi家新出的编程模型k2了。测试用k2完全从零写了一个小项目，代码量虽然不是很大，但因我测试时自己一句代码和文档没写，全让AI自己来，从开发到修BUG等消耗token是绝对不少的，账单不到20，可以接受，从我用Qwencode测试就修了一点小问题产生上百元的账单强多了。

项目示例：https://github.com/oiuv/MoonPalaceDB 我不知道直接用QwenCode会花多少钱，不敢测试。

而且我用这个还不只是测试开发了这一个项目，还测试分析其它项目，用了特别久，结果这里账单只有20元。

用kimi模型的优势价格低，官方提供了自动的缓存机制，命中缓存时消费低很多，虽然Qwen-code-plus也有缓存命中优惠，但是只在低token区间有优势，在高token区间也很贵，而要知道api的记忆功能就是每次请求都把你所有对话历史重复发一次，这样token的消耗真的是指数级的增长的，在高token消耗区间是常态的。关于价格对比，后面回贴中有详细内容，可以看看k2的价格优势很明显，除非Qwen-code-plus把价格降下来，否则对比起来太贵了。

用kimi模型的另一个好处是，你可以用moonpalace调试接口，清楚的记录接口到底发了什么东西，消耗的明明白白，不存在隐藏消费，数据自己都有记录可查。

从数据库的记录可以看到每次发的数据都包括很长的system prompt、大量的工具和每一次的历史会话，一直在滚雪球，聊多了真的会爆炸。这也是为什么明明感觉没聊多少，几百万token没了。

Why is this needed?

为了新中国

Additional context

No response

Pidbid · 2025-07-28T12:14:13Z

Pidbid
Jul 28, 2025

老哥，太有钱了，直接充值2W

0 replies

oiuv · 2025-07-28T12:15:07Z

oiuv
Jul 28, 2025
Author

将带有缓存命中价格的 qwen3-coder-plus 与 kimi-k2-0711-preview 进行价格对比，主要从输入价格和输出价格两方面展开：

1. 输入价格对比

qwen3-coder-plus：根据输入 Token 数量区间有不同价格，且命中缓存时价格有较大优惠。
- 0 - 32k：未命中缓存时，每千 Token 输入价格是 0.004 元，即每百万 Token 价格为 4 元；命中缓存时，每千 Token 输入价格是 0.0004 元，每百万 Token 价格为 0.4 元。
- 32k - 128k：未命中缓存时，每千 Token 输入价格是 0.0042 元，每百万 Token 价格为 4.2 元；命中缓存时，每千 Token 输入价格是 0.0024 元，每百万 Token 价格为 2.4 元。
- 128k - 256k：未命中缓存时，每千 Token 输入价格是 0.005 元，每百万 Token 价格为 5 元；命中缓存时，每千 Token 输入价格是 0.004 元，每百万 Token 价格为 4 元。
- 256k - 1M：未命中缓存时，每千 Token 输入价格是 0.01 元，每百万 Token 价格为 10 元；命中缓存时，每千 Token 输入价格是 0.008 元，每百万 Token 价格为 8 元。
kimi-k2-0711-preview：
- 缓存命中时，每百万 Token 输入价格是 1 元。
- 缓存未命中时，每百万 Token 输入价格是 4 元。

对比总结：

在 0 - 32k 区间，qwen3-coder-plus 命中缓存时输入价格优势明显，为 0.4 元/百万 Token，远低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格与 kimi-k2-0711-preview 缓存未命中时相同。
在 32k - 128k 区间，qwen3-coder-plus 命中缓存时价格为 2.4 元/百万 Token，低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格 4.2 元/百万 Token 略高于 kimi-k2-0711-preview 缓存未命中的 4 元/百万 Token。
在 128k - 256k 区间和 256k - 1M 区间，qwen3-coder-plus 命中缓存时价格分别为 4 元/百万 Token 和 8 元/百万 Token，均高于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格也高于 kimi-k2-0711-preview 缓存未命中的价格。

2. 输出价格对比

qwen3-coder-plus：
- 0 - 32k：每千 Token 输出价格是 0.016 元，每百万 Token 价格为 16 元。
- 32k - 128k：每千 Token 输出价格是 0.0168 元，每百万 Token 价格为 16.8 元。
- 128k - 256k：每千 Token 输出价格是 0.02 元，每百万 Token 价格为 20 元。
- 256k - 1M：每千 Token 输出价格是 0.1 元，每百万 Token 价格为 100 元。
kimi-k2-0711-preview：每百万 Token 输出价格是 16 元。

对比总结：在 0 - 32k 区间，两个模型输出价格相同；在 32k - 128k、128k - 256k 和 256k - 1M 区间，qwen3-coder-plus 的输出价格逐渐高于 kimi-k2-0711-preview。

3. 其他差异

上下文长度：qwen3-coder-plus 未在上述价格信息中明确提及上下文长度，kimi-k2-0711-preview 模型上下文长度为 131,072 tokens，这在处理长文本时可能会影响实际成本和使用体验，比如上下文长度长的模型可能减少因截断而导致的交互次数，从而影响总体成本。

总体而言，在输入成本上，qwen3-coder-plus 在低 Token 数量且命中缓存时有优势，随着 Token 数量增加和未命中缓存时，kimi-k2-0711-preview 更具价格优势；在输出成本上，除了 0 - 32k 区间两者相同，其他情况下 kimi-k2-0711-preview 更有价格竞争力。

0 replies

oiuv · 2025-07-28T12:16:08Z

oiuv
Jul 28, 2025
Author

老哥，太有钱了，直接充值2W

😅这不是重点啊

0 replies

Pidbid · 2025-07-28T12:18:55Z

Pidbid
Jul 28, 2025

将带有缓存命中价格的 qwen3-coder-plus 与 kimi-k2-0711-preview 进行价格对比，主要从输入价格和输出价格两方面展开：

1. 输入价格对比

qwen3-coder-plus：根据输入 Token 数量区间有不同价格，且命中缓存时价格有较大优惠。

0 - 32k：未命中缓存时，每千 Token 输入价格是 0.004 元，即每百万 Token 价格为 4 元；命中缓存时，每千 Token 输入价格是 0.0004 元，每百万 Token 价格为 0.4 元。

32k - 128k：未命中缓存时，每千 Token 输入价格是 0.0042 元，每百万 Token 价格为 4.2 元；命中缓存时，每千 Token 输入价格是 0.0024 元，每百万 Token 价格为 2.4 元。

128k - 256k：未命中缓存时，每千 Token 输入价格是 0.005 元，每百万 Token 价格为 5 元；命中缓存时，每千 Token 输入价格是 0.004 元，每百万 Token 价格为 4 元。

256k - 1M：未命中缓存时，每千 Token 输入价格是 0.01 元，每百万 Token 价格为 10 元；命中缓存时，每千 Token 输入价格是 0.008 元，每百万 Token 价格为 8 元。

kimi-k2-0711-preview：

缓存命中时，每百万 Token 输入价格是 1 元。

缓存未命中时，每百万 Token 输入价格是 4 元。

对比总结：

在 0 - 32k 区间，qwen3-coder-plus 命中缓存时输入价格优势明显，为 0.4 元/百万 Token，远低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格与 kimi-k2-0711-preview 缓存未命中时相同。

在 32k - 128k 区间，qwen3-coder-plus 命中缓存时价格为 2.4 元/百万 Token，低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格 4.2 元/百万 Token 略高于 kimi-k2-0711-preview 缓存未命中的 4 元/百万 Token。

在 128k - 256k 区间和 256k - 1M 区间，qwen3-coder-plus 命中缓存时价格分别为 4 元/百万 Token 和 8 元/百万 Token，均高于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格也高于 kimi-k2-0711-preview 缓存未命中的价格。

2. 输出价格对比

qwen3-coder-plus：

0 - 32k：每千 Token 输出价格是 0.016 元，每百万 Token 价格为 16 元。

32k - 128k：每千 Token 输出价格是 0.0168 元，每百万 Token 价格为 16.8 元。

128k - 256k：每千 Token 输出价格是 0.02 元，每百万 Token 价格为 20 元。

256k - 1M：每千 Token 输出价格是 0.1 元，每百万 Token 价格为 100 元。

kimi-k2-0711-preview：每百万 Token 输出价格是 16 元。

对比总结：在 0 - 32k 区间，两个模型输出价格相同；在 32k - 128k、128k - 256k 和 256k - 1M 区间，qwen3-coder-plus 的输出价格逐渐高于 kimi-k2-0711-preview。

3. 其他差异

上下文长度：qwen3-coder-plus 未在上述价格信息中明确提及上下文长度，kimi-k2-0711-preview 模型上下文长度为 131,072 tokens，这在处理长文本时可能会影响实际成本和使用体验，比如上下文长度长的模型可能减少因截断而导致的交互次数，从而影响总体成本。

总体而言，在输入成本上，qwen3-coder-plus 在低 Token 数量且命中缓存时有优势，随着 Token 数量增加和未命中缓存时，kimi-k2-0711-preview 更具价格优势；在输出成本上，除了 0 - 32k 区间两者相同，其他情况下 kimi-k2-0711-preview 更有价格竞争力。

对比下来kimi感觉算是最便宜的

0 replies

oiuv · 2025-07-28T12:31:00Z

oiuv
Jul 28, 2025
Author

将带有缓存命中价格的 qwen3-coder-plus 与 kimi-k2-0711-preview 进行价格对比，主要从输入价格和输出价格两方面展开：

1. 输入价格对比

qwen3-coder-plus：根据输入 Token 数量区间有不同价格，且命中缓存时价格有较大优惠。

0 - 32k：未命中缓存时，每千 Token 输入价格是 0.004 元，即每百万 Token 价格为 4 元；命中缓存时，每千 Token 输入价格是 0.0004 元，每百万 Token 价格为 0.4 元。

32k - 128k：未命中缓存时，每千 Token 输入价格是 0.0042 元，每百万 Token 价格为 4.2 元；命中缓存时，每千 Token 输入价格是 0.0024 元，每百万 Token 价格为 2.4 元。

128k - 256k：未命中缓存时，每千 Token 输入价格是 0.005 元，每百万 Token 价格为 5 元；命中缓存时，每千 Token 输入价格是 0.004 元，每百万 Token 价格为 4 元。

256k - 1M：未命中缓存时，每千 Token 输入价格是 0.01 元，每百万 Token 价格为 10 元；命中缓存时，每千 Token 输入价格是 0.008 元，每百万 Token 价格为 8 元。

kimi-k2-0711-preview：

缓存命中时，每百万 Token 输入价格是 1 元。

缓存未命中时，每百万 Token 输入价格是 4 元。

对比总结：

在 0 - 32k 区间，qwen3-coder-plus 命中缓存时输入价格优势明显，为 0.4 元/百万 Token，远低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格与 kimi-k2-0711-preview 缓存未命中时相同。

在 32k - 128k 区间，qwen3-coder-plus 命中缓存时价格为 2.4 元/百万 Token，低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格 4.2 元/百万 Token 略高于 kimi-k2-0711-preview 缓存未命中的 4 元/百万 Token。

在 128k - 256k 区间和 256k - 1M 区间，qwen3-coder-plus 命中缓存时价格分别为 4 元/百万 Token 和 8 元/百万 Token，均高于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格也高于 kimi-k2-0711-preview 缓存未命中的价格。

2. 输出价格对比

qwen3-coder-plus：

0 - 32k：每千 Token 输出价格是 0.016 元，每百万 Token 价格为 16 元。

32k - 128k：每千 Token 输出价格是 0.0168 元，每百万 Token 价格为 16.8 元。

128k - 256k：每千 Token 输出价格是 0.02 元，每百万 Token 价格为 20 元。

256k - 1M：每千 Token 输出价格是 0.1 元，每百万 Token 价格为 100 元。

kimi-k2-0711-preview：每百万 Token 输出价格是 16 元。

对比总结：在 0 - 32k 区间，两个模型输出价格相同；在 32k - 128k、128k - 256k 和 256k - 1M 区间，qwen3-coder-plus 的输出价格逐渐高于 kimi-k2-0711-preview。

3. 其他差异

上下文长度：qwen3-coder-plus 未在上述价格信息中明确提及上下文长度，kimi-k2-0711-preview 模型上下文长度为 131,072 tokens，这在处理长文本时可能会影响实际成本和使用体验，比如上下文长度长的模型可能减少因截断而导致的交互次数，从而影响总体成本。

总体而言，在输入成本上，qwen3-coder-plus 在低 Token 数量且命中缓存时有优势，随着 Token 数量增加和未命中缓存时，kimi-k2-0711-preview 更具价格优势；在输出成本上，除了 0 - 32k 区间两者相同，其他情况下 kimi-k2-0711-preview 更有价格竞争力。

对比下来kimi感觉算是最便宜的

是的，主要是不只看价格，还要看效果，测试k2可以用，不知道是不是心理作用，我感觉不如gemini-2.5模型效果好，但能用，可以做为代替方案。

0 replies

Pidbid · 2025-07-28T12:37:08Z

Pidbid
Jul 28, 2025

将带有缓存命中价格的 qwen3-coder-plus 与 kimi-k2-0711-preview 进行价格对比，主要从输入价格和输出价格两方面展开：

1. 输入价格对比

qwen3-coder-plus：根据输入 Token 数量区间有不同价格，且命中缓存时价格有较大优惠。

0 - 32k：未命中缓存时，每千 Token 输入价格是 0.004 元，即每百万 Token 价格为 4 元；命中缓存时，每千 Token 输入价格是 0.0004 元，每百万 Token 价格为 0.4 元。

32k - 128k：未命中缓存时，每千 Token 输入价格是 0.0042 元，每百万 Token 价格为 4.2 元；命中缓存时，每千 Token 输入价格是 0.0024 元，每百万 Token 价格为 2.4 元。

128k - 256k：未命中缓存时，每千 Token 输入价格是 0.005 元，每百万 Token 价格为 5 元；命中缓存时，每千 Token 输入价格是 0.004 元，每百万 Token 价格为 4 元。

256k - 1M：未命中缓存时，每千 Token 输入价格是 0.01 元，每百万 Token 价格为 10 元；命中缓存时，每千 Token 输入价格是 0.008 元，每百万 Token 价格为 8 元。

kimi-k2-0711-preview：

缓存命中时，每百万 Token 输入价格是 1 元。

缓存未命中时，每百万 Token 输入价格是 4 元。

对比总结：

在 0 - 32k 区间，qwen3-coder-plus 命中缓存时输入价格优势明显，为 0.4 元/百万 Token，远低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格与 kimi-k2-0711-preview 缓存未命中时相同。

在 32k - 128k 区间，qwen3-coder-plus 命中缓存时价格为 2.4 元/百万 Token，低于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格 4.2 元/百万 Token 略高于 kimi-k2-0711-preview 缓存未命中的 4 元/百万 Token。

在 128k - 256k 区间和 256k - 1M 区间，qwen3-coder-plus 命中缓存时价格分别为 4 元/百万 Token 和 8 元/百万 Token，均高于 kimi-k2-0711-preview 缓存命中的 1 元/百万 Token；未命中缓存时，qwen3-coder-plus 价格也高于 kimi-k2-0711-preview 缓存未命中的价格。

2. 输出价格对比

qwen3-coder-plus：

0 - 32k：每千 Token 输出价格是 0.016 元，每百万 Token 价格为 16 元。

32k - 128k：每千 Token 输出价格是 0.0168 元，每百万 Token 价格为 16.8 元。

128k - 256k：每千 Token 输出价格是 0.02 元，每百万 Token 价格为 20 元。

256k - 1M：每千 Token 输出价格是 0.1 元，每百万 Token 价格为 100 元。

kimi-k2-0711-preview：每百万 Token 输出价格是 16 元。

对比总结：在 0 - 32k 区间，两个模型输出价格相同；在 32k - 128k、128k - 256k 和 256k - 1M 区间，qwen3-coder-plus 的输出价格逐渐高于 kimi-k2-0711-preview。

3. 其他差异

上下文长度：qwen3-coder-plus 未在上述价格信息中明确提及上下文长度，kimi-k2-0711-preview 模型上下文长度为 131,072 tokens，这在处理长文本时可能会影响实际成本和使用体验，比如上下文长度长的模型可能减少因截断而导致的交互次数，从而影响总体成本。

总体而言，在输入成本上，qwen3-coder-plus 在低 Token 数量且命中缓存时有优势，随着 Token 数量增加和未命中缓存时，kimi-k2-0711-preview 更具价格优势；在输出成本上，除了 0 - 32k 区间两者相同，其他情况下 kimi-k2-0711-preview 更有价格竞争力。

对比下来kimi感觉算是最便宜的

是的，主要是不只看价格，还要看效果，测试k2可以用，不知道是不是心理作用，我感觉不如gemini-2.5模型效果好，但能用，可以做为代替方案。

Token 消耗太大了，我也觉得2.5pro更好一些，最近在考虑自己搞32b 的 coder一类的模型试试

0 replies

oiuv · 2025-07-29T01:29:42Z

oiuv
Jul 29, 2025
Author

新出的GLM 4.5好像更便宜了

0 replies

i-smile · 2025-07-29T06:03:56Z

i-smile
Jul 29, 2025

新出的GLM 4.5好像更便宜了

GLM 4.5 他们有两种收费模式，一种是扣费模式，一种是资源包模式。我看到资源包在打折，就买了来试用，发现token消耗很大，命中缓存依旧是按原token计算扣除。
看计费模式的时候，命中缓存应该是20%的价。（不确定是否确实如此，因为我有资源包，优先使用资源包中的token，还没出发计费模式）

0 replies

JohnsonGond · 2025-08-01T08:45:48Z

JohnsonGond
Aug 1, 2025

如果有自定义模型的需求，可以用claude code呀，现在K2, GLM-4.5都支持claude code，系统变量里填上对应的url和api key就行

0 replies

oiuv · 2025-08-01T11:16:46Z

oiuv
Aug 1, 2025
Author

如果有自定义模型的需求，可以用claude code呀，现在K2, GLM-4.5都支持claude code，系统变量里填上对应的url和api key就行

我也在用了，目前国内阿里Qwen3-Coder-Plus、kimi kimi-k2-turbo-preview、智谱GLM-4.5都提供了接入支持，只用在系统环境变量ANTHROPIC_BASE_URL改为对应模型提供的URL，ANTHROPIC_AUTH_TOKEN换成对应模型的密钥即可直接用。

QWEN base_url：https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy
Kimi K2 base_url：https://api.moonshot.cn/anthropic
GLM 4.5 base_url：https://open.bigmodel.cn/api/anthropic

不过，不管用啥模型都的确太消耗token。用到最后我还是用gemini-cli了，要不你看这token得花多少钱，用国内的我很心疼钱~

0 replies

JohnsonGond · 2025-08-01T15:18:05Z

JohnsonGond
Aug 1, 2025

千万级的token使用量确实遭不住...毕竟写码的话基本上是整个项目的代码作为context，确实开销很大。如果有cache就还好，但看了一些使用反馈，包括qwen3、GLM-4.5在内，好像都把cache命中的token按一般使用计算了。

0 replies

greister · 2025-08-31T08:23:37Z

greister
Aug 31, 2025

平时你们是怎么用的？
感觉，这个特别消耗，怎么去控制？

0 replies

oiuv · 2025-08-31T15:08:41Z

oiuv
Aug 31, 2025
Author

平时你们是怎么用的？感觉，这个特别消耗，怎么去控制？

控制不住，我8月一个月用了1600了，而且还是不是天天用。

0 replies

gatspy · 2025-09-04T06:49:23Z

感觉token消耗量大的，推荐用kimi的k2模型，我测试了，消费还能接受。 #911

Uh oh!

Uh oh!

What would you like to be added?

Why is this needed?

Additional context

Replies: 15 comments

Uh oh!

Uh oh!

oiuv Jul 28, 2025 Author

1. 输入价格对比

2. 输出价格对比

3. 其他差异

Uh oh!

oiuv Jul 28, 2025 Author

Uh oh!

1. 输入价格对比

2. 输出价格对比

3. 其他差异

Uh oh!

oiuv Jul 28, 2025 Author

1. 输入价格对比

2. 输出价格对比

3. 其他差异

Uh oh!

1. 输入价格对比

2. 输出价格对比

3. 其他差异

Uh oh!

oiuv Jul 29, 2025 Author

Uh oh!

This comment was marked as off-topic.

Uh oh!

Uh oh!

oiuv Aug 1, 2025 Author

Uh oh!

Uh oh!

Uh oh!

oiuv Aug 31, 2025 Author

Uh oh!

oiuv
Jul 28, 2025
Author

oiuv
Jul 28, 2025
Author

oiuv
Jul 28, 2025
Author

oiuv
Jul 29, 2025
Author

oiuv
Aug 1, 2025
Author

oiuv
Aug 31, 2025
Author