| icon | message |
|---|
助手 是对所选模型做一些个性化的设置来使用模型,如提示词预设和参数预设等,通过这些设置让所选模型能更加符合你预期的工作。
系统默认助手 预设了一个比较通用的参数(无提示词),您可以直接使用或者到 智能体页面 寻找你需要的预设来使用。
助手 是 话题 的父集,单个助手下可以创建多个话题(即对话),所有 话题 共用 助手 的参数设置和预设词(prompt)等模型设置。
上传图片或文档 上传图片需要模型支持,上传文档会自动解析为文字作为上下文提供给模型。
网络搜索 须在设置中配置网络搜索相关信息,搜索结果作为上下文返回给大模型,详见 联网模式。
知识库 开启知识库,详见 知识库教程。
MCP 服务器 开启 MCP 服务器功能,详见 MCP 使用教程。
生成图片 只有选择的 对话模型 支持生图时才会显示。(非对话生图模型请前往 绘图)
快捷短语 需要先在设置中预设常用短语,在此处调用,直接输入,支持变量。
清除上下文 在不删除内容的情况下,截断模型能获得的上下文,也就是说模型将“忘记”之前的对话内容。
预估 Token 数 展示预估 Token 数,四个数据分别为 当前上下文数 、 最大上下文数 ( ∞ 表示无限上下文)、 当前输入框内消息字数 、 预估 Token 数 。
{% hint style="info" %} 此功能仅用于预估 Token 数,实际 Token 数每个模型都是不一样的,请以模型提供商的数据为准。 {% endhint %}
模型设置与助手设置当中的 模型设置 参数同步,详见 助手设置。
{% hint style="info" %} 在对话设置当中,仅该模型设置作用于当前助手,其余设置作用于全局。如:设置消息样式为气泡后在任何助手的任何话题下都是气泡样式。 {% endhint %}
使用分割线将消息正文与操作栏隔开。
{% tabs %} {% tab title="打开时" %}
{% endtab %}{% tab title="关闭时" %}
{% endtab %} {% endtabs %}字体样式切换,现在你也可以通过 自定义css 来更换字体。
模型输出代码片段时显示代码块行号。
{% tabs %} {% tab title="关闭时" %}
{% endtab %}{% tab title="打开时" %}
{% endtab %} {% endtabs %}打开后,当代码片段中代码较长时,将自动折叠代码块。、
打开后,当代码片段中但行代码较长时(超出窗口),将自动换行。
打开后,支持思考的模型在思考完成后会自动折叠思考过程。
可切对话界面换为气泡样式或列表样式。
可切换代码片段的显示风格。
- KaTeX 渲染速度更快,因为它是专门为性能优化设计的;
- MathJax 渲染较慢,但功能更全面,支持更多的数学符号和命令。
调整对话界面字体的大小。
在输入框显示输入文本预估消耗的Token数(非实际上下文消耗的Token,仅供参考)。
当从其他地方复制长段文本粘贴到输入框时会自动显示为文件的样式,减少后续输入内容时的干扰。
关闭时只渲染模型回复的消息,不渲染发送的消息。
{% tabs %} {% tab title="关闭时" %}
{% endtab %}{% tab title="打开时" %}
{% endtab %} {% endtabs %}在对话界面输入框输入消息后,连敲三次空格可翻译输入的内容为英文。
{% hint style="warning" %} 注意:该操作会覆盖原文。 {% endhint %}
设置输入框翻译按钮以及快速敲击3次空格翻译的目标语言。
在助手界面选择需要设置的助手名称→在右键菜单中选对应设置
{% hint style="info" %} 助手设置作用于该助手下的所有话题。 {% endhint %}
可自定义方便辨识的助手名称。
即 prompt ,可以参照智能体页面的提示词写法来编辑内容。
可以为该助手固定一个默认模型,从智能体页面添加时或复制助手时初始模型为该模型。不设置该项初始模型则为全局初始模型(即 默认助手模型 )。
{% hint style="info" %} 助手的默认模型有两种,一为 全局默认对话模型 ,另一为助手默认模型;助手的默认模型优先级高于全局默认对话模型。当不设置助手默认模型时,助手默认模型=全局默认对话模型。 {% endhint %}
打开时 - 当在该话题下使用过程中切换其他模型使用时,再次新建话题会将新话题的重置为助手的默认模型。当该项关闭时新建话题的模型会跟随上一话题所使用的模型。
如助手的默认模型为gpt-3.5-turbo,我在该助手下创建话题1,在话题1的对话过程中切换了gpt-4o使用,此时:
如果开启了自动重置:新建话题2时,话题2默认选择的模型为gpt-3.5-turbo;
如果未开启自动重置:新建话题2时,话题2默认选择的模型为gpt-4o。
温度参数控制模型生成文本的随机性和创造性程度(默认值为0.7)。具体表现为:
- 低温度值(0-0.3):
- 输出更确定、更专注
- 适合代码生成、数据分析等需要准确性的场景
- 倾向于选择最可能的词汇输出
- 中等温度值(0.4-0.7):
- 平衡了创造性和连贯性
- 适合日常对话、一般性写作
- 推荐用于聊天机器人对话(0.5左右)
- 高温度值(0.8-1.0):
- 产生更具创造性和多样性的输出
- 适合创意写作、头脑风暴等场景
- 但可能降低文本的连贯性
默认值为 1,值越小,AI 生成的内容越单调,也越容易理解;值越大,AI 回复的词汇范围越大,越多样化。
核采样通过控制词汇选择的概率阈值来影响输出:
- 较小值(0.1-0.3):
- 仅考虑最高概率的词汇
- 输出更保守、更可控
- 适合代码注释、技术文档等场景
- 中等值(0.4-0.6):
- 平衡词汇多样性和准确性
- 适合一般对话和写作任务
- 较大值(0.7-1.0):
- 考虑更广泛的词汇选择
- 产生更丰富多样的内容
- 适合创意写作等需要多样化表达的场景
{% hint style="info" %}
- 这两个参数可以独立使用或组合使用
- 根据具体任务类型选择合适的参数值
- 建议通过实验找到最适合特定应用场景的参数组合
- 以上内容仅供参考和了解概念,所给参数范围不一定适合所有模型,具体可参考模型相关文档给出的参数建议。 {% endhint %}
要保留在上下文中的消息数量,数值越大,上下文越长,消耗的 token 越多:
- 5-10:适合普通对话
- >10:需要更长记忆的复杂任务(例如:按照写作提纲分步生成长文的任务,需要确保生成的上下文逻辑连贯)
-
注意:消息数越多,token 消耗越大
单次回答最大 Token 数,在大语言模型中,max token(最大令牌数)是一个关键参数,它直接影响模型生成回答的质量和长度。
如:在CherryStudio当中填写好key后测试模型是否连通时,只需要知道模型是否有正确返回消息而不需特定内容,这种情况下设置MaxToken为1即可。
多数模型的MaxToken上限为32k Tokens,当然也有64k,甚至更多的,具体需要到对应介绍页面查看。
具体设置多少取决于自己的需要,当然也可以参考以下建议。
{% hint style="success" %} 建议:
- 普通聊天:500-800
- 短文生成:800-2000
- 代码生成:2000-3600
- 长文生成:4000及以上 (需要模型本身支持) {% endhint %}
{% hint style="warning" %} 一般情况下模型生成的回答将被限制在 MaxToken 的范围内,当然也有可能会出现被截断(如写长代码时)或表达不完整等情况出现,特殊情况下也需要根据实际情况来灵活调整。 {% endhint %}
流式输出是一种数据处理方式,它允许数据以连续的流形式进行传输和处理,而不是一次性发送所有数据。这种方式使得数据可以在生成后立即被处理和输出,极大地提高了实时性和效率。
在 CherryStudio 客户端等类似环境下简单来说就是打字机效果。
关闭后(非流):模型生成完信息后整段一次性输出(想象一下微信收到消息的感觉);
打开时:逐字输出,可以理解为大模型每生成一个字就立马发送给你,直到全部发送完。
{% hint style="info" %} 如果某些特殊模型不支持流式输出需要将该开关关闭,比如刚开始只支持非流的o1-mini等。 {% endhint %}
在请求体(body)中加入额外请求参数,如 presence_penalty 等字段,一般人一般情况下用不到。
上述top-p、maxtokens、stream等参数就是这些参数之一。
填法:参数名称—参数类型(文本、数字等)—值,参考文档:点击前往
{% hint style="info" %} 各个模型提供商都或多或少有自己独有的参数,需要到提供商的文档中寻找使用方法 {% endhint %}
{% hint style="info" %}
- 自定义参数优先级高于内置参数。即自定义参数如果与内置参数重复,则自定义参数会覆盖内置参数。
如:自定义参数中设置
model为gpt-4o后,在对话中无论选择哪个模型都使用的是gpt-4o模型。
- 使用 参数名称:undefined 的设置可排除参数。 {% endhint %}
 (1) (1) (1).png)
 (1) (1) (1) (1).png)






 (1) (1) (1).png)
 (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2).png)
 (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1).png)
 (1) (1) (1) (1) (1) (1) (1) (1).png)
 (1) (1) (1).png)
 (1) (2).png)
 (1) (2).png)
 (1) (1) (1).png)