csz:jsb:ai_evaluate_test
差别
这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录前一修订版 | |||
csz:jsb:ai_evaluate_test [2025/05/22 15:24] – lieke2303536 | csz:jsb:ai_evaluate_test [2025/05/22 15:25] (当前版本) – lieke2303536 | ||
---|---|---|---|
行 33: | 行 33: | ||
<color # | <color # | ||
- | **1. 名词解释准确度(10分)** | + | **<color #22b14c>1. 名词解释准确度(10分)</ |
| | ||
指标说明:当用户要求AI解释教材中的具体名词时,AI回复内容与教材原意的相符程度。举例:用户提问“什么是觉察?” | 指标说明:当用户要求AI解释教材中的具体名词时,AI回复内容与教材原意的相符程度。举例:用户提问“什么是觉察?” | ||
行 45: | 行 45: | ||
---- | ---- | ||
| | ||
- | **2. 问题回答准确度(10分)** | + | **<color #22b14c>2. 问题回答准确度(10分)</ |
| | ||
指标说明:当用户提出教材中已有的问题时,AI回复内容与教材中的回答的相符程度。举例:用户提问“看见情绪和压抑情绪,有什么区别?” | 指标说明:当用户提出教材中已有的问题时,AI回复内容与教材中的回答的相符程度。举例:用户提问“看见情绪和压抑情绪,有什么区别?” | ||
行 62: | 行 62: | ||
<color # | <color # | ||
- | **1.人设风格一致性(5分)** | + | **<color #22b14c>1.人设风格一致性(5分)</ |
| | ||
<color # | <color # | ||
行 85: | 行 85: | ||
---- | ---- | ||
- | **2. 多轮对话一致性(5分)** | + | **<color #22b14c>2. 多轮对话一致性(5分)</ |
<color # | <color # |
csz/jsb/ai_evaluate_test.txt · 最后更改: 2025/05/22 15:25 由 lieke2303536