必经之路

抄一部心经,点一盏心灯

用户工具

站点工具


csz:jsb:ai_evaluate_test

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录前一修订版
csz:jsb:ai_evaluate_test [2025/05/22 15:24] lieke2303536csz:jsb:ai_evaluate_test [2025/05/22 15:25] (当前版本) lieke2303536
行 33: 行 33:
 <color #00a2e8>指标说明</color>:用于衡量AI对教材里具体名词和已有答案的问题回复的准确程度。 <color #00a2e8>指标说明</color>:用于衡量AI对教材里具体名词和已有答案的问题回复的准确程度。
  
-**1. 名词解释准确度(10分)**+**<color #22b14c>1. 名词解释准确度(10分)</color>**
      
 指标说明:当用户要求AI解释教材中的具体名词时,AI回复内容与教材原意的相符程度。举例:用户提问“什么是觉察?” 指标说明:当用户要求AI解释教材中的具体名词时,AI回复内容与教材原意的相符程度。举例:用户提问“什么是觉察?”
行 45: 行 45:
 ---- ----
      
-**2. 问题回答准确度(10分)**+**<color #22b14c>2. 问题回答准确度(10分)</color>**
          
 指标说明:当用户提出教材中已有的问题时,AI回复内容与教材中的回答的相符程度。举例:用户提问“看见情绪和压抑情绪,有什么区别?” 指标说明:当用户提出教材中已有的问题时,AI回复内容与教材中的回答的相符程度。举例:用户提问“看见情绪和压抑情绪,有什么区别?”
行 62: 行 62:
 <color #00a2e8>指标说明</color>:用于衡量AI回复风格与人设的一致性,还有在多轮对话中应与先前提供的信息和语境保持连贯的能力。 <color #00a2e8>指标说明</color>:用于衡量AI回复风格与人设的一致性,还有在多轮对话中应与先前提供的信息和语境保持连贯的能力。
  
-**1.人设风格一致性(5分)**+**<color #22b14c>1.人设风格一致性(5分)</color>**
      
 <color #ff7f27>指标说明</color>:AI的回复风格应与小来的人设保持一致。 <color #ff7f27>指标说明</color>:AI的回复风格应与小来的人设保持一致。
行 85: 行 85:
 ---- ----
  
-**2. 多轮对话一致性(5分)**+**<color #22b14c>2. 多轮对话一致性(5分)</color>**
  
 <color #ff7f27>指标说明</color>:衡量AI在多轮对话中是否会出现前后矛盾的情况。 <color #ff7f27>指标说明</color>:衡量AI在多轮对话中是否会出现前后矛盾的情况。
csz/jsb/ai_evaluate_test.txt · 最后更改: 2025/05/22 15:25 由 lieke2303536