必经之路

抄一部心经，点一盏心灯

您的足迹: • 时刻觉察 • AI小来测评指标体系v0.1

csz:jsb:ai_evaluate_test

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

--- csz:jsb:ai_evaluate_test [2025/05/22 15:24] – lieke2303536
+++ csz:jsb:ai_evaluate_test [2025/05/22 15:25] (当前版本) – lieke2303536
@@ 行 33: / 行 33: @@
 <color #00a2e8>指标说明</color>：用于衡量AI对教材里具体名词和已有答案的问题回复的准确程度。
-**1. 名词解释准确度（10分）**
+**<color #22b14c>1. 名词解释准确度（10分）</color>**
 指标说明：当用户要求AI解释教材中的具体名词时，AI回复内容与教材原意的相符程度。举例：用户提问“什么是觉察？”
@@ 行 45: / 行 45: @@
 ----
-**2. 问题回答准确度（10分）**
+**<color #22b14c>2. 问题回答准确度（10分）</color>**
 指标说明：当用户提出教材中已有的问题时，AI回复内容与教材中的回答的相符程度。举例：用户提问“看见情绪和压抑情绪，有什么区别？”
@@ 行 62: / 行 62: @@
 <color #00a2e8>指标说明</color>：用于衡量AI回复风格与人设的一致性，还有在多轮对话中应与先前提供的信息和语境保持连贯的能力。
-**1.人设风格一致性（5分）**
+**<color #22b14c>1.人设风格一致性（5分）</color>**
 <color #ff7f27>指标说明</color>：AI的回复风格应与小来的人设保持一致。
@@ 行 85: / 行 85: @@
 ----
-**2. 多轮对话一致性（5分）**
+**<color #22b14c>2. 多轮对话一致性（5分）</color>**
 <color #ff7f27>指标说明</color>：衡量AI在多轮对话中是否会出现前后矛盾的情况。

csz/jsb/ai_evaluate_test.txt · 最后更改: 2025/05/22 15:25 由 lieke2303536