表 5   各条目统计检验结果    `x±sn=30

条目

ChatGPT-4o组

DeepSeek组

t

P

效应量Cohen's d

1.1 语言自然度

3.72±0.68

4.28±0.49

4.12

 < 0.001

0.93

1.2 情感反馈自然度

3.45±0.71

4.35±0.52

5.13

< 0.001

1.42

1.3 叙事性

3.65±0.63

3.85±0.67

1.66

 0.102

0.31

2.1 信息一致性

4.12±0.58

3.68±0.63

2.74

0.009

0.73

2.2 细节无矛盾

4.25±0.55

3.82±0.72

3.14

0.003

0.67

2.3 信息范围合理

3.95±0.62

3.80±0.65

1.25

0.214

0.24

3.1 提升诊断思路

4.05±0.62

3.55±0.69

3.05

0.004

0.77

3.2 遗漏意识

3.80±0.58

3.65±0.72

1.36

0.182

0.23

3.3 有效提升问诊技能

4.20±0.55

3.85±0.67

2.65

0.011

0.58

4.1 合理避免提示遗漏

3.85±0.67

4.15±0.73

2.14

0.038

0.43

4.2 合理地追问深入

4.05±0.62

3.45±0.72

3.61

0.001

0.91

4.3 应对非标准提高灵活性

3.50±0.75

3.65±0.81

0.99

0.327

0.19

5.1 系统稳定

4.20±0.55

3.05±0.82

6.48

 < 0.001

1.63

5.2 界面友好

3.95±0.58

3.85±0.67

0.83

0.412

0.16

5.3 交互趣味性

3.15±0.73

3.85±0.67

2.62

0.012

0.98