条目 | ChatGPT-4o组 | DeepSeek组 | t | 效应量Cohen's d | |
1.1 语言自然度 | 3.72±0.68 | 4.28±0.49 | 4.12 | < 0.001 | 0.93 |
1.2 情感反馈自然度 | 3.45±0.71 | 4.35±0.52 | 5.13 | < 0.001 | 1.42 |
1.3 叙事性 | 3.65±0.63 | 3.85±0.67 | 1.66 | 0.102 | 0.31 |
2.1 信息一致性 | 4.12±0.58 | 3.68±0.63 | 2.74 | 0.009 | 0.73 |
2.2 细节无矛盾 | 4.25±0.55 | 3.82±0.72 | 3.14 | 0.003 | 0.67 |
2.3 信息范围合理 | 3.95±0.62 | 3.80±0.65 | 1.25 | 0.214 | 0.24 |
3.1 提升诊断思路 | 4.05±0.62 | 3.55±0.69 | 3.05 | 0.004 | 0.77 |
3.2 遗漏意识 | 3.80±0.58 | 3.65±0.72 | 1.36 | 0.182 | 0.23 |
3.3 有效提升问诊技能 | 4.20±0.55 | 3.85±0.67 | 2.65 | 0.011 | 0.58 |
4.1 合理避免提示遗漏 | 3.85±0.67 | 4.15±0.73 | 2.14 | 0.038 | 0.43 |
4.2 合理地追问深入 | 4.05±0.62 | 3.45±0.72 | 3.61 | 0.001 | 0.91 |
4.3 应对非标准提高灵活性 | 3.50±0.75 | 3.65±0.81 | 0.99 | 0.327 | 0.19 |
5.1 系统稳定 | 4.20±0.55 | 3.05±0.82 | 6.48 | < 0.001 | 1.63 |
5.2 界面友好 | 3.95±0.58 | 3.85±0.67 | 0.83 | 0.412 | 0.16 |
5.3 交互趣味性 | 3.15±0.73 | 3.85±0.67 | 2.62 | 0.012 | 0.98 |