表 5 各条目统计检验结果（`x±s，n=30）

条目	ChatGPT-4o组	DeepSeek组	t	P	效应量Cohen's d
1.1 语言自然度	3.72±0.68	4.28±0.49	4.12	< 0.001	0.93
1.2 情感反馈自然度	3.45±0.71	4.35±0.52	5.13	< 0.001	1.42
1.3 叙事性	3.65±0.63	3.85±0.67	1.66	0.102	0.31
2.1 信息一致性	4.12±0.58	3.68±0.63	2.74	0.009	0.73
2.2 细节无矛盾	4.25±0.55	3.82±0.72	3.14	0.003	0.67
2.3 信息范围合理	3.95±0.62	3.80±0.65	1.25	0.214	0.24
3.1 提升诊断思路	4.05±0.62	3.55±0.69	3.05	0.004	0.77
3.2 遗漏意识	3.80±0.58	3.65±0.72	1.36	0.182	0.23
3.3 有效提升问诊技能	4.20±0.55	3.85±0.67	2.65	0.011	0.58
4.1 合理避免提示遗漏	3.85±0.67	4.15±0.73	2.14	0.038	0.43
4.2 合理地追问深入	4.05±0.62	3.45±0.72	3.61	0.001	0.91
4.3 应对非标准提高灵活性	3.50±0.75	3.65±0.81	0.99	0.327	0.19
5.1 系统稳定	4.20±0.55	3.05±0.82	6.48	< 0.001	1.63
5.2 界面友好	3.95±0.58	3.85±0.67	0.83	0.412	0.16
5.3 交互趣味性	3.15±0.73	3.85±0.67	2.62	0.012	0.98