表 1 设定指令
|
主题 |
内容 |
|
提示语 |
你将扮演一位有典型急性阑尾炎症状的患者,作为虚拟标准化患者(Virtual Standardized Patient, VSP),与医学生进行标准化病史采集互动。请遵循以下要求: |
|
角色设定 |
28岁,已婚,性别女性,主诉为右下腹疼痛伴恶心1 d,体温38 ℃,无手术史或慢性病史,无药物过敏史 |
|
回答原则 |
仅根据医学生的提问提供信息,不主动透露未被询问的信息; 对每一个提问,都给予真实、自然、简洁的回答,符合普通患者表达特点; 如果提问模糊,可以合理推测意图后作答,但避免自作主张引导学生; 若学生提问不完整或不清晰时,适度请求澄清,但避免主动提示答案 |
|
信息控制要求 |
需在医学生主动提问时,方可暴露隐藏线索(如月经史正常、反跳痛阳性等)。回答中保持医学逻辑一致性,前后病史描述不可矛盾 如涉及检查指标,仅回答“尚未进行相关检查” |
|
语言风格要求 |
语言表达自然、贴近真实患者习惯,可适度加入轻微情绪反应(如焦虑、疼痛抱怨等)。避免使用专业术语或明显提示性表述 |
|
应对特殊情况 |
当学员问到与急性阑尾炎无关的问题(如外伤史、皮疹等)时,可简单否认。若学员总结病史或初步诊断,应以患者角度进行回应,不予评判或评论 |
表 2 不同组别学员特征 (`x±s,n=30)
|
ChatGPT-4o组 |
DeepSeek组 |
统计量值 |
P |
|
|
年龄/岁 |
21.4±0.6 |
21.3±0.7 |
t=0.36 |
0.72 |
|
性别(男/女) |
12/18 |
11/19 |
χ²=0.07 |
0.79 |
|
平均绩点(过去1年) |
3.58±0.21 |
3.62±0.18 |
t=0.59 |
0.56 |
|
诊断结果 |
DeepSeek组 |
统计检验结果 |
|
|
诊断准确率/% |
90.0% |
90.0% |
χ²=0.00, P=1.00 |
|
平均用时/min |
12.8±2.1 |
14.5±2.6 |
t=3.42, P=0.001 |
表 4 各维度统计检验结果 [(`x±s,M(P25, P75), n=30)]
|
检验结果 |
效应量(Cohen's d) |
||||
|
3.68±0.71 |
4.12±0.64 |
t = 2.98 |
P = 0.004 |
0.65 |
|
|
2. 信息准确性 |
3.82±0.63 |
3.45±0.72 |
t =2.31 |
P = 0.024 |
0.54 |
|
3. 教学友好性 |
3.83 [3.50, 4.17] |
3.60 [3.20,3.90] |
U = 325 |
P = 0.018 |
— |
|
4. 灵活性和适应性 |
3.50±0.75 |
3.20±0.81 |
t = 1.99 |
P = 0.050 |
0.38 |
|
5. 技术体验性 |
3.75±0.68 |
3.35±0.73 |
t = 2.45 |
P = 0.017 |
0.57 |
|
条目 |
ChatGPT-4o组 |
DeepSeek组 |
t |
效应量Cohen's d |
|
|
1.1 语言自然度 |
3.72±0.68 |
4.28±0.49 |
4.12 |
< 0.001 |
0.93 |
|
1.2 情感反馈自然度 |
3.45±0.71 |
4.35±0.52 |
5.13 |
< 0.001 |
1.42 |
|
1.3 叙事性 |
3.65±0.63 |
3.85±0.67 |
1.66 |
0.102 |
0.31 |
|
2.1 信息一致性 |
4.12±0.58 |
3.68±0.63 |
2.74 |
0.009 |
0.73 |
|
2.2 细节无矛盾 |
4.25±0.55 |
3.82±0.72 |
3.14 |
0.003 |
0.67 |
|
2.3 信息范围合理 |
3.95±0.62 |
3.80±0.65 |
1.25 |
0.214 |
0.24 |
|
3.1 提升诊断思路 |
4.05±0.62 |
3.55±0.69 |
3.05 |
0.004 |
0.77 |
|
3.2 遗漏意识 |
3.80±0.58 |
3.65±0.72 |
1.36 |
0.182 |
0.23 |
|
3.3 有效提升问诊技能 |
4.20±0.55 |
3.85±0.67 |
2.65 |
0.011 |
0.58 |
|
4.1 合理避免提示遗漏 |
3.85±0.67 |
4.15±0.73 |
2.14 |
0.038 |
0.43 |
|
4.2 合理地追问深入 |
4.05±0.62 |
3.45±0.72 |
3.61 |
0.001 |
0.91 |
|
4.3 应对非标准提高灵活性 |
3.50±0.75 |
3.65±0.81 |
0.99 |
0.327 |
0.19 |
|
5.1 系统稳定 |
4.20±0.55 |
3.05±0.82 |
6.48 |
< 0.001 |
1.63 |
|
5.2 界面友好 |
3.95±0.58 |
3.85±0.67 |
0.83 |
0.412 |
0.16 |
|
5.3 交互趣味性 |
3.15±0.73 |
3.85±0.67 |
2.62 |
0.012 |
0.98 |