报告由清华大学双聘教授@新媒沈阳团队发布,深入探讨AI幻觉现象,以DeepSeek为例展开多方面研究,为理解和应对AI幻觉提供了全面视角。
AI幻觉的定义与表现:AI幻觉指模型生成与事实不符、逻辑断裂或脱离上下文的内容,分为事实性幻觉和忠实性幻觉。如回答糖尿病患者能否用蜂蜜代替糖的问题时,出现与事实不符或偏离用户意图的答案。在实际应用中,DeepSeek在推荐地点时出现错误信息,OpenAI的Whisper在医疗转录中也存在大量幻觉,对相关领域产生严重负面影响。
AI幻觉产生的原因:数据偏差、泛化困境、知识固化和意图误解是AI产生幻觉的主要原因。训练数据的错误或片面性、模型处理复杂场景的能力局限、对参数化记忆的过度依赖以及对用户模糊提问的“自由发挥”,都可能导致幻觉的出现。

《DeepSeek与AI幻觉》
AI幻觉评测:通过随机生成提示语和抽取事实性幻觉测试题进行评测,结果显示不同大模型幻觉率存在差异,如DeepSeekV3、DeepSeekR1等在通用性和事实性测试中表现不同。推理能力与幻觉率存在双向作用机制,推理增强可能降低或增加幻觉率,取决于具体情况。
应对AI幻觉的方法:普通用户可采用联网搜索、双AI验证、提示词工程等方式应对。提示词工程包括知识边界限定和对抗性提示等多种策略。技术层面则可通过RAG框架、外部知识库、精细训练和评估工具等方案来减缓AI幻觉。
AI幻觉的创造力价值:AI幻觉在科学发现、文艺与设计、娱乐与游戏、技术创新等领域具有创造力价值。如大卫·贝克团队利用AI“错误折叠”获得诺贝尔化学奖,DeepMind团队发现AI图像分割的“超现实边界”提升自动驾驶系统识别精度,科学界还构建了新的研究流程。
总结与展望:AI幻觉既反映技术局限,也蕴含创新可能。我们应通过三角验证法等方式应对,同时理解和利用其创造力价值,在理性与狂想的交界处探索创新。