郑纬民院士:大语言模型出现“幻觉”可用知识图谱技术辅助解决

沈怡然2023-09-08 20:29

经济观察网 记者 沈怡然 9月8日,在海致科技知识图谱与大模型融合应用平台发布会上,中国工程院院士郑纬民表示,建议将知识图谱技术与大模型技术深度融合,有效解决大模型在企业级和工业界应用中出现的“幻觉”问题。                     

郑纬民是中国高性能计算和存储系统等方面的泰斗和先行者,也是清华大学计算机科学与技术系教授。海致科技成立于2013年,专注知识图谱和图计算技术,郑纬民曾在该公司设立“高性能图计算院士工作站”。

郑纬民在会上演示发布了由海致科技与高性能图计算院士工作站共同开发的“Atlas LLM知识图谱与大模型融合应用平台”,该平台面向广大B端用户,运用知识图谱帮助大模型在企业级和工业界应用中克服“幻觉”,实现基于行业与场景的精准推演。

大语言模型具备跨领域通用性、快速自主学习和自我改进能力,不仅用于内容创作产业,还被政府、金融、医疗机构当作新的生产工具。郑纬民表示,目前大模型存在“幻觉”问题,难以应用在容错率低、精确度高、较为严谨的工作领域。

简单说,“幻觉”就是大模型在人机对话中给出一些事实错误、推理错误,难以实时更新信息、没有时间概念,无法给专业领域提供可靠的回答。

郑纬民具体解释,由于大语言模型的基本工作方式是分析文本中的词汇、句法结构、语义信息等,并捕捉它们之间的模式和概率分布,因此,它更倾向于基于统计规律生成回答,而非进行深入的逻辑推理或形成高级的认知能力。另外,它在生成文本时可能会受限于训练数据中存在的偏见和误导性信息,在某些情况下可能会产生不准确或不合理的回答。

郑纬民表示,可以看出,模型并不能真正地理解语言,知识根据某些统计规律来连接它之前见过的片段,模型也不懂数据,缺乏严格的演绎推理能力。短期来看,单纯依靠大模型自身的迭代很难解决该问题。一个有效办法是,利用知识图谱技术帮助模型解决这些问题。

知识图谱也是人工智能学术体系中的关键技术之一,自2012年开始流行,是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法,这种技术具备可靠程度高、可解释性强、复杂推理能力强等优势。

郑纬民表示,知识图谱技术作为公认“类脑”的知识表达方式,通过对语义网络进行建模,以结构化的形式描述客观世界中实体及关系,已经被广泛用于知识推理。

可以说,知识图谱具备精确的知识推导能力,可以与大模型技术形成互补。郑纬民表示,在具体操作中,利用知识图谱对大模型进行辅助训练,可提高大模型的可控性,给大模型做领域适配,提高模型在某些专业领域的推理能力。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
大科创新闻部记者
关注硬科技领域,包括机器人及人工智能、无人机、虚拟现实(VR/AR)、智能穿戴,以及新材料领域。擅长企业深度报道及上市公司分析报道。发现前沿技术、发展趋势投资价值。