3月19日,为深入了解大模型的幻觉问题现状并推动其应用落地,中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作,正式发起大模型幻觉测试。本轮测试以大语言模型为对象,涵盖事实性幻觉和忠实性幻觉两种类型,测试数据包含7000余条中文样本,题型包括信息抽取、知识推理及事实判别等。