广告入驻
立即入驻

中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测

3月19日,为深入了解大模型的幻觉问题现状并推动其应用落地,中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作,正式发起大模型幻觉测试。本轮测试以大语言模型为对象,涵盖事实性幻觉和忠实性幻觉两种类型,测试数据包含7000余条中文样本,题型包括信息抽取、知识推理及事实判别等。

© 版权声明

相关文章