广告入驻

中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测

AI资讯8个月前发布人工智能

1,710 0 0

3月19日，为深入了解大模型的幻觉问题现状并推动其应用落地，中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作，正式发起大模型幻觉测试。本轮测试以大语言模型为对象，涵盖事实性幻觉和忠实性幻觉两种类型，测试数据包含7000余条中文样本，题型包括信息抽取、知识推理及事实判别等。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

文远知行成立智能科技新公司，注册资本6000万美元

人工智能

1,754

全国首个制造领域的城市级大模型中心正式开服

人工智能

1,712

DeepSeek开源周启动，首个开源代码库为高效MLA解码内核FlashMLA

人工智能

1,794

英特尔达成35亿美元芯片协议

人工智能

1,848

天奇股份成立人形机器人事业部，聚焦工业场景应用

人工智能

2,177

多家银行被要求不得过度宣传单一大模型使用情况

人工智能

1,725

作为人工智能领域的专业导航网站，我们为您提供以下服务：AI网址、AI行业动态、AI技术教程、AI资源下载等。我们的目标是成为您在人工智能领域的得力助手，助您在这个充满无限可能的领域中探索和发现。立即加入我们，开启您的智能生活之旅吧！

友链申请免责声明广告合作关于我们

Copyright © 2025 AI导航 | 人工智能工具集