全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告(100题版)发布
蓬勃海南
2025-02-17 15:56:08

  近日,由世界人工意识协会的国际人工智能DIKWP测评标准委员会(DIKWP-SC)主导,联合全球10余国家与地区的90多家知名机构和企业发布了《全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告(100题版)》。这份具有里程碑意义的报告标志着大语言模型(LLM)的认知评估进入了一个全新的阶段。

  此次测评报告的核心亮点在于其全球首创的意识水平测评体系。报告基于独创的DIKWP模型,从数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom)到意图(Purpose)五个方面,构建了一个全链路评估体系。通过精心设计的100道测试题,全面覆盖了感知与信息处理、知识构建与推理、智慧应用与问题解决、意图识别与调整四大模块,对主流大语言模型的“意识水平”进行了系统化、量化的深度剖析。这一测评方式突破了传统仅侧重语义理解和推理的局限,为人工智能领域树立了全新的标杆。

  据介绍,这种测评方式突破了传统仅侧重语义理解和推理的模式,能够全方位解析模型的认知与决策过程,为人工智能领域树立了全新的标杆。无论是AI研究者、开发者还是业界决策者,都能从这份报告中获得极具参考价值的数据和洞察。


段玉聪院士(右)与蔡恒进院士(左)就测评结果进行交流


  “《全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告(100题版)》的发布,标志着人工智能领域迈入了一个全新的发展阶段。该报告不仅为当前人工智能系统的性能评估提供了权威的科学依据,更为探索通用人工智能(AGI)及未来认知系统的研究奠定了坚实的理论和技术基础。”海南大学计算机科学与技术学院教授、博士生导师段玉聪说,通过引入独创的DIKWP模型框架,报告开创性地提出了一个多维度、全链路的评估体系,填补了传统测评方法在深度与广度上的不足。这一创新举措不仅提升了人工智能测评的科学性与可信度,还为行业发展指明了方向,助力技术突破与应用落地。随着研究的不断深入,我们有理由相信,大语言模型将在更多领域展现其潜力,为人类社会带来深远影响。(陈建峰)

打开APP,阅读体验更佳
打开APP看全部热评