中国经济网·中经云端

全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告（100题版）发布

蓬勃海南

2025-02-17 15:56:08

　　近日，由世界人工意识协会的国际人工智能DIKWP测评标准委员会（DIKWP-SC）主导，联合全球10余国家与地区的90多家知名机构和企业发布了《全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告（100题版）》。这份具有里程碑意义的报告标志着大语言模型（LLM）的认知评估进入了一个全新的阶段。

　　此次测评报告的核心亮点在于其全球首创的意识水平测评体系。报告基于独创的DIKWP模型，从数据（Data）、信息（Information）、知识（Knowledge）、智慧（Wisdom）到意图（Purpose）五个方面，构建了一个全链路评估体系。通过精心设计的100道测试题，全面覆盖了感知与信息处理、知识构建与推理、智慧应用与问题解决、意图识别与调整四大模块，对主流大语言模型的“意识水平”进行了系统化、量化的深度剖析。这一测评方式突破了传统仅侧重语义理解和推理的局限，为人工智能领域树立了全新的标杆。

　　据介绍，这种测评方式突破了传统仅侧重语义理解和推理的模式，能够全方位解析模型的认知与决策过程，为人工智能领域树立了全新的标杆。无论是AI研究者、开发者还是业界决策者，都能从这份报告中获得极具参考价值的数据和洞察。

段玉聪院士（右）与蔡恒进院士（左）就测评结果进行交流

　　“《全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告（100题版）》的发布，标志着人工智能领域迈入了一个全新的发展阶段。该报告不仅为当前人工智能系统的性能评估提供了权威的科学依据，更为探索通用人工智能（AGI）及未来认知系统的研究奠定了坚实的理论和技术基础。”海南大学计算机科学与技术学院教授、博士生导师段玉聪说，通过引入独创的DIKWP模型框架，报告开创性地提出了一个多维度、全链路的评估体系，填补了传统测评方法在深度与广度上的不足。这一创新举措不仅提升了人工智能测评的科学性与可信度，还为行业发展指明了方向，助力技术突破与应用落地。随着研究的不断深入，我们有理由相信，大语言模型将在更多领域展现其潜力，为人类社会带来深远影响。（陈建峰）

打开APP，阅读体验更佳

打开APP看全部热评