刘成健/季晓慧:基于知识图谱的中文矿物问答系统【ESWA, 2023】
2023-06-25 发布:bat365正版唯一官网 点击:352次
矿物知识的获取在矿物学研究中必不可少,目前可以通过Google等搜索引擎或相关专业矿物学在线数据库获取,但存在搜索引擎的答案不专业、矿物数据库无法回答用户自然语言输入等问题。
针对上述问题,我校bat365正版唯一官网硕士研究生刘成健在季晓慧副教授的指导下,提出了一种基于知识图谱的中文矿物问答系统,该工作的主要贡献如下:
(1) 通过两个基于BERT的深度学习模型从矿物学文献中提取知识,构建了一个专业的中文矿物知识图谱,以专业、准确、高效地为中文矿物知识问答提供知识源;
(2) 构建了基于BERT的深度学习模型来识别用户输入的自然语言问题的意图和实体/属性;
(3) 以预定义模板的形式解析矿物问题,用户输入的自然语言问题经意图和实体/属性识别后匹配相应问题模板生成查询语句并输入到构建的矿物知识图谱中,简洁高效地返回答案。
构建的矿物知识图谱包含22,568个实体和91,699个关系,比大多数地质知识图谱更丰富,所构建的矿物问答系统在测试集上的准确率为91.2%。
图1. 构建的矿物知识图谱(部分)
图2. 问答系统界面
上述成果发表在国际权威期刊《Expert Systems with Applications》:Chengjian Liu, Xiaohui Ji, Yuhang Dong, et al. Chinese mineral question and answering system based on knowledge graph[J]. Expert Systems with Applications, 2023: 120841.(IF=8.665,中科院一区,JCR一区)
全文链接:https://doi.org/10.1016/j.eswa.2023.120841
校址:北京市海淀区学院路29号 邮编:100083
版权所有 bat365正版唯一官网(Vip认证)Green App Store 文保网安备案:1101080023
校址:北京市海淀区学院路29号
邮编:100083
技术支持:信息网络与数据中心
@版权所有:www.hdqdsy.com
文保网安备案:1101080023