G知识图谱研讨会

北京哪些皮肤病医院好 http://pf.39.net/bdfyy/qsnbdf/150717/4658077.html

知识图谱

研讨会

地点:腾讯会议

时间:.2.:30

参会人数:13

Knowledge

Graph

什么是知识图谱?

知识图谱是结构化的语义知识库,即一种描述真实世界客观存在的实体、概念及它们之间关联关系的语义网络。通过对非结构化、半结构化等数据进行有效的加工、处理、整合,转换为简单清晰的三元组实体,关系,实体关系,最后对大量的知识进行融合,形成知识图谱。

图谱构建过程:信息抽取(实体抽取、关系抽取、属性抽取)、知识融合(实体链接[相似度计算]、知识合并)、知识加工(本体构建、知识推理、质量评估)。

研究方向

中医知识图谱构建及应用

研究内容

通过中医古籍、词典、医案等知识源,建立蕴含疾病、症状、证候、方剂、中药等核心概念的中医知识图谱,揭示中医相关证治、方证、药效等关系,实现中医知识的关联、整合与可视化。探究基于中医知识图谱的知识推理、智能问答、语音识别相关应用。

会议内容

1.李荣耀

李荣耀同学此次分享了有关论文《基于本草纲目的中药知识图谱构建及应用研究》的学习研究和实战内容,并向我们展示了《本草纲目》、中医语义网络的图谱构建过程。他通过python对《本草纲目》的文本进行处理,根据文本分解规则将文本进行分解,构建实体和关系,得到分解后的文本,其中文本分解规则分为正则表达式分解,标点符号分解,人工分解。面对文本数据的部分缺失、标点不规范等问题通过人工处理修改解决并得到了较好的结果,最后通过neo4j可视化展示了构建的知识图谱。

·本草纲目数据分析

·信息抽取过程

More

·文本处理结果可视化

荣耀关于研究过程的思考:无论是普通的白话文,还是文言文,所有简短的句子,只要有关系存在,就有实体存在。利用中医古籍中文言文用词简洁、言简意赅的特点,从已有的关系术语推出相应的文言文词汇,从而从文言文文本中获取关系,进而获取实体。

2.吴雨璐

吴雨璐同学分享了文本分词、词性标注、去停用词和关键词提取的方法,分享了关于歧义消解帮助文本分词的论文《面向中医文本分词的多特征歧义消除方法研究》。其研究思路主要是对文本分词的探索,实践过程对中医古籍的片段进行文本分词等操作。

·文本分词研究

More

·文本分词实践操作

3.周嘉玮

周嘉玮同学分享了有关《面向中医文本的关系抽取技术研究》论文的研究学习,该论文指出关系抽取采用组合模型BIGRU-CNN-ATT可能会获得较好的效果。其中讲到了关系抽取的三种方法:分别是基于模式匹配、基于机器学习和基于深度学习。接着嘉玮介绍了Neo4j的相关基础语法及数据导入过程。

·BIGRU-CNN-ATT模型

·Neo4j基础语法

Neo4j是目前最流行的图形数据库,以图形结构的形式存储数据,即节点,关系和属性。顶点和边都可以设置属性,顶点也称作节点,边也称作关系,每个节点和关系都可以有一个或多个属性。

4.霍颖欣

霍颖欣同学汇报了基于《伤寒杂病论》的知识图谱构建研究并分享了图谱构建中目前完成的部分内容,从原文文本结构相对清晰的部分入手,主要是症状与处方、处方与中药,借助文本特点,比如中药后面带有的剂量单位,通过python构建模板“症状,处方主之”,“处方(下一行:)中药”,将处方、中药从文本分离出来,然后导入neo4j构建知识图谱。分享过程提出了目前所遇到的问题:如何将症状实体从文本中提取出来。

·处方与中药

More

·症状与处方

5.蔡格格、周浩峰

研究内容:中医语音识别及应用

蔡格格同学汇报了近期有关中医视频语音识别后文本纠错相关研究的情况,包括以下内容:1.了解视频语音转文本的实现过程,通过github、csdn等查阅相关开源代码并学习实践。2.阅读文献,研究语音识别文本纠错的方法原理,查阅中医领域的文本纠错应用。

周浩峰同学分享了语音识别领域的相关论文,通过使用语音识别引擎,结合文本纠错技术,研究提高中医方言、中医术语等相关视频语音识别准确率。

总结

会议最后,刘秀峰教授赞扬了本次的汇报,同学们准备充分,对中医知识图谱的研究深入且成果丰富。同时建议以后汇报内容按提纲整理,尽量准备PPT,方便汇报者讲解及听众理解。

本次研讨会议内容精彩,相信大家对知识图谱也有了一定的了解。如果对中医知识图谱的研究感兴趣,欢迎加入我们的研讨会,科研路上我们相互陪伴,相互成长;如有更多想了解的问题也欢迎下方留言呀~下期见啦

扫码


转载请注明:http://www.holkv.com/wadwh/14617.html

  • 上一篇文章:
  • 下一篇文章: 没有了