知识图谱——技术与行业应用
2022年10月14日 10:46 发布者:龙腾亚太
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。随着移动互联网的发展,万物互联成为了可能,这种互联所产生的数据也在爆发式地增长,而且这些数据恰好可以作为分析关系的有效原料。如果说以往的智能分析专注在每一个个体上,在移动互联网时代则除了个体,这种个体之间的关系也必然成为我们需要深入分析的很重要一部分。 在一项任务中,只要有关系分析的需求,知识图谱就“有可能”派的上用场。知识图谱的表示知识图谱应用的前提是已经构建好了知识图谱,也可以把它认为是一个知识库。这也是为什么它可以用来回答一些搜索相关问题的原因,比如在Google搜索引擎里输入“Who is the wife of Bill Gates?”,我们直接可以得到答案-“Melinda Gates”。这是因为我们在系统层面上已经创建好了一个包含“Bill Gates”和“Melinda Gates”的实体以及他俩之间关系的知识库。所以,当我们执行搜索的时候,就可以通过关键词提取("Bill Gates", "Melinda Gates", "wife")以及知识库上的匹配可以直接获得最终的答案。这种搜索方式跟传统的搜索引擎是不一样的,一个传统的搜索引擎它返回的是网页、而不是最终的答案,所以就多了一层用户自己筛选并过滤信息的过程。知识图谱的存储知识图谱主要有两种存储方式:一种是基于RDF的存储;另一种是基于图数据库的存储。它们之间的区别如下图所示。RDF一个重要的设计原则是数据的易发布以及共享,图数据库则把重点放在了高效的图查询和搜索上。其次,RDF以三元组的方式来存储数据而且不包含属性信息,但图数据库一般以属性图为基本的表示形式,所以实体和关系可以包含属性,这就意味着更容易表达现实的业务场景。
总之知识图谱是一个既充满挑战而且非常有趣的领域。只要有正确的应用场景,对于知识图谱所能发挥的价值还是可以期待的。我相信在未来不到2,3年时间里,知识图谱技术会普及到各个领域当中。
分享安排一、知识图谱概论1.1知识图谱的起源和历史1.2知识图谱的发展史——从框架、本体论、语义网、链接数据到知识图谱1.3知识图谱的本质和价值1.4知识图谱VS传统知识库VS关系数据库1.5经典的知识图谱1.5.1经典的CYC, WordNnet, WikiData, DBpedia, YAGO, NELL等知识库1.5.2行业知识图谱:Google知识图谱,微软实体图,阿里知识图谱,医学知识图谱,基因知识图谱等知识图谱项目
二、知识图谱应用2.1知识图谱应用场景2.2知识图谱应用简介2.2.1知识图谱在数字图书馆上的应用 2.2.2知识图谱在国防、情报、公安上的应用2.2.3知识图谱在金融上的应用 2.2.4知识图谱在电子商务中的应用2.2.5知识图谱在农业、医学、法律等领域的应用2.2.6知识图谱在制造行业的应用2.2.7知识图谱在大数据融合中的应用 2.2.8知识图谱在人机交互(智能问答)中的应用
三、知识表示与知识建模3.1知识表示概念3.2 知识表示方法a.语义网络 b.产生式规则 c.框架系统 d.描述逻辑 e.本体 f.RDF和RDFSg.OWL和OWL2 Fragments h.SPARQL查询语言i.Json-LD、RDFa、HTML5 MicroData等新型知识表示3.3典型知识库项目的知识表示3.4知识建模方法学3.5知识表示和知识建模实践1.三国演义知识图谱的表示和建模实践案例2.学术知识图谱等
四、知识抽取与挖掘4.1知识抽取基本问题a.实体识别 b.关系抽取 c.事件抽取4.2数据采集和获取4.3面向结构化数据的知识抽取a.D2RQ b.R2RML4.4面向半结构化数据的知识抽取 a.基于正则表达式的方法 b.基于包装器的方法4.5.面向非结构化数据的知识抽取a.实体识别技术(基于规则、机器学习、深度学习、半监督学习、预训练等方法)b.关系抽取技术(基于模板、监督、远程监督、深度学习等方法)c.事件抽取技术(基于规则、深度学习、强化学习等方法)4.6.知识挖掘a.实体消歧b.实体链接c.类型推断 d.知识表示学习4.7知识抽取上机实践A.面向半结构化数据的三国演义知识抽取B.面向文本的三国演义知识抽取C.人物关系抽取
五、知识融合5.1知识融合背景5.2知识异构原因分析5.3知识融合解决方案分析5.4.本体对齐基本流程和常用方法a.基于文本的匹配 b.基于图结构的匹配 c.基于外部知识库的匹配e.不平衡本体匹配 d.跨语言本体匹配 f.弱信息本体匹配5.5实体匹配基本流程和常用方法 a.基于相似度的实例匹配 b.基于规则或推理的实体匹配c.基于机器学习的实例匹配 d.大规模知识图谱的实例匹配(1)基于分块的实例匹配(2)无需分块的实例匹配(3)大规模实例匹配的分布式处理5.6 知识融合上机实践1.百科知识融合 2.OAEI知识融合任务
六、存储与检索6.1.知识图谱的存储与检索概述6.2.知识图谱的存储 a.基于表结构的存储 b.基于图结构的存储6.3.知识图谱的检索a.关系数据库查询:SQL语言 b数据库查询:SPARQL语言 6.4.上机实践案例:利用GraphDB完成知识图谱的存储与检索
七、知识推理7.1.知识图谱中的推理技术概述7.2.归纳推理:学习推理规则 a.归纳逻辑程设计Øb.关联规则挖掘 c.路径排序算法上机实践案例:利用AMIE+算法完成Freebase数据上的关联规则挖掘7.3.演绎推理:推理具体事实Ø a.马尔可夫逻辑网 b.概率软逻辑7.4.基于分布式表示的推理a. TransE模型及其变种 b.RESCAL模型及其变种c.(深度)神经网络模型介绍 d.表示学习模型训练7.5.上机实践案例:利用分布式知识表示技术完成Freebase上的链接预测
八、语义搜索8.1.语义搜索概述8.2.搜索关键技术a.索引技术:倒排索引 b.排序算法:BM25及其扩展8.3.知识图谱搜索a.实体搜索b.关联搜索8.4.知识可视化 a.摘要技术8.5.上机实践案例:SPARQL搜索
九、知识问答9.1.知识问答概述 9.2.知识问答基本流程9.3.相关测试集:QALD、WebQuestions等9.4.知识问答关键技术 a.基于模板的方法 b.语义解析 c.基于深度学习的方法9.5.上机实践案例:DeepQA、TemplateQA学习和关注人工智能技术与咨询,了解更多资讯!!!