知识图谱入门基础,解析语义关系在大数据中的应用

您所在的位置:网站首页 testbench在哪里编写 知识图谱入门基础,解析语义关系在大数据中的应用

知识图谱入门基础,解析语义关系在大数据中的应用

2023-04-14 19:18| 来源: 网络整理| 查看: 265

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

知识图谱 Note and Thought

Abstract:随着信息化时代的演进,数据以TB、PB、EB的速度在增长,无线通信网络往4G、5G、6G推进,鸿蒙的全场景跨屏协作,万物互联的时代曙光慢慢展现出来。信息化远不止快速与存储那么简单,每个人也从不是一个独立的个体。知识图谱从强大的Google搜索开始,到推荐系统、智能机器人、问答系统、智能医疗等等的应用,一切归源于信息知识。

Keyword:笔记;知识图谱 1、知识图谱概念:是一种揭示实体之间关系的语义网络

在金庸小说《鹿鼎记》中,主角韦小宝的人物关系错综复杂,包含了满清朝廷、天地会、神龙教、罗刹国等多条人物关系线,将这些人物的关系进行梳理,就可以得到一个知识图谱。

img

知识图谱中包含了实体以及实体间的关系,例如韦小宝与双儿、建宁公主、阿珂、曾柔、苏荃、方怡、沐剑屏之间的情侣关系,康熙与韦小宝、多隆、鳌拜、吴三桂等的君臣关系,韦小宝与陈近南、九难师太等的师徒关系。每一个人物即是每一个实体,人物实体与人物实体之间构成了实体关系。

实体:代表了现实世界中的一个事物或者一个概念

关系:代表实体和实体之间的关联

2、知识图谱的主要形式

知识图谱可以说,由一条一条的知识构成,而每条知识表示为一个SPO三元组

SPO:Subject Predicate Object

这样的主谓宾结构,就是每一个简单句一样的

1e582b6fce383589f826ae29326510e1.jpg

这是一个有向图,A表示Subject主语,B表示Predicate谓语,C表示Object宾语,ABC构成了一个SPO结构,属于一条知识表示。

知识图谱常用的表现形式是三元组,构成的三元组可以有两种:属性三元组、关系三元组

- 属性三元组:(实体,关系,属性) - 关系三元组:(实体,关系,实体) 复制代码

例如:韦小宝是男的

韦小宝是一个实体,男性是属性,其中包含的属性是性别。则可以定义这个属性三元组为:(韦小宝,性别,男性)

例如:陈近南是天地会总舵主

陈近南是一个实体,天地会是一个实体,其中包含的关系是总舵主关系,则可以定义这个关系三元组为:(天地会,总舵主,陈近南)

3、结构化数据与非结构化数据

知识图谱的研究对象是实体,研究内容是实体属性和实体之间的关系。

实体间的关系与结构化挂钩,关系型数据库中的关系模型就是二维表格模型,一个关系型数据库就是由二维表及其之间的关系组成的一个数据组织。知识图谱只需要对结构化数据进行整合,就可以形成知识表示,而对于半结构化数据、非结构化数据,则要经过实体抽取、属性抽取、关系抽取一系列的知识抽取,形成初步的知识表示。

结构化数据:也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范。

包括所有关系型数据库,规范的Excel表格,CSV文件

id name age gender 1 xia 22 female 2 lian 19 male 3 zhao 18 male 复制代码 非结构化数据:数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。

包括所有格式的办公文档、TXT文本、图片、各类报表、图像和音频/视频信息等等。

A knowledge graph, also known as a semantic network, represents a network of real-world entities—i.e. objects, events, situations, or concepts—and illustrates the relationship between them. This information is usually stored in a graph database and visualized as a graph structure, prompting the term knowledge “graph.” 复制代码 半结构化数据:结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。

包括JSON格式数据文件,XML数据文件

A 18 male 复制代码

5dde66faab2dd3c4e2e7482cbb440bf2.png

4、知识图谱与语义网络

在表现形式上,语义网络和知识图谱相似,语义网络更侧重于描述概念与概念之间的关系,而知识图谱则偏重于描述实体之间的关联。

清华大学朱小燕教授新著作,《人工智能:知识图谱前沿技术》面世|知识图谱|清华大学|人工智能_新浪科技_新浪网 清华大学朱小燕教授新著作,《人工智能:知识图谱前沿技术》面世|知识图谱|清华大学|人工智能_新浪科技_新浪网

语义网络的基本概念- 华为云 语义网络的基本概念- 华为云

5、文章 reference

[1] 为什么需要知识图谱?什么是知识图谱?——KG的前世今生 zhuanlan.zhihu.com/p/31726910

[2] 什么是知识图谱? zhuanlan.zhihu.com/p/71128505

[3] 结构化数据、半结构化数据和非结构化数据 blog.csdn.net/liangyihuai…



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3