知识图谱
2 0 1 8 / 9 / 2 7
什么是知识图谱?
Ronaldo Luís Nazário de Lima
看到这个字符串,脑海里????
看到这幅图
片,他是一
个足球员
三
中文翻译:罗纳尔多·路易斯·纳扎里奥·达·利马
为了让机器能够理解文本背后的含义,我们需要对可描述
的事物(实体)进行建模,填充它的属性,拓展它和其他事
物的联系,即构建机器的先验知识。就以罗纳尔多这个例
子说明,当我们围绕这个实体进行相应的扩展,我们就可
以得到下面这张知识图。
关 系 图
三
KG的前世今生
语义网络(Semantic Network)。语义网络由相互连接的节点和边组成,节点表示概
念或者对象,边表示他们之间的关系。在表现形式上,语义网络和知识图谱相似,
但语义网络更侧重于描述概念与概念之间的关系,而知识图谱则更偏重于描述实体
之间的关联。
三元组
知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知
识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-
Predicate-Object),在三元组中,
•主语subject可以是IRI或者空节点(IRI我们可以看做是URI或者URL的泛化和推广,它
在整个网络或者图中唯一定义了一个实体/资源,和我们的身份证号类似 。)
•谓语predicate只能是IRI
•宾语object可以是IRI,字面量或者是空节
资源是可拥有 URI 的任何事物,属性是拥有名称的资源,属性值是某个
属性的值
知识图谱的基石:RDF
在知识图谱中,我们用RDF形式化地表示这种三元关系。RDF(Resource Description
Framework),即资源描述框架,是W3C制定的,用于描述实体/资源的标准数据模型,
使用 Web 标识符 (URIs) 来标识资源, RDF由节点和边组成,节点表示实体/资源、
属性,边则表示了实体和实体之间的关系以及实体和属性的关系。
RDF 指资源描述框架(Resource Description Framework)
RDF 是一个用于描述 Web 上的资源的框架
RDF 提供了针对数据的模型以及语法,这样独立的团体们就可以交换和使用它
RDF 被设计为可被计算机阅读和理解
RDF 被设计的目的不是为了向人们显示出来
RDF 使用 XML 编写
RDF 是 W3C 语义网络活动的组成部分
RDF 是一个 W3C 推荐标准
• RDF 陈述:
• 资源、属性和属性值的组合可形成一个陈述(被称为陈述的主体、谓语和客体)
• 请看一些陈述的具体例子,来加深理解:
• 陈述:"The author of http://www.runoob.com/rdf is David."
• 陈述的主体是:http://www.runoob.com/rdf
• 谓语是:author
• 宾语是:David
• 陈述:罗纳尔多的中文名是罗纳尔多·路易斯·纳扎里奥·达·利马.
• 陈述的主体是:罗纳尔多
• 谓语是:中文名
• 宾语是:罗纳尔多·路易斯·纳扎里奥·达·利马
那么“罗纳尔多的中文名是罗纳尔多·路易斯·纳扎里奥·达·利马”这样
一个三元组用RDF形式来表示就是:
“www.kg.com/person/1”是一个IRI,用来唯一的表示“罗纳尔多”这个实
体。”kg:chineseName”也是一个IRI,用来表示“中文名”这样一个属性。”kg:”是RDF
文件中所定义的pref