商业要素知识建模

        建立一套基于消费者需求场景的知识图谱本体体系来组织商品,以解决业务痛点,并把知识沉淀到图谱中。经过挖掘和推理,我们构建了海量事件与传统商品类目属性之间的关系,例如去游泳这一场景需要购买哪些品类的商品,具体到手表类目,需要商品属性有防水功能。我们利用逻辑语言来描述这些深度知识。场景又和人群、时间、地点、方式等组合,就产生了海量消费者购物场景知识。

0
核心本体知识
0
概念体系知识
0
实体关系知识
0
规则型知识

知识建模概览

基于多源异构的数据,从多角度、多层次、多粒度对消费者购物场景进行知识建模。从知识类型来看,包含表示购物场景核心概念和关系的连接和语义约束的核心本体类目知识建模、表示购物场景核心概念之间层次的概念体系知识建模、表示购物场景中实例之间的关系的实体关系知识建模、表示适用于可迁移的购物场景推理的规则型知识建模、非结构化描述购物场景的文本型知识建模。

核心本体知识

主要包含核心类(class)和属性知识,这里的类是语义知识相对丰富的对象,属性知识主要包括类的上下位、等价以及不同类之间的关系。核心类的上下位知识用rdfs:subClassOf来表征,比如:(大米, rdfs:subClassOf, 米类),等价关系用owl:equivalentClass来表征。本次发布的开放的数据商业知识图谱包含3种核心超类,即产品类目、品牌、产地。核心类和属性共计463,486种。

概念体系知识

主要涉及核心概念(concept)的上下位层级知识,这里的核心概念是相对简单的对象,会和核心类之间产生关联,这部分的知识用skos来建模。核心概念的上下位层级知识可用skos:broader来表征,比如:(做饭团, skos:broader, 吃粥饭米食)。本次发布的开放的数据商业知识图谱包含5大类核心概念,即场景、主题、时间、人群、细分市场。核心概念共计670,774种。

实体关系知识

主要包括核心类和概念的实例之间的关系,以及实例本身的属性信息。实例通过rdf:type来表征和核心类/概念的实例化关系,比如(优质东本大米, rdf:type, 大米);通过一系列对象属性来表征实例之间的关系,比如 (优质东本大米, relatedScene, 做饭团);通过一系列数据属性来刻画实例的属性信息,比如 (优质东本大米, 储存条件, 常温)。

规则型知识

主要包括图谱中的一些数据规范,可用于不一致性检测等一系列本体推理任务,定义为知识图谱本体中的一些axioms,这部分的知识可以用一系列规则推理模型来建模。比如,(产品A, 含糖量, 0%) ==> (产品A, rdf:type, 无糖食品)。目前图谱沉淀了二十几万条的规则型知识,待发布。

文本型知识

主要涉及核心类/概念的标题以及他们对应的文本描述,这部分的知识可以用语言模型来建模。比如:一个标准产品实例的标题为“优质东北大米”,对应的描述文本为“东北长粒香大米,优质东北大米,吉林梅河口特产香米系列,精选优质大米,产地环境好,温差大,土壤肥沃,米粒均匀,口感醇厚,颗粒饱满,非常香。”。