面向数字商业的开放知识图谱

        开放促进互联,连接创造价值,开放知识图谱是激活数据要素潜力的有力技术手段。数据的价值是在经济活动的信息交互过程中产生的——数据流通越开放,催生的应用场景越丰富;数据连接越充分,其价值也会得到不断放大和提升。秉承“利用开放的商业知识发现社会经济价值”的理念,我们发布首个大规模开放数字商业知识图谱AliOpenKG,第一个版本已包含了超过20亿的三元组,多达百万级核心概念,2681类关系。基于AliOpenKG中的商业要素知识,有利于深度理解零售数据,有利于数智驱动商品运营、商家成长,优化市场供需匹配, 有助于覆盖场景中更多问题,形成完整的以“场景需求”为导向的解决方案。依托于开放图谱中的行业知识与标准规范,有利于商业生态中各类数据要素的融合与流通,有利于数字商业和经济生态的发展,产生更多贴近产业核心需求的智能应用,进一步帮助中小企业数智化转型。利用开放的商业知识发现社会经济的价值,还可以促进数字商务数字经济等领域的交叉学科研究,服务数字经济健康发展的国家战略需求。我们还将基于该数据集建立面向垂域的知识图谱评测基准,进一步促进知识图谱技术的发展和在更多垂直领域的应用。

商业要素知识

大数据驱动的新零售带来人、货、场三大商业核心要素的全面升级,核心是全景式的重构核心商业要素之间的跨界关联关系。通过建模商业要素知识,利用知识图谱重构“人货场”三个基本要素的关系,有利于深入商业要素本质,研究“人、货、场”以及“人货场”的组合效率与规律,分析消费动机偏好场景,催生新的商业模式,赋能产业链条。

零售概念知识

概念是人类认知从具体进入抽象的第一步,也是人类认知世界的基石。概念知识图谱是一种特殊的知识图谱,在语义搜索、自动问答等场景具有广泛的应用价值。将产品分为不同粒度的概念层次结构,以便用户可以轻松地搜索和导航找到他们想要购买的商品。然而,以往的概念图谱构造方法通常只从文本中抽取高频率、粗粒度和静态的概念实例。在实际应用中,其较难覆盖长尾和细粒度概念知识,且存在更新困难的问题。针对这些问题,浙江大学和阿里巴巴的算法工程师们一起提出了一种全新的自动化概念图谱构建方法,并将其落地到了业务应用中。

生活常识知识

生活常识指的是人类在日常生活中总结出来的科学知识,涵盖了健康、饮食、营养、居家、生活小窍门等各方面。在自然语言处理中加入对客观事实的归纳的知识信息,可以促进深层语义理解。生活常识知识图谱,以复合值模板(Compound Value Template,CVT)为核心,旨在通过半自动化的方式关联生活常识知识,建立起常识知识体系。在常识建模过程中,我们不仅考虑一个陈述事实的合理性,还显式定义了常识的显著性分布。

标品实体知识

标准化是指在经济、科学、技术和管理等社会实践中,对重复性的概念和事务,通过制订、发布和实施标准达来到统一,以获得最佳秩序和社会效益。 数字商业知识图谱承载着产品标准化这一根源性、基础性的工作,通过知识表示来规范对产品数据的描述。基于标准产品实体知识库,可以对产品进行精准一致性推理、市场分析,进而基于大数据指导供应链端,使得传统制造业也能享受大数据时代的智能,促进制造业的升级。