白癜风专科医院哪里好 https://jbk.familydoctor.com.cn/bjbdfyy_js/

距离谷歌推出知识图谱产品已经九年了,它彻底改变了搜索,并引发了人们对知识图谱技术的兴趣。看大型科技公司,这种趋势最为明显。计算机无法像人脑一样理解网页内容,尽管自然语言处理(NLP)、计算机视觉(CV)和机器学习(ML)技术最近取得了进展。

知识图谱强调规模和关系。这使它非常适合人工智能驱动的任务,并推动了它在谷歌、苹果、优步等公司的采用。

知识图谱非常适合拥有大量数据集且提取知识通常是数据很繁重的企业。例如,一个企业可能会使用各种数据和内容管理系统,但都无法相互通信。数据的结构可能相互不兼容。或者,问题可能是文化问题,团队和部门之间几乎没有横向协作。

一、建立您的知识图谱团队

在尝试建立知识图谱团队时,您会发现自己很难找到具有第一手经验的合适人选。知识图谱是一项相对较新的创新,您的组织将被迫与财力雄厚的优步、Facebook和谷歌竞争人才。

有趣的是,这一趋势催生了一个新角色——知识科学家。知识科学家来自不同的背景,包括程序员、数据科学家和分类学家。归根结底,关键是你想从人类大脑中解放知识,并以机器可以利用的格式表达它。

二、打下基础

您应该从所有数据的清单开始,确定数据可能流动且易于更新和更改的地方。完成此过程时,始终注意“大数据的五个V”:

容量(数量)、速度、多样性(格式和结构)、准确性(准确性)和价值。这些要点将为您做出关于要包含哪些数据、优先考虑哪些数据以及忽略哪些数据的决策提供参考。

接下来,整合企业知识,通常以业务词汇表、数据字典或电子表格的形式与参考数据和其他相关信息相结合。一旦收集了这些数据资产,就可以开始建模,定义关系和层次结构。可以参考现有的开源例子,例如Schema.org和ConceptNet。

如果搜索“AppleComputers(苹果电脑)”,知识图谱会显示以下内容:

三、技术选型

最后要跨越的桥梁是:选择知识图谱的技术基础。其核心不可避免地是一个图数据库。这里有很多选择,包括商业的和开源的,有两个主要类别的图数据库:属性图和RDF三元组存储。两者都是知识图谱程序中非常有用的工具。

Neo4j或TigerGraph等属性图在构建知识图方面非常受欢迎。Neo4j尤其被开发人员认为易于上手,也可以被看作是一个高性能的图引擎。而图数据库TigerGraph则非常注重规模。

RDF是图数据的唯一标准化语言(使用SPARQL作为RDF数据的标准查询语言),并且它在设计时考虑到了网络规模,因此,值得考虑知识图谱的多少问题将集中在数据集成上,以及采用基于标准的解决方案。AllegroGraph和GraphDB是两种流行的RDF三元存储。

亚马逊云科技的Neptune图数据库实际上支持同一产品中的两种模型。

与任何雄心勃勃的技术项目一样,要了解痛点和需求,在无人区里创新,要考虑三个问题,是否值得做?是否能做成?如何去做到?

亲爱的数据,出品




本文编辑:佚名
转载请注明出处:网站地址  http://www.cqwpz.com/kcyzl/11337158.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 当前时间: