4.1 非结构化知识抽取概述

具体地,面向非结构化数据的知识抽取包括以下子任务:

命名实体识别

从文本中检测出命名实体,并将其归类到预定义的类别中。例如任务、组成、地点、时间等。

关系抽取

从文本中抽取实体及实体间的关系。例如,从句子“[比尔·盖茨]是微软的建立者”中识别初实体“比尔·盖茨”和“微软”之间具有“创建者-被创建者”的关系。

事件抽取

识别文本中关于事件的信息,并以结构化的形式呈现。例如,从新冠疫情的新闻报道中识别出新冠疫情爆发的地点,事件,感染人数以及对应爆发地的医疗储备等信息。

Last updated