4.1 非结构化知识抽取概述
具体地,面向非结构化数据的知识抽取包括以下子任务:
命名实体识别
从文本中检测出命名实体,并将其归类到预定义的类别中。例如任务、组成、地点、时间等。
关系抽取
从文本中抽取实体及实体间的关系。例如,从句子“[比尔·盖茨]是微软的建立者”中识别初实体“比尔·盖茨”和“微软”之间具有“创建者-被创建者”的关系。
事件抽取
识别文本中关于事件的信息,并以结构化的形式呈现。例如,从新冠疫情的新闻报道中识别出新冠疫情爆发的地点,事件,感染人数以及对应爆发地的医疗储备等信息。
Last updated
Was this helpful?