命名实体类

您所在的位置:网站首页 实体类别 命名实体类

命名实体类

2023-08-03 22:25| 来源: 网络整理| 查看: 265

什么是命名实体识别:

命名实体识别是将文本中的元素分成预先定义的类,如人名、地名、 机构名、时间、货币等等。作为自然语言的承载信息单位,命名实体识别 属于文本信息处理的基础的研究领域,是信息抽取、信息检索、机器翻译、 问答系统等多种自然语言处理技术中必不可少的组成部分。

传统的 NER 任务主要是对七大类的识别:

命名实体识别主要分类,一般包括 3 大类(实体类、时间类和数字类)和 7 小类(人名、地名、组织名、机构名、时间、日期、货币和百分比)。但随着 NLP 任务的不断扩充,在特定领域中会出现特定的类别,比如医药领域中,药名、疾病等类别。

slot filling 算是广义的 NER。

NER 会分限定域和开放域: NER 会针对具体 domain 区分,开放域的话应该就是指传统的三大类和七小类了。例如对话的 slot,比如说,特定领域:音乐领域,歌手,歌曲,曲风这些 slot。

Context-Dependent Fine-Grained Entity Type Tagging,https:// arxiv.org/abs/1412.1820,这篇文章提到一些细分的类别。

命名实体识别的应用场景: 知识图谱,文本理解,对话意图理解,舆情分析,对话 NLU 任务

目前做 NER 的主流方法是什么:

MLP->LSTM->LSTM/CNN+CRF->BiLSTM+CRF- >BiLSTM+CNN+CRF。 句法分析规则加概率方法

NER 常用的数据集、工具、评测任务有哪些?? NLTK 工具 Stanford NLP 工具 snownlp Spacy 也有 NER 功能,不过貌似支持英语和德语。

总结来看,常用的用 Stanford、NLTK、snownlp,另外也可使用哈工大 LTP 云和 bosonnlp api,虽然不见得效果就一定准确,但利用多种方式进行处理毕竟是方便些。

参考:http://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247484893&idx=1&sn=5a2cc2a381806d4a322587d35dfa3464&chksm=96e9da5da19e534b3e02b9354bee315ef6811ccd9feac4d02ee42eb3bae4550e00e272878f22&mpshare=1&scene=23&srcid=0703BR9bryjSOQox5FjLQEpe#rd



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3