绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
检索详情页
首页 > 专利首页 > 命名实体识别方法、装置及计算机可读存储介质
添加标签
×
已添加(0/5):

推荐标签:

命名实体识别方法、装置及计算机可读存储介质
摘要: 本发明涉及一种人工智能技术领域,揭露了一种命名实体识别方法,包括:接收由待识别的原始语句组成的第一文本数据,并对所述第一文本数据进行预处理得到文本向量数据;获取具有多层结构的神经实体推理机识别模型,并对所述神经实体推理机识别模型进行训练;将所述文本向量数据输入训练后的所述神经实体推理机识别模型进行训练得到命名实体集合;将所述文本向量数据和所述命名实体集合输入...   查看全部>>
  • 专利类型:
    发明专利
  • 申请/专利号:
    CN201910825074.1
  • 申请日期:
    2019-09-02
  • 公开/公告号:
    CN110688854A
  • 公开/公告日:
    2020-01-14
  • 主分类号:
    G06F40/295(2020.01)  G  G06  G06F  G06F40 
  • 分类号:
    [G06F40/295(2020.01), G06F40/295]
  • 申请/专利权人:
  • 发明/设计人:
  • 主申请人地址:
    518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
  • 专利代理机构:
    深圳市沃德知识产权代理事务所(普通合伙)
  • 代理人:
    高杰%于志光
  • 国别省市代码:
    广东;44
  • 主权项:
    1.一种命名实体识别方法,其特征在于,所述方法包括: 接收由待识别的原始语句组成的第一文本数据,并对所述第一文本数据进行预处理得到文本向量数据; 获取具有多层结构的神经实体推理机识别模型; 将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合; 将所述文本向量数据和所述命名实体集合输入所述神经实体推理机识别模型中的推理机进行推理,得到命名实体。 2.如权利要求1所述的命名实体识别方法,其特征在于,所述神经实体推理机识别模型的每一层结构通过Bi-LSTM模型进行编码,并通过解码器进行解码,解码完成后的数据进入下一层结构再次进行编码和解码。 3.如权利要求2所述的命名实体识别方法,其特征在于,所述将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合包括: 输入经过预处理的所述文本向量数据; 利用所述Bi-LSTM模型对所述文本向量数据进行编码,得到编码表示序列和初始命名实体,将所述初始命名实体加入候选池; 将所述编码表示序列和所述候选池中的所述初始命名实体输入所述推理机中进行处理,得到引用信息; 将所述编码表示序列和所述引用信息输入解码器,得到预测标签,根据所述预测标签更新所述候选池,得到所述命名实体集合。 4.如权利要求3所述的命名实体识别方法,其特征在于,所述解码器包括: 其中,X表示经过上述预处理的所述文本向量数据,y表示经过所述神经实体推理机识别模型训练后得到的所述预测标签,yi表示所述神经实体推理机识别模型中第i层的预测标签,xt表示在t时刻文本向量x的值。 5.如权利要求1~4中任一项所述的命名实体识别方法,其特征在于,所述对所述第一文本数据进行预处理得到文本向量数据包括: 对所述第一文本数据进行分词操作得到第二文本数据,对所述第二文本数据进行去停用词操作得到第三文本数据,对所述第三文本数据进行去重操作得到第四文本数据; 对所述第四文本数据利用TF-IDF算法进行词向量形式转化,得到所述文本向量数据。 6.一种命名实体识别装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的命名实体识别程序,所述命名实体识别程序被所述处理器执行时实现如下步骤: 接收由待识别的原始语句组成的第一文本数据,并对所述第一文本数据进行预处理得到文本向量数据; 获取具有多层结构的神经实体推理机识别模型; 将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合; 将所述文本向量数据和所述命名实体集合输入所述神经实体推理机识别模型中的推理机进行推理,得到命名实体。 7.如权利要求6所述的命名实体识别装置,其特征在于,所述神经实体推理机识别模型的每一层结构通过Bi-LSTM模型进行编码,并通过解码器进行解码,解码完成后的数据进入下一层结构再次进行编码和解码。 8.如权利要求7所述的命名实体识别装置,其特征在于,所述将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合包括: 输入经过预处理的的文本向量数据; 利用所述Bi-LSTM模型对所述文本向量数据进行编码,得到编码表示序列和初始命名实体,将所述初始命名实体加入候选池; 将所述编码表示序列和所述候选池中的所述初始命名实体输入所述推理机中进行处理,得到引用信息; 将所述编码表示序列和所述引用信息输入解码器,得到预测标签,根据所述预测标签更新所述候选池,得到所述命名实体集合。 9.如权利要求8所述的命名实体识别装置,其特征在于,所述解码器包括: 其中,X表示经过上述预处理的所述文本向量数据,y表示经过所述神经实体推理机识别模型训练后得到的所述预测标签,yi表示所述神经实体推理机识别模型中第i层的预测标签,xt表示在t时刻文本向量x的值。 10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有命名实体识别程序,所述命名实体识别程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的命名实体识别方法的步骤。
  • 法律状态:
相关专利(与本文研究内容相同或相近的专利)
相关论文(与本文研究主题相同或者相近的论文)
我的标签
您可以为文献添加知识标签,方便您在书案中进行分类、查找、关联
请输入添加的标签
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部