1.一种电网风险文本分词方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的电网风险文本分词方法,其特征在于,对所述电网风险中文文本词汇数据进行多次预处理,具体包括:
3.根据权利要求2所述的电网风险文本分词方法,其特征在于,在词性标注中,将代词标注为r、并列连词标注为c、助词标注为u、语气词标注为y、数词标注为m、量词标注为q。
4.根据权利要求1所述的电网风险文本分词方法,其特征在于,在使用深度学习bilstm+crf的方法中,bilstm为两个lstm倒置组件模型,该模型的更新和输出公式如下:
5.根据权利要求1所述的电网风险文本分词方法,其特征在于,进行分词效果统计,并进行统计分析,具体为:
6.根据权利要求1所述的电网风险文本分词方法,其特征在于,所述双阶段电网风险文本序列分词模型进行权重分配时,具体按照下式进行:
7.一种电网风险文本分词装置,其特征在于,包括:
8.根据权利要求7所述的电网风险文本分词装置,其特征在于,在所述模型构建模块中,所述双阶段电网风险文本序列分词模型进行权重分配时,具体按照下式进行:
9.一种计算机设备,其特征在于,包括:存储器和处理器及存储在存储器上的计算机程序,当所述计算机程序在处理器上被执行时,实现如权利要求1至6中任一项所述的电网风险文本分词方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器运行时,实现如权利要求1至6中任一项所述的电网风险文本分词方法。