技术编号:34166212
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。.本发明涉及自然语言处理领域,尤其涉及一种基于bert模型的文本数据处理方法及装置。背景技术.随着信息化时代的快速发展,用户经常会受到违规异常文本的骚扰。因此,需要对违规异常文本进行识别和拦截。现有技术通常通过正则匹配,谐音匹配,文字组合,文本黑名单等方式对用户违规异常文本进行拦截,通过在数据库中存储异常文本的关键词汇,并对发送中的文本进行词汇匹配,在异常文本关键词汇匹配成功时,对发送中的文本进行拦截;.但现有的拦截技术人力成本大,需要花费非常大的精力维护拦截语料库;但由于只能通过识别字体...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。