一种基于互联网的智能交互系统的制作方法

文档序号:9547241阅读:387来源:国知局
一种基于互联网的智能交互系统的制作方法
【技术领域】
[0001]本发明涉及一种智能交互方法,更具体的说是涉及一种基于互联网的智能问答方法。
【背景技术】
[0002]在传统的智能交互中,智能交互的一般采用模板方式来应对复杂的对话,准确度较低,或者对信息进行各种分词后进行分析,但一般的分词结果种类多,准确度较低。

【发明内容】

[0003]本发明公开了一种基于互联网的智能交互系统,包括以下步骤:
[0004]A、对用户发出的信息进行分词;
[0005]B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
[0006]C、对步骤A所述分词后的字、词及词组进行语义标注分析;
[0007]D、对步骤A所述分词后的字、词及词组进行文本纠错;
[0008]E、对用户发出的信息进行句法分析;
[0009]F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
[0010]G、对用户发出的信息进行上下文处理;
[0011]H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;
[0012]1、根据阈值结果查询预设知识库,返回结果给用户。
[0013]所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
[0014]所述步骤D中的文本纠错包括在领域的业务类词及词组进行拼音纠错;
[0015]所述步骤F中的句法分析采用规则和标注方法。
【附图说明】
[0016]图1-本体及实例化、继承的实例
[0017]图2-词类管理
[0018]图3-同义词,权重校正
【具体实施方式】
[0019]本发明公开了一种基于互联网的智能交互系统,包括以下步骤:
[0020]A、对用户发出的信息进行分词;
[0021]分词是计算机语言学或人工智能领域的常用技术手段,一般采用“最大匹配分词法”或“最大概率法分词”,
[0022]B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
[0023]对于实体,是本体的实例化,
[0024]所谓本体,是对概念的一种明确且详细的说明,是对现实世界的一种描述方法。或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达。一般包含:
[0025]——具体的本体实例(对象Object)
[0026]——本体的属性
[0027]——所属的本体类别。
[0028]本体实例化后,就可以继承本体的属性,为其后的语义标注分析做好准备;
[0029]具体来说,如附图1,对于银行业务有很多基础业务,所有的基础业务就是一种本体,对于某一种具体的本体,比如办理规则,营销活动就是一种对基础业务的继承,其所有的属性就可以继承下来。
[0030]C、对步骤A所述分词后的字、词及词组进行语义标注分析;
[0031]对于语义标注分析,包括词性标注和词义标注两个部分:
[0032]对于词性标注:一般采用隐马尔科夫模型或者基于转换的错误驱动的磁性标注方法;
[0033]对于词义标注:一般采用基于互信息的词义排歧方法或基于词典的排歧方法;
[0034]对于该步骤,当用户在机器人前端输入一个问题,这个问题会首先进行分词处理,然后根据分词的结果进行匹配,因此词类的建设优劣,与机器人的智能程度紧密相连。对词类的增删和修改都可在【词类管理】中实现。
[0035]如图2,【词类管理】标签下有“公用词类”,“专有词类”,其中“公用词类”下为本体类属性对应的词类,“专有词类”下为项目自定义的特有词类。
[0036]D、对步骤A所述分词后的字、词及词组进行文本纠错;
[0037]E、对用户发出的信息进行句法分析;
[0038]F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
[0039]如图3,选择需要挂入的分类右单击,在菜单中选择【新建子分类】,在弹出框内填入类型名称保存完成。
[0040]本系统中,类别名称旁边标注的“ * ” “ # ”分别用来区分词类的重要度及相似度, 代表重要,权重较高;“#”代表不相似,相似度很低代表该分类下的词具有拼音纠错功能。子分类自动继承父级分类的设定。
[0041]本系统还会根据用户数据日志来调整权重。例如:“不”字基于统计学不重要,但经过统计分析,“不”字出现及句尾比例较高,其含义完全不同,所以当“不”字出现在句尾时,例如“我能开通彩铃不”调整“不”字权重。
[0042]G、对用户发出的信息进行上下文处理;
[0043]H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;
[0044]此外,本系统还可以实现“语义表达式与普通问句的混合运算”,
[0045]例如:一个标准问为:“化妆品标识夸大功效、虚假表示,如何查处? ”
[0046]对应该标准问的语义表达式可分解为:[化妆品|化妆品牌][虚假][标志][惩罚][方法?]
[0047]对应该标准问的某一扩展问为:“化妆品标识标注虚假的信息,对于这种行为工商局采取什么方法惩处”
[0048]假设知识库内包含上述知识,系统对用户给出的信息可以进行混合处理。即判断用户的问题如贴近于标准问可直接回答;如可分解成语义表达式,则依据语义表达式回答;如不能分解成语义表达式而贴近于扩展问,则依据扩展问回答;而非单独采用上述任意一方式,以获得最大阈值。即最吻合用户需求的答案。
[0049]1、根据阈值结果查询预设知识库,返回结果给用户。
[0050]所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
[0051]具体来说,经过根据上述方面进行语义标注分析过后,分过的词的语义准确,歧义基本消除。
[0052]所述步骤D中的文本纠错包括在领域的业务类词及词组进行拼音纠错;
[0053]所述步骤E中的句法分析采用规则和标注方法。
【主权项】
1.一种基于互联网的智能交互系统,所述系统采用以下步骤对用户信息进行处理:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;G、对用户发出的信息进行上下文处理;H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;1、根据阈值结果查询预设知识库,返回结果给用户。2.根据权利要求1所述的一种基于互联网的智能交互系统,其特征在于:所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。3.根据权利要求1所述的一种基于互联网的智能交互系统,其特征在于:所述步骤D中的文本纠错包括在领域的业务类词及词组进行拼音纠错。4.根据权利要求1所述的一种基于互联网的智能交互系统,其特征在于:所述步骤E中的句法分析采用规则和标注方法。
【专利摘要】一种基于互联网的智能交互系统,所述系统采用以下步骤对用户信息进行处理:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;G、对用户发出的信息进行上下文处理;H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;I、根据阈值结果查询预设知识库,返回结果给用户。
【IPC分类】G06F17/30, G06F17/27
【公开号】CN105302859
【申请号】CN201510603622
【发明人】李波, 曾永梅, 姚贡之, 朱频频
【申请人】上海智臻智能网络科技股份有限公司
【公开日】2016年2月3日
【申请日】2015年9月21日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1