技术编号:36711421
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本申请属于错误定位,特别涉及一种可解释类深度神经网络条件规则错误定位方法。背景技术、人工智能类的场景决策方法主要包括基于规则的专家系统和基于深度神经网络的自演进机器学习类方法。其中,基于深度神经网络的自演进机器学习类方法主要以深度学习和深度强化学习两种形式为主。深度强化学习一般被形式化为马尔可夫决策过程求解问题,智能体从当前环境获取观测,产生决策动作并与环境进行交互,环境根据智能体的表现反馈奖赏给智能体,智能体收到奖赏后不断修正自己的行为,好的奖赏将会激励智能体继续做出一致行为,相反,则将惩罚...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。