一种基于AI识别的远程通话监控系统的制作方法

文档序号:23963407发布日期:2021-02-18 20:29阅读:81来源:国知局
一种基于AI识别的远程通话监控系统的制作方法
一种基于ai识别的远程通话监控系统
技术领域
[0001]
本发明涉及监控技术领域,特别涉及一种基于ai识别的远程通话监控系统。


背景技术:

[0002]
近年来,随着计算机多媒体技术高速发展,监狱信息管理正在逐步完善,监狱作为特殊受限环境,对电话系统有特殊要求,例如,要求通话过程中的可控性(根据通话内容强行插话或者挂断等),用以保证服刑人员及其家属的安全。
[0003]
为此,公开号为cn108012037a的中国专利公开了一种监狱外拨电话管理系统,包括:权限数据库和至少一个外拨通话装置。权限数据库,其内部针对每一个监控对象设有一个号码集合和一个声纹集合,号码集合中包含一个或者多个通讯号码,声纹集合中包含一个或者多个声纹特征,每一个声纹特征对应一个身份信息;权限数据库中,每一个监控对象均存储有身份信息和声纹特征;外拨通话装置,与权限数据库连接,其包括:声纹申请模块、拨号模块、话筒、声纹对比模块和异常预警模块;声纹申请模块用于获取监控对象声音,并根据声音提取声纹特征,还用于通过与权限数据库中各监控对象的声纹特征进行对比,确定监控对象身份;拨号模块用于拨打对外通话号码,拨号模块与声纹申请模块连接,用于将拨打号码与监控对象对应的号码集合进行对比,并根据对比结果对拨打号码进行挂断;话筒用于监控对象对外通话,并用于监控对象接听外来通话;声纹对比模块与话筒连接,用于针对话筒接收到的每一句通话提取声纹特征并与监控对象对应的声纹集合中的各预存的声纹特征进行对比;异常预警模块,与声纹对比模块连接,用于根据声纹对比模块的对比结果向预设对象进行预警。
[0004]
上述方案中,杜绝了原来外拨电话使用过程中通话对象与备案对象不一致的情况,提高了监管水平。但是上述方案仅适用于传统的语音通话,目前视频通话已经普及开来,由于视频通话中不仅有声音信息,还存在图像信息,仅仅针对声音信息进行监管难免出现漏洞。
[0005]
为此,需要一种通过ai识别,能对视频通话进行有效监管的监控系统。


技术实现要素:

[0006]
本发明提供了一种基于ai识别的远程通话监控系统,能够对视频通话进行有效监管。
[0007]
为了解决上述技术问题,本申请提供如下技术方案:
[0008]
一种基于ai识别的远程通话监控系统,包括:
[0009]
登陆模块,用于验证服刑人员的身份,当身份验证通过后,生成通话权限;
[0010]
拨号模块,用于在接收到通话权限后,获取服刑人员的拨打请求,并判断拨打请求是否符合预设要求,如果符合预设要求,拨出视频通话;拨打请求包括通话对象和通话号码;
[0011]
还包括:
[0012]
分析模块,用于获取视频通话中的图像,对图像进行识别,判断图像中人物的数量,如果人物的数量大于通话对象的数量,生成报警信息;如果人物的数量小于或等于通话对象的数量,还判断图像中人物是否与通话对象一致,如果不一致,生成警告信息;
[0013]
干预模块,用于在第一次接收到警告信息后,在视频通话中播放语音警告。
[0014]
基础方案原理及有益效果如下:
[0015]
与传统的语音通话相比,视频通话能传递的信息更多,监管难度也更大。本方案在服刑人员视频通话时,基于ai的识别技术,判断图像中人物的数量,还判断图像中人物是否与通话对象一致,能够保证服刑人员当前通话对象就是拨打请求中的通话对象,避免未经批准的人员和服刑人员进行沟通,监管效果好。
[0016]
进一步,所述分析模块还用于识别图像中人物的手势,将手势转换为文本信息,并判断文本信息中是否包含预设的违禁信息,如果包含,生成告警信息。
[0017]
由于视频通话不仅能依靠语音传递信息,还能依靠手势进行信息的传递,将手势也纳入识别的范畴,监管效果更好。
[0018]
进一步,所述分析模块还用于识别图像中的文字,判断文字中是否包含预设的违禁信息,如果包含,生成告警信息。
[0019]
在视频通话中,通话对象还能依靠在本子上写字,或者用显示屏显示文字等方式传递信息给服刑人员,将图像中的文字也纳入识别的范畴,监管效果更好。
[0020]
进一步,所述分析模块还用于识别图像中的物体,判断物体是否属于预设的违禁物体,如果属于,生成告警信息。
[0021]
能有效避免视频通话中出现违禁物体。
[0022]
进一步,所述分析模块还用于获取视频通话中的语音,将语音换为文本信息,并判断文本信息中是否包含预设的违禁信息,如果包含,生成告警信息。
[0023]
能够实现对语音对话的监管。
[0024]
进一步,所述分析模块还用于语音中提取当前声纹特征,将当前声纹特征与预存的通话对象的声纹特征进行对比,判断是否一致,如果不一致,生成告警信息。
[0025]
能有效识别通话对象在画面中只露脸不发声,而未经批准的人员在画面外和服刑人员进行语音沟通的情况,监管效果更好。
[0026]
进一步,所述干预模块还用于在第二次接收到警告信息后,切断视频通话。
[0027]
如果只是语音警告,对累犯的服刑人员威慑力不足,在第二次接收到警告信息后,切断视频通话,威慑力更强。
[0028]
进一步,还包括存储模块,存储模块用于在接收到告警信息后,对预设时长的视频通话进行存储。
[0029]
可以留存证据,便于管理人员查看。
附图说明
[0030]
图1为实施例一一种基于ai识别的远程通话监控系统的逻辑框图。
具体实施方式
[0031]
下面通过具体实施方式进一步详细说明:
[0032]
实施例一
[0033]
如图1所示,本实施例的一种基于ai识别的远程通话监控系统,包括登陆模块、拨号模块、分析模块、干预模块和存储模块。
[0034]
登陆模块用于验证服刑人员的身份,当身份验证通过后,生成通话权限。身份验证的方式可以是人脸识别、指纹识别、指静脉识别中的一种或多种,本实施例中采用人脸识别和指静脉识别的双重身份验证,确保只有服刑人员本人能够进行视频通话。
[0035]
拨号模块用于在接收到通话权限后,获取服刑人员的拨打请求,并判断拨打请求是否符合预设要求,如果符合预设要求,拨出视频通话。拨打请求包括通话对象和通话号码。由于是视频通话,视频画面里可以容纳多个人,所以通话对象可以是多个,例如同时和父亲、母亲进行通话。
[0036]
本实施例中,存储模块中存储有每一位服刑人员的家属白名单,通话对象需要是家属白名单中的人员。家属白名单中的每一位人员还预先采集通话号码、人脸图像和声纹特征。
[0037]
预设要求包括服刑人员当前状态、可拨打时段、当前剩余通话次数、账户余额和家属白名单等。例如服刑人员只要出现当前状态为禁止拨打中,当前拨打时段在可拨打时段外,当前剩余通话次数为0,账户余额不足,通话对象不在家属白名单内,当前通话号码与预先采集的通话号码不一致中的一种情况时,则不符合预设要求。
[0038]
存储模块中还存储有违禁信息和违禁物品,本实施例中违禁信息包括若干与犯罪相关的关键词;违禁物品包括枪支、炸药、管制刀具等。
[0039]
分析模块用于获取视频通话中的图像,对图像进行识别,判断图像中人物的数量,如果人物的数量大于通话对象的数量,生成报警信息;如果人物的数量小于或等于通话对象的数量,还判断图像中人物是否与通话对象一致,如果不一致,生成警告信息。例如服刑人员想同时和父亲、母亲通话,接通后只有母亲在,故人物的数量小于通话对象的数量是允许的。
[0040]
分析模块还用于识别图像中人物的手势,将手势转换为文本信息,并判断文本信息中是否包含预设的违禁信息,如果包含,生成告警信息。手势识别属于现有技术,具体识别过程这里不再赘述。
[0041]
分析模块还用于识别图像中的文字,判断文字中是否包含预设的违禁信息,如果包含,生成告警信息。
[0042]
分析模块还用于识别图像中的物体,判断物体是否属于预设的违禁物体,如果属于,生成告警信息。
[0043]
分析模块还用于获取视频通话中的语音,将语音换为文本信息,并判断文本信息中是否包含预设的违禁信息,如果包含,生成告警信息。
[0044]
分析模块还用于从语音中提取当前声纹特征,将当前声纹特征与预存的通话对象的声纹特征进行对比,判断是否一致,如果不一致,生成告警信息。
[0045]
干预模块用于在第一次接收到警告信息后,在视频通话中播放语音警告;干预模块还用于在第二次接收到警告信息后,切断视频通话。本实施例中,语音警告为:警告,发现违规行为,请立即纠正,如果再次出现,将切断视频通话。
[0046]
存储模块还用于在接收到告警信息后,对预设时长的视频通话进行存储。本实施
例中,预设时长为1分钟,具体以接收到告警信息为时间线中点,分别向前和向后延伸30秒。可以留存证据,便于管理人员查看。分别向前和向后延伸30秒,便于管理人员知晓前因后果。
[0047]
实施例二
[0048]
本实施例和实施例一的区别在于,本实施例中还包括解锁模块,用于采集管理人员的身份信息并验证,在验证通过后,解锁视频通话功能。
[0049]
可以方便狱警等管理人员进行管理,根据实际情况选择什么时候解锁视频通话功能。在解锁视频通话功能后,服刑人员才能进行登陆。
[0050]
实施例三
[0051]
本实施例和实施例一的区别在于,本实施例中还包括监控模块,用于实时查看视频通话。便于狱警等管理人员,通过监控模块人工对服刑人员的视频通话进行监管。
[0052]
实施例四
[0053]
本实施例与实施例一的区别在于,本实施例中,分析模块在识别图像中人物的手势,将手势转换为文本信息时,如果无法识别手势的含义;分析模块还用于记录图像中所有人物的每一个手势以及打手势时的表情,并判断每一个人物预设时间内手势的重复度,和预设时间内的表情是否严肃;如果重复度低于阈值且表情严肃,分析模块还用于判断该人物的沟通对象在同一时间内是否有输出反馈信息,或预设时间内手势的重复度是否低于阈值,如果有输出反馈信息,或预设时间内手势的重复度低于阈值,生成告警信息。本实施例中沟通对象是相对的,服刑人员和服刑人员选择的通话对象互为对方的沟通对象。
[0054]
本实施例中,反馈信息包括可以、好的、ok、没问题、点头等确认性质的信息,还包括不行、办不到、不可以、我不能、摇头等否定性质的信息。具体的,分析模块可以将语音换为文本信息,或者将标准的手势(例如ok的手势)转换为文本信息后,在文本信息中识别出反馈信息;例如“可以、好的、ok、没问题、不行、办不到、不可以、我不能”等。分析模块还可以识别图像中人物的动作变化,来识别点头、摇头等反馈信息。
[0055]
服刑人员和通话对象如果想在逃避监管的情况下传递信息,其中一方会倾向于使用双方能看懂的特定手势给另外一方进行表达,这样的手势和语言障碍人群使用的手语中的手势存在区别,不属于标准的手势,分析模块无法识别其含义,如果无法对这一行为进行自动监管,会存在巨大的漏洞。
[0056]
本实施例中,在这种情况下,分析模块识别到一方的手势重复度低于阈值且表情严肃时,可能就是在使用特定手势传达信息,但是仅依靠一方进行判断,准确度还不够高,本实施例中,还结合该人物的沟通对象进行判断,如果该人物的沟通对象在同一时间内有输出反馈信息,或预设时间内手势的重复度低于阈值时,此时使用特定手势传达信息的可能性较高,故生成告警信息,可以有效阻止这一行为的继续发生。
[0057]
本实施例中,设定预设时间内手势的重复度低于阈值的条件,可以将人在正常语言表达时,自然的比划排除掉,因为这样的比划通常重复度较高,例如有的人说话时会习惯于五指并拢手心朝上。而表情严肃可以表明在认真传递信息,作为判断的条件之一,可以提高判断的准确度。
[0058]
以上的仅是本发明的实施例,该发明不限于此实施案例涉及的领域,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先
权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1