专利名称:垃圾传真过滤器的制作方法
技术领域:
本发明涉及传真设备领域,尤其涉及到传真设备中垃圾传真图像的处理。
相关领域传真设备一直是仅次于电话的商业通信的第二大主要方式。当前,在世界范围内已经开发出超过八千五百万种传真设备,并且超过5亿到10亿个传真电话号已经被广为散布。因此,直接销售产业以其将电话和电子邮件用作直接广告模式的相同方式来将传真图像结合成用于大众广播销售信息的一种手段也就不足为怪了。
在过去,印刷介质用作直接销售产业部分的自发大众广告的主要形式。通常被称作“垃圾邮件”,自发印刷销售材料可以成批传递到有巨大选择性的接收者手中,而不论该接收者是否要求该销售信息。由于百分之一到二的响应比例,垃圾邮件已经成为产生新的销售渠道的有效工具。但是,垃圾邮件的接收者通常对收到垃圾邮件很恼火。此外,对于重要的“邮筒”来说,发送垃圾邮件的邮资是很昂贵的。因此,直接销售产业一直在寻找用于传递自发销售材料的等效但相对廉价的形式。
由于将电子邮件发送到大量的目标接收者手中是无需邮资的,因此电子邮件的出现已经对直接销售者提供了很多必要的缓和。此外,自发电子邮件的传递可以是瞬间的事情,并且自发电子邮件可以包括对产品或服务信息的嵌入式超链接,从而有助于提高对“邮筒”的响应比例。但是,在印刷媒体的世界中,通常被称为“垃圾”的自发电子邮件对于世界范围的用户来说仍然是一种烦恼。结果,“垃圾过滤器”的整个家庭手工业已经出现,它的任务就是要除掉垃圾。
类似于电子邮件,传真媒体仍然是一种用于广播销售的大众媒体。但是不同于电子邮件,用户用传真媒体来接收垃圾是有真实成本的。具体地,单单是垃圾传真图像不仅消耗纸张和墨粉资源,而且还占用本来可用于发送流出传真或者是接收合法流入传真的电信带宽。在联合王国中,估计每个英国公司每年在传真方面要支出超过三百七十六英镑的垃圾成本。在美国,估计每年在传真方面的垃圾成本高达九十亿美元!对主题垃圾传真已经展开严肃而激烈的争论,密苏里州已经成功地依照1991年的电话用户保护法案(下文称之为“TCPA”)的227款对两家最大的垃圾传真组织提出指控,该项诉讼受到了阿拉斯加、阿肯色、加州、卡洛拉多、康涅狄格、佛罗里达、爱达荷、伊利诺伊、爱荷华、肯塔基、马里兰、密歇根、明尼苏达、新墨西哥、俄勒冈、南达科他、德克萨斯、佛蒙特、西弗吉尼亚各州和哥伦比亚特区的支持。值得注意的是,TCPA的227款规定“向电话传真机发送自发广告”是非法的。
但是,本诉讼的结果还没有得以解决,并且该诉讼的被告人站在联邦宪法所提供的商业言论自由的角度上对TCPA是否符合宪法的性质提出了置疑,TCPA的227款的实施有待进一步裁决。具体地,在交换传真数据时不再需要同时存在两部电话传真机。实际上,ITU-T推荐标准T.37已经说明可在电话传真机缺失的情况下通过因特网来传送传真图像。
值得注意,虽然垃圾过滤器在电子邮件领域是有效的,但是在传真领域中还没有得到应用。具体地,电子邮件不同于传真图像在于几种独特而重要的方式。由其值得注意,电子邮件可以文本可读格式,即通常是MIME格式而传送。结果,垃圾过滤器可直接基于电子邮件中文本的性质、内容和结构上其作用。更具体地,垃圾过滤器可以找出指示垃圾存在的特定单词的产生。通过比较,传真图像是以光栅化(rasterized)图像格式传输,这种格式除了以黑白或彩色像素之外是无法得到解释的。因此,电子邮件垃圾过滤器技术在传真领域仍然无效,并且已经考虑了其它的方案。
几种技术,虽然没有直接针对垃圾,但是可认为是对垃圾传真问题提供了初步的方案。例如,在美国专利号.5,999,600中Dong-Myong Shin的“FACSIMILEMAIL SYSTEM AND METHOD FOR CONTROLLING THE SAME”,通过DTMF信号提供的口令可以限制“字面信息”的传送,其中通过DTMF所提供的口令与预存的口令不匹配。作为另一个示例,在美国专利申请公开US 2002/0191226 A1的“CALL-SCREENING DEVICE FOR A FACSIMILE MACHINE”中,来电的电话号与电话号的数据库相比较,以确定是否建立起通过其可传送传真数据的电话连接。有趣的是,在美国专利号.6,553,494中Randal Glass的“METHOD ANDAPPARATUS FOR APPLYING AND VERIFYING A BIOMETRIC-BASED DIGITALSIGNATURE TO AN ELECTRONIC DOCUMENT”,结合到文档中的生物计量数据可由接收者用于验证文档。
更具体地参照传真领域,市场上已经推出了几种传真特定反垃圾技术,例如,GFI软件公司已经开发出GFI FAXmakerTM生产线,其中传真可通过普通的电子邮件用户来收发。作为GFI FAXmaker产品的一部分,提供了一种“垃圾传真过滤器”,通过它,基于垃圾传真发送者的电话号,垃圾传真可被“自动删除”。具体地,与被人工确定为垃圾传真的传真的发送者相关联的电话号数据库可用作鉴别依次收到的传真。
通过比较,美国俄亥俄州辛辛那提的MMFM通信软件公司生产了FaxEverywhereTM产品,其中被人工确定的垃圾传真可被标记为“垃圾”。一旦被标记,可将所标记的传真的内容与随后接收到的传真相比,以识别垃圾。其中所接收到的传真的百分之九十五(95%)与被标记为垃圾的存储的传真的光栅化图像相匹配,则可断定接收到的传真是垃圾。因此,Fax Everywhere产品可以看作是人工辅助垃圾传真检测处理器,但它缺少自学习或预清空垃圾鉴别能力。
还有,仅仅是将传真图像与存储在垃圾传真图像存储库中的图像相比较是一项资源密集且耗时的过程。更重要的是,在必需人工确定垃圾的垃圾检测和封锁系统中,一旦垃圾被人工识别为,特别是在高容量的传真环境(其中广播垃圾传真的单个示例可以达到单个“邮筒”中的数千个终端用户手中)中是如此的话,就会“做出”“损害”。因此,希望能够以自学习、且无需人工介入的方式动态地检测垃圾传真。
发明内容
本发明目的在于针对有关传真领域中的自发传真图像(下文称为“垃圾传真”)传送的技术缺陷,并且提供用于过滤垃圾传真的新颖而非明显的方法,系统和装置,以便在检测到垃圾传真试图进入传真输出设备之后将传真图像自动识别为垃圾传真。重要的是,不同于本领域中已知的常规垃圾传真减少和消除技术,并非对传真影像的光栅化形式进行直接的处理以检测出垃圾传真。而是将传真影像的光栅化形式变换成非光栅化的表达,以便无需像现有技术情形中消耗非必要的系统资源以及经历耗时的像素比较那样,而便于检测到垃圾传真。更重要的是,本发明是一种动态的、自学习系统,它无需为避免垃圾传真邮筒的微弱效果而对垃圾进行预先的人工标记。
依照本发明而配置出的垃圾传真过滤器包括配置成以将光栅化传真图像变换成传真图像的非光栅化表达的传真变换处理器。非光栅化表达可包括基于数字、基于文本、基于向量或这类其它的图像数据表达,包括多页形成传真图像、多个黑白像素形成传真图像以及传真图像的色彩强度。垃圾传真过滤器可包括基于垃圾传真的特征和非垃圾传真的特征的资料库。最后,垃圾传真过滤器可包括配置成将由传真变换处理器所产生的传真图像的非光栅化表达与资料库中的特征相比较、以检测出垃圾传真过滤器中的垃圾传真的比较器。
值得注意,垃圾传真过滤器可选择性包括结合到传真变换处理器的光学字符识别(OCR)处理器。OCR处理器可配置成用于将光栅化传真图像转换成光栅化传真图像的文本式表达。垃圾传真过滤器还可选择性包括结合到传真变换处理器的边缘锐化过滤器。该边缘锐化过滤器还可配置成对光栅化传真图像产生限定光栅化传真图像的强化边缘的中间影像。因此,对于中间影像中的强化边缘可以计算出一组向量。
另一种选择就是,垃圾传真过滤器可包括结合到传真变换处理器的模糊过滤器。并且将稳健散列(robust hash)处理器配置成对光栅化传真图像的模糊形式产生一稳健散列值。最后,垃圾传真过滤器可选择性包括用于在光栅化传真图像一区域中检测多个选中像素的色彩值的装置。基于检测到的色彩值,变换处理器可用至少一个数字值(表示单个光栅化传真图像的多个黑像素以及单个光栅化传真图像中的多个白像素)对每个光栅化传真图像进行数字解码。
用于过滤垃圾传真的方法包括将来自候选传真图像中的光栅化形式变换为一个或多个非光栅化形式;将候选传真图像的非光栅化形式对照诸如垃圾传真特征或已知为非垃圾传真特征的各种传真特征做出测试;并且确定该候选传真图像是垃圾传真(其中顺利地测试出候选传真图像具有至少一项已知垃圾传真的特征)。在这一点上,当传真图像的变换显示出其中一项或多项垃圾的特征超过一阈值水平时,则该传真图像可被断定为垃圾。简单地,当传真图像的变换显示出其中一项或多项非垃圾的特征超过一阈值水平时,则该传真图像可被断定为非垃圾。
变换步骤可包括将候选传真图像在光学字符处理器中进行处理以将候选传真图像转换成文本的步骤。或者,变换步骤包括强化候选传真图像中的边缘的步骤;并且计算出强化边缘的一组向量的步骤。又或者,变换步骤可包括使候选传真图像模糊;并且对模糊的候选传真图像产生稳健散列值。最后,还或者,变换步骤可包括对候选传真图像中一区域检测多个选中像素的色彩值。可用至少一个数字值(表示单个光栅化传真图像的多个黑像素以及单个光栅化传真图像中的多个白像素)对候选传真图像依次进行数字解码。
重要的是,测试步骤包括将特征施加到变换中以产生结果的步骤。具体地,可将该变换与选中的各特征进行比较以确定该变换是否满足特征标准的阈值水平。每次比较都会产生一个评分。当评分超过了阈值水平的对应评分时,则加权该评分,并且将各比较的加权评分求和。该求和可产生用于确定该候选传真图像是合法传真还是垃圾传真的最终结果。
重要地,通过产生对候选图像是垃圾传真还是合法的在线动态决定,可以避免垃圾传真邮筒的成本上的影像,因为本发明在性质上是预测式的。此外,在本发明中,传真图像的非光栅化表达代替传真图像的光栅化形式来对垃圾传真的确定进行处理,就避免了延迟和计算资源的过度消耗。最后,因为本发明结合了可标识垃圾传真的特征的资料库,本发明可以自学习,即被标识的垃圾传真的特征可以用作调整和改进资料库的内容。
在下面的描述中将会对本发明的其它方面进行部分地陈述,并且这些方面从该描述中将会部分地明显,或者可从本发明的实践中得知。由所附权利要求中特别指出的元件和结合的手段可以实现并获得本发明各方面。可以理解,前述一般性的描述和后续详细的描述仅是示例性和解释性的,并非对如权利要求所要求的本发明构成限制。
结合到该说明书中并构成其部分的附图示出了本发明的各实施例,并且与描述一起用作解释本发明的原理。在此示出的实施例是当前较佳的,但是可以理解,本发明不限于本文所示的各种装置和设备,其中图1是依照本发明设想而配置的垃圾传真过滤器的示意图;图2是示出图1垃圾传真过滤器过滤垃圾处理的流程图;图3是示出对照已知垃圾传真特征的资料库来进行候选传真影像测试处理的框图;以及图4是示出图1的传真图像变换处理器的多个较佳配置的框图。
具体实施例方式
本发明是一种垃圾传真过滤器系统、方法和装置。依照发明装置,垃圾传真过滤器可以通过将候选影像的非光栅化变换表达与已知传真特征的资料库相比较来对候选传真影像进行处理。当候选传真影像的变换足以显示在资料库中存储的传真特征指示该传真是垃圾时,则候选传真可被断定为垃圾,并且可对该候选传真进行相应的处理。此外,资料库可以由候选影像所提供的附加数据点进行调整。但是,当候选传真影像不足以显示在资料库中存储的垃圾特征时,则候选传真可被断定为合法的,并且可对该候选传真进行相应的处理。
图1是依照发明设想而配置的垃圾传真过滤器120的示意图。垃圾传真过滤器120可结合到传真输出设备170上,并可包括传真变换处理器130和比较器140。比较器140可结合到能够存储已知传真特征160的数据组的垃圾资料库150。已知传真特征160包括垃圾传真特征和非垃圾传真特征之一或两者都包括。垃圾传真特征可包括有关垃圾特征的非光栅化数据,诸如传真传输的典型页面长度、色彩强度、传真变换中的基本图案等。类似地,非垃圾传真特征可包括有关合法传真特征的非光栅化数据,诸如传真传输的典型页面长度、色彩强度、传真变换中的基本图案等。
现在回到图1,可以由垃圾传真过滤器120接收到光栅化传真图像110。对于本领域一般技术人员可以理解,通过光栅化,传真影像可包括通常以几种标准化格式中的一种标准格式进行存储的光栅化表达,例如,仅例举出TIFF格式、JBIG格式和JPEG格式。传真图像110可在传真变换处理器130中被变换成传真图像110的诸如定义传真图像110的一组向量的一项或多项非光栅化表达,该过程在此处被称为变换180。或者,传真变换处理器130可以减少传真图像110的光栅化形式成为已解码的数字表达或者数字稳健散列。又或者,传真变换处理器130可通过光学字符识别处理将传真图像110的光栅化形式转换成文本形式。
在任何情形中,一旦传真变换处理器130产生出一个或多个传真图像的非光栅化变换180,则所产生的变换180可在比较器140中进行处理。具体地,比较器140可将变换180之一与存储在资料库150中的已知垃圾特征组160相比较。当变换的传真图像180显示出资料库150中的一项或多项垃圾特征组160时,可将传真图像110标识为垃圾传真的示例并对其做出相应的处理,例如丢弃、隔离等。否则,垃圾传真过滤器120将允许通过诸如传真印刷机或传真路由器的传真输出设备170对传真图像110进行进一步的传真输出处理。重要的是,当传真图像110被确定为垃圾时,传真图像110的特征可进入到资料库150中以进一步改进和调整已知的垃圾特征组160。
在更具体的图示中,图2是示出图1的垃圾传真过滤器对垃圾传真图像进行过滤处理的流程图。从框210开始,接收候选光栅化传真图像,用于进一步处理。在框215,候选图像可以变换成非光栅化表达。框215的变换处理无需不限于任何一种类型的变形。在这一点上,图4是示出图1的传真图像变换处理器的多个较佳配置的框图。
如图4所示,变换处理410通过使用四个示出的方法至少之一来产生传真图像的非光栅化形式,但是示出的方法绝非表示用于产生传真图像的变形、非光栅化形式的方法的唯一方法,而是在图像处理领域的一般技术人员看来,存在用于将已产生的光栅图像变换成非光栅图像的多种技术。在如图4所示的本发明中,示出了四种这样的示例性的方法。
在如框420示出的本发明的一方面,边缘锐化过滤器可应用到光栅化图像上以产生具有限定原始传真图像的强化边缘的中间图像。对该这些边缘可以产生出各种向量。所产生的向量组可被存储为光栅化图像的唯一表达。或者,在框430中,可计算出光栅化图像的某一区域中的相对的色彩强度,以用唯一的强度向量对光栅化图像进行数字编码。例如,可以在传真图像中计算出白像素和黑像素的数量,或者可以计算出光栅化图像某一区域中的白对黑像素的比例,以对该区域产生出唯一的强度比例。光栅化图像本身可以被分成一个或多个区域,一般技术人员注意到具有较多的区域可以产生更高的生成独有亮度比例的可能性,但同时也增加了对多个区域计算出相对亮度所需的处理量。
在第三种情形中,在框440中,可以通过将光栅化图像经过模糊过滤器来将光栅化图像变模糊。因此将诸如众所周知的MD-5稳健散列应用到已模糊的图像,以对该图像产生唯一的稳健散列值。最后,在框450中,可通过OCR对图像进行处理,以产生一组文本单词和符号。可对该符号进行诸如通过贝叶斯分析的符号间相关性的预处理。在该情形中,当图像的文本表达与其它类似的变换的图像相比时,当同一相关性存在于两个已变换的图像中时,可认为存在着匹配。
现在回到图2,一旦候选传真图像变换到非光栅化形式,在框220中,可检索到第一组已知垃圾特征,诸如传真传送中的图案的典型色彩强度、垃圾传真图像内的典型图像向量、某一单词或词组的出现,页面的典型数量等。在决定框225中,已变换的表达可与第一组垃圾特征相比较,以确定候选图像是否显示了由第一组所定义的特征。如果是,在框240中,加权结果,以表明该组的相对重要性。在框245中,可用组的加权评分对总的评分进行求和,并且通过决定框230进行继续处理。
在决定框230中,在候选图像中仍然有多组要经过测试的垃圾特征,在框235中,将检索出下一组垃圾特征,并且在框225到245中重复原处理。一旦没有要采用的垃圾特征组,则在决定框250中可确定总的评分求和是否超过了一阈值。如果没有,则在框265中,在将候选图像处理为可允许的传真传送。否则,如果总的评分求和超过了一阈值,则在框255中候选的图像被标定为垃圾传真。此外,在框260中,可以用候选传真中所呈现的非光栅化图像数据对资料库中的垃圾特征组进行重新调整。
重要的是,可以通过如在资料库内定义的垃圾不同特征的用户可配置加权来执行确定候选图像是否是垃圾。为此,图3是示出可能的垃圾的标识处理的框图。如图3所示,候选传真图像的非光栅化变换310可在一个或多个垃圾测试320中同时进行处理。每个垃圾测试320可将一组垃圾特征应用到非光栅化变换,以确定非光栅化变换是否显示出用户可配置阈值内的测试特征。作为一示例,一示例性测试可包括在传真传送中的页面数量。当页面计数超过了五页,可以推断出候选的传真满足了示例性测试的标准。
一般技术人员可以理解,在确认候选传真图像是否是垃圾的总体评估中,并非同等考虑所有的垃圾测试320。相应的,可根据垃圾测试320的重要性加权340每个结果330。可对照阈值350对权重总和350进行评估,以确定候选图像是垃圾传真还是合法传真。
可在硬件、软件、或硬件和软件的结合中实现本发明。本发明方法和系统可在一个计算机系统的中央化模式下实施,也可以在其中不同的元件分散在数台互联的计算机系统的分散模式下实施。适于执行本文所描述的方法的任何计算机系统或其它装置都适于执行在此描述的功能。
硬件和软件的典型结合可以是具有计算机程序(当程序被下载并执行时,可控制计算机系统使之可以执行在此描述的方法)的通用计算机系统。本发明还可嵌入到计算机程序产品中,该产品包括所有能够实现在此描述的方法的特征,并且当它被载入到计算机系统之后,就能够执行这些方法。
在本内容中的计算机程序或应用是指一套指令可以任何语言、代码或注释的任何表达式,该指令旨在使得具有信息处理能力的系统直接执行特定的功能或在下面一个或两个功能之后执行特定功能a)到另一种语言、代码或注释的变换;b)在不同实质形式中的重现。显著地,本发明可以嵌入到其它的特定形式中而脱离其精神和基本属性,并且因此可参考下述权利要求,而非前述说明书来指示本发明的范围。
权利要求
1.一种垃圾传真过滤器,包括传真变换处理器,被配置成将光栅化传真图像变换成传真图像的非光栅化表达;传真特征的资料库,包括从垃圾特征和非垃圾特征所构成的组中选择的至少一个传真特征;以及比较器,被配置成将由所述传真变换处理器所产生的传真图像的非光栅化表达与所述传真特征的至少之一作比较,以用垃圾传真过滤器检测垃圾传真。
2.如权利要求1所述的垃圾传真过滤器,其特征在于,所述资料库包括从由多个传真传送页面、传真图像强度以及传真图像图案所组成的组中选择的各个传真特征。
3.如权利要求1所述的垃圾传真过滤器,还包括光学字符识别处理器,它与所述传真变换处理器相耦合并被配置成将所述光栅化传真图像转换成所述光栅化传真图像的文本式表达。
4.如权利要求1所述的垃圾传真过滤器,还包括边缘锐化过滤器,它与所述传真变换处理器相耦合并被配置成产生所述光栅化传真图像的中间影像,所述中间影像包括具有限定所述光栅化传真图像的强化边缘的图像;以及用于对所述中间影像中的所述强化边缘计算一组向量的装置。
5.如权利要求1所述的垃圾传真过滤器,还包括与所述传真变换处理器相耦合的模糊过滤器;以及稳健散列处理器,被配置成产生所述光栅化传真图像的模糊形式的稳健散列值稳健散列。
6.如权利要求1所述的垃圾传真过滤器,还包括检测在所述光栅化传真图像的某一区域中选择的像素的色彩值的装置;以及用表明单个光栅化传真图像中的多个黑像素和所述单个光栅化传真图像中的多个白像素的至少一个数字值对所述各个光栅化传真图像的每一个进行数字编码的装置。
7.一种过滤垃圾传真的方法,所述方法包括如下步骤将候选传真图像的光栅化形式变换成非光栅化形式;对照从由垃圾特征和非垃圾特征所构成的组中选择的至少一个传真特征,来测试所述候选传真图像的非光栅化形式;以及当所述候选传真图像顺利地测试为与所述传真特征的至少之一相违背时,则将所述候选传真图像标识为垃圾传真。
8.如权利要求7所述的方法,其特征在于,所述变换步骤包括用光学字符识别处理器处理所述候选传真图像以将所述候选传真图像转换成文本的步骤。
9.如权利要求7所述的方法,其特征在于,所述变换步骤包括如下步骤强化所述候选传真图像中的边缘;以及对所述已强化边缘计算一组向量。
10.如权利要求7所述的方法,其特征在于,所述变换步骤包括如下步骤使所述候选传真图像模糊;以及对所述已模糊的候选传真图像产生稳健散列值。
11.如权利要求7所述的方法,其特征在于,所述变换步骤包括如下步骤检测在所述候选传真图像的某一区域中选择的像素的色彩值;以及用表明单个光栅化传真图像的多个黑像素和所述单个光栅化传真图像中的多个白像素的至少一个数字值,对所述光栅化传真图像进行数字编码。
12.如权利要求7所述的方法,其特征在于,所述测试步骤包括如下步骤将所选择的所述特征应用于所述候选传真图像的所述非光栅化形式以产生测试结果;加权所选择的所述测试结果;以及集合所述加权测试结果以产生所述测试的结果。
13.如权利要求7所述的方法,还包括如下步骤建立每个所述特征的阈值,在这些阈值上所述候选图像被评分为已显示每个所述特征;加权超过所述阈值的相应分值的每个评分;以及将所述加权评分相加以产生所述测试步骤的结果。
14.一种具有存储其上的用于过滤垃圾传真的计算机程序的机器可读存储,所述计算机程序包括使所述机器执行如下步骤的指令例程集将候选传真图像的光栅化形式变换成非光栅化形式;对照从由垃圾特征和非垃圾特征构成的组中选择的至少一个传真特征,来测试所述候选传真图像的非光栅化形式;以及当所述候选传真图像顺利地测试为与所述传真特征的至少之一相违背时,则将所述候选传真图像标识为垃圾传真。
15.如权利要求14所述的机器可读存储,其特征在于,所述变换步骤包括用光学字符识别处理器处理所述候选传真图像以将所述候选传真图像转换成文本的步骤。
16.如权利要求14所述的机器可读存储,其特征在于,所述变换步骤包括如下步骤强化所述候选传真图像中的边缘;以及对所述已强化边缘计算一组向量。
17.如权利要求14所述的机器可读存储,其特征在于,所述变换步骤包括如下步骤使所述候选传真图像模糊;以及对所述已模糊的候选传真图像产生稳健散列值。
18.如权利要求14所述的机器可读存储,其特征在于,所述变换步骤包括如下步骤检测在所述候选传真图像的某一区域中选择的像素的色彩值;以及用表明单个光栅化传真图像的多个黑像素以及所述单个光栅化传真图像中的多个白像素的至少一个数字值,对所述候选传真图像进行数字编码。
19.如权利要求14所述的机器可读存储,其特征在于,所述测试步骤包括如下步骤将所选择的所述特征应用于所述候选传真图像的所述非光栅化形式以产生测试结果;加权所选择的所述测试结果;以及结合所述加权测试结果以产生所述测试的结果。
20.如权利要求14所述的机器可读存储,还包括如下步骤建立每个所述特征的阈值,在这些阈值上所述候选图像被评分为已显示每个所述特征;加权超过所述阈值的对应分值的每个评分;以及将所述加权评分相加以产生所述测试步骤的结果。
21.一种过滤垃圾传真的方法,所述方法包括如下步骤对照已知垃圾传真的特征,测试候选传真图像的非光栅化形式;以及当所述候选传真图像顺利地测试为与所述已知垃圾传真的所述特征的至少之一相符时,则将所述候选传真图像标识为垃圾传真。
22.一种过滤垃圾传真的方法,所述方法包括如下步骤对照已知垃圾传真的特征,测试候选传真图像的非光栅化形式;以及当所述候选传真图像顺利地测试为与所述已知垃圾传真的所述特征的至少之一不相符时,则将所述候选传真图像标识为合法传真。
23.一种过滤垃圾传真的方法,所述方法包括如下步骤对照已知垃圾传真的特征,测试候选传真图像的非光栅化形式;以及当所述候选传真图像顺利地测试为与已知垃圾传真的所述特征的至少之一相符时,则向所述候选传真图像赋予所述候选传真图像是垃圾传真的概率。
全文摘要
依照本发明配置的垃圾传真过滤器包括配置成将光栅化传真图像变换成传真图像的非光栅化表达的传真变换处理器。垃圾传真过滤器还包括已知垃圾特征的资料库。最后,该垃圾传真过滤器还包括比较器,它配置成将由传真变换处理器所产生的传真图像的非光栅化表达与资料库中的特征相比,以便垃圾传真过滤器检测出垃圾传真。
文档编号G06F15/00GK1918894SQ200480026222
公开日2007年2月21日 申请日期2004年8月8日 优先权日2003年8月8日
发明者A·艾尔-贾兹阿, W·哈特姆特, A·普恩特, A·诺拉斯科 申请人:弗奈利股份有限公司