一种基于模型的过期域名判断方法及装置与流程

文档序号:22796148发布日期:2020-11-04 03:48阅读:103来源:国知局
一种基于模型的过期域名判断方法及装置与流程

本申请涉及互联网技术领域,特别涉及一种基于模型的过期域名判断方法及装置。



背景技术:

域名注册是有期限的,当其域名所有者在域名到期后没有或忘了对该域名续费后,在一个较短的时间内这个域名将被标识为“过期域名”。

现有的技术,查询域名是否过期的方式包括:厂商提供自己旗下的域名查询系统,可以查询域名是否过期,或者通过人工手动打开,根据页面返回的提示,人工判断该域名是否过期。

现有技术中查询过期域名的方案存在一定的弊端,例如,自动判断过期域名的方案,每个域名提供商只能查询自己旗下域名是否过期,所以适用范围较小,局限性较高。人工方式虽然没有局限性,但是人工查询过期域名的方式人力成本较高,且无法自动化的进行批量判断域名,查询效率较低,因此,如何提供一种过期域名判断方法,用以在提高适用范围的情况下,提升过期域名的查询效率。



技术实现要素:

本申请实施例的目的在于提供一种基于模型的过期域名判断方法及装置。

为了解决上述技术问题,本申请的实施例采用了如下技术方案:一种基于模型的过期域名判断方法,包括:

接收待处理域名;

将所述待处理域名输入至域名检测模型中,所述域名检测模型用于判断所述域名是否过期;

获取所述域名检测模型输出的分类结果;

根据所述域名检测模型输出的分类结果判断所述待处理域名是否过期。

本实施例的有益效果在于:将所述待处理域名输入至域名检测模型中,所述域名检测模型用于判断所述域名是否过期;获取所述域名检测模型输出的分类结果;根据所述域名检测模型输出的分类结果判断所述待处理域名是否过期,从而只要将待处理域名输入至域名检测模型中,就能够通过域名检测模型判断域名是否过期,提高了过期域名查询的适用范围,且通过模型自动查询域名是否过期,也提升了域名查询的效率。

在一个实施例中,所述方法还包括:

创建所述域名检测模型;

收集与所述域名检测模型相关的训练样本;

基于所述训练样本对所述域名检测模型进行预训练。

在一个实施例中,创建所述域名检测模型,包括:

基于以下至少一种算法创建所述域名检测模型:

kmeans算法、k-medoids算法、clarans算法、canopy算法、birch算法以及dbscan算法。

在一个实施例中,所述收集与所述域名检测模型相关的训练样本,包括:

选取第一预设数目个未过期域名和第二预设数目个过期域名作为与所述域名检测模型相关的训练样本。

在一个实施例中,所述基于所述训练样本对所述域名检测模型进行预训练,包括:

对所述训练样本进行预处理,以得到所述训练样本对应的特征向量;

将所述训练样本对应的特征向量输入至所述域名检测模型中;

获取所述域名检测模型输出的分类结果;

当所述域名检测模型输出的分类结果满足预设条件时,确定所述域名检测模型训练完成。

在一个实施例中,所述域名检测模型输出的分类结果满足预设条件,包括:

将所述域名检测模型输出的分类结果与预设结果进行比对,以判断所述域名检测模型是否将过期域名聚集到表征过期域名的分类标识中;

当所述域名检测模型将过期域名聚集到表征过期域名的分类标识中时,确定所述域名检测模型输出的判断结果满足预设条件。

本申请还提供一种基于模型的过期域名判断装置,包括:

接收模块,用于接收待处理域名;

输入模块,用于将所述待处理域名输入至域名检测模型中,所述域名检测模型用于判断所述域名是否过期;

获取模块,用于获取所述域名检测模型输出的分类结果;

判断模块,用于根据所述域名检测模型输出的分类结果判断所述待处理域名是否过期。

在一个实施例中,所述装置还包括:

创建模块,用于创建所述域名检测模型;

收集模块,用于收集与所述域名检测模型相关的训练样本;

预训练模块,用于基于所述训练样本对所述域名检测模型进行预训练。

在一个实施例中,所述创建模块,包括:

创建子模块,用于基于以下至少一种算法创建所述域名检测模型:

kmeans算法、k-medoids算法、clarans算法、canopy算法、birch算法以及dbscan算法。

在一个实施例中,所述收集模块,包括:

选取子模块,用于选取第一预设数目个未过期域名和第二预设数目个过期域名作为与所述域名检测模型相关的训练样本。

在一个实施例中,所述预训练模块,包括:

预处理子模块,用于对所述训练样本进行预处理,以得到所述训练样本对应的特征向量;

输入子模块,用于将所述训练样本对应的特征向量输入至所述域名检测模型中;

获取子模块,用于获取所述域名检测模型输出的分类结果;

确定子模块,用于当所述域名检测模型输出的分类结果满足预设条件时,确定所述域名检测模型训练完成。

在一个实施例中,所述域名检测模型输出的分类结果满足预设条件,包括:

将所述域名检测模型输出的分类结果与预设结果进行比对,以判断所述域名检测模型是否将过期域名聚集到表征过期域名的分类标识中;

当所述域名检测模型将过期域名聚集到表征过期域名的分类标识中时,确定所述域名检测模型输出的判断结果满足预设条件。

附图说明

图1为本申请一实施例中的一种基于模型的过期域名判断方法的流程图;

图2为本申请另一实施例中的一种基于模型的过期域名判断方法的流程图;

图3为本申请又一实施例中的一种基于模型的过期域名判断方法的流程图;

图4为本申请一实施例中对域名检测模型进行预训练的过程示意图;

图5为本申请实施例的一种基于模型的过期域名判断装置的框图;

图6为本申请实施例的一种基于模型的过期域名判断装置的框图。

具体实施方式

此处参考附图描述本申请的各种方案以及特征。

应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本申请的范围和精神内的其他修改。

包含在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且与上面给出的对本申请的大致描述以及下面给出的对实施例的详细描述一起用于解释本申请的原理。

通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本申请的这些和其它特性将会变得显而易见。

还应当理解,尽管已经参照一些具体实例对本申请进行了描述,但本领域技术人员能够确定地实现本申请的很多其它等效形式,它们具有如权利要求所述的特征并因此都位于借此所限定的保护范围内。

当结合附图时,鉴于以下详细说明,本申请的上述和其他方面、特征和优势将变得更为显而易见。

此后参照附图描述本申请的具体实施例;然而,应当理解,所申请的实施例仅仅是本申请的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本申请模糊不清。因此,本文所申请的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本申请。

本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本申请的相同或不同实施例中的一个或多个。

图1为本申请实施例的一种基于模型的过期域名判断方法的流程图,该方法包括以下步骤s11-s14:

在步骤s11中,接收待处理域名;

在步骤s12中,将待处理域名输入至域名检测模型中,域名检测模型用于判断域名是否过期;

在步骤s13中,获取域名检测模型输出的分类结果;

在步骤s14中,根据域名检测模型输出的分类结果判断待处理域名是否过期。

域名,是由一串用点分隔的字符组成的互联网上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位。域名可以说是一个ip地址的代称,目的是为了便于记忆后者。例如,threatbook.cn是一个域名,和ip123.59.85.88地址相对应。人们可以直接访问threatbook.cn来代替ip地址,然后域名系统(dns)就会将它转化成便于机器识别的ip地址。这样,人们只需要记忆threatbook.com这一串带有特殊含义的字符,而不需要记忆没有含义的数字。域名注册是有期限的,当其域名所有者在域名到期后没有或忘了对该域名续费后,在一个较短的时间内这个域名将被标识为“过期域名”

本申请旨在提供一种基于模型的过期域名判断方法,具体的,接收待处理域名;例如,本申请可以提供待处理域名的输入框,在用户输入待处理域名时,接收用户输入的待处理域名。另外,本申请还可以提供接收批量检测域名的任务接口,从而通过该任务接口接收其他设备发送的批量待处理域名。

将待处理域名输入至域名检测模型中,域名检测模型用于判断域名是否过期;获取域名检测模型输出的分类结果,例如,在本申请中,只存在两种分类结果,分别是“未过期”和“已过期”两种,其中,域名检测模型识别出的未过期域名的分类结果标识为1,而识别出的已过期域名的分类结果标识为2,在对域名进行分类时,所有未过期域名的分类结果栏输出的都是1,已过期域名分类结果栏输出的都是2,也可以理解为域名检测模型会将未过期域名分为[1]类,将已过期域名分为[2]类。举例而言,对于一域名“crystalunionoffshore.com”,使用模型进行预测结果如图2所示;其中,输出结果中[173530100502]代表div,a,script等标签的数目,模型根据标签的数据将该域名分为[2]类,也就是说,该域名为过期域名。

本实施例的有益效果在于:将待处理域名输入至域名检测模型中,域名检测模型用于判断域名是否过期;获取域名检测模型输出的分类结果;根据域名检测模型输出的分类结果判断待处理域名是否过期,从而只要将待处理域名输入至域名检测模型中,就能够通过域名检测模型判断域名是否过期,提高了过期域名查询的适用范围,且通过模型自动查询域名是否过期,也提升了域名查询的效率。

在一个实施例中,如图2所示,方法还可被实施为如下步骤s21-s23:

在步骤s21中,创建域名检测模型;

在步骤s22中,收集与域名检测模型相关的训练样本;

在步骤s23中,基于训练样本对域名检测模型进行预训练。

本申请中,创建域名检测模型,由于该域名检测模型的作用是根据域名是否过期进行分类,类别只存在“未过期”和“已过期”两个类别,因此,可以基于各种聚类算法创建域名检测模型,例如,通过kmeans(k-meansclusteringalgorithm,k均值聚类算法)创建域名检测模型,kmeans是一种迭代求解的聚类分析算法,其步骤是,预将数据分为k组,则随机选取k个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

又例如,还可以基于k-medoids算法、clarans算法、canopy算法、birch算法、dbscan算法等算法来创建域名检测模型。在域名检测模型创建完毕后,需要对域名检测模型进行预训练,使其具备更加良好的分类能力,具体的,收集与域名检测模型相关的训练样本;基于训练样本对域名检测模型进行预训练。

在一个实施例中,上述步骤s21可被实施为:

基于以下至少一种算法创建域名检测模型:

kmeans算法、k-medoids算法、clarans算法、canopy算法、birch算法以及dbscan算法。

在一个实施例中,上述步骤s22可被实施为如下步骤:

选取第一预设数目个未过期域名和第二预设数目个过期域名作为与域名检测模型相关的训练样本。

在一个实施例中,上述步骤s23可被实施为如下步骤s31-s34:

在步骤s31中,对训练样本进行预处理,以得到训练样本对应的特征向量;

在步骤s32中,将训练样本对应的特征向量输入至域名检测模型中;

在步骤s33中,获取域名检测模型输出的分类结果;

在步骤s34中,当域名检测模型输出的分类结果满足预设条件时,确定域名检测模型训练完成。

本实施例用于对域名检测模型进行预训练,图4为对域名检测模型进行预训练的过程示意图,具体的手机大量的正常域名(即未过期域名)和过期域名作为训练样本,然后对训练样本进行预处理,以得到训练样本对应的特征向量;具体的,由于训练样本是域名,故对训练样本进行预处理包括:编程并下载所有域名的源码,统计域名页面内的html各标签数目,如div标签,p标签,img标签等。html标签由开始标签和结束标签组成,开始标签是被括号包围的元素名,结束标签是被括号包围的斜杠和元素名,举例来说,如<h1>thisisaheading</h1>就是一个网页标签。

选取若干典型标签作为训练样本对应的特征向量,去掉其中权重较低的标签数防止干扰,同时对不存在的标签数补充为0。将训练样本对应的特征向量输入至域名检测模型中;域名检测模型会对根据各个训练样本(即域名)对应的特征向量对域名进行聚类,然后从输出端输出域名的分类结果。

当域名检测模型输出的分类结果满足预设条件时,确定域名检测模型训练完成。具体的,可以通过如下两种方式判断分类结果是否满足预设条件。

方式一,域名检测模型会不断更换聚类中心数目,可以通过查看wss(withinclustersumofsquares,组内平方和),评估域名检测模型的分类效果,当域名检测模型能够达到准确的将过期类域名聚成一类的目的,则确定域名检测模型训练完成。

方式二

本实施例中,假设已经预先知道训练样本中哪些是过期域名,哪些是非过期域名,那么,在域名检测模型输出分类结果之后,可以将域名检测模型输出的分类结果与预设结果进行比对,以判断域名检测模型是否将过期域名聚集到表征过期域名的分类标识中;当域名检测模型将过期域名聚集到表征过期域名的分类标识中时,确定域名检测模型输出的判断结果满足预设条件。

在一个实施例中,上述步骤s34中的域名检测模型输出的分类结果满足预设条件,包括如下步骤a1-a2:

在步骤a1中,将域名检测模型输出的分类结果与预设结果进行比对,以判断域名检测模型是否将过期域名聚集到表征过期域名的分类标识中;

在步骤a2中,当域名检测模型将过期域名聚集到表征过期域名的分类标识中时,确定域名检测模型输出的判断结果满足预设条件。

本实施例中,假设已经预先知道训练样本中哪些是过期域名,哪些是非过期域名,那么,在域名检测模型输出分类结果之后,可以将域名检测模型输出的分类结果与预设结果进行比对,以判断域名检测模型是否将过期域名聚集到表征过期域名的分类标识中;当域名检测模型将过期域名聚集到表征过期域名的分类标识中时,确定域名检测模型输出的判断结果满足预设条件。

图5为本申请实施例的一种基于模型的过期域名判断装置的框图,该装置包括以下模块:

接收模块51,用于接收待处理域名;

输入模块52,用于将待处理域名输入至域名检测模型中,域名检测模型用于判断域名是否过期;

获取模块53,用于获取域名检测模型输出的分类结果;

判断模块54,用于根据域名检测模型输出的分类结果判断待处理域名是否过期。

在一个实施例中,如图6所示,装置还包括:

创建模块61,用于创建域名检测模型;

收集模块62,用于收集与域名检测模型相关的训练样本;

预训练模块63,用于基于训练样本对域名检测模型进行预训练。

在一个实施例中,创建模块,包括:

创建子模块,用于基于以下至少一种算法创建域名检测模型:

kmeans算法、k-medoids算法、clarans算法、canopy算法、birch算法以及dbscan算法。

在一个实施例中,收集模块,包括:

选取子模块,用于选取第一预设数目个未过期域名和第二预设数目个过期域名作为与域名检测模型相关的训练样本。

在一个实施例中,预训练模块,包括:

预处理子模块,用于对训练样本进行预处理,以得到训练样本对应的特征向量;

输入子模块,用于将训练样本对应的特征向量输入至域名检测模型中;

获取子模块,用于获取域名检测模型输出的分类结果;

确定子模块,用于当域名检测模型输出的分类结果满足预设条件时,确定域名检测模型训练完成。

在一个实施例中,域名检测模型输出的分类结果满足预设条件,包括:

将域名检测模型输出的分类结果与预设结果进行比对,以判断域名检测模型是否将过期域名聚集到表征过期域名的分类标识中;

当域名检测模型将过期域名聚集到表征过期域名的分类标识中时,确定域名检测模型输出的判断结果满足预设条件。

以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1