一种图片信息的处理方法、装置及电子设备与流程

文档序号:27198147发布日期:2021-11-03 13:08阅读:94来源:国知局
一种图片信息的处理方法、装置及电子设备与流程

1.本发明涉及软件技术领域,特别涉及一种图片信息的处理方法、装置及电子设备。


背景技术:

2.互联网应用中,对于图片搜索有两种实现方式,一种是以图搜图,另一种是根据查询词搜图。第二种方式通常根据图片所在网页提供的图片描述信息与查询词之间的匹配进行图片搜索。
3.目前,互联网上的每天增加海量的图文页面,图文页面的质量参差不齐,不乏存在图文不符的页面。另外,随着图片的扩散和转发,与之对应的描述信息因为编辑、转发而逐渐失真,出现图文不符的情况。这些图文不符的页面,对图片搜索排序会产生负面影响,大大降低图片搜索排序的准确性。


技术实现要素:

4.本发明实施例提供一种图片信息的处理方法、装置及电子设备,用于解决现有技术中因图文不符的页面导致的图片搜索排序准确性降低的技术问题,提高图片搜索排序的准确性。
5.本发明实施例提供一种图片信息的处理方法,所述方法包括:
6.对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合;
7.针对每张类簇图片,根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重,其中,所述词权重用于反映所述关键词和类簇图片的相关度;
8.根据每张类簇图片对应的所有关键词的词权重,获取每张类簇图片的目标关键词;
9.根据每张类簇图片的所述目标关键词及所述目标关键词的词权重,对图片搜索结果进行排序。
10.可选的,所述根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重,包括:
11.获取所述每个标记文本域中的关键词;
12.针对每个关键词获得如下目标参数:所述关键词在所属标记文本域中的词频和出现次数以及所述关键词对应的网站域名个数;
13.根据每个所述关键词的所述目标参数,计算获得每个所述关键词的词权重。
14.可选的,根据每个所述关键词的所述目标参数,计算获得每个所述关键词的词权重,包括:
15.针对每个所述关键词,根据所述关键词在每个所属标记文本域中的词频和出现次数,计算获得所述关键词在每个所属标记文本域中的重要程度,所述重要程度按所述词频
和出现次数衰减累加;
16.根据所述关键词在所有所属标记文本域中的重要程度以及所述关键词对应的网站域名个数,计算获得每个所述关键词的词权重。
17.可选的,所述根据每张类簇图片的所述目标关键词及所述目标关键词的词权重,对图片搜索结果进行排序,包括:
18.将图片搜索时所采用的搜索词与每张类簇图片的所述目标关键词进行匹配,获得匹配关键词;
19.根据所述匹配关键词作为搜索词的词权重和匹配关键词作为所述目标关键词的词权重,计算每张类簇图片的所述目标关键词与所述搜索词之间的匹配得分;
20.根据每个所述匹配得分对图片搜索结果进行排序。
21.可选的,所述根据所述匹配关键词作为搜索词的词权重和匹配关键词作为所述目标关键词的词权重,计算每张类簇图片的所述目标关键词与所述搜索词之间的匹配得分,包括:
22.针对每张类簇图片,根据所述匹配关键词作为目标关键词的词权重和所述匹配关键词作为搜索词的词权重,计算获得所述匹配关键词的词权重;根据所述搜索词与所述目标关键词的并集和所述匹配关键词,计算获得匹配权重;
23.根据所述匹配关键词的词权重和所述匹配权重,计算获得每张类簇图片的所述目标关键词与所述搜索词之间的匹配得分。
24.可选的,所述对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合,包括:
25.对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片;
26.从所述类簇图片所在的每个网页中抽取所述类簇图片的标记文本域;
27.去除所述标记文本域中的垃圾文本,并将去除所述垃圾文本后的所有标记文本域作为所述标记文本域集合。
28.可选的,所述去除所述标记文本域中的垃圾文本,包括:
29.通过预设匹配模式对所述标记文本域中的文本内容进行搜索,去除所述文本内容为垃圾文本的标记文本域;和/或,
30.根据所述标记文本域对应的网页类型,去除从垃圾网页上获取到的所述标记文本域;和/或,
31.根据所述标记文本域的对应的网页发布时间,去除发布时间早于设定时间的所述标记文本域。
32.本发明实施例还提供一种图片信息的处理装置,所述装置包括:
33.聚类单元,用于对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合;
34.词权重计算单元,用于针对每张类簇图片,根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重,其中,所述词权重用于反映所述关键词和类簇图片的相关度;
35.关键词抽取单元,用于根据每张类簇图片对应的所有关键词的词权重,获取每张类簇图片的目标关键词;
36.排序单元,用于根据每张类簇图片的所述目标关键词及所述目标关键词的词权重,对图片搜索结果进行排序。
37.可选的,所述词权重计算单元用于:
38.获取所述每个标记文本域中的关键词;
39.针对每个关键词获得如下目标参数:所述关键词在所属标记文本域中的词频和出现次数以及所述关键词对应的网站域名个数;
40.根据每个所述关键词的所述目标参数,计算获得每个所述关键词的词权重。
41.可选的,所述词权重计算单元还用于:
42.针对每个所述关键词,根据所述关键词在每个所属标记文本域中的词频和出现次数,计算获得所述关键词在每个所属标记文本域中的重要程度,所述重要程度按所述词频和出现次数衰减累加;
43.根据所述关键词在所有所属标记文本域中的重要程度以及所述关键词对应的网站域名个数,计算获得每个所述关键词的词权重。
44.可选的,所述排序单元用于:
45.将图片搜索时所采用的搜索词与每张类簇图片的所述目标关键词进行匹配,获得匹配关键词;
46.根据所述匹配关键词作为搜索词的词权重和匹配关键词作为所述目标关键词的词权重,计算每张类簇图片的所述目标关键词与所述搜索词之间的匹配得分;
47.根据每个所述匹配得分对图片搜索结果进行排序。
48.可选的,所述排序单元还用于:
49.针对每张类簇图片,根据所述匹配关键词作为目标关键词的词权重和所述匹配关键词作为搜索词的词权重,计算获得所述匹配关键词的词权重;根据所述搜索词与所述目标关键词的并集和所述匹配关键词,计算获得匹配权重;
50.根据所述匹配关键词的词权重和所述匹配权重,计算获得每张类簇图片的所述目标关键词与所述搜索词之间的匹配得分。
51.可选的,所述聚类单元用于:
52.对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片;
53.从所述类簇图片所在的每个网页中抽取所述类簇图片的标记文本域;
54.去除所述标记文本域中的垃圾文本,并将去除所述垃圾文本后的所有标记文本域作为所述标记文本域集合。
55.可选的,所述聚类单元还用于:
56.通过预设匹配模式对所述标记文本域中的文本内容进行搜索,去除所述文本内容为垃圾文本的标记文本域;和/或,
57.根据所述标记文本域对应的网页类型,去除从垃圾网页上获取到的所述标记文本域;和/或,
58.根据所述标记文本域的对应的网页发布时间,去除发布时间早于设定时间的所述标记文本域。
59.本技术实施例中的上述一个或多个技术方案,至少具有如下技术效果:
60.本技术实施例提供一种图片信息的处理方法,对网页中的图片进行重复图片聚
类,获取每个类簇的类簇图片及其标记文本域集合;针对每张类簇图片,根据标记文本域集合获取集合中每个标记文本域包含有的关键词及该关键词的词权重,通过词权重来反映关键词和类簇图片的相关度;根据关键词的词权重,获取每张类簇图片的目标关键词及该目标关键词的词权重;进而根据每张类簇图片的目标关键词及目标关键词的词权重,对图片搜索结果进行排序。上述技术方案中,通过重复图片聚类获取大量的标记文本域,基于大量的标记文本域来选取图片的目标关键词及目标关键词的权重,提高图片描述信息的准确性,据此进行图片搜索结果的排序,解决了现有技术中因页面图文不符导致的图片搜索排序的准确性降低的技术问题,提高了图片搜索排序的准确性。
附图说明
61.图1为本技术实施例提供的一种搜索数据处理方法的流程示意图;
62.图2为本技术实施例提供的一种数据处理装置的方框图;
63.图3为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
64.在本技术实施例提供的技术方案中,提供一种图片信息的处理方法,通过重复图片聚类来获取大量的标记文本域,并从中选取优质的关键词及其词权重来进行图片搜索排序,从而解决现有技术中因页面图文不符导致的图片搜索排序准确性降低的技术问题。
65.下面结合附图对本技术实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细的阐述。
66.实施例
67.请参考图1,本技术实施例提供一种图片信息的处理方法,该方法包括如下s11~s14:
68.s11、对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合。
69.其中,重复图片聚类是将完全相同的图片聚到一起,例如,目前通过图片搜索,聚类前搜到的原始图片总量大概有60亿,聚类后有8亿个类簇,每个类簇代表不同的图片,也即目前有8亿张不同的图片。每个类簇对应的图片称之为类簇图片。每张类簇图片可能在大量不同的网页中出现,可以从其所在的每个网页中获得该类簇图片的标记文本域,如图片的标题、图片的环绕文本、图片的描述文本等,一般的,图片的描述文本为图片正下方与图片相邻的一行文本信息,图片的环绕文本则为距离图片一定距离内的文本信息,所有的标记文本域构成该类簇图片的标记文本域集合。
70.s12、针对每张类簇图片,根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重。
71.其中,关键词的词权重用于反映关键词和类簇图片的相关度。词权重越大与类簇图片的相关度越大,表示该关键词对于该类簇图片的重要程度越大,反之,词权重越小与类簇图片的相关度越小,表示该关键词对于该类簇图片的重要程度越小。通过获得关键词的词权重,可以明确关键词对该类簇图片的重要程度。
72.s13、根据每张类簇图片对应的所有关键词的词权重,获取每张类簇图片的目标关
键词。
73.其中,每张类簇图片对应的标记文本域集合中会包含大量的关键词,但并不是所有的关键词都与该类簇图片相符,本实施例通过关键词的词权重来进行优质关键词筛选,获取优质的目标关键词。将目标关键词和目标关键词的词权重用作类簇图片的文本描述信息,对类簇图片进行标记。
74.s14、根据每张类簇图片的所述目标关键词及所述目标关键词的词权重,对图片搜索结果进行排序。
75.其中,每张类簇图片的目标关键词及其词权重作为图片搜索结果排序的特征参数,参与图片搜索结果的排序。
76.在上述实施例中,通过重复图片聚类获得大量的来自不同网页的标记文本域,根据大量的标记文本域来获得图片关键词的词权重,进而根据该词权重来对类簇图片进行标记,为类簇图片选取优质的目标关键词及其词权重作为图片描述信息,从而获得更为准确的图片描述信息,以此进行图片搜索结果排序,进而提高图片搜索结果排序的准确性。
77.在具体实时过程中,s11对网页中的图片进行重复图片聚类时,可以先爬取互联网上网页中的图片;然后,对每一张图片利用分环算法进行存储(因为上亿张图片不可能存在一台机器上,会用多台机器存储这些图片);进一步的,将每一张图片同时对所有机器上的图片进行近邻检索,找到完全和它相同的图片,之后对图片的近邻检索结果利用并查集进行合并,这样就把每一张图片所有的相同图片关联起来,并定义一个专属的类簇id,由此实现重复图片的聚类,类簇id对应的图片则为该类簇的类簇图片。
78.在完成重复图片聚类,获取类簇图片后,s11进一步从类簇图片所在的每个网页中收取类簇图片的标记文本域,即从大量重复图片所属的网页上爬取该图片的标记文本域。为了提高标记文本域的质量,去除标记文本域中的垃圾文本,并将去除垃圾文本后的所有标记文本域作为类簇图片的标记文本域集合。
79.具体的,可以通过下述至少一种方式进行垃圾文本去除:
80.1、通过预设匹配模式对标记文本域中的文本内容进行搜索,去除文本内容为垃圾文本的标记文本域。预设匹配模式为单字+空格的匹配模式,该匹配模式能够挖掘出博彩、寄生虫等类型的特征文本。例如:通过单字+空格的匹配模式,可以挖掘出“代做静态寄生虫排名”、“官方唯一指定在线赌场”、“真人美女荷官在线发牌”等类型的垃圾文本。
81.2、根据标记文本域对应的网页类型,去除从垃圾网页上获取到的标记文本域。互联网上的网页的类型一般可分为垃圾网页和正常网页,对于来自于垃圾网页的标记文本域可以将其过滤掉。
82.3、根据标记文本域的对应的网页发布时间,去除发布时时间早于设定时间之前的标记文本域。设定时间可以根据所需的标记文本域的数据量进行设定,数量越大设定时间越长,反之越小。例如:若设定时间为1年,某一标记文本域来自于网页a,网页a的发布时间为3年前,那么去除该标记文本域。
83.4、根据标记文本域的尺寸,去除文本尺寸小于设定尺寸的标记文本域。例如:去除长宽均小于180mm的标记文本域。
84.5、进行文本内容比对,去除文本内容重复的标记文本域。
85.根据去除垃圾文本后获得的标记文本域集合,执行s12对标记文本域集合中各个
标记文本域包含的关键词进行词权重计算,通过词权重来表征关键词对于该类簇图片的重要程度,关键词的重要程度与其词权重成正比。具体的,针对每一张类簇图片的标记文本域集合,获取标记文本域集合中每个标记文本域中的关键词;针对每个关键词获得如下目标参数:关键词在所属标记文本域中的词频、关键词在所属标记文本域中的出现次数以及关键词对应的网站域名个数;根据每个关键词的所述目标参数,计算获得每个所述关键词的词权重。
86.其中,针对每个关键词,根据关键词在每个所属标记文本域中的词频和出现次数,计算获得关键词在每个所属标记文本域中的重要程度,重要程度按关键词的述词频和出现次数衰减累加,具体可以通过如下公式二计算获得:进一步的,根据关键词在所有所属标记文本域中的重要程度以及关键词对应的网站域名个数,计算获得每个关键词的词权重。具体可以通过如下公式一计算获得:
[0087][0088][0089]
w表示所述词权重,i表示标记文本域集合中的第i个标记文本域,n表示标记文本域集合中的文本域个数,f(i)表示关键词在第i个标记文本域中的重要程度,n_page_domain
uniq
表示所述类簇图片对应的网站域名个数,max_weight表示预设的最大权重值,norm_k表示归一化参数,m表示所述词频,n
domain
表示所述关键词在所属的所述标记文本域中出现的次数。其中,词权重的最大值可以取255表示该关键词term频繁出现在每个标记文本域中,最小值可以取1表示在类簇中出现极少。norm_k的取值可以为4。
[0090]
基于计算获得的词权重,执行s13对关键词进行筛选。具体的,可以根据词权重,对每张类簇图片的所有关键词进行排序,获取词权重最大的前n位关键词作为目标关键词,n≥1。例如:假设利用大量重复图片,获得一“情人节快乐”的图一共重复出现了76次,根据其所出现在的网页中获得50个可用的标记文本域,并计算出每个标记文本域中的各个关键词的词权重【情人节:49;情人节快乐:26;立体:24;情人:10;素材:10;苏州:10】,根据各个关键词的词权重抽取出该图片的目标关键词为【情人节:49;情人节快乐:26;立体:24】,排除了一些图文不符或者图文不相关的关键词。
[0091]
在获取到每个类簇图片的目标关键词后,执行s14对图片搜索结果进行排序。具体的,可以将每张类簇图片的目标关键词与图片搜索时所采用的搜索词进行匹配,根据匹配上的匹配关键词及其词权重,计算获得类簇图片的目标关键词与搜索词之间的匹配得分;根据每张类簇图片对应的匹配得分对图片搜索结果进行排序。一张类簇图片对应的所有目标关键词及其词权重构成该类簇图片的描述文本,将类簇图片的目标关键词与搜索词进行匹配时,是将类簇图片的描述文本与搜索词进行匹配,在计算目标关键词与搜索词之间的匹配得分cluster_tf_bmrank时,可以根据类簇图片的描述文本的文本得分doc_score和描述文本与搜索词之间文本匹配得分jaccard_match_weight之间的乘积获得,如下公式三所示:
[0092]
cluster_tf_bmrank=doc_score*jaccard_match_weight
ꢀꢀꢀ
公式三
[0093]
文本得分doc_score,实际上是类簇图片对应的所有目标关键词中与搜索词匹配上的匹配关键词的词权重。匹配关键词为目标关键词和搜索词中出现过的相同关键词,为此匹配关键词的词权重可以根据匹配关键词其作为目标关键词的词权重和其作为搜索词的词权重计算获得。具体的,doc_score可以根据如下公式四计算获得:
[0094]
doc_score=∑match_term_freq*query_weight
ꢀꢀꢀ
公式四
[0095]
其中,match_term_freq表示匹配关键词作为目标关键词的词权重,query_weight表示该匹配关键词作为搜索词的词权重。
[0096]
jaccard_match_weight为文本匹配得分,表征类簇图片的所有目标关键词与搜索词之间的匹配度,又称为匹配权重,可以根据搜索词与目标关键词的并集和匹配关键词计算获得,如公式五所示:
[0097][0098]
其中,query_term_freq∪cluster_term-freq表示搜索词与目标关键词的并集的词权重总和=并集中关键词总数*目标关键词的平均词权重,match_term_freq匹配关键词作为目标关键词的词权重。
[0099]
在重复图片聚类的基础上,可以拿到大量的重复doc。首先通过时间、站点、尺寸、文本等信息进行垃圾doc过滤,然后通过相关文本、站点和词分布等计算词权重,最后通过词权重和图片搜索query的匹配情况生成特征(记做cluster_tf_bmrank),参与排序模型的训练,进而对图片搜索的排序效果进行优化。
[0100]
根据计算获得每张类簇图片的匹配得分cluster_tf_bmrank,将cluster_tf_bmrank作为一维特征,参与图片搜索结果排序模型的训练,进而对图片搜索结果的排序效果进行优化。亦或,根据匹配得分cluster_tf_bmrank对已有的图片搜索结果的排序进行重排序,优化排序结果,使得优化后的排序结果更能反映图片与搜索意图之间的匹配度,提高排序的准确性。
[0101]
基于同一发明构思,针对上述实施例提供的一种图片信息的处理方法,本技术实施例还对应提供一种图片信息的处理装置,请参考图2,该装置包括:
[0102]
聚类单元21,用于对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合;
[0103]
词权重计算单元22,用于针对每张类簇图片,根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重,其中,所述词权重用于反映所述关键词和类簇图片的相关度;
[0104]
关键词抽取单元23,用于根据每张类簇图片对应的所有关键词的词权重,获取每张类簇图片的目标关键词;
[0105]
排序单元24,用于根据每张类簇图片的所述目标关键词及所述目标关键词的词权重,对图片搜索结果进行排序。
[0106]
作为一种可选的实施方式,所述词权重计算单元22用于:获取所述每个标记文本域中的关键词;针对每个关键词获得如下目标参数:所述关键词在所属标记文本域中的词频和出现次数以及所述关键词对应的网站域名个数;根据每个所述关键词的所述目标参数,计算获得每个所述关键词的词权重。可选的的,所述词权重计算单元22还用于:针对每
个所述关键词,根据所述关键词在每个所属标记文本域中的词频和出现次数,计算获得所述关键词在每个所属标记文本域中的重要程度,所述重要程度按所述词频和出现次数衰减累加;根据所述关键词在所有所属标记文本域中的重要程度以及所述关键词对应的网站域名个数,计算获得每个所述关键词的词权重。
[0107]
作为一种可选的实施方式,所述排序单元24用于:将图片搜索时所采用的搜索词与每张类簇图片的所述目标关键词进行匹配,获得匹配关键词;根据所述匹配关键词作为搜索词的词权重和匹配关键词作为所述目标关键词的词权重,计算每张类簇图片的所述目标关键词与所述搜索词之间的匹配得分;根据每个所述匹配得分对图片搜索结果进行排序。可选的,所述排序单元24还用于:针对每张类簇图片,根据所述匹配关键词作为目标关键词的词权重和所述匹配关键词作为搜索词的词权重,计算获得所述匹配关键词的词权重;根据所述搜索词与所述目标关键词的并集和所述匹配关键词,计算获得匹配权重;根据所述匹配关键词的词权重和所述匹配权重,计算获得每张类簇图片的所述目标关键词与所述搜索词之间的匹配得分。
[0108]
作为一种可选的实施方式,所述聚类单元21用于:对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片;从所述类簇图片所在的每个网页中抽取所述类簇图片的标记文本域;去除所述标记文本域中的垃圾文本,并将去除所述垃圾文本后的所有标记文本域作为所述标记文本域集合。可选的,作为一种可选的实施方式,所述聚类单元21还用于:通过预设匹配模式对所述标记文本域中的文本内容进行搜索,去除所述文本内容为垃圾文本的标记文本域;和/或,根据所述标记文本域对应的网页类型,去除从垃圾网页上获取到的所述标记文本域;和/或,根据所述标记文本域的对应的网页发布时间,去除发布时间早于设定时间的所述标记文本域。
[0109]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0110]
图3是根据一示例性实施例示出的一种用于实现图片信息的处理方法的电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
[0111]
参照图3,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/展现(i/o)的接口812,传感器组件814,以及通信组件816。
[0112]
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
[0113]
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪
存储器,磁盘或光盘。
[0114]
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
[0115]
多媒体组件808包括在所述电子设备800和用户之间的提供一个展现接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0116]
音频组件810被配置为展现和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于展现音频信号。
[0117]
i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0118]
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0119]
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0120]
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0121]
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由电子设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0122]
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种图片信息的处理方法,所述方法包括:对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合;针对每张类簇图片,根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重,其中,所述词权重用于反映所述关键词和类簇图片的相关度;根据每张类簇图片对应的所有关键词的词权重,获取每张类簇图片的目标关键词;根据每张类簇图片的所述目标关键词及所述目标关键词的词权重,对图片搜索结果进行排序。
[0123]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本技术旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
[0124]
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
[0125]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1