信息处理方法及装置的制造方法
【专利摘要】本发明实施例提供了一种信息处理方法及装置,采用本发明实施例提供的方法,在用户将稿件投递给某一出版物之前,用户将待投递的稿件上传,并填写需要投递的意向出版物,从稿件中获得特征信息,从数据库中获得意向出版物的收录稿件要求信息,将特征信息与收录稿件要求信息进行比对,计算出该稿件被意向出版物收录的概率。这样用户就能够知道,自己稿件投递至意向出版物可能被收录概率,从而判断自己是否放弃向该意向出版物投递稿件,是否需要向其他出版物投递稿件,从而避免了用户浪费出版物审核稿件期的这段时间,提高了用户体验。
【专利说明】
信息处理方法及装置
技术领域
[0001]本发明实施例涉及通信技术领域,更具体的涉及一种信息处理方法及装置。
【背景技术】
[0002]目前用户向出版物投递稿件后,出版物需要对该稿件进行审核,如果用户投递的稿件相对于该出版物出版的出版物不合适,则会告知用户稿件投递失败。
[0003]出版物对稿件的审核周期都很长,如果用户的出版物不能被使用,而又经历了很长的审核时间,就会耽误用户向其他出版物投递稿件的时间,导致用户体验不好。
【发明内容】
[0004]为此本发明提供一种信息处理方法和装置,以解决现有技术中由于出版物审核稿件的周期长,耽误用户向其他出版物投递稿件的时间,导致用户体验不好的问题。
[0005]为实现上述目的,本发明提供如下技术方案:
[0006]—种信息处理方法,包括:
[0007]获取用户上传的稿件以及投递信息,所述投递信息包括:意向出版物;
[0008]确定所述稿件的特征信息,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种;
[0009]从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种;
[0010]依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。
[0011]其中,在所述特征信息包括技术领域时,确定所述稿件的技术领域包括:
[0012]从所述稿件中查找包含有关键词字段的语句;
[0013]从所述语句中获得表示技术领域的词汇,将所述表示技术领域的词汇确定为所述稿件的技术领域。
[0014]其中,在所述投递信息还包括投递技术领域时,所述确定所述稿件的技术领域包括:
[0015]从所述稿件中查找包含有关键词字段的语句;
[0016]从所述语句中获得表示技术领域的词汇;
[0017]比较所述表示技术领域的词汇和所述投递技术领域,将范围较小的技术领域确定为所述稿件的技术领域。
[0018]其中,在所述特征信息包括用户级别时,所述确定所述稿件的用户级别包括:
[0019]从所述稿件中获取用户的归属信息,所述归属信息包括单位信息或院校信息;
[0020]从预先存储的归属信息与用户级别的对应关系中,获得所述用户的用户级别。
[0021]其中,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比,所述依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率包括:
[0022]依据所述特征信息中用户级别与所述录用稿件的最低用户级别的大小关系,确定第一录用数据;
[0023]依据所述特征信息中技术领域与所述收录稿件要求信息中录用稿件的技术领域的包含关系,确定第二录用数据;
[0024]依据所述特征信息中的稿件复制比与所述收录稿件要求信息中的录用稿件的最大复制比的大小关系,确定第三录用数据;
[0025]依据所述特征信息中的稿件篇幅与所述收录稿件要求信息中的录用稿件的篇幅的大小关系,确定第四录用数据;
[0026]依据所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据,获得所述稿件被所述意向出版物收录的概率。
[0027]优选地,还包括:
[0028]当所述稿件被所述意向出版物收录的概率低于预设值时,将所述特征信息与所述数据库中每一出版物的收录稿件要求信息进行比较;
[0029]计算出收录概率大于等于预设值的推荐出版物;
[0030]按照收录概率从大至小,将推荐出版物推荐至所述用户。
[0031]一种信息处理装置,包括:
[0032]第一获取模块,用于获取用户上传的稿件以及投递信息,所述投递信息包括:意向出版物;
[0033]确定模块,用于确定所述稿件的特征信息,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种;
[0034]第二获取模块,用于从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种;
[0035]第一计算模块,用于依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。
[0036]其中,在所述特征信息包括技术领域时,所述确定模块包括:
[0037]查找单元,用于从所述稿件中查找包含有关键词字段的语句;
[0038]第一获取单元,用于从所述语句中获得表示技术领域的词汇,将所述表示技术领域的词汇确定为所述稿件的技术领域。
[0039]其中,在所述投递信息还包括投递技术领域时,所述确定模块包括:
[0040]查找单元,用于从所述稿件中查找包含有关键词字段的语句;
[0041]第一获取单元,用于从所述语句中获得表示技术领域的词汇;
[0042]比较单元,用于比较所述表示技术领域的词汇和所述投递技术领域,将范围较小的技术领域确定为所述稿件的技术领域。
[0043]其中,在所述特征信息包括用户级别时,所述确定模块包括:
[0044]第二获取单元,用于从所述稿件中获取用户的归属信息,所述归属信息包括单位信息或院校信息;
[0045]第三获取单元,用于从预先存储的归属信息与用户级别的对应关系中,获得所述用户的用户级别。
[0046]其中,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比,所述第一计算模块包括:
[0047]第一确定单元,用于依据所述特征信息中用户级别与所述录用稿件的最低用户级别的大小关系,确定第一录用数据;
[0048]第二确定单元,用于依据所述特征信息中技术领域与所述收录稿件要求信息中录用稿件的技术领域的包含关系,确定第二录用数据;
[0049]第三确定单元,用于依据所述特征信息中的稿件复制比与所述收录稿件要求信息中的录用稿件的最大复制比的大小关系,确定第三录用数据;
[0050]第四确定单元,用于依据所述特征信息中的稿件篇幅与所述收录稿件要求信息中的录用稿件的篇幅的大小关系,确定第四录用数据;
[0051]计算单元,用于依据所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据,获得所述稿件被所述意向出版物收录的概率。
[0052]优选的,还包括:
[0053]比较模块,用于当所述稿件被所述意向出版物收录的概率低于预设值时,将所述特征信息与所述数据库中每一出版物的收录稿件要求信息进行比较;
[0054]第二计算模块,用于计算出收录概率大于等于预设值的推荐出版物;
[0055]推荐模块,用于按照收录概率从大至小,将推荐出版物推荐至所述用户。
[0056]经由上述的技术方案可知,与现有技术相比,本发明实施例提供的信息处理方法,在用户将稿件投递给某一出版物之前,用户将待投递的稿件上传,并填写需要投递的意向出版物,从稿件中获得特征信息,从数据库中获得意向出版物的收录稿件要求信息,将特征信息与收录稿件要求信息进行比对,计算出该稿件被意向出版物收录的概率。这样用户就能够知道,自己稿件投递至意向出版物可能被收录概率,从而判断自己是否放弃向该意向出版物投递稿件,是否需要向其他出版物投递稿件,从而避免了用户浪费出版物审核稿件期的这段时间,提高了用户体验。
【附图说明】
[0057]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0058]图1为本发明实施例提供的一种信息处理方法的流程示意图;
[0059]图2为本发明实施例提供的一种信息处理方法中的确定稿件的技术领域的一种实现方式的方法流程示意图;
[0060]图3为本发明实施例提供的一种信息处理方法中确定稿件的技术领域的另一实现方式的方法流程示意图;
[0061]图4为本发明实施例提供的一种信息处理方法中确定稿件的用户级别的一种实现方式的方法流程示意图;
[0062]图5为本发明实施例提供的一种信息处理方法中依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率的一种实现方式的方法流程示意图;
[0063]图6为本发明实施例提供的一种信息处理方法的另一种实现方式的方法流程示意图;
[0064]图7为本发明实施例提供的一种信息处理装置的结构示意图;
[0065]图8为本发明实施例提供的一种信息处理装置中的确定模块的一种实现方式的结构示意图;
[0066]图9为本发明实施例提供的一种信息处理装置中确定模块的另一实现方式的结构示意图;
[0067]图10为本发明实施例提供的一种信息处理装置中确定模块的一种实现方式的结构示意图;
[0068]图11为本发明实施例提供的一种信息处理装置中第一计算模块的一种实现方式的方法流程示意图;
[0069]图12为本发明实施例提供的一种信息处理装置的另一种实现方式的结构示意图。
【具体实施方式】
[0070]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0071]请参阅图1,为本发明实施例提供的一种信息处理方法的流程示意图,该方法包括:
[0072]步骤SlOl:获取用户上传的稿件以及投递信息,所述投递信息包括:意向出版物。
[0073]用户在上传稿件前或在上传稿件后,需要填写期望将该稿件投递至哪个出版物。需要投递的意向出版物可以是出版物的名称。
[0074]意向出版物是指以传播为目的贮存知识信息并具有一定物质形态的出版产品,可以是指杂质、图书、期刊、报纸等等。
[0075]步骤S102:确定所述稿件的特征信息。
[0076]所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种。
[0077]用户级别可以是指用户所属的单位的级别或者所属的院校的级别。
[0078]稿件篇幅是指稿件的字数或字符数。
[0079]稿件复制比是指稿件中与已经发表的文章中完全相同的段落的字数/该稿件的所有字数。具体的,可以将稿件的全文与存储有各个出版物出版的文章的数据库中的各个文章进行匹配,如果发现稿件中某一段落或某些语句完全与该数据库中某一篇文章或多篇文章的内容一致,则确定该某一段落或某些语句为复制语句,通过复制语句的字数或字符数/稿件的全文字数或字符数计算稿件的复制比。
[0080]稿件的技术领域是指该稿件中所描述的技术所属的技术领域。
[0081]可以理解的是,有的出版物对其录用的稿件的用户级别不限定,则特征信息中就可以不包括用户级别这一参数,如果对稿件的篇幅不限定,则特征信息中就可以不包括稿件篇幅这一参数,特征信息具体包含哪些参数与具体出版物的要求有关。本发明实施例在此不做具体限定。
[0082]可以理解的是,有的出版物虽然没有向外界公布其收录稿件的要求中的某个参数,但是在其真实的收录过程中,确实的参考了该参数,那么特征信息也包括该参数。例如用户级别这一参数,一般情况下,出版物不期望大家知道其对用户级别有一定要求,而在实际收录稿件过程中,确实将这个参数作为收录稿件的要求,那么特征信息就可以包括用户级别这一参数。
[0083]步骤S103:从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息。
[0084]所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种。
[0085]收录稿件要求信息与特征信息对应,即特征信息中的用户级别与收录稿件要求信息中的录用稿件的最低用户级别相对应,特征信息中的稿件篇幅与收录稿件要求信息中的录用稿件的篇幅相对应,特征信息中的稿件复制比与收录稿件要求信息中的录用稿件的最大复制比相对应,特征信息中的技术领域与收录稿件要求信息中的录用稿件的技术领域相对应,也就是说,如果特征信息包括用户级别,则收录稿件要求信息包括录用稿件的最低用户级别;如果特征信息包括稿件篇幅,则收录稿件要求信息包括录用稿件的篇幅,其他情况依次类推,在此不做详细描述。
[0086]数据库可以包含有国内外各个出版物的收录稿件要求信息,例如收稿要求(例如复制比、篇幅)、历年收录的稿件的技术领域、用户级别等信息。在数据库中各个出版物与其对应的收稿要求、稿件的技术领域、用户级别分别对应存储。这些信息在数据库中可以是以表格的形式存储,也可以是以其他形式存储,本发明实施例对此不做具体限定。
[0087]步骤S104:依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。
[0088]本发明实施例提供了一种信息处理方法,在用户将稿件投递给某一出版物之前,用户将待投递的稿件上传,并填写需要投递的意向出版物,从稿件中获得特征信息,从数据库中获得意向出版物的收录稿件要求信息,将特征信息与收录稿件要求信息进行比对,计算出该稿件被意向出版物收录的概率。这样用户就能够知道,自己稿件投递至意向出版物可能被收录概率,从而判断自己是否放弃向该意向出版物投递稿件,是否需要向其他出版物投递稿件,从而避免了用户浪费出版物审核稿件期的这段时间,提高了用户体验。
[0089]上述信息处理方法实施例中,特征信息可以包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种,如果特征信息包括技术领域,则确定所述稿件的特征信息包括确定稿件的技术领域,请参阅图2,为本发明实施例提供的一种信息处理方法中的确定稿件的技术领域的一种实现方式的方法流程示意图,该方法包括:
[0090]步骤S201:从所述稿件中查找包含有关键词字段的语句。
[0091]稿件有严格的格式要求,格式中需要用户必须填写“关键字”这一字段,一般情况下格式如下:关键词:A、B、C、D。可以从稿件中查找“关键字”这一字段,从而确定出包含关键词的语句“关键词:A、B、C、D”。
[0092]步骤S202:从所述语句中获得表示技术领域的词汇,将所述表示技术领域的词汇确定为所述稿件的技术领域。
[0093]仍以上述例子进行说明,表示技术领域的词汇可以为A、B、C、D,由于各个词汇之间都有“、”或“,”作为间隔,因此可以依据“、”或“,”提取出各个词汇,即从语句中提取出关键词A、关键词B、关键词C和关键词D。这些词汇可以作为该稿件的技术领域。
[0094]稿件的技术领域可以是依据上述确定稿件的技术领域实施例中获得的,也可以是用户在上传稿件后,自己填写的,即投递信息包括该稿件的投递技术领域。为了更加准确的确定稿件的技术领域,可以将用户填写的投递技术领域和从稿件中获得的技术领域进行比对,将范围较小的技术领域作为稿件的技术领域,请参阅图3,为本发明实施例提供的一种信息处理方法中确定稿件的技术领域的另一实现方式的方法流程示意图,该方法包括:
[0095]步骤S301:从所述稿件中查找包含有关键词字段的语句。
[0096]步骤S302:从所述语句中获得表示技术领域的词汇。
[0097]步骤S303:比较所述表示技术领域的词汇和所述投递技术领域,将范围较小的技术领域确定为所述稿件的技术领域。
[0098]例如,目前医学研究领域中的细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、月中瘤细胞等等,生殖细胞又包括:卵母细胞、精子。卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。假设表示技术领域的词汇为细胞骨架,而用户填写的技术领域为卵母细胞,则以表示技术领域的词汇即细胞骨架为稿件的技术领域。
[0099]上述信息处理方法实施例中,特征信息可以包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种,如果特征信息包括用户级别,则确定所述稿件的特征信息包括确定稿件的用户级别,请参阅图4,为本发明实施例提供的一种信息处理方法中确定稿件的用户级别的一种实现方式的方法流程示意图,该方法包括:
[0100]步骤S401:从所述稿件中获取用户的归属信息。
[0101]所述归属信息包括单位信息或院校信息。
[0102]稿件中需要填写用户姓名、用户所属单位或所述院校。
[0103]步骤S402:从预先存储的归属信息与用户级别的对应关系中,获得所述用户的用户级别。
[0104]例如A单位的级别为三级、B单位的级别为三级、C单位的级别为二级、D单位的级别为一级。假设用户所属的单位是C,则用户的用户级别为二级。
[0105]假设E院校为985院校,将E院校设置为二级院校;F院校为211且985院校,将F院校设置为三级院校,G院校为普通院校,将G院校设置为一级院校。假设用户所属的院校为G,则用户的用户级别为一级。
[0106]请参阅图5,为本发明实施例提供的一种信息处理方法中依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率的一种实现方式的方法流程示意图,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比,该方法包括:
[0107]步骤S501:依据所述特征信息中用户级别与所述录用稿件的最低用户级别的大小关系,确定第一录用数据。
[0108]假设录用稿件的最低用户级别为二级,用户的级别为二级,那么从用户级别角度考虑,可以录用该稿件,此时可以确定第一录用数据为1,也可以为98%、90%、70%、60%等较大的概率,如果用户的级别为一级,从用户级别考虑,录用该稿件的概率较低,此时可以确定第一录用数据为O,也可以为10%、20%等较小的概率。
[0109]可以理解的是,级别越高被录用的概率可能越大,假设录用稿件中用户级别为三级的概率为60%,用户级别为二级的概率为40 %,如果上传稿件的用户的用户级别为二级,那么第一录用数据可以为40%,如果上传稿件的用户的用户级别为一级,那么第一录用数据可以为O。
[0110]第一录用数据的具体值可以依据实际情况而定,本发明实施例并不做具体限定。
[0111]步骤S502:依据所述特征信息中技术领域与所述收录稿件要求信息中录用稿件的技术领域的包含关系,确定第二录用数据。
[0112]例如,目前医学研究领域中的细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、月中瘤细胞等等,生殖细胞又包括:卵母细胞、精子。卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。
[0113]假设收录稿件要求信息中录用稿件的技术领域包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞。特征信息中技术领域为卵母细胞。由于生殖细胞包括卵母细胞,从技术领域考虑,可以录用该稿件,第二录用数据可以为I,也可以为98 %、90 %、70 %、60 %等较大的概率,如果特征信息中技术领域为图像处理,显然图像处理不属于录用稿件的技术领域中任何一个,此时可以确定第二录用数据为O,也可以为10%、20%等较小的概率。
[0114]可以理解的是,可以依据技术领域对收录的各个稿件进行分类,确定出各个技术领域收录的稿件个数,然后依据每一技术领域对应的稿件个数/收录的稿件总数,计算出各个技术领域的收录概率,可以依据该收录概率,确定第二录用数据,假设录用稿件的技术领域包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞,其中生殖细胞方向的稿件的收录概率为20%,胚胎干细胞方向的稿件的收录概率为40%,体细胞方向的稿件的收录概率为30%,月中瘤细胞方向的稿件的收录概率为10%。如果特征信息中技术领域为卵母细胞,卵母细胞属于生殖细胞,则第二录用数据为20%,如果特征信息中技术领域为图像处理,显然图像处理不属于录用稿件的技术领域中任何一个,此时可以确定第二录用数据为O。
[0115]步骤S503:依据所述特征信息中的稿件复制比与所述收录稿件要求信息中的录用稿件的最大复制比的大小关系,确定第三录用数据。
[0116]假设收录稿件要求信息中的录用稿件的最大复制比为5%,如果特征信息中稿件复制比为6 %,则可以确定第三录用数据为O,也可以为10%、20%等较小的概率。如果特征信息中稿件复制比为4%,则可以确定第三录用数据为1,也可以为98%、90%、70%、60%等较大的概率。
[0117]步骤S504:依据所述特征信息中的稿件篇幅与所述收录稿件要求信息中的录用稿件的篇幅的大小关系,确定第四录用数据。
[0118]假设收录稿件要求信息中的录用稿件的篇幅不得超过10000字等等,稿件篇幅为6000字,则从篇幅考虑,录用该稿件的可能性较大,此时第四录用数据可以为98%、90%、70%、60%等较大的概率。如果稿件篇幅为15000,则从篇幅考虑,录用该稿件的可能性较小,此时第四录用数据可以为1 %、20 %等较小的概率。
[0119]步骤S505:依据所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据,获得所述稿件被所述意向出版物收录的概率。
[0120]具体的,可以是计算所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据之和,作为稿件被所述意向出版物收录的概率,此时第一录用数据、第二录用数据、第三录用数据以及第四录用数据的具体数值,需要满足四个数据之和最大为I,最小为O。
[0121]具体的,还可以为第一录用数据、第二录用数据、第三录用数据以及第四录用数据分配有权重,权重分别为第一权重、第二权重、第三权重和第四权重,稿件被所述意向出版物收录的概率=第一录用数据*第一权重+第二录用数据*第二权重+第三录用数据*第三权重+第四录用数据*第四权重,此时需要满足稿件被所述意向出版物收录的概率最大为1,最小为O。
[0122]请参阅图6,为本发明实施例提供的一种信息处理方法的另一种实现方式的方法流程示意图,该方法包括:
[0123]步骤S601:获取用户上传的稿件以及投递信息,所述投递信息包括:意向出版物。
[0124]步骤S602:确定所述稿件的特征信息,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种。
[0125]步骤S603:从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息。
[0126]所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种。
[0127]步骤S604:依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。
[0128]步骤S605:当所述稿件被所述意向出版物收录的概率低于预设值时,将所述特征信息与所述数据库中每一出版物的收录稿件要求信息进行比较。
[0129]步骤S606:计算出收录概率大于等于预设值的推荐出版物。
[0130]步骤S607:按照收录概率从大至小,将推荐出版物推荐至所述用户。
[0131]假设用户想将稿件投递至出版物A,预设值为55%,稿件被所述意向出版物收录的概率为40%,此时将特征信息与数据库中每一出版物的录用稿件要求信息进行比较。发现出版物B可能收录该稿件的概率为55%,出版物C可能收录该稿件的概率为70%,出版物D可能收录该稿件的概率为80%。则可以优先给用户推荐出版物D,再给用户推荐出版物C,然后给用户推荐出版物B。
[0132]请参阅图7,为本发明实施例提供的一种信息处理装置的结构示意图,该装置包括:第一获取模块701、确定模块702、第二获取模块703以及第一计算模块704,其中:
[0133]第一获取模块701,用于获取用户上传的稿件、所述用户填写的投递信息,所述投递信息包括:需要投递的意向出版物。
[0134]用户在上传稿件前或在上传稿件后,需要填写期望将该稿件投递至哪个出版物。需要投递的意向出版物可以是出版物的名称。
[0135]确定模块702,用于确定所述稿件的特征信息,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种。
[0136]所述特征信息包括用户级别、稿件篇幅、稿件复制比、技术领域中的一种或多种。
[0137]用户级别可以是指用户所属的单位的级别或者所属的院校的级别。
[0138]稿件篇幅是指稿件的字数或字符数。
[0139]稿件复制比是指稿件中与已经发表的文章中完全相同的段落的字数/该稿件的所有字数。具体的,可以将稿件的全文与存储有各个出版物出版的文章的数据库中的各个文章进行匹配,如果发现稿件中某一段落或某些语句完全与该数据库中某一篇文章或多篇文章的内容一致,则确定该某一段落或某些语句为复制语句,通过复制语句的字数或字符数/稿件的全文字数或字符数计算稿件的复制比。
[0140]技术领域是指该稿件中所描述的技术所属的技术领域。
[0141]可以理解的是,有的出版物对其录用的稿件的用户级别不限定,则特征信息中就可以不包括用户级别这一参数,如果对稿件的篇幅不限定,则特征信息中就可以不包括稿件篇幅这一参数,特征信息具体包含哪些参数与具体出版物的要求有关。本发明实施例在此不做具体限定。
[0142]可以理解的是,有的出版物虽然没有向外界公布其收录稿件的要求中的某个参数,但是在其真实的收录过程中,确实的参考了该参数,那么特征信息也包括该参数。例如用户级别这一参数,一般情况下,出版物不期望大家知道其对用户级别有一定要求,而在实际收录稿件过程中,确实将这个参数作为收录稿件的要求,那么特征信息就可以包括用户级别这一参数。
[0143]第二获取模块703,用于从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种。
[0144]所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种。
[0145]收录稿件要求信息与特征信息对应,即特征信息中的用户级别与收录稿件要求信息中的录用稿件的最低用户级别相对应,特征信息中的稿件篇幅与收录稿件要求信息中的录用稿件的篇幅相对应,特征信息中的稿件复制比与收录稿件要求信息中的录用稿件的最大复制比相对应,特征信息中的技术领域与收录稿件要求信息中的录用稿件的技术领域相对应,也就是说,如果特征信息包括用户级别,则收录稿件要求信息包括录用稿件的最低用户级别;如果特征信息包括稿件篇幅,则收录稿件要求信息包括录用稿件的篇幅,其他情况依次类推,在此不做详细描述。
[0146]数据库可以包含有国内外各个出版物的收录稿件要求信息,例如收稿要求(例如复制比、篇幅)、历年收录的稿件的技术领域、用户级别等信息。在数据库中各个出版物与其对应的收稿要求、稿件的技术领域、用户级别分别对应存储。这些信息在数据库中可以是以表格的形式存储,也可以是以其他形式存储,本发明实施例对此不做具体限定。
[0147]第一计算模块704,用于依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。
[0148]本发明实施例提供了一种信息处理装置,在用户将稿件投递给某一出版物之前,第一获取模块701获取用户上传的待投递的稿件,以及填写的需要投递的意向出版物,确定模块702从稿件中获得特征信息,第二获取模块703从数据库中获得意向出版物的收录稿件要求信息,第一计算模块704将特征信息与收录稿件要求信息进行比对,计算出该稿件被意向出版物收录的概率。这样用户就能够知道,自己稿件投递至意向出版物可能被收录概率,从而判断自己是否放弃向该意向出版物投递稿件,是否需要向其他出版物投递稿件,从而避免了用户浪费出版物审核稿件期的这段时间,从而提高了用户体验。
[0149]上述信息处理装置实施例中,特征信息可以包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种,如果特征信息包括技术领域,则确定所述稿件的特征信息包括确定稿件的技术领域,请参阅图8,为本发明实施例提供的一种信息处理装置中的确定模块的一种实现方式的结构示意图,该确定模块包括:查找单元801以及第一获取单元802,其中:
[0150]查找单元801,用于从所述稿件中查找包含有关键词字段的语句。
[0151]稿件有严格的格式要求,格式中需要用户必须填写“关键字”这一字段,一般情况下格式如下:关键词:A、B、C、D。可以从稿件中查找“关键字”这一字段,从而确定出包含关键词的语句“关键词:A、B、C、D”。
[0152]第一获取单元802,用于从所述语句中获得表示技术领域的词汇,将所述表示技术领域的词汇确定为所述稿件的技术领域。
[0153]仍以上述例子进行说明,表示技术领域的词汇可以为A、B、C、D,由于各个词汇之间都有“、”或“,”作为间隔,因此可以依据“、”或“,”提取出各个词汇,即从语句中提取出关键词A、关键词B、关键词C和关键词D。这些词汇可以作为该稿件的技术领域。
[0154]稿件的技术领域可以是依据上述确定稿件的技术领域实施例中获得的,也可以是用户在上传稿件后,自己填写的,即投递信息包括该稿件的投递技术领域。为了更加准确的确定稿件的技术领域可以将投递技术领域和从稿件中获得的技术领域进行比对,将范围较小的技术领域作为稿件的技术领域,请参阅图9,为本发明实施例提供的一种信息处理装置中确定模块的另一实现方式的结构示意图,该确定模块包括:
[0155]查找单元801,用于从所述稿件中查找包含有关键词字段的语句。
[0156]第一获取单元802,用于从所语句中获得表示技术领域的词汇。
[0157]比较单元901,用于比较所述表示技术领域的词汇和所述投递技术领域,将范围较小的技术领域确定为所述稿件的技术领域。
[0158]例如,目前医学研究领域中的细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、月中瘤细胞等等,生殖细胞又包括:卵母细胞、精子。卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。假设表示技术领域的词汇为细胞骨架,而用户填写的技术领域为卵母细胞,则以表示技术领域的词汇即细胞骨架为稿件的技术领域。
[0159]上述信息处理方法实施例中,特征信息可以包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种,如果特征信息包括用户级别,则确定所述稿件的特征信息包括确定稿件的用户级别,请参阅图10,为本发明实施例提供的一种信息处理装置中确定模块的一种实现方式的结构示意图,该确定模块包括:第二获取单元1001以及第三获取单元1002,其中:
[0160]第二获取单元1001,用于从所述稿件中获取用户的归属信息,所述归属信息包括单位信息或院校信息。[0161 ]所述归属信息包括单位信息或院校信息。
[0162]稿件中需要填写用户姓名、用户所属单位或所述院校。
[0163]第三获取单元1002,用于从预先存储的归属信息与用户级别的对应关系中,获得所述用户的用户级别。
[0164]例如A单位的级别为三级、B单位的级别为三级、C单位的级别为二级、D单位的级别为一级。假设用户所属的单位是C,则用户的用户级别为二级。
[0165]假设E院校为985院校,将E院校设置为二级院校;F院校为211且985院校,将F院校设置为三级院校,G院校为普通院校,将G院校设置为一级院校。假设用户所属的院校为G,则用户的用户级别为一级。
[0166]请参阅图11,为本发明实施例提供的一种信息处理装置中第一计算模块的一种实现方式的方法流程示意图,特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比,该第一计算模块包括:第一确定单元1101、第二确定单元1102、第三确定单元1103、第四确定单元1104以及计算单元1105,其中:
[0167]第一确定单元1101,用于依据所述特征信息中用户级别与所述录用稿件的最低用户级别的大小关系,确定第一录用数据。
[0168]假设录用稿件的最低用户级别为二级,用户的级别为二级,那么从用户级别角度考虑,可以录用该稿件,此时可以确定第一录用数据为1,也可以为98%、90%、70%、60%等较大的概率,如果用户的级别为一级,从用户级别考虑,录用该稿件的概率较低,此时可以确定第一录用数据为O,也可以为10%、20%等较小的概率。
[0169]可以理解的是,级别越高被录用的概率可能越大,假设录用稿件中用户级别为三级的概率为60%,用户级别为二级的概率为40 %,如果上传稿件的用户的用户级别为二级,那么第一录用数据可以为40%,如果上传稿件的用户的用户级别为一级,那么第一录用数据可以为O。
[0170]第一录用数据的具体值可以依据实际情况而定,本发明实施例并不做具体限定。
[0171]第二确定单元1102,用于依据所述特征信息中技术领域与所述收录稿件要求信息中录用稿件的技术领域的包含关系,确定第二录用数据。
[0172]例如,目前医学研究领域中的细胞生物学包括:生殖细胞、胚胎干细胞、体细胞、月中瘤细胞等等,生殖细胞又包括:卵母细胞、精子。卵母细胞包括细胞骨架、信号通路、纺锤体检验点等等。
[0173]假设收录稿件要求信息中录用稿件的技术领域包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞。特征信息中技术领域为卵母细胞。由于生殖细胞包括卵母细胞,从技术领域考虑,可以录用该稿件,第二录用数据可以为I,也可以为98 %、90 %、70 %、60 %等较大的概率,如果特征信息中技术领域为图像处理,显然图像处理不属于录用稿件的技术领域中任何一个,此时可以确定第二录用数据为O,也可以为10%、20%等较小的概率。
[0174]可以理解的是,可以依据技术领域对收录的各个稿件进行分类,确定出各个技术领域收录的稿件个数,然后依据每一技术领域对应的稿件个数/收录的稿件总数,计算出各个技术领域的收录概率,可以依据该收录概率,确定第二录用数据,假设录用稿件的技术领域包括:生殖细胞、胚胎干细胞、体细胞、肿瘤细胞,其中生殖细胞方向的稿件的收录概率为20%,胚胎干细胞方向的稿件的收录概率为40%,体细胞方向的稿件的收录概率为30%,月中瘤细胞方向的稿件的收录概率为10%。如果特征信息中技术领域为卵母细胞,卵母细胞属于生殖细胞,则第二录用数据为20%,如果特征信息中技术领域为图像处理,显然图像处理不属于录用稿件的技术领域中任何一个,此时可以确定第二录用数据为O。
[0175]第三确定单元1103,用于依据所述特征信息中的稿件复制比与所述收录稿件要求信息中的录用稿件的最大复制比的大小关系,确定第三录用数据。
[0176]假设收录稿件要求信息中的录用稿件的最大复制比为5%,如果特征信息中稿件复制比为6 %,则可以确定第三录用数据为O,也可以为10%、20%等较小的概率。如果特征信息中稿件复制比为4%,则可以确定第三录用数据为1,也可以为98%、90%、70%、60%等较大的概率。
[0177]第四确定单元1104,用于依据所述特征信息中的稿件篇幅与所述收录稿件要求信息中的录用稿件的篇幅的大小关系,确定第四录用数据。
[0178]假设收录稿件要求信息中的录用稿件的篇幅不得超过10000字等等,稿件篇幅为6000字,则从篇幅考虑,录用该稿件的可能性较大,此时第四录用数据可以为98%、90%、70%、60%等较大的概率。如果稿件篇幅为15000,则从篇幅考虑,录用该稿件的可能性较小,此时第四录用数据可以为1 %、20 %等较小的概率。
[0179]计算单元1105,用于依据所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据,获得所述稿件被所述意向出版物收录的概率。
[0180]具体的,可以是计算所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据之和,作为稿件被所述意向出版物收录的概率,此时第一录用数据、第二录用数据、第三录用数据以及第四录用数据的具体数值,需要满足四个数据之和最大为I,最小为O。
[0181]具体的,还可以为第一录用数据、第二录用数据、第三录用数据以及第四录用数据分配有权重,权重分别为第一权重、第二权重、第三权重和第四权重,稿件被所述意向出版物收录的概率=第一录用数据*第一权重+第二录用数据*第二权重+第三录用数据*第三权重+第四录用数据*第四权重,此时需要满足稿件被所述意向出版物收录的概率最大为1,最小为O。
[0182]请参阅图12,为本发明实施例提供的一种信息处理装置的另一种实现方式的结构示意图,该装置包括:第一获取模块701、确定模块702、第二获取模块703、第一计算模块704、比较模块1201、第二计算模块1202以及推荐模块1203,其中:
[0183]第一获取模块701,用于获取用户上传的稿件、所述用户填写的投递信息,所述投递信息包括:需要投递的意向出版物。
[0184]确定模块702,用于确定所述稿件的特征信息,所述特征信息包括用户级别、稿件篇幅、稿件复制比、技术领域中的一种或多种。
[0185]第二获取模块703,用于从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种。
[0186]第一计算模块704,用于依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。
[0187]比较模块1201,用于当所述稿件被所述意向出版物收录的概率低于预设值时,将所述特征信息与所述数据库中每一出版物的收录稿件要求信息进行比较。
[0188]第二计算模块1202,用于计算出收录概率大于等于预设值的推荐出版物。
[0189]推荐模块1203,用于按照收录概率从大至小,将推荐出版物推荐至所述用户。
[0190]假设用户想将稿件投递至出版物A,预设值为55%,稿件被所述意向出版物收录的概率为40%,此时将特征信息与数据库中每一出版物的录用稿件要求信息进行比较。发现出版物B可能收录该稿件的概率为55%,出版物C可能收录该稿件的概率为70%,出版物D可能收录该稿件的概率为80%。则可以优先给用户推荐出版物D,再给用户推荐出版物C,然后给用户推荐出版物B。
[0191]需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0192]对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【主权项】
1.一种信息处理方法,其特征在于,包括: 获取用户上传的稿件以及投递信息,所述投递信息包括:意向出版物; 确定所述稿件的特征信息,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种; 从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种; 依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。2.根据权利要求1所述信息处理方法,其特征在于,在所述特征信息包括技术领域时,确定所述稿件的技术领域包括: 从所述稿件中查找包含有关键词字段的语句; 从所述语句中获得表示技术领域的词汇,将所述表示技术领域的词汇确定为所述稿件的技术领域。3.根据权利要求2所述信息处理方法,其特征在于,在所述投递信息还包括投递技术领域时,所述确定所述稿件的技术领域包括: 从所述稿件中查找包含有关键词字段的语句; 从所述语句中获得表示技术领域的词汇; 比较所述表示技术领域的词汇和所述投递技术领域,将范围较小的技术领域确定为所述稿件的技术领域。4.根据权利要求1所述信息处理方法,其特征在于,在所述特征信息包括用户级别时,所述确定所述稿件的用户级别包括: 从所述稿件中获取用户的归属信息,所述归属信息包括单位信息或院校信息; 从预先存储的归属信息与用户级别的对应关系中,获得所述用户的用户级别。5.根据权利要求1所述信息处理方法,其特征在于,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域,所述收录稿件要求信息包括录用稿件的最低用户级另O、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比,所述依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率包括: 依据所述特征信息中用户级别与所述录用稿件的最低用户级别的大小关系,确定第一录用数据; 依据所述特征信息中技术领域与所述收录稿件要求信息中录用稿件的技术领域的包含关系,确定第二录用数据; 依据所述特征信息中的稿件复制比与所述收录稿件要求信息中的录用稿件的最大复制比的大小关系,确定第三录用数据; 依据所述特征信息中的稿件篇幅与所述收录稿件要求信息中的录用稿件的篇幅的大小关系,确定第四录用数据; 依据所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据,获得所述稿件被所述意向出版物收录的概率。6.根据权利要求1至5任一所述信息处理方法,其特征在于,还包括: 当所述稿件被所述意向出版物收录的概率低于预设值时,将所述特征信息与所述数据库中每一出版物的收录稿件要求信息进行比较; 计算出收录概率大于等于预设值的推荐出版物; 按照收录概率从大至小,将推荐出版物推荐至所述用户。7.一种信息处理装置,其特征在于,包括: 第一获取模块,用于获取用户上传的稿件以及投递信息,所述投递信息包括:意向出版物; 确定模块,用于确定所述稿件的特征信息,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域中的一种或多种; 第二获取模块,用于从数据库中获得所述意向出版物已录用的稿件的收录稿件要求信息,所述收录稿件要求信息包括录用稿件的最低用户级别、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比中的一种或多种; 第一计算模块,用于依据所述特征信息和所述收录稿件要求信息,计算所述稿件被所述意向出版物收录的概率。8.根据权利要求7所述信息处理装置,其特征在于,在所述特征信息包括技术领域时,所述确定模块包括: 查找单元,用于从所述稿件中查找包含有关键词字段的语句; 第一获取单元,用于从所述语句中获得表示技术领域的词汇,将所述表示技术领域的词汇确定为所述稿件的技术领域。9.根据权利要求7所述信息处理装置,其特征在于,在所述投递信息还包括投递技术领域时,所述确定模块包括: 查找单元,用于从所述稿件中查找包含有关键词字段的语句; 第一获取单元,用于从所述语句中获得表示技术领域的词汇; 比较单元,用于比较所述表示技术领域的词汇和所述投递技术领域,将范围较小的技术领域确定为所述稿件的技术领域。10.根据权利要求7所述信息处理装置,其特征在于,在所述特征信息包括用户级别时,所述确定模块包括: 第二获取单元,用于从所述稿件中获取用户的归属信息,所述归属信息包括单位信息或院校信息; 第三获取单元,用于从预先存储的归属信息与用户级别的对应关系中,获得所述用户的用户级别。11.根据权利要求7所述信息处理装置,其特征在于,所述特征信息包括用户级别、稿件篇幅、稿件复制比、稿件的技术领域,所述收录稿件要求信息包括录用稿件的最低用户级另O、录用稿件的技术领域、录用稿件的篇幅、录用稿件的最大复制比,所述第一计算模块包括: 第一确定单元,用于依据所述特征信息中用户级别与所述录用稿件的最低用户级别的大小关系,确定第一录用数据; 第二确定单元,用于依据所述特征信息中技术领域与所述收录稿件要求信息中录用稿件的技术领域的包含关系,确定第二录用数据; 第三确定单元,用于依据所述特征信息中的稿件复制比与所述收录稿件要求信息中的录用稿件的最大复制比的大小关系,确定第三录用数据; 第四确定单元,用于依据所述特征信息中的稿件篇幅与所述收录稿件要求信息中的录用稿件的篇幅的大小关系,确定第四录用数据; 计算单元,用于依据所述第一录用数据、所述第二录用数据、所述第三录用数据以及所述第四录用数据,获得所述稿件被所述意向出版物收录的概率。12.根据权利要求7至11任一所述信息处理装置,其特征在于,还包括: 比较模块,用于当所述稿件被所述意向出版物收录的概率低于预设值时,将所述特征信息与所述数据库中每一出版物的收录稿件要求信息进行比较; 第二计算模块,用于计算出收录概率大于等于预设值的推荐出版物; 推荐模块,用于按照收录概率从大至小,将推荐出版物推荐至所述用户。
【文档编号】G06F17/30GK105824964SQ201610202118
【公开日】2016年8月3日
【申请日】2016年3月31日
【发明人】文漪, 董亚坤
【申请人】比美特医护在线(北京)科技有限公司