一种基于社交化词典的单词推荐系统的制作方法
【专利摘要】本发明公开了一种基于社交化词典的单词推荐系统,用户在网络词典查词的同时,向社交化词典提供的单词,通过新单词提取算法,生成一个供选择的待推荐单词库;待推荐单词库通过过滤集成方法形成推荐单词库;根据用户行为进行协同过滤,产生个性化的推荐单词库,针对待推荐单词词库进行个性化分类,推送给用户。本发明的有益效果:本发明采用上述方案提供个性化单词学习方法的时候,可快速有效的给用户提供有针对性的、高效的单词学习;此外,本发明能够有效的利用社交网络,发现有针对性的单词,从而提高学习的质量。
【专利说明】一种基于社交化词典的单词推荐系统
【技术领域】
[0001]本发明涉及移动互联领域,特别涉及社交化词典的单词推荐系统。
【背景技术】
[0002]在用户使用词典、学习单词的过程中,如何根据每个用户自身的特点,推荐有针对性的单词,来优化其知识结构、提高学习的针对性、提高学习的效率,是个性化学习和提供个性化教育的重要问题。而现有的个性化单词学习,只是根据固定的词库,对不同层次类型的用户进行的一种基本分类之后的学习。这种分类方法过于简单,不易于用户持续学习新的知识,而且对词汇也没有做有效的分类,因此个性化的推荐单词有较大的改进空间。
[0003]另外,由于现有的个性化单词分类方法没有考虑到社会化的学习交流,使得用户孤立的学习,这样可能导致下述问题:其一:用户不能适时的学习到新单词;其二:不能有效的分享学习到的知识,其三:学习效率低。
[0004]通过检索发现,专利号为CN2010102007365,名称为一种个性化元搜索的方法及其
应用终端。该专利是一种个性化搜索的方法,包括:预先建立兴趣库;根据确定被搜索的关键词,从兴趣库中提取使用日志,并对搜索引擎返回的搜索结果进行预处理;利用使用日志,对预处理后的搜索结果和兴趣库中对应所述被搜索的关键词的资源定位符(U R L)的兴趣度进行计算,根据计算结果排序并显示;更新所述兴趣库。
[0005]专利号为CN2006100363617名称为一种综合搜索结果的排序系统及方法,该专利是一种综合搜索结果的排序系统,用于对综合搜索引擎中相互独立的垂直搜索引擎的结果进行排序,所述系统包括数据分析模块、数据库和排序模块;所述数据分析模块提供可用于排序算法的数据信息,并导入所述数据库中存储;所述数据库用于存储数据分析模块提供的数据信息,供应所述排序模块执行排序算法时的提取,并存储所述排序模块得到的最终排序信息;所述排序模块用于根据所述数据库中存储的数据信息执行排序算法,对所述垂直搜索引擎进行排序,并将最终排序信息存储到所述数据库中。
[0006]专利号为CN2007100995946名称为一种基于用户行为信息的搜索引擎检索结果重排序方法,该专利是一种基于用户行为信息的搜索引擎检索结果重排序方法,该方法是在搜索引擎的计算机上依次按以下步骤实现的:步骤(1).用户常用查询集的筛选:步骤(1.1).数据预处理:通过搜索引擎网络服务器从至少一个搜索引擎的用户日志中提取供基于用户行为进行搜索结果重排序的用户信息,形成的用户信息至少包含以下内容:Query:用户提交的查询;URL:该查询对应的用户点击的结果页面地址;Id:系统自动分配给每个用户每次使用搜索引擎时的标识号;所述步骤(1.1)依次含有以下各子步骤:步骤(1.1.1).把搜索引擎网络服务器记录的编码格式转换成国家标准汉字编码的GBK格式;步骤(1.1.2).去除所述Query、URL、Id以外的信息,并把日志信息整理成所述用户日志的三个内容项字符串的形式;步骤(1.1.3).在步骤(1.1.2)的范围内,再利用如KMP的字符串匹配算法过滤用户查询中的噪声信息,仅保留直接反映搜索引擎普通用户查询需求行为的内容项;步骤(1.2).提取查询用户数信息:对于在设定的最近时间段内用户日志中的用户提交的每一个查询Q,统计提交过该查询Q的用户数,该数值表示了用户对该查询的关注度;步骤(1.3).常用查询集的筛选:若:某查询Q在搜索引擎用户日志中其查询用户数小于设定值,则排除在常用查询集合之外;否则,把该查询Q放在所述常用查询集合S中;步骤⑵.用户点击率信息的提取:步骤(2.1).单搜索引擎用户点击率的提取:用户点击率=对于查询Q,用户点击结果页面地址URL的次数/查询Q的用户的点击总次数;步骤(2.2).多搜索引擎下用户点击率信息合并,用一个概率表达式P (URL |查询Q)来表示在合并后对查询Q的用户点击率的结果页面地址URL的用户点击率:P(URL |查询Q)=* P (SE 丨[i] | 查询 Q).P(URL | SE 丨[i ],查询 Q);其中,P(SE 丨[i ] | 查询 Q)表示在第i个搜索引擎SE I [ i ]中查询Q的概率,用SE I [ i ]查询可信度表示:SE I [ i ]查询可信度=log (在搜索引擎日志SE丨[i ]中查询Q的用户总数)/ *log (SE丨[i ]中查询Q的用户总数),i = 1,2,…,IP (URL I SE丨[i ],查询Q)表示在搜索引擎日志SE I [ i ]中,对于查询Q。
[0007]以上专利都是对搜索结果进行重新排序,方便用户使用,但是已有的专利只是侧重于网页搜索结果的排序。
【发明内容】
[0008]针对现有技术的不足,本发明解决推送哪些单词给用户,从而便于用户学习的问题,提供了一种个性化的解决方案,借助于社交化词典的使用,为不同的用户推荐有针对性的单词。本发明的目的在于提供一种能够有效利用社交网络学习资源,提供个性化单词推荐学习方法。
[0009]为了实现上述目的,本发明所采取的技术方案是:
一种基于社交化词典的单词推荐系统,用户在网络词典查词的同时,向社交化词典提供的单词,通过新单词提取算法,生成一个供选择的待推荐单词库;
待推荐单词库通过过滤集成方法形成推荐单词库;
根据用户行为进行协同过滤,产生个性化的推荐单词库,针对待推荐单词词库进行个性化分类,推送给用户。
[0010]社交化词典:用户在使用词典的过程中,自动或手动的提交到社交网络并进行交流。
[0011]提取待推荐词:在用户使用社会化词典的交互过程中,搜集用户新的单词,包括每个相对每个用户的单词和相对全部用户的单词。
[0012]用户分类:根据用户的注册信息、社交化词典的使用情况,通过聚类算法对用户进行分类。
[0013]过滤集成待推荐词:对待推荐词进行去噪、集成等操作。
[0014]推荐词库:某个阶段形成的可以供推荐的词库。
[0015]推荐单词:在社交化词典界面上显示推荐的单词。
[0016]本专利侧重于对词库的排序,以及对词库中多个释义的排序
本发明的有益效果: 本发明采用上述方案提供个性化单词学习方法的时候,可快速有效的给用户提供有针对性的、高效的单词学习;此外,本发明能够有效的利用社交网络,发现有针对性的单词,从而提高学习的质量。【专利附图】
【附图说明】
[0017]图1、本发明的原理方框图。
【具体实施方式】
[0018]如图1本发明的整体原理方框图;注册用户在登陆后使用社交化词典,记录用户社交化词典中使用过的单词,从使用过的词中提取新词,保存到待推荐单词库中;对待推荐单词库进行去噪等处理,生成推荐单词库;根据用户的行为进行协同过滤生成针对每个用户的个性化的推荐单词库;在合适的时候推荐给用户。
【权利要求】
1.一种基于社交化词典的单词推荐系统,其特征在于,用户在网络词典查词的同时,向社交化词典提供的单词,通过新单词提取算法,生成一个供选择的待推荐单词库;待推荐单词库通过过滤集成方法形成推荐单词库;根据用户行为进行协同过滤,产生个性化的推荐单词库,针对待推荐单词词库进行个性化分类,推送给用户。
【文档编号】G06F17/30GK103631779SQ201210298147
【公开日】2014年3月12日 申请日期:2012年8月21日 优先权日:2012年8月21日
【发明者】苗忠良, 王珊珊, 张莉 申请人:上海凌攀信息科技有限公司