一种最佳内容重构的无障碍快速阅读方法

文档序号:9911277阅读:290来源:国知局
一种最佳内容重构的无障碍快速阅读方法
【技术领域】
[0001] 本发明涉及无障碍快速阅读方法的技术领域,特别是最佳内容重构的无障碍 Skimming快速阅读方法。
【背景技术】
[0002] 世界上约有盲人3000万人左右,中国约有500万盲人,占世界总数的18%,随着互 联网的高度普及和互联网在日常生活中重要性的不断上升,盲人上网问题将成为无障碍建 设中的重要问题。盲人由于无法通过视力接受信息,所以其上网问题特别突出。当前视力障 碍人士使用读屏软件获取网页文章信息主要存在两大问题。一方面读屏软件朗读正文时逐 字逐行的读取,这使得视力障碍人士获取信息的效率明显下降,另一方面视力障碍人士获 取消息的信道狭窄,他们只能通过听觉获取信息,这时大量的语音朗读很容易给他们带来 信息过载的问题。
[0003] 针对视力障碍人士使用读屏软件获取信息时所面对的效率低与视障人士遭受的 信息过载问题,读屏软件的快速阅读功能被提出。读屏软件快速阅读需要解决以下两个问 题:(1)视障人士使用读屏软件效率低的问题。快速阅读解决效率问题提出应该首先给视障 人士一个文章的摘要,这样视障人士可以很快的了解文章的内容并根据自己的兴趣决定是 否继续阅读文章,这是通过文章选择性阅读提高视障人士的阅读效率。(2)视障人士使用读 屏软件的信息过载问题。摘要也是解决视障人士信息过载问题的一种解决方案。针对视障 人士获取信息的信道窄的问题,我们应该提供他们高质量的阅读内容。文章摘要可以通过 极少的句子或者词语表达清楚原文的意思,这样我们就可以解决读屏软件给视障人士带来 的信息过载问题。

【发明内容】

[0004] 本发明要克服现有技术的上述缺点,提出一种基于最佳内容重构的无障碍 Skimming快速阅读方法,以帮助视力障碍人士快速的获取网上的信息解决。
[0005] -种基于最佳内容重构的无障碍快速阅读方法,从互联网抓取网页后,针对每个 网页进行以下操作:
[0006] 1)提取网页中的文章二,其中D为文章的句子向量集合, 为句子向量表不文章 d的第i个句子;
[0007] 2)利用词性标注的方法对集合D中的句子进行名词,介词的抽取得到句子部分集 合户=...灸,...1]%其中句子部分1为句子向量;抽取名词、介词所得,然后 将任意的句子部分&表不成TF向量,则句子部分P可以表不为TF矩阵 S' :S.2,* * .,i.' · * * ;
[0008] 3)使用最佳内容重构的方法根据TF矩阵S从P选取k个句子部分组成集合 X = ?,…朶,…叉Γ作为文章的摘要,其中篇是选取出的第i个句子部分,X是P的真 子集。
[0009] 4)根据Skimming快速阅读框架要求将k个句子部分中的名词与介词按照原文中出 现的顺序排列作为摘要文本;通过读屏软件自由切换摘要与原文的功能实现视力障碍人士 快速阅读。
[0010] 所述的步骤2)中所述的句子向量1描述如下:假设文章 D在抽取名词,介词后得到 的句子部分集合P包含η个不同的词汇m个句子,按照字典序建立字典diet向量,字典为η X 1 的向量;那么第i个TF句子向量;^的第j个值表示字典diet中的第j个词在第i句子的词频, 则;^为η X 1的向量。S为m X η的矩阵,Dij为字典diet中的第j个词在第i句的词频。
[0011 ] 所述的步骤3)中使用最佳内容重构的方法为DSDR方法,DSDR方法可以从P中选取k 个句子部分进行原文最佳重构,选取的k个句子部分组成摘要X。假设摘要为 X = [?, ?,…I... ,x对应的 TF矩阵为 T = [II...... ~ 分I对应的TF向量;可以用X对应的TF矩阵T重构即spfideti)其中乜为重构函数,T为η Xk的TF矩阵,ai为kXl权重向量,那么任意TF向量^重构的损失函数为L(Si,T,ai)= | |Si- fi(T,ai) I 12;对S中的所有句子重构的损失函数1]1$2^|5) -/^2;0^|进行最小化可以找到 最佳的k个句子进行原文最佳重构即X。
[0012] 所述的步骤4)的具体做法是:
[0013] 1)首先将基于最佳内容重构的方法得到的k个摘要句子按照原文出现的顺序排 序;
[0014] 2)对排序好的摘要中的名词,介词分别一一映射到原文中去。若对于摘要中一个 名词Μ原文中有多个映射及,那么选择及中的第一个词作为Μ的映射,这样可以保证不会丢 失?目息;
[0015] 3)视力障碍人士使用基于最佳内容重构的无障碍Skimming快速阅读方法阅读时, 首先播放摘要文本,用户根据摘要文本的信息自由的选择摘要文本与原文跳读,快速阅读。 [0016]本发明提出了基于最佳内容重构的无障碍Skimming快速阅读方法,其优点在于: 对文章进行自动摘要,一方面提供文章摘要给视力障碍人士可以加速他们理解文章大意减 少信息过载,另一方面Skimming的原文与摘要之间跳读可以帮助视力障碍人士获取更多的 文章细节。
【附图说明】
[0017]图1是本发明的方法流程图。
【具体实施方式】
[0018] 参照附图,进一步说明本发明:
[0019] 1、一种基于最佳内容重构的无障碍快速阅读方法,从互联网抓取网页后,针对每 个网页进行以下操作:
[0020] 1)提取网页中的文章汐=,其中D为文章的句子向量集合, _Fl.为句子向量表不文章 d的第i个句子;
[0021] 2)利用词性标注的方法对集合D中的句子进行名词,介词的抽取得到句子部分集 合P = >其中句子部分A为句子向量工抽取名词、介词所得,然后 将任意的句子部分&表不成T F向量$,ι则句子部分P可以表不为T F矩阵 S- = i'S'l··, S'Zy - * . Sif., . . I;
[0022] 3)使用最佳内容重构的方法根据TF矩阵S从P选取k个句子部分组成集合 X = [$,5,...... 乍为文章的摘要,其中S是选取出的第i个句子部分,X是p的 真子集。
[0023] 4)根据Skimmin
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1