专利名称:一种报纸数字化版面信息的裁剪与拼装的方法及系统的制作方法
技术领域:
本发明属于数字图书馆与数字报刊应用领域,具体涉及一种报纸数字化版面信息
的裁剪与拼装的方法及系统。
背景技术:
目前,随着计算机网络技术的发展,数字报刊以它信息量大、时效性高、便于检索、收藏、管理的优势获得了人们的青睐。同时,随着web2.0时代的到来,数字媒体的用户个性化数据再加工技术_数字报剪报技术也越来越受到人们的关注和期待。
传统纸质剪报技术缺点明显,面对数字报刊更是束手无策。传统剪报是用一把剪刀,从一张完好的报纸或者一本崭新的刊物里直接将所需文章剪裁下来,然后用浆糊把它们拼凑在一起。这种做法破坏了报纸和刊物的完整性,降低了其保存利用的价值。同时,剪报制作者不能对剪裁下来的文章进行再加工,并且传递方式单一。数字报刊剪报技术的出现正好能够解决上述存在的问题。 报纸信息作为平面媒体资讯的重要来源显得格外重要,但是目前的数字报只提供
原文和原版面图信息是不够的,当报纸资讯文章独立被检索和使用时,它的出处佐证图片
显得格外重要,通过使用本方法也可以解决上述问题。
目前数字报刊剪报技术的实现,主要采用如下方案 将图片形式的报纸版面反解为电子文本,并根据一定的人工标注住息将待剪的报道以文本方式抽取出来,提供给读者的是报道文本。由于并未将待剪报道保持原来的形状以版面图片子图的形式裁剪出来,无法将各裁剪出的报道进行拼接,所以并未实现真正意义上的剪报。 以上剪报方案,未达到模拟读者纸质剪报习惯,保持原报纸报道排版样式,按读者兴趣分类管理剪报、排版打印的效果和初衷。
发明内容
针对现有技术中存在的缺陷,本发明的目的是提供一种报纸数字化版面信息的裁剪与拼装的方法及系统,该方法及系统能够模拟纸质剪报,根据用户点击裁剪报纸数字化版面上的文章报道,从而实现面向读者提供个性化数字剪报功能的目的。
为达到以上目的,本发明采用的技术方案是 —种报纸数字化版面信息的裁剪与拼装的方法,包括以下步骤 步骤一,图片定位裁剪模块将图片形式的报纸数字化版面中读者需要裁剪的目标
文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此目标文
章区域的新图片; 步骤二,多图片拼接模块将用户裁剪下来的多个图片进行拼接; 步骤三,打印成簿模块对拼接后的图片进行输出或打印。 进一步,步骤一中,对目标文章区域进行裁剪的方法包括以下步骤
4
(1)用户选定需要裁剪的目标文章,系统获得目标文章区域的外接矩形;
(2)按外接矩形边界进行裁剪,将目标文章外接矩形位置信息同本版面所有其它文章外接矩形位置进行比较计算,判断是否有交集,如果是,则得到交集区域,否则转入步骤(5); (3)将交集区域位置信息与目标文章的热点信息进行比较计算,从而判断交集区域是否属于目标文章,如果是,转入步骤(5),否则转入步骤(4); (4)计算获得交集区域,并将不属于目标文章的交集区域设置底色为白色,生成一幅新的图片作为裁剪后的文章图片; (5)保存裁剪后文章图片并记录裁剪边界位置信息。更进一步,步骤(1)中,系统获得目标文章区域的外接矩形的方法如下系统首先获得该目标文章的ID,然后从数据库中读取该目标文章的热点信息,在热点信息中找出横、纵坐标的最小值与最大值,最后组合成为能够覆盖此目标文章全部区域的最小矩形的四个顶点的坐标,该最小矩形为目标文章区域的外接矩形。 进一步,步骤二中,用户将裁剪好的文章的图片分类保存,当用户希望对多张图片进行拼接排版时,选择某一分类,系统将分类中所有用户保存的图片读至浏览器页面一侧候选区。 更进一步,步骤二中,拼接的画布默认大小为A4,并且能够自定义设置。拼接时采用Flash技术,将候选区的剪切图片拖至画布区,自由摆放,如有重叠则由用户设置层次。在画布上拼接的剪切图片的图片信息放在缓冲区,用户关闭浏览器时排版信息清除。
进一步,步骤三中,对拼接后的图片进行输出或打印的方法包括以下步骤
首先将用户排版的画布上的每个剪切图片按ID从数据库中读出相应标题和文章正文建立关联,将各文章标题按照位置自上至下自左至右顺序,依次排列形成目录;
然后按照目录顺序将文章正文按文章分页排列成文档,将排列的页数加至目录项中; 最后将画布上排版好的拼接图片信息、目录、文章正文输出保存或传给打印机,由打印机打印输出。 —种报纸数字化版面信息的裁剪与拼装的系统,包括以下模块 图片定位裁剪模块,用于将图片形式的报纸版面中读者需要裁剪的文章包括其涉
及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此文章区域的新图片; 用于将用户裁剪下来的多个图片进行拼接的多图片拼接模块; 用于对拼接后的图片进行输出或打印的打印成簿模块。 本发明的效果在于采用本发明所述的方法和系统,可以有效地根据用户点击裁剪报纸数字化版面上的文章报道,分类保存、在线排版、打印,达到了模拟纸质剪报,面向读者提供个性化剪报功能的初衷。
图1是本发明所述系统的结构图; 图2是本发明所述方法中图片定位裁剪方法的流程图。
具体实施例方式
下面结合附图和具体实施方式
对本发明作进一步地描述。
如图1所示,一种报纸数字化版面信息的裁剪与拼装的系统,包括以下模块 图片定位裁剪模块ll,多图片拼接模块12,打印成簿模块模块13。 所述的图片定位裁剪模块11用于将图片形式的报纸版面中读者需要裁剪的文章
包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此文章区域的
新图片。 所述的多图片拼接模块12用于将用户裁剪下来的多个图片进行拼接。 所述的打印成簿模块13对拼接后的图片进行输出或打印。 如图2所示,一种报纸数字化版面信息的裁剪与拼装的方法,包括以下步骤 步骤一,图片定位裁剪模块将图片形式的报纸版面中读者需要裁剪的目标文章包
括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此目标文章区域
的新图片。 本实施例中,由于报纸中每篇文章的显示形状大部分呈矩形,但也有许多呈不规则形状或分离的几个子图,所以使用最大拼接算法来确定需要裁剪的目标文章的正确区域。 数据库中存有每份报纸各个版面中每个文字块及图片的位置信息。要求每个文字块及图片的形状都为矩形,如呈不规则形状,将被拆分成多个不相交的矩形。为每个矩形单元保存四个顶点的位置坐标。在数字报出版前,排版人员将手工设置各矩形单元的关联-即每篇文章由哪些矩形组成。因此将在数据库中保存每份报纸各个版面上每篇文章的ID,以及组成这篇文章区域的所有矩形单元的顶点坐标值,将这些坐标值的集合称作该文章的热点信息。 本实施例中,使用最大拼接算法来确定需要裁剪的目标文章的正确区域的方法包括以下步骤 (1)当用户选定需要裁剪的目标文章后,系统获得该目标文章的ID,从数据库中读取该目标文章的热点信息S21,在热点信息中找出横、纵坐标的最小值与最大值,组合成为能够覆盖此目标文章全部区域的最小矩形的四个顶点的坐标,称此矩形为目标文章区域的外接矩形; (2)按外接矩形边界进行裁剪S22,将目标文章外接矩形位置信息同本版面所有其它文章外接矩形位置进行比较计算,判断是否有交集S23,如果是,则得到交集区域,否则转入步骤(5); (3)将交集区域位置信息与目标文章的热点信息进行比较计算S24,从而判断交集区域是否属于目标文章,如果是,转入步骤(5),否则转入步骤(4); (4)计算获得交集区域S26,并将不属于目标文章的交集区域设置底色为白色
S27,生成一幅新的图片作为裁剪后的文章图片; (5)保存裁剪后文章图片并记录裁剪边界位置信息。 以上文章图片生成过程也可以实现通过计算机自动批量的完成生成某份报纸所有文章的出处图片的应用。 步骤二,多图片拼接模块将用户裁剪下来的多个图片进行拼接。
本实施例中,用户首先将裁剪好的文章的图片分类保存。当用户希望对多张图片进行拼接排版时,选择某一分类,系统将分类中所有用户保存图片读至浏览器页面一侧候选区。 为方便操作及交互采用Flash技术,用户可将候选区的图片拖至画布区,自由摆放,如重叠可由用户设置层次。画布默认大小为A4,可自定义设置。画布上图片摆放图片信息放在缓冲区,用户关闭浏览器排版信息清除。
步骤三,打印成簿模块对拼接后的图片进行输出或打印。 本实施例中,首先将用户排版的画布上的每个剪切图片按ID从数据库中读出相应标题和文章正文建立关联,将各文章标题按照位置自上至下自左至右顺序,依次排列形成目录。然后按照目录顺序将文章正文按文章分页排列成文档,将排列的页数加至目录项中。最后将画布上排版好的拼接图片信息、目录、文章正文输出保存或传给打印机,由打印机打印输出。 本发明具体应用的实例 用户在提供数字报刊剪报的数字报网站注册后,为用户按用户ID开辟相应的剪报存储空间。用户浏览某报纸版面时,浏览器页面左上方显示出该版面的图象。当用户鼠标移动至某篇文章上,捕捉鼠标信息获得文章位置信息,传给服务器端,查询出相应文章ID及热点信息,计算出文章区域的边界,返回客户端,此时版面图象上相应的边界绘制的热区显示,即在文章区域完整范围用红色线条画出的边框。 读者在热区中点击鼠标右键出现下拉框中选择"剪报",服务器端获得剪报消息后,调用后台裁剪程序,具体方法见关键技术"图片定位裁剪"。同时浏览器页面内用户裁剪的文章热区边界上出现小剪刀剪裁的动画。后台裁剪程序执行完毕时小剪刀动画结束。动画时间默认最低时间为2秒,最长10秒。如10秒内后台程序未能执行完毕或是响应,浏览器端跳出裁剪失败提示。 后台裁剪程序执行完成后,将所生成的文章图片与用户ID建立关联,存放至个人剪报空间。用户可以对个人剪报空间浏览,可以对图片进行分类。当用户新建分类时将分类名与用户ID建立关联,服务器端建立相应的以分类名类名的子目录,将用户分类的图片存至相应目录下。 浏览器界面设置"七巧拼接"按钮,用户点击后进入Flash操作界面,从服务器端
读取图片,显示在界面左侧,用户可以自由拖拽拼接。具体方法见"多图片拼接"。 拼接后用户选择打印,则可将剪报打印成簿,第一页为拼接好的A4图片,第二页
为文章标题目录,后依次为每篇文章内容。 本发明所述的方法及系统并不限于具体实施方式
中所述的实施例,本领域技术人员根据本发明的技术方案得出其他的实施方式,同样属于本发明的技术创新范围。
权利要求
一种报纸数字化版面信息的裁剪与拼装的方法,包括以下步骤步骤一,图片定位裁剪模块将图片形式的报纸数字化版面中读者需要裁剪的目标文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此目标文章区域的新图片;步骤二,多图片拼接模块将用户裁剪下来的多个图片进行拼接;步骤三,打印成簿模块对拼接后的图片进行输出或打印。
2. 如权利要求1所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于, 步骤一中,对目标文章区域进行裁剪的方法包括以下步骤(1) 用户选定需要裁剪的目标文章,系统获得目标文章区域的外接矩形;(2) 按外接矩形边界进行裁剪,将目标文章外接矩形位置信息同本版面所有其它文 章外接矩形位置进行比较计算,判断是否有交集,如果是,则得到交集区域,否则转入步骤 (5);(3) 将交集区域位置信息与目标文章的热点信息进行比较计算,从而判断交集区域是 否属于目标文章,如果是,转入步骤(5),否则转入步骤(4);(4) 计算获得交集区域,并将不属于目标文章的交集区域设置底色为白色,生成一幅新 的图片作为裁剪后的文章图片;(5) 保存裁剪后文章图片并记录裁剪边界位置信息。
3. 如权利要求2所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于, 步骤(1)中,系统获得目标文章区域的外接矩形的方法如下系统首先获得该目标文章的 ID,然后从数据库中读取该目标文章的热点信息,在热点信息中找出横、纵坐标的最小值与 最大值,最后组合成为能够覆盖此目标文章全部区域的最小矩形的四个顶点的坐标,该最 小矩形为目标文章区域的外接矩形。
4. 如权利要求1至3之一所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特 征在于步骤二中,用户将裁剪好的文章的图片分类保存,当用户希望对多张图片进行拼接 排版时,选择某一分类,系统将分类中所有用户保存的图片读至浏览器页面一侧候选区。
5. 如权利要求4所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于步骤二中,拼接的画布默认大小为A4,并且能够自定义设置。
6. 如权利要求5所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于拼接时采用Flash技术,将候选区的剪切图片拖至画布区,自由摆放,如有重叠则由用户设 置层次。
7. 如权利要求6所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于 在画布上拼接的剪切图片的图片信息放在缓冲区,用户关闭浏览器时排版信息清除。
8. 如权利要求1至3之一所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于,步骤三中,对拼接后的图片进行输出或打印的方法包括以下步骤首先将用户排版的画布上的每个剪切图片按ID从数据库中读出相应标题和文章正文 建立关联,将各文章标题按照位置自上至下自左至右顺序,依次排列形成目录;然后按照目录顺序将文章正文按文章分页排列成文档,将排列的页数加至目录项中; 最后将画布上排版好的拼接图片信息、目录、文章正文输出保存或传给打印机,由打印 机打印输出。
9. 一种报纸数字化版面信息的裁剪与拼装的系统,包括以下模块图片定位裁剪模块,用于将图片形式的报纸版面中读者需要裁剪的文章包括其涉及的 图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此文章区域的新图片; 用于将用户裁剪下来的多个图片进行拼接的多图片拼接模块; 用于对拼接后的图片进行输出或打印的打印成簿模块。
全文摘要
本发明涉及一种报纸数字化版面信息的裁剪与拼装的方法及系统,属于数字图书馆与数字报刊领域。现有的方法和系统只能够支持数字报刊的整版浏览和存储,并不能提供以新闻报道为单位的裁剪技术来提供原文的佐证,更没有面向用户的个性化的剪报、收藏等功能。本发明所述的系统由三个核心模块组成图片定位裁剪模块,多图片拼接模块,打印成簿模块。采用本发明所述的方法和系统,可以实现数字报刊在线裁剪、自由拼接、按类存储、打印成簿等功能,为用户提供个性化的数字报刊剪报服务。
文档编号G06T11/60GK101739705SQ200810226958
公开日2010年6月16日 申请日期2008年11月21日 优先权日2008年11月21日
发明者刘艳珠, 吴艳伟, 孙赓, 耿晓笛, 赵东岩 申请人:北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学