一种笔记摘引及结构化的方法与流程

文档序号:31475695发布日期:2022-09-10 00:24阅读:85来源:国知局
一种笔记摘引及结构化的方法与流程

1.本发明涉及信息摘引和结构化处理领域,特别涉及使用软件进行笔记摘引和结构化的方法。


背景技术:

2.在信息获取日益多样化和碎片化的信息大爆炸时代,如何构建持久化的个人和团队深度学习系统和知识结构,是学习人士和机构所面临的重大问题。
3.目前,基于平板电脑、电脑和手机等多平台的笔记类软件已有多种,但其提供的都是通用的操作工具,由用户自行创建笔记。其优点是自由度高,但也存在不可避免的缺点:首先,用户的操作空间有限,尤其是在手机和平板上创建笔记时,文字录入繁琐,导致摘引操作不便;其次,不能有效减轻笔记的大量重复性工作,比如需要重复多次录入来源,笔记无法共享;再次,不同用户的笔记格式不一致,导致笔记的创建、传播和积累相当不便;最后,因为笔记一般是以线性的页面形式、分类树或网状的思维导图形进行组织,不利于用户整理资料,更不利于在其他人的笔记基础上进行个性化的迭代更新。总之,现有笔记让用户在非内容的外部操作上耗费过多精力,不具有成长性,不便于进行传播和滚动式的积累,更难以形成个性化的结构性知识库。
4.因此,需要一种能够便于摘引、传播、迭代和重新组织为个人知识库的笔记摘引和组织方法。


技术实现要素:

5.本发明提供了一种笔记摘引及结构化的方法,是基于通用的电脑、平板电脑、手机、电纸书等阅读硬件,其上的操作系统和阅读、笔记、编辑软件,以及通用的互联网和移动互联网基础而实现的。
6.每一份笔记具有固定的数据格式,至少包括笔记编号、主题词、摘引内容、来源等格式,还包括关键词、概要、链接、标签、属性等格式。
7.其基本的方法如下。
8.a)用户在阅读资料时,遇到需要摘引的内容,则在该内容上点击进行摘引,系统将选取对象数据放入内存剪贴板中;用户继续选取其他内容的,新数据不覆盖之前放入的数据,而是作为另外的条目亦放入内存剪贴板中。内存剪贴板中能够保存的条目数由用户进行设定。
9.用户可对内存剪贴板中的数据进行删除、输入新内容、移动、条目合并、分割。经编辑后的条目内容是一个整体数据块,默认一键选中条目的全部数据库。
10.b)用户创建笔记,系统自动赋予该笔记数据以唯一的笔记编号。笔记编号中至少包括用户标识码,用户标识码指的是用户的编码、账号、用户所使用的机器编码、软件编码之类与用户唯一性关联的一种或组合。
11.c)用户输入该笔记的主题词,系统将其与笔记库中现有笔记的主题词进行比对,
若存在相同的主题词,则将该笔记归入具有相同主题词的所有笔记的集合内,形成同主题词笔记组。
12.d)用户从内存剪贴板中选取某条目,该条目数据导入笔记的某格式中。一般来说,内存剪贴板的某条目数据是以一个整体数据块的形式直接导入的。内存剪贴板中的条目数据可被导入到概要、摘引内容、来源等格式中。摘引内容也是以多条形式存在的,分为“原文摘引”、“缩略摘引”和“大意摘引”,且每条摘引内容具有可选的来源格式,在其中输入该摘引内容之来源。
13.e)用户对该笔记进行的分类、链接的外部操作,均被视为是对该笔记所属同主题词笔记组的操作。亦即,若对某主题词集合内的某张卡片与另一主题词的某张卡片进行链接操作时,即相当于这两个同主题词笔记组之间进行了链接操作;当将某份笔记的映射放入分类树的某个节点时,即相当于将该同主题词笔记组的映射被放入到该节点中。还包括一个同义词库,相同主题词也包括相似、同义的主题词。
14.f)笔记被归类到分类树的多个不同节点下,但其在系统内只存在唯一的活动数据,所有对该笔记内容的操作均映射到该唯一的活动数据。亦即,笔记数据在某个用户的笔记系统内只存在一份活动数据,无论笔记被放入多少个节点、与多少笔记进行链接、从何处进入对其内容进行修改,所操作的都是此唯一的活动的数据实体,此被视为笔记数据的唯一性。当然,该笔记数据可被额外备份。
15.g)笔记通过转让、共享的方式进行转移,当新用户接收并同意接受笔记数据后,该笔记被导入新用户的笔记库。笔记数据是以数据文件存在的,其可以在不同用户间转移,当新用户接收到新的笔记数据后,其对笔记内容进行评估,若认可接受该笔记数据,则导入该笔记到自己的笔记库中。对导入后的笔记与用户自身笔记的操作是一致的。原笔记之间的链接关系仍可保留,也允许通过链接关系直接导入下一层笔记。在原用户允许的情况下,被接受的笔记编号中的用户标识码替换为新用户的标识码,而原用户则被记录到该笔记的编辑记录中。
16.还包括一种区分直接选取和区域选取的方法;设定一个选取方式区分时间,用户点击时监测时间和点击点的移动;依据点击点在起始位置的停留时间是否大于选取方式区分时间,将该选取动作视为是直接选取还是区域选取。比如停留时间小于等于或小于选取方式区分时间的,则为直接选取;大于或大于等于选取方式区分时间的,则为区域选取。也可相反。
17.或者使用一种区分直接选取和区域选取的方法;设定一个选取方式区分力度值,用户点击时检测点击力度;依据点击点力度是否大于选取方式区分力度值,将该选取动作视为是直接选取还是区域选取。比如点击力度小于等于或小于选取方式区分力度值的,则为直接选取;大于或大于等于选取方式区分力度值的,则为区域选取。也可相反。
18.若选取动作为直接选取且对象为可选取文本,则直接选取文本作为选取对象数据;若为非可选取文本,则使用文字检测算法,向点击点四周扩散检测文字边界,以文字边界之内的内容为选取对象,识别为文本作为选取对象数据。若为区域选取,则以点击点起始位置和终止位置为对角点之间的矩形区域为选取对象。区域选择的选取对象优先以图像数据形式存入内存剪贴板。对于过大的图像数据可进行另外存储,以缩略图放入到内容剪贴板。
19.还可设定一个直接选取笔触宽度,若为直接选取,则以直接选取笔触宽度所覆盖范围为选取对象;进行上述操作。
20.还包括一种间断式选取的方法,设定一个容断时间,系统在上一次点击终止时开始计时直至下一次点击或容断时间届满孰先;若用户在容断时间内进行了下一次点击,则将下一次的选取对象数据存入内存剪贴板的与上一次选取对象数据的同一个条目内。选取对象结果为文本的,在文本之间自动添加省略号;当用户将该条目数据导入笔记内容的摘引内容格式内时,该条摘引自动被标识为“缩略摘引”。
21.还包括一种自动形成关键词网络的方法,所有含有某关键词的同主题词笔记组成为该关键词网络的主题词节点,所有与该关键词出现在同一笔记内的其他关键词成为该关键词网络的关键词节点。
22.在本关键词网络内,主题词节点提供的是该关键词的纵向深度,关键词节点提供的是本关键词的横向广度。在此广度和深度的结合下,以该关键词为中心自动形成知识网络。
23.关键词网络中,某关键词与其他关键词的关联强度与两个关键词同时存在的笔记数量正相关,但具有相同来源的笔记不重复计数。
24.还包括对笔记质量进行评价的方法,系统统计所有用户开放查询的具有相同主题词的笔记的关键词,计算本笔记关键词与总体关键词分布的偏离度,偏离度与笔记质量负相关。
25.还包括一种自动形成链接的方法,用户在阅读某资料某页创建笔记时,系统自动在该页面上生成锚点,与该笔记形成链接,链接的目标资源定位即指向该页面。目标资源定位包括该资源的存储位置、资料名和页码;用户通过转移获得该笔记的,通过设置目标资源的存储位置和资料名,重新建立起目标资源和该笔记的链接。
26.还包括一种自动填充来源的方法,用户在阅读某资料时若创建笔记,系统判断该资料上是否已有笔记;若有,则新笔记以该资料上已有笔记的来源数据自动作为新笔记的来源数据。若无,则由用户输入来源数据。
27.为便于用户核对笔记来源,对资料页面上被摘引的内容进行标识,如划线、背景色、线框等。
28.本发明的特点和优势在于:
29.1.笔记系统具有成长性。笔记的转移、分享、传播更为便利,用户既可以自行创建笔记库,也可以基于其他用户的笔记,重构自己的知识库。
30.2.便于进行碎片化记录和结构化整理。笔记数据在本系统内具有唯一性,每一份笔记无论其位于多少个分类节点中和关键词网络中,其对应的数据实体均是唯一的,对该数据实体的修改在任意位置上均可呈现。
31.3.本发明提供的笔记摘引方法尤其适合在小尺度电子设备上进行。通过多条目可编辑的内存剪贴板和容断式摘引的方法,用户无需或只需输入少量文字,即可将资料摘引的到笔记内,极大地提高了效率。
32.4.本发明还提供了笔记自组织的方法。相对固定的笔记数据格式及自动归类和结构化的方法,使得用户无需关注笔记格式,全力集中在笔记内容。对原子化、碎片化的笔记通过主题词和关键词的自动连接,形成兼顾广度和深度的笔记网络。
附图说明
33.图1是本发明实施例进行摘引的操作界面示意图。
34.图2是本发明实施例进行摘引和创建笔记的方法流程示意图。
35.图3是本发明实施例进行容断式摘引的方法流程示意图。
36.图4是本发明实施例形成的关键词网络示意图。
37.其中1是文件名栏,2是页面操作菜单,31是第一次点击的点击点起始位置,32是第一次点击的点击点终止位置,33是下一次点击的点击点起始位置,34是下一次点击的点击点终止位置,35是原文中的引用标识,4是内存剪贴板,41是内存剪贴板的第一个条目,51是笔记操作菜单,52是笔记主题词格式,53是笔记概要格式,541是笔记摘引内容格式,542是笔记摘引内容来源标识,543是笔记摘引类型标识,55是笔记其他格式标识,551是该格式被选中形态,552是该格式有内容形态,553是该格式无内容形态。
具体实施方式
38.以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求和技术方案限定和覆盖的多种不同方式进行实施。
39.图1是进行摘引的操作界面示意图。
40.用于在阅读资料时,在文件名栏1中显示所打开的资料的文件名、网址、资料编号等,通过笔记操作菜单2执行在该页面新增笔记、显示该页面笔记的操作。
41.在本例中,用户欲摘引资料中第二行的“mnop”和“rstu”的内容,则在文字m处点击并连续移动划过文字直至p,系统记录第一次点击的点击点起始位置31,和第一次点击的点击点终止位置32。系统检测到点击点在第一次点击的点击点起始位置31停留时间未超过设定的选取方式区分时间,视为直接选取。且因其间的选取对象为可选取文本,则直接选取文本“mnop”作为选取对象数据放入内存剪贴板的第一个条目41中。
42.用户设定了间断式选取的容断时间。点击点在第一次点击的点击点的终止位置32抬起时开始计时。在本例中,用户在容断时间以内进行了下一次点击,则将下一次点击的点击点起始位置33和下一次点击的点击点终止位置34之间的可选取文本“rstu”存入到内存剪贴板中上一条相同的条目即内存剪贴板的第一个条目41中,位于上一条的选取对象数据“rstu”之后并在两者间自动添加省略号,省略号的格式与摘引内容有所区别。
43.用户点击页面操作菜单2的新增笔记菜单,赋予该笔记唯一的笔记编码。系统还检测到该资料上已有笔记,则自动将已有笔记的来源格式中的来源数据填入到新建笔记的来源格式中,并点亮来源格式标识,显示该格式有内容形态552。
44.用户通过笔记操作菜单51对笔记进行最小化、最大化、关闭、删除、收藏、设置属性、查看笔记编码等操作。在笔记主题词格式52、笔记概要格式53中填入相应内容。
45.用户选取内存剪贴板中的第一个条目41,将其数据块整体填入到笔记摘引内容格式541中。因存在原文中的引用标识35,意为上述内容有二次引用来源,则用户将该二次引用的来源信息填入该条笔记摘引后的来源格式中,则笔记摘引内容来源标识542点亮。因本笔记摘引是容断式摘引,故笔记摘引类型标识543显示为“缩略摘引”。
46.用户点击笔记其他格式标识55进入相应格式中进行编辑,若该格式被选中显示,则呈现该格式被选中形态551;若该格式有内容则是该格式有内容形态552;若该格式无内
容,则是该格式无内容形态553。
47.图2是进行摘引和创建笔记的方法流程示意图。
48.用户阅读资料时,点击欲摘引的内容,将选取对象数据放入内存剪贴板中,对内存剪贴板数据进行编辑后,每一个条目即为一个完整的数据块。用户创建笔记,系统自动赋予笔记以笔记编码,编码中包含有用户标识码;并在该页设置锚点,笔记与该锚点链接,即笔记中该链接的目标资源位置指向该页面。
49.系统检索该资料上是否存在已有笔记。若有,则将已有笔记的来源格式中的来源数据自动填入新笔记的来源格式中。若该资料上有多个笔记且来源不同,则填入最近创建的笔记的来源数据。若无已有笔记,则由用户填入来源数据。
50.用户填入主题词后,从内存剪贴板中导入相应的条目数据到笔记的格式中。自动保存,完成本笔记的创建。
51.图3是进行容断式摘引的方法流程示意图。用户设定了选取方式区分时间和容断时间。
52.用户点击页面上欲摘引的内容,系统记录点击点的起始位置,并对在起始位置的停留时间进行计时。若在选取方式区分时间内点击点仍停留在起始位置,则视为区域选取,停止计时;若未到选取方式区分时间点击点即已移动,则视为直接选取,停止计时。
53.若为区域选取,则记录点击点的终止位置,以起始位置和终止位置为对角线之间的矩形为选取对象。
54.若为直接选取,则记录点击点的终止位置。判断选取对象是否为可选取文本,若是,则直接选取文本作为选取对象数据,存入内存剪贴板。若不是可选取文本,则调用文字检测算法,以持续移动的点击点为中心向四周寻找文字边界,直至终止位置,以文字边界内的对象为选取对象,并进行ocr识别文字内容,将识别文本作为选取对象数据,存入内存剪贴板内。
55.点击点从终止位置抬起后开始计时,直至容断时间到或者下一次点击开始,以孰先为准。若在设定的容断时间内用户尚未进行下一次点击,即容断时间先到,则本次摘引结束。若用户在容断时间内进行了下一次点击,即下一次点击先发生,则视为容断式选取。将选取对象按照本流程及图1进行摘引的方式进行处理后,将选取对象数据放入到与上一次点击所产生的选取对象数据所在内存剪贴板的同一个条目内,置于其后方。并在两者间添加省略号,格式有所差异。
56.图4是形成的关键词网络示意图。
57.以关键词a的关键词网络为例,是系统通过提取笔记的主题词和关键词数据自动构建的,当然,用户也可手动进行调整。
58.所有具有相同主题词的笔记都被归入同主题词笔记组,对其中任何一张卡片的外部操作,如形成链接、分类,都被视为对该同主题词笔记组的操作。
59.本示意图中,在主题词a1和主题词a2的同主题词笔记组内,均有笔记以关键词a作为关键词,故该两组同主题词笔记组均作为主题词节点被列入关键词a网络中,与关键词a相连。
60.另外,同时与关键词a出现在同一份笔记内的关键词还有关键词b、关键词c,故其均都与关键词a直接相连。其中,来源不同且同时存在关键词a和关键词c的笔记数量较多,
故其连接线较粗。而具有关键词c的主题词有主题词c1和主题词c2,则该两组同主题词笔记组作为主题词节点与关键词c相连。对于关键词b的主题词节点也做同样处理,图中省略。
61.同时,因没有笔记将关键词d与关键词a同时列为关键词,但因在具有主题词a1的同主题词笔记组内的其他笔记内曾出现过关键词d,所以关键词d以虚线形式通过主题词a1连接。
62.通过上述技术方案,本发明可以方便地在平板、电脑、手机等小屏幕上方便地摘引内容,记录笔记,系统自动构建知识结构,并能相互之间传播和分享笔记,有利于在笔记库的持续积累、成长和迭代。
63.以上所述仅为本发明的实施例而已,并非对本发明的限制,对于本领域的技术人员来说,基于本发明内容可以有多种更改、变化和实现途径。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1