一种文本标注方法及装置与流程

文档序号:19745796发布日期:2020-01-21 18:23阅读:135来源:国知局
一种文本标注方法及装置与流程

本发明涉及信息技术领域,具体而言,涉及一种文本标注方法及装置。



背景技术:

机器了解人类的语言,一直以来是各界学者努力解决的问题。如果机器可以完全了解人类语言,并根据不同的情况给出合适的反馈,那么人工智能也将成为现实。人工智能作为一个广为人知的概念使大家对于机器解决各类问题抱有无限期待,然而,被多数人所不知的是,机器之所以智能都是源自于人工的信息输入,是大量的人工信息输入才使机器变得智能。

自然语言处理是人工智能的一个主要问题,自然语言处理通俗来讲就是让机器可以理解人类的文字、语音等各种表现形式的语言的含义。同样的,自然语言处理依旧需要大量的人工的信息输入作为机器学习的基础。

人工的信息输入并不是任何信息都可以,对文本领域来讲,人工的信息输入必须是标注过的信息,只有经过标注的数据对于机器来说才是有价值的人工的信息输入——也就是人们所常说的训练集,机器学习必须有一定量的训练集作为学习来源。

数据的标注其实就是按照人类的已具备的知识将数据进行标记、分类等操作。相当于做一份专属于机器的学习资料,让机器进行学习。

在由人工标注数据时,一般是由人工标注文本对应的标签,但是相关技术中的人工标注较为繁琐。

针对相关技术中人工为文本标注标签较为繁琐的问题,尚未提出解决方案。



技术实现要素:

本发明实施例提供了一种文本标注方法及装置,以至少解决相关技术中人工为文本标注标签较为繁琐的问题。

根据本发明的一个实施例,提供了一种文本标注方法,包括:

接收触发对待标注的目标文本进行标注的触发指令;

根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;

接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;

根据所述拖动指令为所述目标文本标注所述一个或多个目标标签。

可选地,根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表包括以下至少之一:

在所述第一预定位置以预定透明度并覆盖所述目标文本的部分区域的方式显示包含根据使用频率确定的预定数量的标签的第一标签列表;

在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含预定时间段内使用过的标签的第二标签列表;

在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含多个标签类别和所述多个标签类别对应的标签的第三标签列表,其中,每个所述标签类别对应多个标签,每个所述标签类别与对应的多个标签通过相同的标识标记,所述目标标签列表包括以下至少之一:所述第一标签列表、所述第二标签列表、所述第三标签列表。

进一步的,在第一标签列表、第二标签列表和/或第三标签列表中标签数量比较多的情况下,为了避免占用过多的区域,折叠显示标签,例如,标签数量大于10时,对应的,根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表具体可以包括:以折叠的方式显示第一标签列表、第二标签列表和/或第三标签列表中的标签,即只显示其中的部分标签,另一部分折叠起来,当前用户点击展开显示的箭头时,才显示完整的标签。

可选地,在根据所述拖动指令为所述目标文本标注所述一个或多个目标标签之后,所述方法还包括:

接收在所述目标文本所在页面显示所述第一标签列表和/或所述第二标签列表的显示指令;

根据所述显示指令在所述目标文本所在页面的第二预定位置显示所述第一标签列表和/或所述第二标签列表。

可选地,接收选中所述标签列表中的一个或多个目标标签的选择指令包括:

接收选中所述第一标签列表中的目标标签的第一选择指令;

接收选中所述第二标签列表中的目标标签的第二选择指令;

接收选中所述第三标签列表中的目标标签的第三选择指令,其中,所述目标选择指令包括以下至少之一:所述第一选择指令、所述第二选择指令、所述第三选择指令。

可选地,在根据所述拖动指令为所述目标文本标注所述一个或多个目标标签之后,所述方法还包括:

接收单击或双击所述目标文本的第一触控指令;

根据所述第一触控指令在所述目标文本所在页面的第三预定位置显示标注的所述一个或多个目标标签;

再次接收单击或双击所述目标文本的第二触控指令;

根据所述第二触控指令隐藏标注的所述一个或多个目标标签。

可选地,在根据所述拖动指令为所述目标文本标注所述一个或多个目标标签之后,所述方法还包括:

接收将所述目标文本的内容从当前页面切换到下一页面的第三触控指令;

根据所述第三触控指令将所述目标文本的内容从当前页面切换到下一页面,并在所述第三预定位置显示为所述目标文本标注的所述一个或多个目标标签。

根据本发明的另一个实施例,还提供了一种文本标注装置,包括:

第一接收模块,用于接收触发对待标注的目标文本进行标注的触发指令;

第一显示模块,用于根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;

第二接收模块,用于接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;

标注模块,用于根据所述拖动指令为所述目标文本标注所述一个或多个目标标签。

可选地,所述第一显示模块包括以下至少之一:

第一显示子模块,用于在所述第一预定位置以预定透明度并覆盖所述目标文本的部分区域的方式显示包含根据使用频率确定的预定数量的标签的第一标签列表;

第二显示子模块,用于在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含预定时间段内使用过的标签的第二标签列表;

第三显示子模块,用于在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含多个标签类别和所述多个标签类别对应的标签的第三标签列表,其中,每个所述标签类别对应多个标签,每个所述标签类别与对应的多个标签通过相同的标识标记,所述目标标签列表包括以下至少之一:所述第一标签列表、所述第二标签列表、所述第三标签列表。

可选地,所述装置还包括:

第三接收模块,用于接收在所述目标文本所在页面显示所述第一标签列表和/或所述第二标签列表的显示指令;

第二显示模块,用于根据所述显示指令在所述目标文本所在页面的第二预定位置显示所述第一标签列表和/或所述第二标签列表。

可选地,所述第二接收模块包括:

第一接收子模块,用于接收选中所述第一标签列表中的目标标签的第一选择指令;

第二接收子模块,用于接收选中所述第二标签列表中的目标标签的第二选择指令;

第三接收子模块,用于接收选中所述第三标签列表中的目标标签的第三选择指令,其中,所述目标选择指令包括以下至少之一:所述第一选择指令、所述第二选择指令、所述第三选择指令。

可选地,所述装置还包括:

第四接收模块,用于接收单击或双击所述目标文本的第一触控指令;

第三显示模块,用于根据所述第一触控指令在所述目标文本所在页面的第三预定位置显示标注的所述一个或多个目标标签;

第五接收模块,用于再次接收单击或双击所述目标文本的第二触控指令;

隐藏模块,用于根据所述第二触控指令隐藏标注的所述一个或多个目标标签。

可选地,所述装置还包括:

第六接收模块,用于接收将所述目标文本的内容从当前页面切换到下一页面的第三触控指令;

第四显示模块,用于根据所述第三触控指令将所述目标文本的内容从当前页面切换到下一页面,并在所述第三预定位置显示为所述目标文本标注的所述一个或多个目标标签。

根据本发明的又一个实施例,还提供了一种计算机可读的存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明,接收触发对待标注的目标文本进行标注的触发指令;根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;根据所述拖动指令为所述目标文本标注所述一个或多个目标标签,因此,可以解决相关技术中人工为文本标注标签较为繁琐的问题,通过直接从标签列表中选中目标标签的方式,便可完成文本标签的标注,简化了人工标注的方式,且不同于常见的单标签分类文本,将文本分类拓展为支持多标签的文本分类标注,让多标签的文本分类更加快捷。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明实施例的一种文本标注方法的移动终端的硬件结构框图;

图2是根据本发明实施例的文本标注方法的流程图;

图3是根据本发明实施例的文本标签显示的示意图;

图4是根据本发明实施例的文本标注的示意图;

图5是根据本发明实施例的文本标注装置的框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种文本标注方法的移动终端的硬件结构框图,如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的报文接收方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。

基于上述的移动终端,本实施例提供了一种文本标注方法,图2是根据本发明实施例的文本标注方法的流程图,如图2所示,该流程包括如下步骤:

步骤s202,接收触发对待标注的目标文本进行标注的触发指令;

步骤s204,根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;

上述的第一预定位置可以是页面的正上面,正下面,左方或右方的某个位置,可以预先进行设置。

可选地,上述步骤s204具体可以包括以下至少之一:

在所述第一预定位置以预定透明度并覆盖所述目标文本的部分区域的方式显示包含根据使用频率确定的预定数量的标签的第一标签列表;

在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含预定时间段内使用过的标签的第二标签列表;

在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含多个标签类别和所述多个标签类别对应的标签的第三标签列表,其中,每个所述标签类别对应多个标签,每个所述标签类别与对应的多个标签通过相同的标识标记,所述目标标签列表包括以下至少之一:所述第一标签列表、所述第二标签列表、所述第三标签列表。

进一步的,在第一标签列表、第二标签列表和/或第三标签列表中标签数量比较多的情况下,为了避免占用过多的区域,折叠显示标签,例如,标签数量大于10时,对应的,根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表具体可以包括:以折叠的方式显示第一标签列表、第二标签列表和/或第三标签列表中的标签,即只显示其中的部分标签,另一部分折叠起来,当前用户点击展开显示的箭头时,才显示完整的标签。

优选的,还可以为标签设置检索框,用户只需将关键词输入到检索框中,便可检索出对应的标签。

步骤s206,接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;

进一步的,上述步骤s206可以具体包括以下至少之一:

接收选中所述第一标签列表中的目标标签的第一选择指令;

接收选中所述第二标签列表中的目标标签的第二选择指令;

接收选中所述第三标签列表中的目标标签的第三选择指令,其中,所述目标选择指令包括以下至少之一:所述第一选择指令、所述第二选择指令、所述第三选择指令。

进一步的,在接收到拖动指令之后,为了便于用户标注目标文本,还可以将目标标签列表隐藏起来,即隐藏所述目标标签列表。

步骤s208,根据所述拖动指令为所述目标文本标注所述一个或多个目标标签。

通过上述步骤s202至s208,接收触发对待标注的目标文本进行标注的触发指令;根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;根据所述拖动指令为所述目标文本标注所述一个或多个目标标签,因此,可以解决相关技术中人工为文本标注标签较为繁琐的问题,通过直接从标签列表中选中目标标签的方式,便可完成文本标签的标注,简化了人工标注的方式,且不同于常见的单标签分类文本,将文本分类拓展为支持多标签的文本分类标注,让多标签的文本分类更加快捷。

本发明实施例中,在根据所述拖动指令为所述目标文本标注所述一个或多个目标标签之后,接收在所述目标文本所在页面显示所述第一标签列表和/或所述第二标签列表的显示指令;根据所述显示指令在所述目标文本所在页面的第二预定位置显示所述第一标签列表和/或所述第二标签列表。第二预定位置在目标文本中某个位置,可以预先进行设置。

本发明实施例中,在根据所述拖动指令为所述目标文本标注所述一个或多个目标标签之后,接收单击或双击所述目标文本的第一触控指令;根据所述第一触控指令在所述目标文本所在页面的第三预定位置显示标注的所述一个或多个目标标签;再次接收单击或双击所述目标文本的第二触控指令;根据所述第二触控指令隐藏标注的所述一个或多个目标标签。即可以显示标注的目标标签,也可以将目标标签隐藏起来。

本发明实施例中,在根据所述拖动指令为所述目标文本标注所述一个或多个目标标签之后,接收将所述目标文本的内容从当前页面切换到下一页面的第三触控指令;根据所述第三触控指令将所述目标文本的内容从当前页面切换到下一页面,并在所述第三预定位置显示为所述目标文本标注的所述一个或多个目标标签。

图3是根据本发明实施例的文本标签显示的示意图,如图3所示,文本分类就是将一段自然语言文本进行分类。首先在标签栏里新建双层(每一层可有无数个标签)标签树,首层为大类,第二层为首层每个标签的小分类。标签树上的标签可随时添加、删除、修改。标签树可以被折叠且拥有一定的透明度从而不影响阅读文本。阅读文本时最上方的标签栏将会有对文本的推荐标签,为标注提供快捷方法。建好标签树后,即可开始文本数据的分类工作。

一个页面中可出现多个文本。通过观察,确定文本的类别,而后在标签树中查找并点击该类别的标注,便可一次性在所有此类别文本中进行标注,方便快捷。

单击文本,文本的右上角会出现此文本的类别,表示此文本关联此标签,再单击一次文本框,显示类别的文本框消失;表示此文本取消关联此标签。而选取文本任意处单击右键,文本按右键处附近会出现文本的类别,再任意单击一处,文本框同样消失。同一个文本可选择多个标签,只要每次标完一个标签后选取新的标签再重复操作即可。

图4是根据本发明实施例的文本标注的示意图,如图4所示,若是文本过长,页面上将展示文本的前一部分,若是想要阅读完整的文本,点击文本下方的箭头即可。当文档下滑的时候,此文本选中的标签会固定显示在文档顶端,方便用户根据文本内容选择标签。上划文档,超过标签过的文本后,之前被打上标签的文本关联将被自动保存。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

本发明实施例,还提供了一种文本标注装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本发明实施例的文本标注装置的框图,如图5所示,包括:

第一接收模块52,用于接收触发对待标注的目标文本进行标注的触发指令;

第一显示模块54,用于根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;

第二接收模块56,用于接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;

标注模块58,用于根据所述拖动指令为所述目标文本标注所述一个或多个目标标签。

可选地,所述第一显示模块54包括以下至少之一:

第一显示子模块,用于在所述第一预定位置以预定透明度并覆盖所述目标文本的部分区域的方式显示包含根据使用频率确定的预定数量的标签的第一标签列表;

第二显示子模块,用于在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含预定时间段内使用过的标签的第二标签列表;

第三显示子模块,用于在所述第一预定位置以所述预定透明度并覆盖所述目标文本的部分区域的方式显示包含多个标签类别和所述多个标签类别对应的标签的第三标签列表,其中,每个所述标签类别对应多个标签,每个所述标签类别与对应的多个标签通过相同的标识标记,所述目标标签列表包括以下至少之一:所述第一标签列表、所述第二标签列表、所述第三标签列表。

可选地,所述装置还包括:

第三接收模块,用于接收在所述目标文本所在页面显示所述第一标签列表和/或所述第二标签列表的显示指令;

第二显示模块,用于根据所述显示指令在所述目标文本所在页面的第二预定位置显示所述第一标签列表和/或所述第二标签列表。

可选地,所述第二接收模块包括:

第一接收子模块,用于接收选中所述第一标签列表中的目标标签的第一选择指令;

第二接收子模块,用于接收选中所述第二标签列表中的目标标签的第二选择指令;

第三接收子模块,用于接收选中所述第三标签列表中的目标标签的第三选择指令,其中,所述目标选择指令包括以下至少之一:所述第一选择指令、所述第二选择指令、所述第三选择指令。

可选地,所述装置还包括:

第四接收模块,用于接收单击或双击所述目标文本的第一触控指令;

第三显示模块,用于根据所述第一触控指令在所述目标文本所在页面的第三预定位置显示标注的所述一个或多个目标标签;

第五接收模块,用于再次接收单击或双击所述目标文本的第二触控指令;

隐藏模块,用于根据所述第二触控指令隐藏标注的所述一个或多个目标标签。

可选地,所述装置还包括:

第六接收模块,用于接收将所述目标文本的内容从当前页面切换到下一页面的第三触控指令;

第四显示模块,用于根据所述第三触控指令将所述目标文本的内容从当前页面切换到下一页面,并在所述第三预定位置显示为所述目标文本标注的所述一个或多个目标标签。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s11,接收触发对待标注的目标文本进行标注的触发指令;

s12,根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;

s13,接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;

s14,根据所述拖动指令为所述目标文本标注所述一个或多个目标标签。

可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-onlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

实施例4

本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

s11,接收触发对待标注的目标文本进行标注的触发指令;

s12,根据所述触发指令在所述目标文本所在页面的第一预定位置显示目标标签列表;

s13,接收选中所述标签列表中的一个或多个目标标签的目标选择指令,并接收将选中的所述一个或多个目标标签拖动到所述目标文本中的拖动指令;

s14,根据所述拖动指令为所述目标文本标注所述一个或多个目标标签。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1