本技术涉及文本处理领域,尤其涉及一种剧本中故事线的提取方法、装置、电子设备及存储介质。
背景技术:
1、在电视剧的制作流程中,剧本的质量将直接影响电视剧的质量,因此,剧本评估占据十分重要的地位。然而,剧本评估通常需要消耗大量的人力、精力,同时也是一个主观性极强,需要根据人们口味变化和市场需求调整的过程。创作者和评审人员现在需要花费大量的时间阅读、理解和评价每一个剧本,这无疑增加了制作过程的复杂性,也拖长了制作周期。
2、在这样的背景下,提出一种基于故事线来进行剧本评估的方案,其中,故事线是电视剧的生命线,由其展现的事件顺序、角色发展、冲突和解决等元素构成,揭示了剧本的核心内容。如果能有效的提取和分析故事线,就能对剧本进行深入的理解和评估。
3、然而,在故事线提取的过程中,故事线间的交叉关系和模糊边界带来了诸多挑战,一个事件中可能存在两条或多条交叉的故事线,这些交织的故事线使得确定故事线的粒度变得困难。针对此问题,目前尚未提出有效的解决方案。
技术实现思路
1、本技术提供了一种剧本中故事线的提取方法、装置、电子设备及存储介质,以解决现有技术中无法有效提取剧本中故事线的技术问题。
2、第一方面,本技术提供了一种剧本中故事线的提取方法,所述方法包括:
3、获取待分析的剧本文本;
4、从所述剧本文本中提取出目标角色,以及从所述剧本文本中提取出事件集;
5、从所述事件集中确定每个所述目标角色参与的事件;
6、基于每个所述目标角色参与的事件形成每个所述目标角色的角色故事线;
7、基于每个所述目标角色的角色故事线形成所述剧本文本的剧本故事线。
8、在一可能的实施方式中,所述从所述剧本文本中提取出目标角色,包括:
9、从所述剧本文本包含的每个场次的剧情文本中提取每个场次中出场的角色;
10、确定每个所述角色在所述剧本文本中的出场次数;
11、将出场次数满足第一设定条件的角色确定为目标角色。
12、在一可能的实施方式中,所述从所述剧本文本中提取出事件集,包括:
13、基于所述剧本文本包含的每个场次的剧情文本,对所述剧本文本中的场次进行分组,得到多个场次分组,其中,同一个场次分组中的不同场次发生同一事件;
14、从每个所述场次分组对应的剧情文本中提取出事件,得到事件集。
15、在一可能的实施方式中,所述基于所述剧本文本包含的每个场次的剧情文本,对所述剧本文本中的场次进行分组,得到多个场次分组,包括:
16、针对所述剧本文本包含的每个场次,从所述场次的剧情文本中提取所述场次中出场的角色和所述场次对应的场景;
17、根据每个所述场次中出场的角色和所述场次对应的场景,对所述剧本文本中的场次进行分组,得到多个场次分组。
18、在一可能的实施方式中,所述基于每个所述目标角色参与的事件形成每个所述目标角色的角色故事线,包括:
19、针对每个所述目标角色,利用训练好的故事线抽取模型对所述目标角色参与的事件进行处理,得到所述目标角色的至少一条角色故事线,其中,不同的角色故事线的情节类型不同。
20、在一可能的实施方式中,所述基于每个所述目标角色的角色故事线形成所述剧本文本的剧本故事线,包括:
21、对所述目标角色进行分组,得到多个角色组合;
22、确定每个所述角色组合中的两个目标角色的角色故事线之间的重合度;
23、针对重合度满足第二设定条件的角色组合,将所述角色组合中的两个目标角色的角色故事线进行合并处理,得到所述剧本文本的一条剧本故事线;
24、针对重合度不满足所述第二设定条件的角色组合,将所述角色组合中的每个目标角色的角色故事线分别作为所述剧本文本的一条剧本故事线。
25、在一可能的实施方式中,在所述剧本文本包括至少两条剧本故事线的情况下,在所述基于每个所述目标角色的故事线形成所述剧本文本的剧本故事线之后,还包括:
26、确定所述剧本文本包含的每个场次所属的剧本故事线,形成所述剧本文本的故事线结构。
27、第二方面,本技术提供了一种剧本中故事线的提取装置,所述装置包括:
28、剧本获取模块,用于获取待分析的剧本文本;
29、目标角色提取模块,用于从所述剧本文本中提取出目标角色;
30、事件提取模块,用于从所述剧本文本中提取出事件集;
31、角色事件匹配模块,用于从所述事件集中确定每个所述目标角色参与的事件;
32、角色故事线形成模块,用于基于每个所述目标角色参与的事件形成每个所述目标角色的角色故事线;
33、剧本故事线形成模块,用于基于每个所述目标角色的角色故事线形成所述剧本文本的剧本故事线。
34、在一可能的实施方式中,所述目标角色提取模块,包括:
35、角色提取单元,用于从所述剧本文本包含的每个场次的剧情文本中提取每个场次中出场的角色;
36、出场次数确定单元,用于确定每个所述角色在所述剧本文本中的出场次数;
37、目标确定单元,用于将出场次数满足第一设定条件的角色确定为目标角色。
38、在一可能的实施方式中,所述事件提取模块,包括:
39、场次分组单元,用于基于所述剧本文本包含的每个场次的剧情文本,对所述剧本文本中的场次进行分组,得到多个场次分组,其中,同一个场次分组中的不同场次发生同一事件;
40、事件提取单元,用于从每个所述场次分组对应的剧情文本中提取出事件,得到事件集。
41、在一可能的实施方式中,所述场次分组单元,包括:
42、场次信息提取子单元,用于针对所述剧本文本包含的每个场次,从所述场次的剧情文本中提取所述场次中出场的角色和所述场次对应的场景;
43、分组子单元,用于根据每个所述场次中出场的角色和所述场次对应的场景,对所述剧本文本中的场次进行分组,得到多个场次分组。
44、在一可能的实施方式中,所述角色故事线形成模块,具体用于:
45、针对每个所述目标角色,利用训练好的故事线抽取模型对所述目标角色参与的事件进行处理,得到所述目标角色的至少一条角色故事线,其中,不同的角色故事线的情节类型不同。
46、在一可能的实施方式中,所述剧本故事线形成模块,包括:
47、角色分组单元,用于对所述目标角色进行分组,得到多个角色组合;
48、重合度确定单元,用于确定每个所述角色组合中的两个目标角色的角色故事线之间的重合度;
49、故事线形成单元,用于针对重合度满足第二设定条件的角色组合,将所述角色组合中的两个目标角色的角色故事线进行合并处理,得到所述剧本文本的一条剧本故事线;
50、针对重合度不满足所述第二设定条件的角色组合,将所述角色组合中的每个目标角色的角色故事线分别作为所述剧本文本的一条剧本故事线。
51、在一可能的实施方式中,所述装置还包括:
52、故事线结构形成模块,用于在所述剧本文本包括至少两条剧本故事线的情况下,在所述基于每个所述目标角色的故事线形成所述剧本文本的剧本故事线之后,确定所述剧本文本包含的每个场次所属的剧本故事线,形成所述剧本文本的故事线结构。
53、第三方面,本技术提供了一种电子设备,包括:至少一个通信接口;与所述至少一个通信接口相连接的至少一个总线;与所述至少一个总线相连接的至少一个处理器;与所述至少一个总线相连接的至少一个存储器,其中,所述处理器被配置为:
54、获取待分析的剧本文本;
55、从所述剧本文本中提取出目标角色,以及从所述剧本文本中提取出事件集;
56、从所述事件集中确定每个所述目标角色参与的事件;
57、基于每个所述目标角色参与的事件形成每个所述目标角色的角色故事线;
58、基于每个所述目标角色的角色故事线形成所述剧本文本的剧本故事线。
59、第四方面,本技术还提供了一种计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行本技术上述任一项所述的剧本中故事线的提取方法。
60、本技术实施例提供的上述技术方案与现有技术相比具有如下优点:本技术实施例提供的该方法,通过从待分析的剧本文本中提取出目标角色,以及从剧本文本中提取出事件集,从事件集中确定每个目标角色参与的事件,基于每个目标角色参与的事件形成每个目标角色的角色故事线,基于每个目标角色的角色故事线形成剧本文本的剧本故事线,创新性的提出了一种以目标角色为核心,目标角色参与的事件为线索的故事线提取方式,通过该种方式提取出的各个目标角色的角色故事线之间边界清晰,在此基础上,通过不同目标角色的角色故事线能够形成完整且连贯的剧本文本的剧本故事线。