一种基于价值驱动的平台算法进行行为分析系统

文档序号:29237614发布日期:2022-03-12 14:31阅读:85来源:国知局
1.发明属于涉及生态系统理论、计算实验技术复杂系统,尤其涉及一种基于价值驱动的平台算法进行行为分析系统。
背景技术
::2.随着大数据、物联网、人工智能等数字技术体系的发展和平台经济的崛起,多种多样的智能算法正在社会中前所未有的广泛应用,并且正不断渗透到社会的方方面面。越来越多的政府和企业开始利用算法进行日常事务和决策的处理。例如新闻排名算法和社交媒体机器人影响人民所听所看的信息、信用评分算法决定贷款决策算法等等。人类、数据和算法更加紧密融合的数字化社会逐渐形成。算法正在成为数字化社会的重要组成部分,并且对塑造着我们与媒体、社会、文化、经济的互动产生越来越大的影响。3.算法在推动信息通信技术与计算科学技术融合创新、积极促进经济社会发展的同时,也对现行的社会治理模式和方法提出了新的挑战。近年来,越来越多的组织通过利用算法技术来管理其平台,这意味着一切都将以比之前更加精细、精确、透彻的方式被获取、分析和评价。算法黑盒的作用过程导致其被滥用的风险骤然上升,信息茧房、算法歧视、内卷化效应等负面事件层出不穷,已经严重影响了数字化社会的健康发展。4.伴随着算法与数字生产日益密切的联系,算法概念的内涵和外延正在超越计算机、数学、信息技术等领域而变得更加宏观和更具跨学科属性。虽然在方法上分离算法塑造人类行为的研究是方便的,反之亦然。但大多数算法都在人类共存的复杂混合系统领域工作。因此我们必须重点深入分析人类对算法行为的影响和算法对人类行为的影响之间的反馈循环,而不是单向的影响。然而,当前的研究缺乏对数字化社会的整体建模,研究主题主要聚焦在算法对人的影响。难以充分地、动态地反映数字化社会的内在运作规律,对平台算法与社会系统的交互机理解释力不足。5.平台算法在推动人类生产生活变革的同时,也对现行的社会治理模式和方法提出了新的挑战。信息茧房、算法歧视、内卷化效应等负面事件层出不穷,已经严重影响了数字化社会的健康发展。为了使数字化社会朝着健康的方向发展,我们希望深入分析数字化平台负面效应的成因,进而找到合适的干预策略使其良性发展。然而,现有的研究是分散的、不系统的,不能有效地揭示平台算法与社会系统的交互机理。在此基础上,我们通过整合各学科的知识,把价值网络做为算法与社会系统交互的媒介,提出了一个由数据处理单元、价值网络和社会网络构成循环反馈交互的平台算法行为分析模型,可以揭示算法对于数字化社会的内在运行规则和原理的影响。技术实现要素:6.针对现有技术存在问题,本发明提出了一种价值驱动的平台算法行为分析的方法:1)从社会网络、价值网络以及数据处理单元三部分对平台算法行为作用机制进行拆分;2)对三个部分分别构建相应的数学模型;3)依据三个部分的数学模型,进一步得出了各部分之间的关联关系。7.本发明采用如下技术方案实施:8.一种基于价值驱动的平台算法进行行为分析系统,所述行为分析系统包括社会网络价值网络和数据处理单元;行为分析系统通过社会网络、价值网络和数据处理单元信息反馈交互回路实现对数据化程序评估;9.所述社会网络通过sle框架将个人进化、组织进化和社会进化特征信息形成反馈回路输出行为反馈数据信息;10.所述数据处理单元将行为反馈数据信息按照行指标区分度运算生成社会网络评价反馈数据信息;11.所述价值网络将社会网络评价反馈数据信息进行分配和调整输出价值驱动数据信息反馈给所述社会网络,其中:所述数据处理单元生成社会网络评价反馈数据信息过程:12.step1:计算每个行为反馈数据信息的指标数据的平均值qj_ave[0013][0014]其中,qj_ave表示指标对应数据的平均值,表示社会实体i对应特征指标的绝对值,n为社会网络中实体的总数;[0015]step2:计算每个行为反馈数据信的个体每项指标得分[0016][0017]其中,表示社会实体i在指标的得分,其是相对指标对应的平均值qj_ave而言的,其范围为[0,+∞];[0018]step3:计算社会网络的社会实体的指标体系得分qosi;[0019]遍历社会实体属性集合ωt,根据下式计算出每个社会实体的指标体系得分qosi;[0020][0021]其中,表示社会网络的社会实体i对应特征指标的值;[0022]step4:根据指标区分度得分qosi进行排序;[0023]其中,根据社会实体的指标体系得分进行降序排列rankt[1..n],排名的顺序是价值分配的重要依据;[0024]step5:根据指标区分度判断指标体系的有效性;.当指标体系的区分度d大于或等于ε时,指标体系不变并输出,算法结束;当指标体系的区分度小于ε时,进入step6;其中:[0025]指标体系的区分度d表达式如下:[0026][0027]其中,h是高分组在指标体系下的平均得分,l是低分组在指标体系下的平均得分,max是指标体系下的最高得分值[0028]step6:计算各社会实体的加权指标得分遍历社会实体属性集合的集合ωt,根据下式计算出每个社会实体的每项加权指标得分[0029][0030]其中,表示社会实体i对应特征指标的加权指标得分。[0031]进一步,所述sle框架包括个人进化模块、组织进化模块和社会进化模块构成,其中:所述个人进化模块将模拟个人的遗传进行模拟构建个体数据进化信息;[0032]所述组织进化模块将个体数据进化信息按照如下公式训练生成组织数据进化信息;[0033](vi,t≥vnei_ave,t)?evole(no):evole(yes)[0034]其中,vi,t表示第i个社会实体在t时刻的价值,vi_nave,t表示第i个社会实体邻居在t时刻的平均价值;[0035]所述社会化模块将组织数据进化信息进行提升输出行为反馈数据信息。[0036]进一步,所述价值网络将社会网络评价反馈数据信息进行创造、分配和调整输出价值驱动数据信息过程:[0037]价值创造的过程可以用下式来表示:[0038]ri*rc*kp=value[0039]其中,ri表示供给网络的资源状态空间,包括资源供给者提供的候选资源,用于满足需求者的需求,并为调整选择提供依据;;rc表示需求网络的需求状态空间,是需求者的需求集合,即资源供给者提供的产品或服务等资源;kp表示供需匹配的平台算法;[0040]价值分配的过程可以用下式来表示:[0041]valuei=《value,{producti},plarule,rankt[1..n]》[0042]其中,valuei代表第i个供给者获得的收益,value表示供需匹配后所创造的价值总和,{producti}代表参加利益分配的供给者集合,plarule代表运营者的价值分配规则,主要包括基础薪酬和绩效奖励的设计,不同比例的价值分配规则会造成不同强度的干预效果;算法最终排名rankt[1..n]为价值分配的依据。[0043]有益效果[0044]本发明提出了一个由数据处理单元、价值网络和社会网络构成的价值驱动的平台算法行为分析方法,清晰描述了三者之间正反馈的循环作用机制。并在实验与讨论中以评价算法加剧学术生态系统内卷化为例验证了分析模型的有效性。同时,本发明模型具有泛化性,可以分析数字化社会的不同领域中算法与社会系统的交互机理,例如在服务业中,外卖骑手在平台算法的干预下配送时间越来越短,付出的努力越来越多而收入却没有增长。整体呈现出过度竞争,边际效应递减的内卷化状态。以上工作为平台算法与社会系统交互机理的研究提供了新的思路和方法。附图说明[0045]图1是价值驱动的平台算法行为分析方法图。[0046]图2是计算实验系统运行场景图。[0047]图3是采用三种干预强度策略时三种绩效指标的比较图。[0048]图4是以中美为例的生态学术体系的退化趋势对比图具体实施方式[0049]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图与实例对本发明做详细的论述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。[0050]一.社会网络[0051]根据优胜劣汰的规律,每个社会实体为了在激烈的竞争中生存都需要不断进化。通过与环境的互动和行动中学习和积累经验,并通过各种学习方法来提高其价值获取能力。sle框架可以被用来描述社会网络的三个层次的进化特征:个人进化、组织进化和社会进化。sle框架由两部分组成:左栏表示三个建模层,右栏表示每个层采用的实现模型。三个建模层之间存在一个反馈回路:个体进化的建模模拟了个体的遗传进化现象;组织进化模型模拟了组织间的模仿和观察学习;社会进化的建模是在顶层,一些精英的知识可以被提取为文化来指导底层个体的演化。具体步骤如下:[0052](1)个体进化[0053]在社会生态系统的演进过程中,个体间的竞争是自发的。个体的能力影响其争夺有限[0054]资源的竞争力。社会网络实体一般描述如下:[0055]socialagent=《r,st,et,yt,vt,n》ꢀꢀꢀ(1)[0056]其中,r代表社会实体在中的角色;st是社会实体的特征集合,包括不变的特征和可能变化的特征;et是社会实体的感知能力,实现社会个体与邻居节点、需求环境之间的信息交换作用;vt是社会实体可以执行的行为集合,包括其自发行为和由外部事件触发的所有行为;yt是社会实体在感受外在事件刺激以及与其他社会节点进行交互学习过程中所采取的决策机制;n代表社会实体所受的各种约束条件。[0057]为了使价值最大化,社会实体需要调整自己的行为策略,评估所有行为的潜在利益,选择估值最高的行为作为动作选项。社会实体行为规则如下:[0058][0059]其中,δ(α,vt,et,yt)表示社会节点α在环境et和决策yt的情况下完成行为vt后的结果评估。→表示“满足”;n表示社会节点所受的约束条件;valuet+1表示预估t+1时刻完成行为vt带来的价值,是收益outcome与成本cost的比率。上面等式代表社会实体在环境et和决策yt的情况下完成行为vt后,下一时刻状态集合st+1满足了约束条件n,并且下一时刻收获的效益valuet+1最大化。[0060](2)组织进化[0061]现实世界中,个体不只依靠个体进化来适应外部环境,往往还通过模仿学习和观察学习等学习方式来增强自身能力。在组织学习过程中,个体及其邻居可以构建学习型组织。通过与优秀合作伙伴的比较和学习来提高自身的竞争力。个体是否要进化主要取决于以[0062]下公式:[0063](vi,t≥vnei_ave,t)?evole(no):evole(yes)ꢀꢀ(3)[0064]其中,vi,t表示第i个社会实体在t时刻的价值,vi_nave,t表示第i个社会实体邻居在t时刻的平均价值。当个体的价值低于邻居平均水平时,则通过模仿学习和观察学习等学习方式来提高其能力。这里可以根据特定的需求选择不同的邻居选择规则,包括随机近邻、冯诺依曼邻居、摩尔型邻居和复杂网络邻居等。[0065](3)社会进化[0066]根据适者生存的原则,一些精英将摆脱激烈的竞争。然后,提取出的优秀知识会传递到顶层,通过知识积累建立文化。文化被用来加速社会网络中单个实体的进化速度。个体或组织会通过观察和模拟某些精英的行为,迅速提高他们的能力。目前个体采用的主流模仿规则有以下三种:[0067]利润比较原则:利润小的实体在下一轮的选择中将效仿利润较大的个体策略。利润较大的实体保持其原有策略。[0068]多数原则:将大多数实体视为学习对象,而不管它们具体利润如何。这反应了社会实体的从众心理和对他人判断能力的信任,符合许多实际场景中的情况。[0069]概率准则:每个实体都是有限理性个体。每个实体会以很大概率向利润更高的实体学习。但有时候,它也会以较小概率向低利润个体学习。[0070]二.数据处理单元[0071]算法与人的行为之间存在着一个互动的影响过程。社会个体根据他们所掌握的信息来形成对价值分配的预期并据此对进化策略进行选择,而他们所采取的行动接下来又会影响到算法的进化。在计算输出每个社会实体的得分排名的同时,算法必须通过人为设计改变或自适应改变来不断进化。通过改变指标的完成难度可以保证算法的有效性。为了更具体地说明算法进化过程,相关概念定义如下:[0072]定义1:指标体系qos(t)与特征指标空间{qj}[0073]指标体系的定义如下公式:[0074][0075]constrains:w1+w2+...+wm=1[0076]其中,m表示特征指标的个数;表示指标体系的第j个特征指标;x表示其完成难度,值越大表示完成难度越大;wj表示指标体系的偏好权重。[0077]指标体系会对测试实体的不同属性特征进行度量,而当前某一属性特征指标可能会因为区分度太低而失效。指标空间在保证可以度量同类特征属性的同时,为提高指标区分度提供了选择,其定义如下:[0078][0079]其中,qj表示第j个特征指标的指标空间,x表示其完成难度。[0080]定义2:指标区分度dj与指标体系区分度d[0081]指标区分度反映指标对所度量对象某一属性特征的鉴别力,也就是度量的有效性。指标区分度是衡量指标质量的重要指标之一,是筛选指标的依据。其数值在0-1之间。数值越高,说明指标设计的越好。本文区分度计算方法采用两端分组法:先将得分按照降序排列,把前α%的实体列为高分组,把后α%的实体列为低分组,则第j个指标的区分度为dj,公式如下:[0082][0083]其中,hj是高分组在指标j的平均得分,lj是低分组在指标j的平均得分,maxj是指标j的最高得分值。[0084]同理,指标体系的区分度d表达式如下:[0085][0086]其中,h是高分组在指标体系下的平均得分,l是低分组在指标体系下的平均得分,max是指标体系下的最高得分值。[0087]算法进化的具体步骤如下:[0088]given:n个社会实体属性集合{si}的集合ωt{{s0},{s1},…,{si},…,{sn}};t时刻的指标体系qos(t).find:t+1时刻的指标体系qos(t+1),t时刻的排名rankt[1..n][0089]initialization:指标体系有效性阈值ε;指标有效性阈值ε;分组阈值α。[0090]step1:计算每个指标数据的平均值qj_ave[0091][0092]其中,qj_ave表示指标对应数据的平均值,表示社会实体i对应特征指标的绝对值,n为社会实体的总数。[0093]step2:计算每个个体每项指标得分[0094][0095]其中,表示社会实体i在指标的得分,其是相对指标对应的平均值qj_ave而言的,其范围为[0,+∞].[0096]step3:计算各社会实体的指标体系得分qosi[0097]遍历社会实体属性集合ωt,根据下式计算出每个社会实体的指标体系得分qosi。[0098][0099]其中,表示社会实体i对应特征指标的值。[0100]step4:根据指标体系得分qosi进行排序[0101]根据社会实体的指标体系得分进行降序排列rankt[1..n],排名的顺序是价值分配的重要依据。step5:判断指标体系的有效性根据排名顺序计算得分前α%的平均得分h和得分后α%的的平均得分l,根据式7得出指标体系的区分度d.当指标体系的区分度大于或等于ε时,指标体系不变并输出,算法结束。当指标体系的区分度小于ε时,进入step6.[0102]step6:计算各社会实体的加权指标得分遍历社会实体属性集合的集合ωt,根据下式计算出每个社会实体的每项加权指标得分[0103][0104]其中,表示社会实体i对应特征指标的加权指标得分。[0105]step7:调整特征指标并更新指标体系[0106]根据社会实体的加权指标得分进行降序排序[1..n],并计算得分前α%的平均得分hj和得分后α%的平均得分lj,根据式3得出各特征指标的区分度dj.[0107]遍历所有特征指标的区分度dj,当其区分度dj小于σ时,更新为当其区分度dj大于或等于σ时,特征指标不变。[0108]三.价值网络[0109]不同社会关系之间的资源依赖性导致了价值交换、资源整合和价值创造。供给者所创造的资源作为一种特殊的资源在需求者、供给者、运营者及其群体之间进行价值流转。供给者指资源的提供者,需求者指资源的消费者,运营者作为一个中介枢纽,是提供者和需求者进行供需效益的平台。价值流转由价值创造、价值分配和价值调整三个步骤组成。具体情况如下:[0110](1)价值创造[0111]价值创造的本质是供需之间的匹配。在数字化社会中,运营者通过平台算法作为作为供应和需求之间的桥梁来实现这一过程。并且算法还可以监控、跟踪和评估资源空间和需求空间的状态,从而通过算法调节供需匹配的过程。这里,价值创造的过程可以用下式来表示:[0112]ri*rc*kp=valueꢀꢀ(12)[0113]其中,ri表示供给网络的资源状态空间,包括资源供给者提供的候选资源,用于满足需求者的需求,并为调整选择提供依据;;rc表示需求网络的需求状态空间,是需求者的需求集合,即资源供给者提供的产品或服务等资源;kp表示供需匹配的平台算法。供需匹配可以由多个价值链来满足。为了实现供需的最佳匹配,需要由平台算法确定哪条价值链能够最大限度地创造价值。[0114](2)价值分配[0115]运营者通过价值分配来引导供给者的行为朝着期望的方向发展,并吸引和留住参与者。运营者会根据算法评估的结果来量化价值并分配。某个供给者的利润按公式13计算:[0116]valuei=《value,{producti},plarule,rankt[1..n]》ꢀꢀ(13)[0117]其中,valuei代表第i个供给者获得的收益,value表示供需匹配后所创造的价值总和,{producti}代表参加利益分配的供给者集合,plarule代表运营者的价值分配规则,主要包括基础薪酬和绩效奖励的设计,不同比例的价值分配规则会造成不同强度的干预效果。算法最终排名rankt[1..n]为价值分配的依据。由于供给者提供的经济资源是有限的,需要供给者通过提高排名来竞争这些有限的资源,使得供给者必须不断进化来面对激烈的竞争。[0118](3)价值调整[0119]由于资源有限并且大多数实体竞争为同一资源,个体之间的行动存在着相互影响。个体的适应性变化会影响其他个体的收益或成本发生改变。并且,越多的个体做出回应,会对其他个体产生更强的互动压力或互动影响。每一轮的价值分配都会改变收益矩阵,进而引发社会实体间新一轮的价值调整。[0120]四.计算实验[0121]本发明利用repast仿真平台,以评价算法加剧智能数字社会学术生态系统内卷化为例,基于分析模型构建了相应的计算实验系统,并且设计了不同的实验场景,比较不同强度的干预策略对学术生态系统内卷化的影响。实验结果将用于验证价值驱动的平台算法行为分析方法的有效性。[0122]具体实验步骤:[0123]步骤1:构建环境模型。[0124]如图2所示,可以通过设置和梳理供应侧和需求侧的参数来定制各种实验场景。整个场景分为三个区域,由不同类型的节点(primarynodes、intermedianodes和advancednodes)占据,他们分别代表了不同特征的科研供给者。这些节点是主动和动态的,作为系统环境中活动行为实体,由不同的符号表示。不同的需求将分散在三个区域(primaryarea①、intermediaarea②和advancedarea③),代表了所处不同阶段学科的需求,由不同明度绿色的点表示,绿色明度的差别反映需求的处理难度。表3说明了真实世界与计算实验系统之间的映射关系。通过观察实验系统中的演化现象,可以直观地找到学术生态系统的内卷化规律。[0125]步骤2:实验参数设置计算实验的初始化部分,包括研究目标、参数设置和评价标准。该案例研究的重点是不同强度的干预策略对学术生态系统内卷化的影响。采用不同的基本收入和奖励作为研究对象,通过调整基本收入和奖励的比例来组合成不同强度的干预策略。[0126]实验环境长250个cell,宽120个cell,不同类型的科研需求节点随机分布在各自的区域,实验参数设置主要以《nature》针对全球科学界的调查为主,通过同比例的缩放来设置实验参数。基本实验参数设置见表1.[0127]table1[0128]计算实验参数设置[0129][0130][0131]步骤3:模拟学术生态系统运行,得出实验结果[0132]步骤4:搜集中美学术生态系统相关数据,进行实际案例分析[0133]本发明并不限于上文描述的实施方式。以上对具体实施方式的描述旨在描述和说明本发明的技术方案,上述的具体实施方式仅仅是示意性的,并不是限制性的。在不脱离本发明宗旨和权利要求所保护的范围情况下,本领域的普通技术人员在本发明的启示下还可做出很多形式的具体变换,这些均属于本发明的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1