技术特征:
1.一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,包括如下步骤:s1.对比特币交易建立三级复杂网络;s2.读取以前聚类信息,包括集群的id和集群的地址集合;s3.调用增量聚类算法,基于多输入地址聚类算法开始增量聚类;s4.保存新更改的聚类信息;s5.对链下信息进行标签收集,组成互斥对l,合并入加有互斥对的地址集群;s6.通过概率模型的可能性函数平衡启发式聚类和互斥对产生的集群中错误的部分。2.根据权利要求1所述的一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,所述步骤1的实现包括:将比特币交易映射为petri网中的变迁t;将交易的输入和输出映射为petri网中的输入库所p;将比特币交易的流向映射为库所和变迁之间的有向弧得到比特币交易petri网;将地址和交易输出点之间的关系映射为地址与库所p的连接关系,得到比特币交易的三级复杂网络。3.根据权利要求2所述的一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,所述步骤1的具体步骤包括如下:s1.1建立比特币区块链有向网络的形式化定义为五元组g=(a,p,t,f,γ),其中a={a1,a2,
…
,a
m
}为比特币区块链中输入地址的有限集合;p={p1,p2,
…
,p
n
}为比特币交易petri网中输入库所的有限集合;t={t1,t2,
…
,t
j
}为比特币交易petri网中变迁的有限集合;为库所和变迁之间的有向弧的有限集合;γ(p)表示与库所p映射的地址;s1.2建立关于比特币地址、输入库所和变迁的三级复杂网络:定义网络中的符号,设
°
t={p|(p,t)∈f}为变迁的输入库所的集合;
°
a={p|γ(p)∈a}为与同一地址相关联的输入库所的集合;为输入库所p的变迁的集合;为输入库所映射到地址a上的变迁的集合;
*
t={γ(p)|p∈t
°
}为与t的所有输入库所相关联的地址集合;s1.3依次取出每个区块中比特币交易t,添加进变迁的有限集合t={t}∪t;s1.4对于交易t中每一个输出p,设β(p)为锁定在输出中的比特币数量,将γ(p)设为从输出p的scriptpubkey字段中提取的地址a,将a添加进比特币区块链中输入地址的有限集合a={a}∪a;s1.5对于交易t中的每一个输入p,添加进输入库所的有限集合p={p}∪p,将输入的有向弧添加进库所和变迁之间的有向弧的有限集合f=(p,t)∪f。4.根据权利要求1所述的一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,所述步骤3的实现包括:s3.1,输入待聚类的地址集合,然后从集合中依次取出集合中的地址;s3.2,若集合为空,那么输出带有类id和类id变动信息的地址,否则从集合中依次取出地址,判断地址是否未聚类;s3.3,若已聚类那么执行步骤3.1,若未聚类,就调用地址簇发现算法,查找该地址所在的类;s3.4,查找并确认该类的id;
s3.5,将该id分配给该类中的地址;s3.6,标记类id发生变化的地址。5.根据权利要求4所述的一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,所述步骤s3.3的实现包括:s3.3.1,输入地址a
′
,设一个地址集合和一个地址队列,将地址放入集合,将地址入队;s3.3.2,若地址队列为空,就输出地址聚类,否则地址出队,然后依次取出该地址的输出点p
′
;s3.3.3,若输出点未聚类,那么查找把p
′
当作输入的交易t
′
;s3.3.4,若能找到该交易,那么依次取出作为t
′
的输入;若输入对应的输出点未聚类,那么查找输出点映射的地址a”;s3.3.5,若地址集合未包括a”,那么将此地址添加到地址集合中,将a”入队,并将输出点设为已聚类。6.根据权利要求1所述的一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,所述步骤s5的实现包括:s5.1,对公布有比特币地址的公共论坛和用户档案的网络进行信息的爬取,或者对比特币组织和系统程序进行人为分析,通过带有公司特定前缀的地址来识别用户;s5.2,将比特币组织区分为若干个类别:矿池、交易所、混币器和其他服务,将字典中的每个标签对应一个类别,一个地址可以具有不同类别的标签,设l={(a
i
,a
j
)}为互斥对的集合,其中地址a
i
和a
j
表示来自同一类别的不同标签或来自不同类别的标签。7.根据权利要求1所述的一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,所述步骤s6的可能性函数的设计包括:设可能性函数为:其中a为比特币区块链中输入地址的有限集合,t
h
为多输入启发式算法产生的输入地址的集群,p为交易t∈t
h
满足多输入地址聚类算法的地址集合addr
h
(t)为一个集群的概率,q为两个地址(a
i
,a
j
)∈l由同一个账户控制的概率,所以l中任意一对地址为互斥对的概率为1-q,对于某些比特币地址s,表示存在一个集群a
l
,使得的概率。则本发明设计的log可能性函数为:
8.根据权利要求7所述的一种基于多输入地址聚类的比特币地址增量聚类方法,其特征在于,所述步骤s6的实现包括:s6.1针对区块链中的所有交易,在每个交易中,根据log可能性函数决定是否聚合与所考虑的交易t
j
的地址addr
h
(t
j
)相对应的集群;s6.2设是属于addr
h
(t
j
)的所有集群的并集,为所对应的交易t
j
存在的集群,加入互斥对后的若合并与addr
h
(t
j
)对应的所有集群后,log可能性函数增量为正,那么就采用与addr
h
(t
j
)合并生成的集群,否则保留多输入地址聚类算法生成的集群,然后进行下一个交易的操作,最终得到带有链下信息标签类别的比特币地址集群。