基于XRD的三元组合材料芯片结构分析系统及方法与流程

文档序号:20780447发布日期:2020-05-19 21:11阅读:881来源:国知局
基于XRD的三元组合材料芯片结构分析系统及方法与流程

本发明涉及的是一种计算机辅助材料分析领域的技术,具体是一种基于xrd的三元组合材料芯片结构分析系统及方法。



背景技术:

根据组合材料的xrd(x射线衍射光谱)数据,通过pca降维技术以及层次聚类方法对谱图数据进行聚类,以此构建相图并用于观察xrd数据的变化趋势是现有较为常见的计算机辅助材料分析技术。但现有的分析技术大多仅从数据表面对谱图进行聚类,而忽略了材料中原有的物理特性,这使得相图构建精度不准确。

当前材料学界,是根据领域先验知识人为标定可能存在的晶体结构的峰值位置,再判断谱图是否在该相的衍射角有峰值来确定其所属相,但该技术需要先验知识确定可能存在的相以及他所属的峰值。



技术实现要素:

本发明针对现有技术存在的上述不足,提出一种基于xrd的三元组合材料芯片结构分析系统及方法,利用材料物理特性中xrd的三强峰原则,通过峰值查找算法、峰值区间聚合算法和基向量查找算法,实现快速构建相图,并使用层次聚类方法作为参照物,辅助调整分析相图,为材料学专业领域学者提供了高效的xrd数据分析、相图快速构建的解决方案。

本发明是通过以下技术方案实现的:

本发明涉及一种基于xrd的三元组合材料芯片结构分析系统,包括:用于导入谱图的坐标成分数据以及xrd光谱数据的数据导入模块、用于显示所有谱图的汇总视图的谱图模块、对各个谱图所属类进行标定的预测模块、区间调整模块和方法比较模块,其中:数据导入模块通过一键导入的方式生成相图并输出至方法比较模块,区间调整模块分别输出观测基向量至谱图模块,输出重新生成的相图至方法比较模块,观测模块输出观测到的单/多成分谱图至谱图模块。

本发明涉及一种基于上述系统的三元组合材料芯片结构分析方法,通过分析材料谱图中的xrd数据和坐标数据,以三强峰原则确定峰值并得到峰值分布图,然后依据峰值区间聚合算法将所有的峰值划分为多个候选基向量判别所需的区间并根据此区间使用基向量算法获得所有的基向量;最后判断每张材料谱图是否存在基向量及其复合情况进行结构标定。

技术效果

与现有技术相比,本发明不仅通过机器学习聚类手段对谱图聚类,还通过和材料学领域专家沟通协作,结合了材料领域知识三强峰原则,设计了多种适用于xrd数据分析的算法,保证了算法的可靠性和稳定性。本发明采用了基于web的可视交互系统用于相图的辅助构建,不仅停留在数据的展示层面,还充分结合了可视分析技术对数据的进一步分析处理能力。相对于现有方法通常需要安装matlab软件,本系统只需要安装python2.7即可搭建后台服务、支持程序运行,更加方便,易用性更高,多图联动的可视交互方式极大提升了数据挖掘和xrd数据分析效益,一键式的导入数据直接生成相图大大精简了材料领域专家研究xrd数据的步骤,也降低了使用门槛。同时交互操作和系统控制简便,算法处理速度快,谱图聚类准确度高是本系统的最大特点。

附图说明

图1为系统模块组成图;

图2为本发明流程图;

图3为基向量查找算法流程图:

图4为峰值区间聚合算法流程图。

具体实施方式

如图1所示,为本实施例涉及一种基于xrd的三元组合材料芯片结构分析系统,包括:用于导入谱图的坐标成分数据以及xrd光谱数据的数据导入模块、用于显示所有谱图的汇总视图的谱图模块、对各个谱图所属类进行标定的预测模块、用于修改峰值区间的区间调整模块和方法比较模块。

所述的数据导入模块用于载入坐标成分数据和xrd数据,坐标成分数据首行需要指定各个位置的材料成分,接下来每一行代表不同的成分数据,xrd数据首行代表谱图的横坐标,接下来每一行代表不同谱图数据,两份数据文件逐行一一对应。

所述的谱图模块以直角坐标为框架显示所有谱图的汇总视图,横坐标标定了衍射角2theta的取值,纵坐标为xrd强度值,用户可以通过刷选或者放大、缩小等交互方式查看感兴趣的衍射角区间。同时对于预测出的多个基向量,放置对应矩形标签用于和其他模块交互。该模块不仅可以查看谱图汇总视图,还可以观察特定谱图或某一类的谱图以增加交互方式。

所述的预测模块通过基向量查找算法得到的各个谱图所属类将会用不同的颜色标定,鼠标悬浮谱图点可以查看该点的材料成分;点击坐标点,谱图模块将会高亮该点的折线图,可以点击多个谱图进行观察。

所述的区间调整模块用于标定各个具体判别区间的2theta值范围,同时为每个区间标定了所属基向量,材料领域专家可通过对该值修改来重新构建相图,以减少判断误差。

所述的方法比较模块包括:用于展示基于基向量查找算法和层次聚类算法所构建的相图所对应的基向量相图单元和层次聚类相图单元,以及两幅相图在相同成分下对比的交叉比较单元,其中:层次聚类相图单元用于提供构建相图比较的参照,材料专家可针对两张相图产生的相边界不同进一步分析调整判别区间,提高相图构建准确率;基向量相图单元用于显示计算出的三元组合材料的相图,其中每张谱图所属的相类别用不同颜色标示;上述两个单元往往对于相边界数据会有一些判断误差,在交叉比较单元体现,正是这部分误差可用于人工判断区间端点是否正确,各个单相的三强峰区间是否正确。因此交叉比较单元可用于材料专家在分析各个谱图以及单相的峰值分布后结合区间调整模块进行修正探索。

本实施例涉及一种三元组合材料芯片结构分析方法,通过分析材料谱图中的xrd数据和坐标数据,以三强峰原则确定峰值并得到峰值分布图,然后依据峰值区间聚合算法将所有的峰值划分为多个候选基向量判别所需的区间并根据此区间使用基向量查找算法获得所有的基向量;最后判断每张材料谱图是否存在基向量及其复合情况进行结构标定。

所述的xrd数据包括衍射角、特定成分在不同衍射角下的x射线衍射强度。

所述的坐标数据包括三元材料信息以及其对应的占比。

本实施例中的基向量具体是指:基向量查找算法根据峰值最高的三强峰找出xrd数据中的单相,同一张相图中各张谱图中峰值必由一个或多个基向量复合构成,因此基向量即为单相的等价替换。

所述的峰值分布图为:xrd数据每一行代表一张谱图的信息,其峰值点可通过峰值查找算法获得,将所有谱图的峰值所在的衍射角和衍射强度在直角坐标系下高亮标出,即形成谱图中的峰值分布图,通过分布图可以观察相同的相在同一衍射角下强度的高低以及衍射角的横向偏移情况。

所述的峰值查找算法是指:通过查找谱图的极大值点确定峰值位置,具体流程为:遍历单个谱图的xrd数据,随着峰值左半区间衍射强度不断的增强,极大值点也不断的更新,当到达峰值点后,由于峰值右半区间衍射强度均小于该峰值衍射强度,该极大值点会一直保留,直到右侧强度与此时所记录的极大值高度差大于设定的阈值时,将该极大值的衍射角和衍射强度记录为一个峰值点和对应峰值,接着继续遍历,将所有峰值点找出。

本实施例中的阈值,采用导入的xrd数据的平均衍射强度值,具有数据自适应性。

所述的峰值区间聚合算法是指:考虑到xrd数据由于材料的结构成分导致峰值衍射角偏移,而自适应地获得用于基向量判别的区间,具体步骤包括:

1)初始化区间集合m,记minnum=n/20设置为合理峰值区间内包含峰值的最小个数,其中:n为xrd数据的行数,scale=1.5为判别比例阈值,peaknum为峰值区间内峰值的实际个数。

2)由于三元合金复合相大多为两个相的复合,依据三强峰原则,对于每个谱图只需选取最高的6个峰值作为原始峰值数据,汇总所有峰值后排序并依次遍历:前一区间的右端点和当前遍历的横坐标大于5个数据间隙时,将其设置为待添区间的新起点,接着继续遍历峰值数据直到密度小于阈值,确定待添区间的右端点,即实现判别区间的分割,接着向集合m添加数据,继续遍历直到找出所有峰值区间。

所述的添加数据是指:当同时满足以下3个条件才能添加该峰值区间:

①peaknum>=minnum

②avgtopkpeak/avgpeak>=scale

③avgtopkpeak/avgsegment>=scale

3)计算上述区间内峰值数据中最高的0.5*minnum个峰值的平均值,记为avgtopkpeak;计算区间内平均峰值高度,记为avgpeak;计算该区间内所有xrd数据的平均值,记为avgsegment。

所述的基向量查找算法是指:对于峰值区间聚合算法得到的峰值区间,依据三强峰原则确定基向量的峰值分布在这些区间的位置,具体步骤为:

i)统计所有谱图三强峰,依据三强峰所落区间将谱图划分成多个类;

ii)谱图数量最多的类即为第一个基向量;

iii)在剩余类中寻找三强峰区间与先前找到的基向量均不同并且数量最多的类作为第二个基向量,以此类推,直到剩余类中均不满足此要求则结束。

所述的结构标定是指:根据基向量查找算法确定了各个基向量的对应区间后,遍历所有谱图的峰值衍射角,预测各个点的单、复相。

所述的遍历是指:根据当前分析出有a、b、c等多个单相,当谱图在a的三强峰区间都存在峰值,且其余单相的三强峰区间峰值数均小于2,则该谱图标定为单相a;当谱图在a的三强峰区间至少存在两个峰值,同时b的三强峰区间也至少有两个峰值,则该谱图标定为单相a和单相b的复合相;其余情况标记为未知相。

所述的结构标定,进一步采用层次聚类算法构建相图形成参照以辅助提升相图的准确率,具体为:初始以每张谱图的三强峰值区间的中值数组作为单个类别数据,构成距离矩阵,计算不同类别数据间的相似度,通过不断迭代合并相似度最近的两个数据,创建出一棵有层次的嵌套聚类树。聚类数量使用上述基向量查找算法所得的纯单相和复合相的总类别数。其中相似度使用皮尔森相关系数体现,u、v为距离矩阵中任意两个数据。

如图2所示,本实施例上述系统具体通过web页面和后端服务器的前后端交互软件架构实现,其中:以html、css、javascript等前端语言编写设计网页,并采用主流的数据可视化js库d3.js来处理矢量图;以基于python的web服务器框架tornado进行前后端传递,前端通过get的http方法传递参数给服务器,提供视图展示以及材料专家人机交互的功能,服务器接收到数据转换为json格式过渡给后台函数接口处理,通过ajax进行页面传值。

数据通过网页导入文件方式载入服务器端,服务器调用峰值查找算法获得每一张谱图峰值衍射强度最高的6个峰值以及对应的衍射角的二元组数据列表,并依据衍射角将他们从小到大排序;接着利用峰值区间聚合算法将所有的峰值二元组划分为多个候选基向量判别所需的区间,将判别区间展示在谱图视图中,并将数值填入区间调整视图,同时创建所有谱图区间内是否包含峰值的布尔矩阵mat,行代表一张谱图,列为所有的判别区间,用以表示该谱图在该判别区间上是否存在峰值;紧接着,基于上述求得的峰值判别区间,依据基向量查找算法获得所有的基向量及其对应的判别区间转为json文件反馈给前端谱图视图和区间调整视图,最后结合布尔矩阵mat,对照基向量的三强峰所在区间,判断每张谱图是否存在基向量及其复合情况,用数字对每张谱图分类,反馈给前端基向量视图,前端视图通过传递的数字对每个点颜色渲染,便完成最终相图构建。

本发明通过峰值区间聚合算法防止同一种物质的相在一定偏移误差下衍射角相同的情况;通过区间调整模块显示后台算法得到的区间聚合结果,由于算法不能保证区间的左右端点一定正确,因此添加了调整功能,如果材料学专家认为后台计算结果不是很契合实际,可以更改数值,系统将会根据调整后的区间重新计算。同时由于系统对基向量的预测并非百分百正确,因此有必要提供区间增删功能作为辅助手段用于系统分析后对基向量人工校正。

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1