本申请拟对DNA一级结构序列中的某些片段,如外显子(exon)进行编码,然后,在此基础上,进行不同物种免疫球蛋白中DNA一级结构序列的外显子片段的相似性比较。其中编码方案拟进行两种途径的试探一是在二维、三维直角坐标系统中,对A,T,G,C四种碱基进行编码,通过这种编码,首先将某个外显子转换成"结构图",然后实施图论运算,由它,得到必要的参数,最后,进行相似度的比较;二是在四维坐标系统中,对A,T,G,C四种碱基,每一种赋予一定的值,通过这种方法将之首先转换成矩阵,然后对矩阵实施诸种运算,如参数的计算和参数(即变量)的选择,进而进行相似性的比较。同时,由所得结果来比较几种方案的优劣,从中推荐出可取的方案;对所得相似性比较结果作出生物化学的解释。
本申请拟对DNA一级结构序列中的某些片段,如外显子(exon)进行编码,然后,在此基础上,进行不同物种免疫球蛋白中DNA一级结构序列的外显子片段的相似性比较。考虑到碱基a, t, c, g及碱基对在DNA一级序列中位置的特征,则用数字序列对DNA进行描述。在此基础上,衍生分子连接性指数并且进行DNA序列的相似性比较。其结果,10个物样的进化关系与生物进化树能很好的相一致。在上述信息的基础上,即4个碱基在DNA一级序列中的位置,我们提出另外一种不变量即参数的计算方案。一个含400左右碱基编码区的β-球蛋白一般要包含多个外显子,为了利用多个外显子的信息,则将如上所得第一个外显子的参数与第二个外显子的参数相除,第二个与第三个相除,等等,由此可以衍生出一种新的不变量,将之用于不同的物种,得到了满意的结果。