PTA 2 新冠状病毒的基因序列(动态规划) |
您所在的位置:网站首页 › 郑州的新病毒 › PTA 2 新冠状病毒的基因序列(动态规划) |
2019年12月下旬,武汉出现了多例不明原因的病毒性肺炎病例。之后,中国疾病预防控制中心确定此次致病的病原体为一种新的冠状病毒。1月12日,世界卫生组织将其命名为“2019新型冠状病毒(2019-nCoV)”。为了弄清新型冠状病毒的起源,中国疾控中心等机构的研究人员对住院患者的样本进行高通量测序,获得了完整和部分的2019-nCoV基因组序列。接着对这些2019-nCoV基因组和其他冠状病毒的基因组开展系统进化分析,以便确定这些病毒的进化史,帮助推断其可能的来源。 上述的研究就属于计算机和生物医学的交叉领域的相关研究,我们称之为生物信息学。在生物信息学中,我们以DNA为例说明基因序列的相似度研究。DNA (脱氧核糖核酸 )是生命体中主要的遗传物质 , 能将遗传信息由亲代传到子代. 它是一种线性 多聚脱氧核糖核苷酸 , 由碱基、戊糖及磷酸组成. 所有 DNA的主链均相同 , 只是腺嘌呤 (A)、鸟嘌呤(G)、胞嘧啶 (C)和胸腺嘧啶 (T)这 4种碱基的排列顺序不同. 不同生物体的 DNA具有自己独特的碱基顺序 , 遗传信息是由碱基顺序体现的 , 所以 , 进行 DNA序列的比较 (即观察 4种碱基在主链上的排列顺序 )是非常重要的. 通过比较不同物种的 DNA序列 , 得出其相似度 , 从而可以推断出物种间亲缘关系的远近.。 现在给你两个由AGCT四个字母构成的字符串,请你求出两个DNA序列的最长公共子序列。 输入格式:两行,每行一个字符串,分别表示一个DNA序列(每个字符串长度不超过1000)。 输出格式:一个数,最长公共子序列元素的个数。 输入样例:在这里给出一组输入。例如: AGCT ATT结尾无空行 输出样例:在这里给出相应的输出。例如: 2结尾无空行 分析:这道题是求最长公共子序列,注意不是最长公共子串。这两个是有去别的。例如ABCDEFG和ABCFGH。最长公共子序列是ABCFG,而最长公共子串是ABC。现在求两个串里的最长公共子序列。现在设两个串未X[n]={x1,x2,x3...xn}和Y[n]={y1,y2,y3....yn}。Z[n]用来存每个元素的最长公共子序列的值。 (1)如果X[n]==Y[n],则Z[n]=X[n]或者Z[n]=Y[n],那么“剩下的”最长公共子序列一定在X[n-1]和Y[n-1]中。 (2)如果X[n]!=Y[n],而Z[n]!=X[n]或者Z[n]!=Y[n],则最长公共子序列一定在X[n-1],Y[n] 和 X[n]和有Y[n-1]之间的较大值。 这个公式分析可能第一次比较不好懂,在读的同时,自己用笔写一下,画一下。读者可以再参考其他人写的,加深理解。 因为这里是从后往前推,最大值是Z[0]。 如果是从前往后推的话,最大值是Z[n]。而我是从前往后推。 代码如下: #include #include int Max(int a, int b) { return a > b ? a : b; } int main() { int i, j; char a[1001] = { 0 }, b[1001] = { 0 }; int f[1001][1001] = { 0 };//这个元素的意义是X[i]和Y[j]之间的最长公共子序列 gets(a); gets(b); int n = strlen(a); int m = strlen(b); for (i = 1; i |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |