PTA 2 新冠状病毒的基因序列(动态规划)

您所在的位置:网站首页 郑州的新病毒 PTA 2 新冠状病毒的基因序列(动态规划)

PTA 2 新冠状病毒的基因序列(动态规划)

2024-07-11 16:10| 来源: 网络整理| 查看: 265

2019年12月下旬,武汉出现了多例不明原因的病毒性肺炎病例。之后,中国疾病预防控制中心确定此次致病的病原体为一种新的冠状病毒。1月12日,世界卫生组织将其命名为“2019新型冠状病毒(2019-nCoV)”。为了弄清新型冠状病毒的起源,中国疾控中心等机构的研究人员对住院患者的样本进行高通量测序,获得了完整和部分的2019-nCoV基因组序列。接着对这些2019-nCoV基因组和其他冠状病毒的基因组开展系统进化分析,以便确定这些病毒的进化史,帮助推断其可能的来源。

2020020112184521.jpg

上述的研究就属于计算机和生物医学的交叉领域的相关研究,我们称之为生物信息学。在生物信息学中,我们以DNA为例说明基因序列的相似度研究。DNA (脱氧核糖核酸 )是生命体中主要的遗传物质 , 能将遗传信息由亲代传到子代. 它是一种线性 多聚脱氧核糖核苷酸 , 由碱基、戊糖及磷酸组成. 所有 DNA的主链均相同 , 只是腺嘌呤 (A)、鸟嘌呤(G)、胞嘧啶 (C)和胸腺嘧啶 (T)这 4种碱基的排列顺序不同. 不同生物体的 DNA具有自己独特的碱基顺序 , 遗传信息是由碱基顺序体现的 , 所以 , 进行 DNA序列的比较 (即观察 4种碱基在主链上的排列顺序 )是非常重要的. 通过比较不同物种的 DNA序列 , 得出其相似度 , 从而可以推断出物种间亲缘关系的远近.。

timg.jpg

现在给你两个由AGCT四个字母构成的字符串,请你求出两个DNA序列的最长公共子序列。

输入格式:

两行,每行一个字符串,分别表示一个DNA序列(每个字符串长度不超过1000)。

输出格式:

一个数,最长公共子序列元素的个数。

输入样例:

在这里给出一组输入。例如:

AGCT ATT

结尾无空行

输出样例:

在这里给出相应的输出。例如:

2

结尾无空行

分析:这道题是求最长公共子序列,注意不是最长公共子串。这两个是有去别的。例如ABCDEFG和ABCFGH。最长公共子序列是ABCFG,而最长公共子串是ABC。现在求两个串里的最长公共子序列。现在设两个串未X[n]={x1,x2,x3...xn}和Y[n]={y1,y2,y3....yn}。Z[n]用来存每个元素的最长公共子序列的值。

(1)如果X[n]==Y[n],则Z[n]=X[n]或者Z[n]=Y[n],那么“剩下的”最长公共子序列一定在X[n-1]和Y[n-1]中。

(2)如果X[n]!=Y[n],而Z[n]!=X[n]或者Z[n]!=Y[n],则最长公共子序列一定在X[n-1],Y[n]    和   X[n]和有Y[n-1]之间的较大值。

这个公式分析可能第一次比较不好懂,在读的同时,自己用笔写一下,画一下。读者可以再参考其他人写的,加深理解。

因为这里是从后往前推,最大值是Z[0]。

如果是从前往后推的话,最大值是Z[n]。而我是从前往后推。

代码如下:

#include #include

int Max(int a, int b) {     return a > b ? a : b; } int main() {     int i, j;         char a[1001] = { 0 }, b[1001] = { 0 };            int f[1001][1001] = { 0 };//这个元素的意义是X[i]和Y[j]之间的最长公共子序列         gets(a);         gets(b);         int n = strlen(a);         int m = strlen(b);            for (i = 1; i



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3