3款猪50K SNP芯片基因型填充至序列数据的效果评估

您所在的位置:网站首页 v1芯片是什么类型的芯片 3款猪50K SNP芯片基因型填充至序列数据的效果评估

3款猪50K SNP芯片基因型填充至序列数据的效果评估

2024-07-12 20:31| 来源: 网络整理| 查看: 265

单核苷酸多态性(Single nucleotide polymorphisms, SNP)是指由于单个核苷酸发生变异引起的基因组水平上DNA序列的多态性,具有遗传稳定性强、位点数量多且分布广,易于大规模自动化检测的优势,SNP芯片作为检测SNP的重要手段,已被广泛应用于生物、医学、农学等领域[1]。在猪育种中,相对低密度芯片的位点信息不足和高密度芯片的价格高昂,中密度50K芯片成为了猪基因组选择的主流芯片类型。其中,Neogen子公司Geneseek研发的纽勤50K(Porcine SNP 50K beadchip)、江西农业大学研发的中芯一号50K(KPS Porcine breeding chip v2)及中国农业大学研发的液相50K(GenoBaits porcine SNP 50K)为国内常见的3款猪50K SNP芯片。3款芯片设计的原理不同,纽勤50K和中芯一号50K均是基于Illumina平台研发的固相芯片,液相50K芯片是基于靶向测序基因型分型技术[2]研发的芯片。

全基因组测序数据(Whole genome sequencing, WGS)相比芯片数据记录了更完整的遗传信息,但由于直接测序成本较高,因此人们常用基因型填充技术将低密度的芯片数据填充至序列数据。基因型填充是一项根据参考群体的基因型信息推断目标群体缺失基因型的技术,其能够充分利用现有的SNP芯片信息将低密度数据准确填充至高密度,实现了在节约育种成本的基础上提高育种准确性[3-4]。现有的基因型填充软件有很多,常用的有Beagle[5-6]、Impute2[7]、Findhap[8]、AlphaImpute[9]、FAMHAP[10]、FImpute[11]等。基因型填充技术现已成为一种常规、有效的工具,被广泛应用于动物遗传育种领域,在猪的相关研究中,基于填充后的数据有助于筛选新的候选基因[12]、提升基因组选择的准确性,并降低生产的成本[13-15]。同样,在牛[16-17]、羊[18]、鸡[19]的遗传育种研究中基因型填充也起到了重要的作用。一方面,基因型填充的效果受到许多数据如参考群体大小、参考群体与目标群体之间的遗传关系、最小等位基因频率(Minor allele frequency, MAF)等的影响;另一方面,不同填充软件计算的质控指标对填充准确性也有一定的影响,如Beagle[5-6]软件的DR2(Dosage R-squared)、Impute[7]软件的INFO等。

此前,国内研究团队对3款芯片之间相互填充的效果进行了评估[20],但对3款芯片填充至序列数据的效果鲜有报道,因此本研究旨在评估3款猪50K SNP芯片基因型填充至序列数据的效果,以期为我国猪遗传研究和分子育种工作提供参考和借鉴。

1 材料与方法 1.1 芯片群体

本研究所用的48头杜洛克猪的芯片群体来自广西某育种场,该群体在纽勤50K、中芯一号50K及液相50K芯片的位点数分别为50697、57466和50885,具体的位点重叠情况见图1a。另外,在芯片重叠的位点里,本研究在等位基因精确匹配后评估了3款芯片两两之间的一致性与相关性。

图 1 3款芯片之间的位点分布 Fig. 1 Distribution of loci among three chips

芯片数据利用根据以下步骤进行质量控制:1)剔除位置重复或未知的位点;2)剔除非常染色体位点;3)利用Conform-gt软件校正正反链并去除参考群以外的位点。质控后纽勤50K、中芯一号50K及液相50K芯片剩余位点数分别为31756、29469和42311,分别占原始芯片数据的62.6%、51.3%和83.2%,质控后具体的位点重叠情况见图1b。

1.2 参考群体

本研究使用的全基因组测序参考群体共260头猪,其中50头来自福建某种猪场的杜洛克,210头来自华南地区的21个地方猪品种。该群体平均测序深度为14.53×,平均测序覆盖度为98.85%,经过MAF



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3