快速了解fastq.gz文件中的reads数目

您所在的位置:网站首页 gz文件grep 快速了解fastq.gz文件中的reads数目

快速了解fastq.gz文件中的reads数目

#快速了解fastq.gz文件中的reads数目| 来源: 网络整理| 查看: 265

因为R1和R2数据量相同的原因,我只看R1的真实文件和gz文件大小与数据量之间的关系。

数据量=FASTQ文件行数/4*151/1000/1000 单位为M

真实文件大小估计=FASTQ文件行数/4*357/1024/1024 单位为M,预测值,差别不大,因为FASTQ文件中每四行357个字符(和平台和设置有关系),每个字符1byte。

GZ文件大小通过ll -h查看

因为FASTQ文件是规范的,每四行字符基本一致,所以FASTQ真实文件大小和数据量成正比。比如我前面提到的每四行有357个字符,其中序列只占151个字符,也就是说FASTQ文件大小大概是测序量的357/151≈2.3倍多。但因为FASTQ文件为文本文件,占用空间较大,所以一般将FASTQ文件压缩成gzip格式文件。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3