一起玩转HiC格式转换

您所在的位置:网站首页 ann文件格式转换 一起玩转HiC格式转换

一起玩转HiC格式转换

2023-08-20 11:02| 来源: 网络整理| 查看: 265

日常瞎掰

  五一放假了么?   放了!好像又没放。无所谓了,反正已经禁足快五十天了,都已经失去知觉了!有一种“不知天上宫阙,今夕是何年”的朦朦胧胧的恍惚!   《那年那兔那些事》这个讲述抗战的历史小动漫,现在已经记不起自己何时何地因何第一次接触到这个动漫的了,但它给我的感觉还是依然很清晰。说不清因为什么自己这么印象深刻,或许是引起了内心的爱国情怀,但更多的应该是受到了当时人们为了追求和平所做出的巨大牺牲的冲击,也许那种同仇敌忾、勇往无前的情怀才是最深入人心的印记!世上并没有感同身受,而时间又是治愈一切的良药,那么应该如何保持初心呢?   今天为何会说到那兔呢?答案很简单,因为无意中看到了关于那兔的小视频,看到这个一点都不感到惊讶,因为现在分享各式各样的视频都有,其实心里早有预感,这个动漫迟早会被拿出来分享——《那年那兔那些事》。   那时候的,小钱钱,真心甜!

格式知多少

  好了,现在要从大国情怀回到现实了,说点大家唾手可得的东西。关于HIC技术想必大家应该有所了解了,不了解也没有关系,反正这里我也不会介绍。那我们就一起外行看个热闹吧!   分析HIC的软件各式各样,这里就列举一二:juicer、homer、hic-pro、hicexplorer等,这些软件的好坏这里就不做评论了,但是要吐槽一下格式不统一的情况。都是分析HIC,这些工具产生的结果的数据格式却大相径庭。这里也列举一二:.hic、cool、homer、hic-pro的六列文件、hdf5等。这些不同的格式(天知道为什么会弄出这么些格式)着实给数据处理带来了不少的麻烦,毕竟这些格式基本上都属于二进制的文件,想要轻易预览里面的内容,根本没有的事。那么,格式转换是必然面临的问题了,因为没有一款软件可以满足你的全部需求,只能根据需要来转换成软件接受的文件格式。   当然,也不必惊慌,既然有需求,那就会有人来实现这个解决办法,就比如hicexplorer软件就有格式转换的功能,基本覆盖上面提到的格式了,hicConvertFormat:

usage: hicConvertFormat --matrices MATRICES [MATRICES ...] --outFileName OUTFILENAME [OUTFILENAME ...] --inputFormat {h5,cool,hic,homer,hicpro} --outputFormat {cool,h5,homer,ginteractions,mcool} [--correction_name CORRECTION_NAME] [--correction_division] [--store_applied_correction] [--chromosome CHROMOSOME] [--enforce_integer] [--load_raw_values] [--resolutions RESOLUTIONS [RESOLUTIONS ...]] [--help] [--version] [--bedFileHicpro BEDFILEHICPRO [BEDFILEHICPRO ...]]

  现在格式转换的问题基本迎刃而解,转换的时候只需一行命令就可以完成。但这里还是想要单独强调一下.hic这个格式,这个格式可以包含多个分辨率的交互矩阵,转化格式的就应当特别注意一下。这里也顺便提一下,其实cool也有多分辨率结果的格式,即mcool。故.hic格式可以直接转化为mcool,然后由mcool再提取其中一个分辨率的结果就是cool。   hicConvertFormat转化格式的命令,基本形式如下:

hicConvertFormat --matrices sample.h5 --inputFormat h5 --outputFormat ginteractions --outFileName sample.gi.tsv

  使用上面的命令,基本满足任何从inputFormat到outputFormat的转化,但这里还是指出一个特殊情况,hicConvertFormat只能将.hic直接转为cool,不能是其他格式,不信你看:

  上面是hicConvertFormat的部分代码,可以看出.hic可以直接转化为cool,利用的是hic2cool这个软件。如果用hicConvertFormat命令将.hic到其他格式,需要先转为cool/mcool作为中间格式,然后再转换为需要的格式。下面演示一下如何查看mcool里面的结果:

cooler ls sample.mcool

结果如下:

sample::/resolutions/1000 sample::/resolutions/5000 sample::/resolutions/10000 sample::/resolutions/25000 sample::/resolutions/50000 sample::/resolutions/100000 sample::/resolutions/250000 sample::/resolutions/500000 sample::/resolutions/1000000 sample::/resolutions/2500000

  从上面的结果可以知道mcool里面都有哪些结果,这样就可以有选择性地做格式转化了:

hicConvertFormat --matrices sample.mcool::/resolutions/25000 --inputFormat cool --outputFormat h5 --outFileName sample.h5 结束语

  hicexplorer的格式转化功能已经挺完善了,基本上可以玩转HiC的数据格式了。不过,这里还想提一下straw(安装有些费力)和cooler两款软件,前一个软件可以直接将.hic转为txt格式,后一个软件可以直接将cool转为txt,得到了txt文件后续处理起来便可以随心所欲了。格式统一是不可能了,但有了这些工具的支持,基本上也是可以玩转HiC的格式转化了。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3