dyno使用教程 |
您所在的位置:网站首页 › 细胞分化轨迹分析 › dyno使用教程 |
在上一期的《单细胞轨迹分析知多少--拟 1.准确性2.可扩展性3.稳定性4.可用性 得出了几项重要结论: •轨迹推断(TI,trajectory inference)软件方法输入和输出接口的标准化对于TI方法的广泛应用非常关键•不同TI方法的组合存在一定的互补性,能够高概率的得出与实际生物学模型相符的轨迹推断结果•在1个项目的数据集上尝试多种TI分析算法,一是可以提供多种算法证据支持,二是如果多种算法的结果有冲突有利于我们深度思考可能的具体生物学原因 A comparison of single-cell trajectory inference methods[1](Saelens et al., 2019)的作者做了一个R包--dyno为终端用户提供完整的TI分析流程,dyno特点如下: 1.统一59种TI方法的输入输出接口2.提供交互式指南工具,可帮助用户选择最合适的TI方法3.简化了轨迹的解释和可视化,包括根据基因表达或者cluster着色4.还可以进行下游分析,例如潜在marker gene 的鉴定 dyno安装dyno是一个R包,需要R/Rstudio运行环境,目前的存放地址是在github- https://github.com/dynverse/dyno,所以我们用devtools进行安装,打开Rstudio,输入以下命令: #install.packages("devtools") devtools::install_github("dynverse/dyno")在这个过程中会安装一系列dynverse R包(dynwrap, dynplot, dynmethods, …)。 如果是在linux系统使用,需要安装udunits和ImageMagick •Debian / Ubuntu / Linux Mint: sudo apt-get install libudunits2-dev imagemagick•Fedora / CentOS / RHEL: sudo dnf install udunits2-devel ImageMagick-c++-devel 运行TI方法需要用到Docker或者Singularity (version ≥ 3.0),如果电脑系统是Windows或者MacOS,推荐使用docker,如果是在集群,推荐使用 Singularity。 如果是win10系统,可以运行Docker CE[2]。Singularity的安装请参考https://www.sylabs.io/docs/,如果已经安装了anaconda,可以执行conda create -n singularity -c conda-forge singularity=3.0.1安装 安装过程遇到的问题API rate limit exceeded因为dyno存放在了Github,在dyno的安装过程会使用GitHub API,默认的API限制是60次请求,所以会遇到API rate limit exceeded的问题,解决方式如下: •在Rstudio命令行执行 usethis::browse_github_pat()建议一个GitHub token•执行usethis::edit_r_environ() 添加以下环境变量GITHUB_PAT = 'your_github_token•重启R/Rstudio (重新载入 GITHUB_PAT)•再次重新安装:devtools::install_github("dynverse/dyno") 其他安装问题如果没有devtools是不能安装dyno的,所以有些时候devtools的安装也会出现一些问题,例如网络不稳定等,这时可以采用国内的源进行安装:install.packages('devtools', repos='https://mirrors.tuna.tsinghua.edu.cn/CRAN/') 在linux集群,如果没有root权限,安装使用dyno会非常困难,我准备了解决方案会在文章最后一节介绍。 windows10/MACOS用户快速体验方式dyno的整个安装过程会非常漫长,如果是windows10或者MACOS用户可以在安装docker之后用我构建的R镜像:seqyuan/seqyuan-r:v0.0.1(R version 3.6.1)进行体验,这个R镜像安装了dyno、tidyverse及Seurat等包,可以免去安装过程快速体验dyno的强大,具体使用会在文章最后一节介绍。 dyno的使用dyno[3]的官网https://dynverse.org/有详细的使用步骤介绍,在这里我们就不再重复官网测试数据的结果,重点介绍Seurat分析的10X单细胞转录组数据的结果怎么样和dyno对接。 主要步骤主要步骤如下[4] 准备数据为数据集选择最佳方法运行TI方法轨迹可视化从生物学角度解释轨迹RootingMilestone labelling基因表达在轨迹上的展示A global overview of the most predictive genesLineage/branch markersGenes important at bifurcation points准备数据首先打开Rstudio(如果是linux,打开R命令行),载入以下R包 library(dyno) library(tidyverse) library(Matrix) library(Seurat)dyno对数据的包装主要通过dynwrap[5]包来实现 Gene expression datadynwrap要求raw counts和normalised(log2)表达数据,低表达的细胞、双细胞、坏细胞应该被提前过滤。使用Seurat处理后的数据一般都包含了这些步骤。 wrap_expression要求raw counts和normalised表达为 sparse matrix (dgCMatrix)(列为genes/features,行为细胞) #读入seurat处理后的rds文件 sdata |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |