单细胞测序要用几个样本啊，没钱测很多怎么办？

您所在的位置：网站首页 › 单细胞测序技术服务如何寻找客户 › 单细胞测序要用几个样本啊，没钱测很多怎么办？

单细胞测序要用几个样本啊，没钱测很多怎么办？

2023-03-16 04:13| 来源: 网络整理| 查看: 265

用小成本搞定单细胞测序，我们一起学习一下单细胞混样技术（Cell hashing）的分析流程！

从同一个细胞同时测量多种数据类型的能力，被称为多模态分析，代表了单细胞基因组学的一个新的和令人兴奋的前景

那么，我们开始吧

引言

这一部分我们主要讲解两部分内容：一部分是技术本身；一部分则是我们后面演示数据集来自的参考文献

那么，我们首先讲解第一部分：技术本身（单细胞混样技术（Cell hashing）），下面展示一下要点总结：

Cell Hashing是在CITE-seq的基础上改进的，CITE-seq全称cellular indexing of transcriptomes and epitopes by sequencing，是一种同时对细胞内RNA和细胞表面蛋白进行测序的技术，而Cell Hashing技术不同于CITE-seq技术的点在于，其是为了解决如何将不同样本的细胞混起来测序（便宜），测完了还能区分哪个细胞来源于哪个样本，这样做也减少了批次效应

Cell Hashing是在CITE-seq的基础上改进，是给需要混合的样品提前加上HTO (A distinct Hashtag oligonucleotide) 标签，这样即使混合后也可以提供不同的HTO标签进行区分

了解了技术本身，我们再来看一下我们后面代码演示数据集来自的参考文献：

中文题目：人类骨髓（BM）和脐血（UCB）细胞的单细胞转录组揭示了红细胞分化连续体的假定调节因子

摘要：

了解成年人类造血干细胞（HSC）参与红细胞生成的的精细分化轨迹对于理解人类红细胞生成的动态发育变化至关重要。利用直接从成人

骨髓(BM)和脐带血(UCB)中分离的原代人类末端红细胞(CD34−CD235a+)的单细胞RNA测序(scRNA-seq)，本研究以前所未有的分辨率记录

了最终分化的人类成红细胞的转录组。这些见解使我们能够区分处于发育早期和晚期的多色成红细胞（PolyEs），以及正色成色细胞

（OrthoEs）的不同发育阶段。本研究通过监测细胞分化和凋亡，进一步鉴定出一套终端红系分化调节剂，并在功能上验证了已鉴定的三

个基因AKAP8L，TERF2IP和RNF10。本研究记录了AKAP8L的敲低抑制了造血干细胞对红系谱系和细胞增殖的命运，并抑制了红系集落

（CFU-E）到成红细胞期（ProE）的分化。相比之下，敲低TERF2IP和RNF10延迟PolyE分化为OrthoE阶段

数据集：GSE150774

样本信息：从六个年轻的健康男性供体中收集了10毫升的BM样品，从六个健康的新生儿脐带中收集了20毫升的UCB样品。基于10x 平台进行测序后，最终获得了来自三个BM样品的8,668个细胞和来自三个UCB样品的17,692个细胞的数据。

代码实操（思路）

下面尝试进行分析思路的复现：

我们首先面对的第一个问题其实就是，那个95.9Mb的文件到底是什么？

因为我们理解了单细胞表达矩阵的本质，其实就是观测是Gene symbol，变量是Barcode ID，然后表达信息是稀疏矩阵，所以说这些一个文件的我们都可以把其整理成Seurat对象，但是第一个文件GSE4558614_UCB2UCB3_.....就很让人费解，因为为什么会把脐带血两个样本混在一起？

其实这个样本就是所谓的单细胞混样技术（Cell hashing）,那么下面我们通过代码来逐步的进行操作

#准备工作 library(Seurat) library(ggplot2) library(tidyverse) library(stringr) library(harmony) #读取输入数据（这里我们主要基于GSE4558614_UCB2UCB3这个样本，因为只有这个样本是基于Cell hashing） HP

](https://imgtu.com/i/X7occD

#先查看一下HTO标志的数据 yhto

那么，到这里我们需要再次明确我们分析的目的

我们分析的目的其实就是因为我们的数据基于Cell hashing技术，这就导致我们读取的这个数据其实是包含两个样本的数据，而我们想做的就是把两个样本分开，因为都混在一起了，我们也不太好进行后续的操作

#我们来看一下表达矩阵数据

表达矩阵数据显然只有一个表达矩阵，所以我们可以有理由推断，Cell hashing技术是把多样本的表达信息融合在一个表达矩阵之中，然后通过标志矩阵（HTO tag矩阵）识别不同样本来源的细胞ID，进而允许我们将其分离

明确了我们的目的后，我们继续往下探索

#简单进行质控，减少下游分析的计算机负荷 pbmc.htos 0]#在两个样本中都是0的barcode ID显然就不是我们研究的重点 #然后再查看表达量矩阵 pbmc.umis

【本文地址】

单细胞测序要用几个样本啊，没钱测很多怎么办？

单细胞测序要用几个样本啊，没钱测很多怎么办？

今日新闻

推荐新闻