“各种基因”的ID

您所在的位置:网站首页 基因的id用斜体吗为什么 “各种基因”的ID

“各种基因”的ID

2024-07-10 06:17| 来源: 网络整理| 查看: 265

Gene ID Gene Symbol Ensembl ID NCBI的RefSeq数据库ID UniProt ID(Entry) Gene ID

也称Entrez ID,EntrezGene ID。就是一串数字。 需要注意的是,同一基因,不同物种之间可能有相同名称,但Gene ID不同。狗中TP53的Gene ID是403869,他们都有着相同的Official Symbol:TP53。可能我们经常看到的Ensembl ID后面还加.加数字,有时候也有"_",总之, "."后面的数字表示的是版本号,我们进行基因注释或者转换的时候需要去掉,你可以理解成和某些手机软件的版本号一样:1.2,1.2.2.3,1.3,

Gene Symbol

HOGN数据库为gene提供的官方命名,是科研工作者按照基因的功能起的名字,通常是对功能描述的缩写。由大写字母和数字组成,一般为全名的缩写,但我们在NCBI的gene数据库中看到人TP53基因的Official Symbol是由HGNC所提供。而斑马鱼的tp53由ZNC提供。 HGNC是人类基因命名委员会(HUGO Gene Nomenclature Committee);人类基因组命名委员会。有专门的数据库:https://www.genenames.org/。需要注意的是 HGNC数据库中也给基因一个 ID,叫HGNC ID,他和Gene ID不一样,尽管都是数字。

Ensembl ID

其所代表的是在Ensembl数据库中对基因的命名,常见的物种前缀:“ENS“表示Homo sapiens (Human),”ENSMUS“表示Mus musculus (Mouse),”ENSDAR“表示Danio rerio (Zebrafish);而常见的序列类型用G、P、T、分别表示gene、protein和transcript。

NCBI的RefSeq数据库ID

一般是两个大写首字母,加下划线,后面接数字。两个首字母如 ”NC_”、”NM_”、”NP_”分别对应DNA、mRNA、Protein。

UniProt ID(Entry)

是UniProt 数据库 https://www.uniprot.org/ 中蛋白质的编号。UniProt(全称Universal Protein),它整合了三个老字号数据库(Swiss-Prot、 TrEMBL 和 PIR-PSD )的数据。是目前信息最丰富、资源最广的免费蛋白质数据库。UniProt ID就是Entry,是UniProt的给每个蛋白质赋予的独一无二的ID号,而Entry name通常是基因名称加物种名称。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3