糖及其GLYCAM力场中的命名约定

您所在的位置:网站首页 糖代表啥 糖及其GLYCAM力场中的命名约定

糖及其GLYCAM力场中的命名约定

2024-07-11 12:12| 来源: 网络整理| 查看: 265

2017年03月31日 09:06:33

子曰:“必也正名乎!名不正,则言不顺;言不顺,则事不成。故君子名之必可言也,言之必可行也。”                 ——《论语·子路》

道可道非常道。名可名非常名。无名天地之始。有名万物之母。                 ——《老子·第一章》

【按】以下说明整理自维基百科 糖类, 并翻译自Amber 16手册以及GLYCAM网站说明.

糖(碳水化合物): 多羟基醛或多羟基酮及其缩聚物和某些衍生物的总称

单糖 羰基位置: 醛糖, 酮糖 碳原子数: 丙糖, 丁糖, 戊糖, 己糖 手性: D, L 双糖 低聚(寡)糖/多糖

半缩醛异构化: 呋喃糖(5元环)与吡喃糖(6元环)

葡萄糖

葡萄糖的α-与β-(后者)端基异构物。

注意结合在碳5上的CH2OH基团与端基异构碳上的羟基(红色或绿色)之间的空间关系:

两者异面为(α)型, 同面则为(β)型

葡聚糖 D-葡萄糖单体组成的多糖 α-葡聚糖 β-葡聚糖 结合类型 名称 主要存在场所 结合类型 名称 主要存在场所 α-1,4 直链淀粉 大米 β-1,4 纤维素 树 α-1,6 右旋糖酐 乳酸菌 β-1,3 酵母多糖 酵母 黑木耳多糖 黑木耳 金藻昆布多糖 金藻门 α-1,4/1,6 糖原 动物 β-1,3/1,6 海带多糖 海草、蕈类 支链淀粉 糯米 热凝胶多糖 细菌 普鲁兰多糖 酵母 愈伤葡聚糖 植物   平菇多糖 平菇   β-1,6:β-1,3 香菇多糖 香菇, 严格钝化 β-1,3/1,4 地衣多糖 地衣 纤维素

属于广义的糖类, D-葡萄糖以β-1,4-糖苷键组成的大分子多糖,分子量约50,000~2,500,000,相当于300~15,000个葡萄糖基

视图: 投影 正交着色: 按链 按残基模式: 飘带 骨架 管板 卡通显示: 水分子 非键原子   名称颜色: 氨基酸 形状 极性 酸性 彩虹左键: 转动   滚轮: 缩放   双击: 自动旋转开关   Alt+左键: 移动Fig.1 3.3 碳水化合物 GLYCAM06力场 leaprc.GLYCAM_06j-1: 使用GLYCAM06的LEaP配置文件, 可单独用于碳水化合物或与ff14SB力场联合使用 GLYCAM_06j.dat: 寡糖参数 GLYCAM_06j-1.prep: 糖基残基的结构和电荷 GLYCAM_lipids_06h.prep: 一些脂类残基的结构和电荷 GLYCAM_amino_06j_12SB.lib: 与ff14SB力场兼容的糖蛋白库文件 GLYCAM_aminoct_06j_12SB.lib GLYCAM_aminont_06j_12SB.lib 使用孤对电子(额外点)的GLYCAM06EP力场 GLYCAM_06EPb.dat: 寡糖参数 GLYCAM_06EPb.prep: 糖残基结构和电荷 leaprc.GLYCAM_06EPb: 用于GLYCAM-06EP的LEaP配置文件 3.3.7 GLYCAM中的碳水化合物命名约定

为了将碳水化合物以标准方式添加到建模程序中, 也为了提供用于X射线和NMR pdb文件的标准, 我们已经发展了一套三字符的编码命名方法. 使用三字符是基于RCSB PDB Advisory Committee ()pdb文件标准, 实用原因在于, 所有的建模和实验软件都可以读入三字符编码, 主要是用于蛋白和核酸.

作为单糖三字符PDB编码的基础, 我们为单糖引入了单字符编码(表3.5). 如果可能, 字符取自单糖名称的第一个字母(A=Ara, F=Fuc, G=Glc, I=Ido, M=Man, P=Psi, Q=Qui, R=Rib, T=Tal, X=Xyl), 但出于其他考虑, L被用于Gal, 尽管它比Lyz更不常用. 考虑到单糖衍生物存在无限多种变体, 26个字母的限制无法保证单字母(或三字母)编码能够不重复. 因此我们首先将单字符用于所有的戊糖和己糖, 非衍生的单糖. 接下来, 根据出现频率或生物重要性来分配字母.

使用三字符(表3.6到3.8), 目前的GLYCAM残基名称编码了下列内容: 碳水化合物残基名称(Glc, Gal等), 环类型(吡喃p或呋喃f), 端基异构(α或β), 异构体类型(D或L)和出现的连接位置(2-, 2,3-, 2,4,6-等). 连接位置信息非常重要, 且不能由单糖名称获知, 不像氨基酸那样. 进一步, 三字符编码选择时与氨基酸目前使用的编码不重合.

纤维二糖的GLYCAM命名约定

表 3.4: GLYCAM目前支持的单糖. (a) 目前正在开发. (b) 只有一种对映体和环类型可用. Carbohydrate碳水化合物 Pyranose 吡喃(己)糖α/β, D/L Furanose 呋喃(戊)糖α/β, D/L Arabinose 树胶醛醣/阿拉伯糖/阿糖 yes yes Lyxose 来苏糖 yes yes Ribose 核糖 yes yes Xylose 木糖 yes yes Allose 阿洛糖 yes Altrose 阿卓糖 yes Galactose 半乳糖 yes a Glucose 葡萄糖 yes a Gulose 古罗糖 yes Idose 艾杜糖 a Mannose 甘露糖 yes Talose 塔洛糖 yes Fructose 果糖 yes yes Psicose 阿卢糖 yes yes Sorbose 山梨糖 yes yes Tagatose 塔格糖 yes yes Fucose 海藻糖 yes Quinovose 奎诺糖/异万年青糖/鸡纳糖 yes Rhamnose 鼠李糖 yes Galacturonic Acid 半乳糖醛酸 yes Glucuronic Acid 葡(萄)糖醛酸 yes Iduronic Acid 艾杜糖醛酸 yes N-Acetylgalactosamine N-乙酰半乳糖胺 yes N-Acetylglucosamine N-乙酰葡糖胺 yes N-Acetylmannosamine N-乙酰甘露糖胺 yes Neu5Ac N-乙酰神经氨酸 yes, b yes, b KDN 2-keto-3-deoxy-nonulosonate a,b a,b KDO 2-keto-3-deoxy-octulosonate a,b a,b 表 3.5: 单糖GLYCAM残基名称的核心--单字母编码 编号 碳水化合物a 单字母编码b 常用简写 1 D-Arabinose A Ara 2 D-Lyxose D Lyx 3 D-Ribose R Rib 4 D-Xylose X Xyl 5 D-Allose N All 6 D-Altrose E Alt 7 D-Galactose L Gal 8 D-Glucose G Glc 9 D-Gulose K Gul 10 D-Idose I Ido 11 D-Mannose M Man 12 D-Talose T Tal 13 D-Fructose C Fru 14 D-Psicose P Psi 15 D-Sorbose Bd Sor 16 D-Tagatose J Tag 17 D-Fucose (6-deoxy D-galactose) F Fuc 18 D-Quinovose (6-deoxy D-glucose) Q Qui 19 D-Rhamnose (6-deoxy D-mannose) H Rha 20 D-Galacturonic Acid Od GalA 21 D-Glucuronic Acid Zd GlcA 22 D-Iduronic Acid Ud IdoA 23 D-N-Acetylgalactosamine Vd GalNac 24 D-N-Acetylglucosamine Yd GlcNAc 25 D-N-Acetylmannosamine Wd ManNAc 26 N-Acetyl-neuraminic Acid Sd NeuNAc, Neu5Ac KDN KNc,d KDN KDO KOc,d KDO N-Glycolyl-neuraminic Acid SGc,d NeuNGc, Neu5Gc a 残基对应的prep文件目前不可用, 可联系Woods课题组(www.glycam.org)获取结构和电荷参数. b 小写字母表示L型糖, 因此L-Fucose应表示为f, 参见表3.8. c 对于不能指定单字母编码的不常用残基, 其名称忽略了一些信息. d 在将来, 这些残基的命名方法可能会改变. 请查看www.glycam.org网站的最新信息. 表 3.6: 基于GLYCAM单字母编码, D型吡喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法 α-D-Glcp β-D-Galp α-D-Arap β-D-Xylp 连接位置 残基名称 残基名称 残基名称 残基名称 末端b 0GAb 0LB 0AA 0XB 1-c 1GAc 1LB 1AA 1XB 2- 2GA 2LB 2AA 2XB 3- 3GA 3LB 3AA 3XB 4- 4GA 4LB 4AA 4XB 6- 6GA 6LB 2,3- ZGAd ZLB ZAA ZXB 2,4- YGA YLB YAA YXB 2,6- XGA XLB 3,4- WGA WLB WAA WXB 3,6- VGA VLB 4,6- UGA ULB 2,3,4- TGA TLB TAA TXB 2,3,6- SGA SLB 2,4,6- RGA RLB 3,4,6- QGA QLB 2,3,4,6- PGA PLB a 在吡喃糖中, A表示α构象, B表示β构象. b 以前称为GA, 前缀0表示没有氧原子能够成键, 即, 残基位于链的结束处. c 引入以便能形成 1-1' 连接, 如α-D-Glc-1-1'-α-D-Glc {1GA 0GA}. d 涉及多于一个的连接位置时, 有必要避免使用前缀字母, 以免导致形成的三字母编码与氨基酸所用的重复, 如ALA 表 3.7: 基于GLYCAM单字母编码, D型呋喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法. 在呋喃糖中 D(down) 表示α; U(up)表示β. α-D-Glcf β-D-Manf α-D-Araf β-D-Xylf 连接位置 残基名称 残基名称 残基名称 残基名称 末端 0GD 0MU 0AD 0XU 1- 1GD 1MU 1AD 1XU 2- 2GD 2MU 2AD 2XU 3- 3GD 3MU 3AD 3XU ··· ··· ··· ··· ··· 表 3.8: L型吡喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法. α-L-Glcp β-L-Manp α-L-Arap β-L-Xylp 连接位置 残基名称 残基名称 残基名称 残基名称 末端 0gA 0mB 0aA 0xB 1- 1gA 1mB 1aA 1xB 2- 2gA 2mB 2aA 2xB 3- 3gA 3mB 3aA 3xB ··· ··· ··· ··· ···


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3