alphafold初探

您所在的位置:网站首页 uniprokb数据库 alphafold初探

alphafold初探

2023-07-01 01:41| 来源: 网络整理| 查看: 265

alphafold初探 1.数据库初探2. mmCIF文件解析与数据读取参考文献资料

1.数据库初探

近期,alphafold这个模型又开始刷爆各种平台,其主要贡献简单说就是通过AI技术解决了复杂蛋白质结构预测的难题。这意味着,曾经分子生物学家需要花费数年实验来破译的蛋白质结构,AlphaFold只需在几分钟内就能完成。这一突破性的进步证明了人工智能对科学发现的影响。并且,alphafold开源了目前预测得到的蛋白质结构,并构建了一个可供科研目的的开源数据库【1】。

2. mmCIF文件解析与数据读取

先安装好biopython包

pip install biopython -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

安装成功

下载一个cif文件,简单测试解析文件

from Bio.PDB.MMCIFParser import MMCIFParser parser = MMCIFParser() structure = parser.get_structure('AF-F4HVG8-F1-model_v3', r'C:\Users\LIU\PycharmProjects\pythonProject\Bio_protein\AF-F4HVG8-F1-model_v3.cif') ### 要解释mmCIF的额外信息, 需要MMCIF2Dict from Bio.PDB.MMCIF2Dict import MMCIF2Dict mmcif_dict = MMCIF2Dict(r'C:\Users\LIU\PycharmProjects\pythonProject\Bio_protein\AF-F4HVG8-F1-model_v3.cif') print(f"mmcif_dict: {mmcif_dict}")

内部结构

太长了,做一个简单解析,读取肽链

structure=parser.get_structure(filename=r'C:\Users\LIU\PycharmProjects\pythonProject\Bio_protein\AF-F4HVG8-F1-model_v3.cif',structure_id=None) chains=structure.get_chains() print(f"chain{list(chains)}")

结果

更多解析工具可以参考Biopython的wiki【2】

参考文献资料

[1] AlphaFold Protein Structure Database [2] Biopython的API文档



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3