一种调控CAR

您所在的位置:网站首页 cra—t细胞疗法 一种调控CAR

一种调控CAR

2023-03-26 12:55| 来源: 网络整理| 查看: 265

技术领域

本发明属于基因工程技术领域,具体涉及一种启动子、一种CAR结构、一种分离的核酸分子、一种表达载体和一种CAR-T细胞以及其在制备肿瘤药物中的应用和一种提高缺氧环境下CAR-T细胞杀伤能力的方法。

背景技术

CAR-T全称是嵌合抗原受体T细胞免疫疗法,其在血液系统瘤中取得较好的成绩,但CAR-T在实体瘤中的效果不如血液系统瘤,其原因一方面因为CAR-T较难进入实体瘤内部,一方面即便CAR-T细胞进入实体瘤内部也因为肿瘤微环境而不能正常发挥功能,这些都影响CAR-T细胞在实体瘤治疗的疗效;并且由于实体瘤异质程度高,实体瘤靶点往往在正常组织也有所表达,因此还存在脱靶风险等安全问题。虽然目前有构建第四代CAR、有构建双CAR(构建带有双抗原的CAR-T)或带有激活抑制功能的iCAR的结构以期望提高实体瘤CAR-T治疗的有效性和安全性,但这些CAR结构仍存在安全性或较难被激活的问题。因此,构建一种在肿瘤微环境中特异启动活化的CAR结构很有必要。

酸性和缺氧是肿瘤微环境中的两大物理因素,实体瘤中的大部分的细胞都处在缺氧的环境中,而缺氧改变了肿瘤细胞的糖代谢途径,产生大量的乳酸,造成肿瘤微环境中酸性的特征,而这些酸性可以降低肿瘤细胞凋亡,增强细胞的增殖和生长,并且帮助肿瘤细胞的迁移。缺氧在实体瘤微环境研究比较清楚,如果可以设计在缺氧条件下被激活的可调控启动子,就可以达到在肿瘤微环境中特异性激活下游蛋白的表达从而提高CAR-T细胞的有效性和安全性的目的。

虽然关于肿瘤组织缺氧的理论研究较多,但如何应用缺氧环境联合CAR-T治疗还是新的方向,需要全面的研究和尝试。

发明内容

有鉴于此,本发明的目的之一在于提供一种启动子,及包含所述启动子的CAR结构、表达载体和CAR-T细胞。所述缺氧可调控的启动子能够在缺氧环境强化目的基因表达,增强目的因子(蛋白、核酸等)的表达,提高抗肿瘤的药物疗效。

本发明从肿瘤自身的缺氧微环境出发,通过构建缺氧激活的调控元件特异性调控蛋白的表达,调控CAR-T特异性活化,通过体外药物构建缺氧环境的成功以及后续的CAR-T杀伤的结果显示在CoCl

为实现上述目的,本发明采用以下方案:

一种启动子,其特征在于,所述启动子由重复数为4的Hif1a调节元件和迷你启动子连接构成,所述Hif1α调节元件核酸序列如SEQ ID NO:1所示。所述启动子为4HRE-CMVmini promoter。

具体的,所述Hif1α调节元件为4个重复的串联,所述串联不仅指的是两个核酸序列直接相连,即一个核酸序列的3’端和另一个核酸序列的5’端直接连接,还包括两个核酸序列可以间接进行连接,即在两个核酸序列中间也可以连接有其他的核酸序列,只要不影响这两个核酸序列功能的表达即可。

进一步,所述启动子受缺氧环境调控,所述迷你启动子选自细胞病毒启动子、HSV胸苷激酶的启动子、猿猴病毒40的启动子、腺病毒晚期启动子和合成启动子中的任一。

优选的,迷你启动子选择miniCMV。

进一步,将所述Hif1α调节元件的结构进行优化得到优化的Hif1α调节元件,其核苷酸序列如SEQ ID NO:2;所述Hif1α调节元件优化后可以适配不同的表达载体。

进一步,所述启动子的核酸序列如SEQ ID NO:3所示。

进一步,所述CAR结构包含受缺氧环境调控启动的启动子,所述启动子的核苷酸序列如SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3序列所示。

具体的,所述CAR结构可以是常规的第一代、第二代、第三代CAR结构,也可以是改进的双CAR、可调控CAR结构(如FRB/FKBP12调控)等新型CAR结构。

进一步,所述CAR结构的抗原识别区为ScFv,所述ScFv的氨基酸序列如SEQ IDNO.8或SEQ ID NO.9所示或其功能性变体。

进一步,所述CAR结构的铰链区的氨基酸序列如SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12所示或其功能性变体。。

具体的,CAR结构中的铰链区序列可以来源于:IgG、CD8、CD7、CD4;CAR结构中跨膜区可以来源于:CD8、CD28、CD3ε、CD4、CD16、CD137、CD80以及CD86;CAR结构中胞内信号区可来源于:CD3、CD137、CD28、CD27、OX40、ICOS、GITR、CD2、CD40、PD-1、PD1L、B7-H3、淋巴细胞功能相关抗原-1(LFA-1)、ICAM-1、CD7、NKG2C、CD83、CD86以及CD127。

进一步,所述CAR结构的跨膜区氨基酸序列如SEQ ID NO:13或SEQ ID NO:14所示或其功能性变体。

进一步,所述CAR结构的胞内共刺激结构域氨基酸序列如SEQ ID NO:15或SEQ IDNO:16所示其功能性变体。

进一步,所述CAR结构的胞内活化信号的氨基酸序列如SEQ ID NO:17所示或其功能性变体。

进一步,所述CAR结构的氨基酸序列如SEQ ID NO:18-21任一所示或其功能性变体。

在某些实施例中,所述包含所述缺氧启动子的CAR结构带有截短的EGFRt调控标签;在某些实施例中,包含所述缺氧启动子的CAR为通用型CAR结构;在某些实施例中,包含所述缺氧启动子的CAR结构带有自杀基因如iCasp9。

在某些实施例中,抗原识别区可以为识别靶抗原的配体/受体;在某些实施例中,ScFv可以是鼠源抗体或全人源抗体或人鼠嵌合抗体的ScFv,也可以是鲨鱼、羊驼或骆驼抗体等单域抗体,也可以是双特异性抗体,也可以是人工设计的识别特定靶点的靶点特异性纤连蛋白III型(FN3)结构域组合。

在某些实施例中,所述CAR结构包含天然杀伤细胞受体(NKR)的一种或多种组分,因而形成NKR-CAR。NKR组分可以是来自以下任何天然杀伤细胞受体的跨膜结构域、铰链结构域或胞质结构域:杀伤细胞免疫球蛋白样受体(KIR),例如KIR2DL1、KIR2DL2/L3、KIR2DL4、KIR2DL5A、KIR2DL5B、KIR2DS1、KIR2DS2、KIR2DS3、KIR2DS4、DIR2DS5、KIR3DL1/S1、KIR3DL2、KIR3DL3、KIR2DP1和KIR3DP1;天然细胞毒性受体(NCR),例如,NKp30、NKp44、NKp46;免疫细胞受体的信号传导淋巴细胞活化分子(SLAM)家族,例如,CD48、CD229、2B4、CD84、NTB-A、CRA、BLAME和CD2F-10;Fc受体(FcR),例如,CD16、和CD64;和Ly49受体,例如,LY49A、LY49C。所述的NKR-CAR分子可以与衔接分子或胞内信号结构域(例如,DAP12)相互作用。

进一步,包含缺氧启动子的CAR表达载体,所述缺氧启动子的核苷酸序列如SEQ IDNO.1或SEQ ID NO.2或SEQ ID NO.3所示;所述表达载体为慢病毒表达载体、逆转录病毒表达载体、腺病毒表达载体、腺相关病毒表达载体、DNA载体,RNA载体、质粒中的任一种。

优选的,所述载体是慢病毒载体。

在某些实施例中,所述慢病毒载体选自基本上由以下组成的群组:人免疫缺陷病毒1(HIV-1)、人免疫缺陷病毒2(HIV-2)、维斯纳-梅迪病毒(visna-maedi virus,VMV)病毒、山羊关节炎-脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)和猿猴免疫缺陷病毒(SIV)。

在某些实施例中,载体包含左(5')逆转录病毒LTR、Psi(Ψ)包装信号、中心多嘌呤段/DNA瓣(cPPT/FLAP)、逆转录病毒导出元件、可操作地连接到编码本文所涵盖的CAR的多核苷酸的启动子和右(3')逆转录病毒LTR。

在某些实施例中,CAR包含乙型肝炎病毒转录后调节元件(HPRE)或土拔鼠转录后调节元件(WPRE)以及优化的土拔鼠转录后调节元件(oPRE)。

在某些实施例中,所述5'LTR的启动子经异源启动子置换。

在某些实施例中,所述异源启动子是巨细胞病毒(CMV)启动子、劳斯肉瘤病毒(Rous Sarcoma Virus,RSV)启动子或猿猴病毒40(SV40)启动子。

在某些实施例中,所述5'LTR或3'LTR是慢病毒LTR。

在某些实施例中,所述3'LTR是自我失活(SIN)LTR。

在某些实施例中,编码本文所涵盖的CAR的多核苷酸包含优化的Kozark序列。

在某些实施例中,可操作地连接到编码本文所涵盖的CAR的多核苷酸的所述启动子以及以下组成的群组:巨细胞病毒立即早期基因启动子(CMV)、延伸因子1α启动子(EF1-α)、磷酸甘油酸激酶-1启动子(PGK)、泛素-C启动子(UBQ-C)、巨细胞病毒增强子/鸡β-肌动蛋白启动子(CAG)、多瘤病毒增强子/单纯疱疹胸苷激酶启动子(MC1)、β肌动蛋白启动子(β-ACT)、猿猴病毒40启动子(SV40)和骨髓增生肉瘤病毒增强子,阴性对照区缺失的、dl587rev引物结合位点取代的(MND)启动子。

在某些实施例中,包含CAR的载体可以包含分泌型抗PD-1ScFv;在某些实施例中,包含CAR的载体包含PD-1共轭转导肽(如PD-1-CD28-CD137-CD3信号结构);在某些实施例中,包含CAR的载体多个CAR组合,如2个靶向不同抗原或同一抗原的不同识别位点的CAR组合。

进一步,所述载体包含如SEQ ID NO:4-7任一所示的核苷酸序列,具体的,SEQ IDNO:4-7包含编码CAR结构的核苷酸序列和启动子序列。

进一步,包含所述表达载体的CAR-T细胞。

具体的,所述“功能性变体”通常是指包括与其具有基本上相同的功能(例如,可以具备所述嵌合抗原受体的性质),且与其具有至少85%(例如,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少100%)序列同一性的氨基酸序列。在某些实施方式中,所述氨基酸序列的变体为与其具有基本上相同的功能。

本发明的目的之二在于提供一种分离的核酸分子。

为实现上述目的,本发明采用以下方案:

所述核酸分子编码所述的CAR结构。

本发明的目的之三在于提供一种所述启动子、CAR结构、表达载体和CAR-T细胞的应用。

为实现上述目的,本发明采用以下方案:

所述应用为在制备肿瘤药物中的应用,所述肿瘤为恶性肿瘤,包括急性淋巴样白血病、慢性淋巴细胞白血病、慢性髓性白血病、非霍奇金淋巴瘤、霍奇金淋巴瘤、前列腺癌、结直肠癌、乳腺癌、卵巢癌、宫颈癌、胰腺癌、肺癌、肾癌、肝癌、脑癌和皮肤癌。

进一步,所述肿瘤高表达CD19、CD20、CD123、CD22、BCMA、ROR1、CEA、间皮素、PSCA、PSMA、c-Met、GPC-3、Her2、EGFRvIII、GD-2、NY-ESO-1TCR、MAGE A3TCR中的一种或多种。。

具体的,所述细胞可以与其他可增强CAR表达活性的活性剂和/或治疗组合使用。

具体的,所述活性剂和/或治疗可以是手术、化疗、放射、免疫抑制剂,例如环孢素(cyclosporin)、硫唑嘌呤(azathioprine)、甲氨蝶呤(methotrexate)、霉酚酸酯(mycophenolate)和FK506、抗体或其它免疫清除剂(immunoablativeagents)例如CAMPATH、抗CD3抗体或其它抗体治疗、环磷酰胺(cytoxan)、氟达拉滨(fludarabine)、环孢素(cyclosporin)、FK506、雷帕霉素(rapamycin)、霉酚酸(mycophenolicacid)、类固醇(steroids)、FR901228、细胞因子和辐射。

在某些实施例中,所述细胞可以表达其它活性剂,例如,增强CAR表达细胞活性的活性剂。活性剂可以是阻断抑制性分子的活性剂。抑制性分子如PD1可以在一些实施方案中降低CAR表达细胞发动免疫效应子反应的能力。抑制性分子包括PD1、PD-L1、CTLA4、TIM3、LAG3、VISTA、BTLA、TIGIT,LAIR1、CD160、2B4、CEACAM(CEACAM-1、CEACAM-3、CEACAM-5)、LAG3、VISTA、BTLA、TIG、LAIR1、CD160、2B4、CD80、CD86、B7-H3(CD276)、B7-H4(VTCN1)、HVEM(TNFRSF14或CD270)、KIR、A2aR、MHC I类、MHC II类、GAL9、腺苷、TGFR(TGFRβ)和TGFRβ。所述抑制性分子的胞外结构域可以融合到跨膜结构域和胞内信号传导结构域,比如PD1CAR。

本发明的目的之三在于提供一种提高缺氧环境下CAR-T细胞杀伤能力的方法。所述CAR-T细胞能在缺氧环境和靶抗原存在下诱导活化,在缺氧环境下靶抗原刺激后CAR表达能力和丰度均提高,增强CAR-T有效性,在非缺氧环境下靶抗原刺激后CAR表达能力和丰度均低于常规CAR-T,安全性更高。

为实现上述目的,本发明采用以下方案:

所述方法为构建一种所述的CAR结构的表达载体并感染T淋巴细胞,然后作用于靶细胞,以提高缺氧环境下CAR-T细胞杀伤能力。

本发明的有益效果在于:

1)本发明提供的缺氧微环境诱导的启动子能够在缺氧环境强化目的基因表达;

2)本发明提供的缺氧微环境诱导启动的CAR结构,不仅可以有效的表达于T淋巴细胞,而且在缺氧环境中能够加强CAR-T细胞的活化,提高CAR-T细胞针对肿瘤靶细胞的杀伤,能够用于肿瘤的靶向治疗;

3)本发明提供的嵌合抗原受体T细胞在缺氧环境下活性增强,可以用于制备治疗恶性血液病以及恶性实体瘤的药物中的过继细胞治疗。

附图说明

图1为启动子结构图。

图2为缺氧诱导方案验证。

图3为缺氧诱导药物对细胞增殖影响。

图4为CAR阳性率检测。

图5为缺氧诱导后CAR表达强度检测。

图6为启动子改造CAR-T有效性验证。

图7为缺氧和非缺氧环境下启动子改造CAR-T活性对比。

图8为缺氧和非缺氧环境下启动子改造CAR-T活性后因子分泌对比。

具体实施方式

以下将参照附图,对本发明的优选实施例进行详细描述。优选实施例中未注明具体条件的实验方法,通常按照常规条件,例如分子克隆实验指南(第三版,J.萨姆布鲁克等著)中所述的条件,或按照制造厂商所建议的条件。所举实施例是为了更好地对本发明的内容进行说明,但并不是本发明的内容仅限于所举实施例。所以熟悉本领域的技术人员根据上述发明内容对实施方案进行非本质的改进和调整,仍属于本发明的保护范围。

实施例1:质粒构建

构建与慢病毒载体匹配的启动子4HRE-CMVmini promoter-NheI(4H1P),核酸序列如SEQ ID NO:3所示,利用双酶切分别切割并回收片段,基因片段进行连接、转化并挑单克隆,获得重组载体,载体编号分别为1、2、3、4。CAR结构原件包含:氨基酸序列如SEQ ID NO:8或SEQ ID NO:9的靶向CEA或PSCA的ScFv;氨基酸序列如SEQ ID NO:10、SEQ ID NO:11或SEQID NO:12的铰链结构;氨基酸序列如SEQ ID NO:13或SEQ ID NO:14的跨膜结构,氨基酸序列如SEQ ID NO:15或SEQ ID NO:16的胞内共刺激结构域,氨基酸序列如SEQ ID NO:17的胞内活化信号;获得的缺氧启动子改造的CAR的核苷酸序列如SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6以及SEQ ID NO:7所示,氨基酸序列如SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20以及SEQ ID NO:21;图1为启动子结构图。。

实施例2:体外缺氧模型验证

CoCl

1)缺氧诱导方案验证:

利用nHRE-GFP病毒感染活化的PBMC构建体外缺氧细胞模型,培养12-18h后换液。利用CoCl

结果如图2所示,可发现加CoCl

2)缺氧诱导药物对细胞增殖影响

当天早上分别对适量的Hela和PBMC细胞量铺板96孔板,细胞贴壁5h后,进行CoCl

实施例3:制备慢病毒及感染T淋巴细胞

本实施例包装慢病毒采用磷酸钙法,具体为:用含10%FBS(w/v)的DMEM培养基培养293T细胞至较佳状态,保证转染时细胞汇合度为70-80%,细胞预先换液。包装质粒(RRE:REV:2G)和表达质粒按一定比列加入到1.5的离心管中,加入2.5mol/LCaCl

利用梯度离心法进行淋巴细胞分离;离心后,取第二层白色淋巴细胞层,生理盐水洗涤,加入含有10%FBS的RPMI 1640完全培养基培养,获得人PBMC细胞。获得的PBMC细胞经抗CD3、CD28单克隆抗体活化24h后,按一定的感染复数(MOI)感染已活化的PBMC并加入polybrene以帮助病毒感染,培养过夜后换液(10%RPMI 1640+IL-2+双抗),于37℃培养箱继续培养,在病毒感染的第12天检测CAR-T的阳性率,检测方法为流式检测,抗体为:Protein-L-PE,Protein-L可识别抗体轻链,CAR抗原识别区的ScFv序列的轻链可被Protein-L识别,因此利用Protein-L可检测CAR阳性率和CAR表达强度。

结果如图4所示:4H1P启动子改造的不同结构CAR-T细胞,在诱导的缺氧环境下CAR表达显著增高。

结果如图5所示:4H1P启动子改造的不同结构CAR-T细胞,黑色直方图为启动子改造的CAR在非缺氧环境下的CAR表达强度;白色直方图为启动子改造的CAR在缺氧环境下的CAR表达强度,在诱导的缺氧环境下CAR表达强度增强。

实施例4:检测缺氧诱导后包含缺氧启动子的CAR-T有效性

分别以PSCA阳性的Hela细胞与体外改造的CEA阳性DLD1-CEA细胞作为靶细胞验证启动子改造后CAR-T有效性功能。将效应细胞(含启动子改造CAR表达的CAR-T细胞)缺氧预处理过夜后收集CAR-T细胞,按照一定的效靶比铺于靶细胞中,并利用ACEA xCELLigenceRTCA MP仪器检测不同CAR-T对靶细胞杀伤能力,实验步骤依据仪器说明书进行。ACEAxCELLigence RTCA MP原理为对附着于孔底的肿瘤细胞以电阻指数为数据每15分钟记录一次,通过电阻指数判断贴壁的靶细胞的增殖或者死亡情况。利用电阻指数分析结果公式为:CAR-T细胞杀伤率=基线电阻指数-实时电阻指数。

结果如图6所示:与对照组相比,包含缺氧启动子4H1P的不同结构的CAR-T细胞均能发挥正常功能。

图7进一步验证了在缺氧和非缺氧环境下改造的缺氧特异性启动子对CAR-T杀伤活性的调控,结果显示,在缺氧环境下,在1:5的低效靶比条件下,缺氧特异性启动子可以特异性诱导CAR-T的进行高效杀伤,而常规的CAR-T在缺氧环境下杀伤能力极差,具体杀伤百分比如下表所示。

实施例5:Elisa检测IFN-γ检测

实施例4收集的上清,利用ELISA(酶联免疫)方法检测IFN-γ和IL-2的分泌情况。IFN-γ检测采用BD IFN-γ试剂盒检测,货号555142,实验步骤依据产品说明书进行。

结果如图8所示,Treat表示启动子改造的CAR-T细胞在缺氧环境下靶细胞杀伤后因子分泌情况,UnTreat表示启动子改造的CAR-T细胞在非缺氧环境下靶细胞杀伤后因子分泌情况。结果可见,只有在缺氧环境下启动子改造的CAR-T细胞被激活后才能分泌较高的IFN-γ。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

序列表

重庆精准生物技术有限公司

一种调控CAR-T特异性活化的启动子及其应用

22

SIPOSequenceListing 1.0

1

158

DNA

人工序列(Artificial sequence)

1

ccacagtgca tacgtgggct ccaacaggtc ctcttgtcga gccacagtgc atacgtgggc 60

tccaacaggt cctcttgtcg agccacagtg catacgtggg ctccaacagg tcctcttgtc 120

gagccacagt gcatacgtgg gctccaacag gtcctctt 158

2

179

DNA

人工序列(Artificial sequence)

2

gtcgacgata tcccacagtg catacgtggg ctccaacagg tcctcttgtc gagccacagt 60

gcatacgtgg gctccaacag gtcctcttgt cgagccacag tgcatacgtg ggctccaaca 120

ggtcctcttg tcgagccaca gtgcatacgt gggctccaac aggtcctctt gtcgagatc 179

3

233

DNA

人工序列(Artificial sequence)

3

ccacagtgca tacgtgggct ccaacaggtc ctcttgtcga gccacagtgc atacgtgggc 60

tccaacaggt cctcttgtcg agccacagtg catacgtggg ctccaacagg tcctcttgtc 120

gagccacagt gcatacgtgg gctccaacag gtcctcttgt cgagatctgg taggcgtgta 180

cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcac tag 233

4

2261

DNA

人工序列(Artificial sequence)

4

ccacagtgca tacgtgggct ccaacaggtc ctcttgtcga gccacagtgc atacgtgggc 60

tccaacaggt cctcttgtcg agccacagtg catacgtggg ctccaacagg tcctcttgtc 120

gagccacagt gcatacgtgg gctccaacag gtcctcttgt cgagatctgg taggcgtgta 180

cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcac taggctagca 240

tggccctgcc agtgaccgcc ctgctgctgc ccctggccct gctgctgcac gcagcacggc 300

ccgacatcca ggatatccag ctgacacagt cccctagctc cctgagcgcc tccgtgggcg 360

acagggtgac catcacatgc agcgcctcta gctccgtgag attcatccac tggtaccagc 420

agaagcccgg caaggcccct aagaggctga tctatgatac ctctaagctg gccagcggag 480

tgccctcccg cttctctggc agcggctccg gcaccgactt taccctgaca atctctagcc 540

tgcagccaga ggattttgcc acatactatt gccagcagtg gtcctctagc cccttcacct 600

ttggccaggg cacaaaggtg gagatcaagg gatctaccag cggatccggc aagcctggat 660

ctggagaggg cagcacaaag ggctccgagg tgcagctggt ggagtccgga ggaggactgg 720

tgcagccagg aggatctctg aggctgagct gtgcagcctc cggcttcaac atcaaggact 780

actatatcca ctgggtgaga caggcacctg gcaagggact ggagtgggtg gcatggatcg 840

accctgagaa tggcgatacc gagttcgtgc caaagtttca gggcagggcc acaatctctg 900

ccgacaccag caagaacaca gcctacctgc agatgaatag cctgcgcgcc gaggataccg 960

ccgtgtacta ttgtaagaca ggaggatttt ggggacaggg caccctggtg acagtgtcct 1020

ctctcgagga gagcaagtac ggccctccct gccccccttg ccctgccccc gagttcctgg 1080

gcggacccag cgtgttcctg ttccccccca agcccaagga caccctgatg atcagccgga 1140

cccccgaggt gacctgtgtg gtggtggacg tgtcccagga ggaccccgag gtccagttca 1200

actggtacgt ggacggcgtg gaggtgcaca acgccaagac caagccccgg gaggagcagt 1260

tcaatagcac ctaccgggtg gtgtccgtgc tgaccgtgct gcaccaggac tggctgaacg 1320

gcaaggaata caagtgtaag gtgtccaaca agggcctgcc cagcagcatc gagaaaacca 1380

tcagcaaggc caagggccag cctcgggagc cccaggtgta caccctgccc cctagccaag 1440

aggagatgac caagaatcag gtgtccctga cctgcctggt gaagggcttc taccccagcg 1500

acatcgccgt ggagtgggag agcaacggcc agcccgagaa caactacaag accacccccc 1560

ctgtgctgga cagcgacggc agcttcttcc tgtacagcag gctgaccgtg gacaagagcc 1620

ggtggcagga gggcaacgtc tttagctgct ccgtgatgca cgaggccctg cacaaccact 1680

acacccagaa gagcctgtcc ctgagcctgg gcaaggaatt cttctgggtg ctggtcgtgg 1740

tgggtggcgt gctggcctgc tacagcctgc tggtgacagt ggccttcatc atcttttggg 1800

tgaggagcaa gcggagcaga ggcggccaca gcgactacat gaacatgacc ccccggaggc 1860

ctggccccac ccggaagcac taccagccct acgcccctcc cagggacttc gccgcctacc 1920

ggagccgggt gaagttcagc cggagcgccg acgcccctgc ctaccagcag ggccagagcc 1980

agctgtacaa cgagctgaac ctgggccgga gggaggagta cgacgtgctg gacaagcgga 2040

gaggccggga ccctgagatg ggcggcaagc cccggagaaa gaaccctcag gagggcctgt 2100

ataacgaact gcagaaagac aagatggccg aggcctacag cgagatcggc atgaagggcg 2160

agcggcggag gggcaagggc cacgacggcc tgtaccaggg cctgagcacc gccaccaagg 2220

atacctacga cgccctgcac atgcaggccc tgccccctcg c 2261

5

2282

DNA

人工序列(Artificial sequence)

5

ccacagtgca tacgtgggct ccaacaggtc ctcttgtcga gccacagtgc atacgtgggc 60

tccaacaggt cctcttgtcg agccacagtg catacgtggg ctccaacagg tcctcttgtc 120

gagccacagt gcatacgtgg gctccaacag gtcctcttgt cgagatctgg taggcgtgta 180

cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcac taggctagca 240

tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac gccgccaggc 300

cggacatcca gatgacccag agcccaagca gcctgagcgc cagcgtgggt gacagagtga 360

ccatcacctg tagtaccagt tcgagtgtaa gttacatgca ctggtaccag cagaagccag 420

gtaaggctcc aaggctgctg atctacagca catccaacct ggcttctggt gtgccaagca 480

gattcagcgg tagcggtagc ggtaccgact tcaccttcac catcagcagc ctccagccag 540

aggacatcgc cacctactac tgccatcagt ggagtagtta tcccacgttc ggccaaggga 600

ccaaggtgga aatcaaagga tccacttccg gttcaggaaa gcccgggagt ggtgaaggta 660

gcactaaagg ccaggtccag ctgcaggaga gcggtccagg tcttgtgaga cctagccaga 720

ccctgagcct gacctgcacc gtgtctggct tcaccatcag cagtggttat agctggcact 780

gggtgagaca gccacctgga cgaggtcttg agtggattgg atacatacag tacagtggta 840

tcactaacta caacccctct ctcaaaagta gagtgacaat gctggtagac accagcaaga 900

accagttcag cctgagactc agcagcgtga cagccgccga caccgcggtc tattattgtg 960

caagagaaga ctatgattac cactggtact tcgatgtctg gggtcaaggc agcacggtca 1020

ccgtctcctc aggtgcggcc gccctcgagg agagcaagta cggccctccc tgcccccctt 1080

gccctgcccc cgagttcctg ggcggaccca gcgtgttcct gttccccccc aagcccaagg 1140

acaccctgat gatcagccgg acccccgagg tgacctgtgt ggtggtggac gtgtcccagg 1200

aggaccccga ggtccagttc aactggtacg tggacggcgt ggaggtgcac aacgccaaga 1260

ccaagccccg ggaggagcag ttcaatagca cctaccgggt ggtgtccgtg ctgaccgtgc 1320

tgcaccagga ctggctgaac ggcaaggaat acaagtgtaa ggtgtccaac aagggcctgc 1380

ccagcagcat cgagaaaacc atcagcaagg ccaagggcca gcctcgggag ccccaggtgt 1440

acaccctgcc ccctagccaa gaggagatga ccaagaatca ggtgtccctg acctgcctgg 1500

tgaagggctt ctaccccagc gacatcgccg tggagtggga gagcaacggc cagcccgaga 1560

acaactacaa gaccaccccc cctgtgctgg acagcgacgg cagcttcttc ctgtacagca 1620

ggctgaccgt ggacaagagc cggtggcagg agggcaacgt ctttagctgc tccgtgatgc 1680

acgaggccct gcacaaccac tacacccaga agagcctgtc cctgagcctg ggcaaggaat 1740

tcttctgggt gctggtcgtg gtgggtggcg tgctggcctg ctacagcctg ctggtgacag 1800

tggccttcat catcttttgg gtgaggagca agcggagcag aggcggccac agcgactaca 1860

tgaacatgac cccccggagg cctggcccca cccggaagca ctaccagccc tacgcccctc 1920

ccagggactt cgccgcctac cggagccggg tgaagttcag ccggagcgcc gacgcccctg 1980

cctaccagca gggccagagc cagctgtaca acgagctgaa cctgggccgg agggaggagt 2040

acgacgtgct ggacaagcgg agaggccggg accctgagat gggcggcaag ccccggagaa 2100

agaaccctca ggagggcctg tataacgaac tgcagaaaga caagatggcc gaggcctaca 2160

gcgagatcgg catgaagggc gagcggcgga ggggcaaggg ccacgacggc ctgtaccagg 2220

gcctgagcac cgccaccaag gatacctacg acgccctgca catgcaggcc ctgccccctc 2280

gc 2282

6

1724

DNA

人工序列(Artificial sequence)

6

gatatcccac agtgcatacg tgggctccaa caggtcctct tgtcgagcca cagtgcatac 60

gtgggctcca acaggtcctc ttgtcgagcc acagtgcata cgtgggctcc aacaggtcct 120

cttgtcgagc cacagtgcat acgtgggctc caacaggtcc tcttgtcgag atctggtagg 180

cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca gatcactagg 240

ctagcatggc cttaccagtg accgccttgc tcctgccgct ggccttgctg ctccacgccg 300

ccaggccgga catccagatg acccagagcc caagcagcct gagcgccagc gtgggtgaca 360

gagtgaccat cacctgtagt accagttcga gtgtaagtta catgcactgg taccagcaga 420

agccaggtaa ggctccaagg ctgctgatct acagcacatc caacctggct tctggtgtgc 480

caagcagatt cagcggtagc ggtagcggta ccgacttcac cttcaccatc agcagcctcc 540

agccagagga catcgccacc tactactgcc atcagtggag tagttatccc acgttcggcc 600

aagggaccaa ggtggaaatc aaaggatcca cttccggttc aggaaagccc gggagtggtg 660

aaggtagcac taaaggccag gtccagctgc aggagagcgg tccaggtctt gtgagaccta 720

gccagaccct gagcctgacc tgcaccgtgt ctggcttcac catcagcagt ggttatagct 780

ggcactgggt gagacagcca cctggacgag gtcttgagtg gattggatac atacagtaca 840

gtggtatcac taactacaac ccctctctca aaagtagagt gacaatgctg gtagacacca 900

gcaagaacca gttcagcctg agactcagca gcgtgacagc cgccgacacc gcggtctatt 960

attgtgcaag agaagactat gattaccact ggtacttcga tgtctggggt caaggcagca 1020

cggtcaccgt ctcctcaggt gcggccgccc tcgagaccac gacgccagcg ccgcgaccac 1080

caacaccggc gcccaccatc gcgtcgcagc ccctgtccct gcgcccagag gcgtgccggc 1140

cagcggcggg gggcgcagtg cacacgaggg ggctggactt cgcctgtgat atctacatct 1200

gggcgccctt ggccgggact tgtggggtcc ttctcctgtc actggttatc accctttact 1260

gcaaacgggg cagaaagaaa ctcctgtata tattcaaaca accatttatg agaccagtac 1320

aaactactca agaggaagat ggctgtagct gccgatttcc agaagaagaa gaaggaggat 1380

gtgaactgag agtgaagttc agcaggagcg cagacgcccc cgcgtacaag cagggccaga 1440

accagctcta taacgagctc aatctaggac gaagagagga gtacgatgtt ttggacaaga 1500

gacgtggccg ggaccctgag atggggggaa agccgagaag gaagaaccct caggaaggcc 1560

tgtacaatga actgcagaaa gataagatgg cggaggccta cagtgagatt gggatgaaag 1620

gcgagcgccg gaggggcaag gggcacgatg gcctttacca gggtctcagt acagccacca 1680

aggacaccta cgacgccctt cacatgcagg ccctgccccc tcgc 1724

7

1724

DNA

人工序列(Artificial sequence)

7

ccacagtgca tacgtgggct ccaacaggtc ctcttgtcga gccacagtgc atacgtgggc 60

tccaacaggt cctcttgtcg agccacagtg catacgtggg ctccaacagg tcctcttgtc 120

gagccacagt gcatacgtgg gctccaacag gtcctcttgt cgagatctgg taggcgtgta 180

cggtgggagg tctatataag cagagctcgt ttagtgaacc gtcagatcac taggctagca 240

tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac gccgccaggc 300

cggacatcca gatgacccag agcccaagca gcctgagcgc cagcgtgggt gacagagtga 360

ccatcacctg tagtaccagt tcgagtgtaa gttacatgca ctggtaccag cagaagccag 420

gtaaggctcc aaggctgctg atctacagca catccaacct ggcttctggt gtgccaagca 480

gattcagcgg tagcggtagc ggtaccgact tcaccttcac catcagcagc ctccagccag 540

aggacatcgc cacctactac tgccatcagt ggagtagtta tcccacgttc ggccaaggga 600

ccaaggtgga aatcaaagga tccacttccg gttcaggaaa gcccgggagt ggtgaaggta 660

gcactaaagg ccaggtccag ctgcaggaga gcggtccagg tcttgtgaga cctagccaga 720

ccctgagcct gacctgcacc gtgtctggct tcaccatcag cagtggttat agctggcact 780

gggtgagaca gccacctgga cgaggtcttg agtggattgg atacatacag tacagtggta 840

tcactaacta caacccctct ctcaaaagta gagtgacaat gctggtagac accagcaaga 900

accagttcag cctgagactc agcagcgtga cagccgccga caccgcggtc tattattgtg 960

caagagaaga ctatgattac cactggtact tcgatgtctg gggtcaaggc agcacggtca 1020

ccgtctcctc aggtgcggcc gccctcgaga agccaaccac aaccccagca ccaaggccac 1080

ctacacctgc accaaccatc gcaagccagc cactgtccct gaggccagag gcaagacctg 1140

cagcaggagg cgccgtgcac acacggggcc tggacttcgc cgatgaattc atctacatct 1200

gggcgccctt ggccgggact tgtggggtcc ttctcctgtc actggttatc accctttact 1260

gcaaacgggg cagaaagaaa ctcctgtata tattcaaaca accatttatg agaccagtac 1320

aaactactca agaggaagat ggctgtagct gccgatttcc agaagaagaa gaaggaggat 1380

gtgaactgag agtgaagttc agcaggagcg cagacgcccc cgcgtacaag cagggccaga 1440

accagctcta taacgagctc aatctaggac gaagagagga gtacgatgtt ttggacaaga 1500

gacgtggccg ggaccctgag atggggggaa agccgagaag gaagaaccct caggaaggcc 1560

tgtacaatga actgcagaaa gataagatgg cggaggccta cagtgagatt gggatgaaag 1620

gcgagcgccg gaggggcaag gggcacgatg gcctttacca gggtctcagt acagccacca 1680

aggacaccta cgacgccctt cacatgcagg ccctgccccc tcgc 1724

8

237

PRT

人工序列(Artificial sequence)

8

Asp Ile Gln Leu Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Ser Ala Ser Ser Ser Val Arg Phe Ile

20 25 30

His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr

35 40 45

Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

50 55 60

Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu

65 70 75 80

Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser Ser Pro Phe Thr

85 90 95

Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Gly Ser Thr Ser Gly Ser

100 105 110

Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Ser Glu Val Gln

115 120 125

Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg

130 135 140

Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Tyr Tyr Ile His

145 150 155 160

Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ala Trp Ile

165 170 175

Asp Pro Glu Asn Gly Asp Thr Glu Phe Val Pro Lys Phe Gln Gly Arg

180 185 190

Ala Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr Leu Gln Met

195 200 205

Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Lys Thr Gly

210 215 220

Gly Phe Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser

225 230 235

9

243

PRT

人工序列(Artificial sequence)

9

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Ser Thr Ser Ser Ser Val Ser Tyr Met

20 25 30

His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Arg Leu Leu Ile Tyr

35 40 45

Ser Thr Ser Asn Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

50 55 60

Gly Ser Gly Thr Asp Phe Thr Phe Thr Ile Ser Ser Leu Gln Pro Glu

65 70 75 80

Asp Ile Ala Thr Tyr Tyr Cys His Gln Trp Ser Ser Tyr Pro Thr Phe

85 90 95

Gly Gln Gly Thr Lys Val Glu Ile Lys Gly Ser Thr Ser Gly Ser Gly

100 105 110

Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Gln Val Gln Leu Gln

115 120 125

Glu Ser Gly Pro Gly Leu Val Arg Pro Ser Gln Thr Leu Ser Leu Thr

130 135 140

Cys Thr Val Ser Gly Phe Thr Ile Ser Ser Gly Tyr Ser Trp His Trp

145 150 155 160

Val Arg Gln Pro Pro Gly Arg Gly Leu Glu Trp Ile Gly Tyr Ile Gln

165 170 175

Tyr Ser Gly Ile Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr

180 185 190

Met Leu Val Asp Thr Ser Lys Asn Gln Phe Ser Leu Arg Leu Ser Ser

195 200 205

Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Glu Asp Tyr

210 215 220

Asp Tyr His Trp Tyr Phe Asp Val Trp Gly Gln Gly Ser Thr Val Thr

225 230 235 240

Val Ser Ser

10

228

PRT

人工序列(Artificial sequence)

10

Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Pro Val

1 5 10 15

Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu

20 25 30

Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser

35 40 45

Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu

50 55 60

Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Gln Ser Thr

65 70 75 80

Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn

85 90 95

Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser

100 105 110

Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln

115 120 125

Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val

130 135 140

Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val

145 150 155 160

Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro

165 170 175

Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr

180 185 190

Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val

195 200 205

Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu

210 215 220

Ser Leu Gly Lys

225

11

47

PRT

人工序列(Artificial sequence)

11

Lys Pro Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr

1 5 10 15

Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala

20 25 30

Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp

35 40 45

12

45

PRT

人工序列(Artificial sequence)

12

Lys Pro Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr

1 5 10 15

Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Arg Pro Ala Ala

20 25 30

Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Asp

35 40 45

13

27

PRT

人工序列(Artificial sequence)

13

Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu

1 5 10 15

Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val

20 25

14

24

PRT

人工序列(Artificial sequence)

14

Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu

1 5 10 15

Ser Leu Val Ile Thr Leu Tyr Cys

20

15

41

PRT

人工序列(Artificial sequence)

15

Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr

1 5 10 15

Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro

20 25 30

Pro Arg Asp Phe Ala Ala Tyr Arg Ser

35 40

15

41

PRT

人工序列(Artificial sequence)

15

Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr

1 5 10 15

Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro

20 25 30

Pro Arg Asp Phe Ala Ala Tyr Arg Ser

35 40

16

44

PRT

人工序列(Artificial sequence)

16

Val Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe

1 5 10 15

Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg

20 25 30

Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg

35 40

17

111

PRT

人工序列(Artificial sequence)

17

Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln

1 5 10 15

Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp

20 25 30

Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro

35 40 45

Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp

50 55 60

Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg

65 70 75 80

Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr

85 90 95

Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg

100 105 110

18

644

PRT

人工序列(Artificial sequence)

18

Asp Ile Gln Leu Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Ser Ala Ser Ser Ser Val Arg Phe Ile

20 25 30

His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr

35 40 45

Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

50 55 60

Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu

65 70 75 80

Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser Ser Pro Phe Thr

85 90 95

Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Gly Ser Thr Ser Gly Ser

100 105 110

Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Ser Glu Val Gln

115 120 125

Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg

130 135 140

Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Tyr Tyr Ile His

145 150 155 160

Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ala Trp Ile

165 170 175

Asp Pro Glu Asn Gly Asp Thr Glu Phe Val Pro Lys Phe Gln Gly Arg

180 185 190

Ala Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr Leu Gln Met

195 200 205

Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Lys Thr Gly

210 215 220

Gly Phe Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Glu Ser Lys

225 230 235 240

Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro

245 250 255

Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser

260 265 270

Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp

275 280 285

Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn

290 295 300

Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Gln Ser Thr Tyr Arg Val

305 310 315 320

Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu

325 330 335

Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys

340 345 350

Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr

355 360 365

Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr

370 375 380

Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu

385 390 395 400

Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu

405 410 415

Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys

420 425 430

Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu

435 440 445

Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly

450 455 460

Lys Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser

465 470 475 480

Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg

485 490 495

Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro

500 505 510

Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe

515 520 525

Ala Ala Tyr Arg Ser Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala

530 535 540

Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg

545 550 555 560

Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu

565 570 575

Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn

580 585 590

Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met

595 600 605

Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly

610 615 620

Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala

625 630 635 640

Leu Pro Pro Arg

19

650

PRT

人工序列(Artificial sequence)

19

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Ser Thr Ser Ser Ser Val Ser Tyr Met

20 25 30

His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Arg Leu Leu Ile Tyr

35 40 45

Ser Thr Ser Asn Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

50 55 60

Gly Ser Gly Thr Asp Phe Thr Phe Thr Ile Ser Ser Leu Gln Pro Glu

65 70 75 80

Asp Ile Ala Thr Tyr Tyr Cys His Gln Trp Ser Ser Tyr Pro Thr Phe

85 90 95

Gly Gln Gly Thr Lys Val Glu Ile Lys Gly Ser Thr Ser Gly Ser Gly

100 105 110

Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Gln Val Gln Leu Gln

115 120 125

Glu Ser Gly Pro Gly Leu Val Arg Pro Ser Gln Thr Leu Ser Leu Thr

130 135 140

Cys Thr Val Ser Gly Phe Thr Ile Ser Ser Gly Tyr Ser Trp His Trp

145 150 155 160

Val Arg Gln Pro Pro Gly Arg Gly Leu Glu Trp Ile Gly Tyr Ile Gln

165 170 175

Tyr Ser Gly Ile Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr

180 185 190

Met Leu Val Asp Thr Ser Lys Asn Gln Phe Ser Leu Arg Leu Ser Ser

195 200 205

Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Glu Asp Tyr

210 215 220

Asp Tyr His Trp Tyr Phe Asp Val Trp Gly Gln Gly Ser Thr Val Thr

225 230 235 240

Val Ser Ser Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala

245 250 255

Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys

260 265 270

Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val

275 280 285

Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp

290 295 300

Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe

305 310 315 320

Gln Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp

325 330 335

Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu

340 345 350

Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg

355 360 365

Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys

370 375 380

Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp

385 390 395 400

Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys

405 410 415

Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser

420 425 430

Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser

435 440 445

Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser

450 455 460

Leu Ser Leu Ser Leu Gly Lys Phe Trp Val Leu Val Val Val Gly Gly

465 470 475 480

Val Leu Ala Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe

485 490 495

Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn

500 505 510

Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr

515 520 525

Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser Val Lys Phe Ser Arg

530 535 540

Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn

545 550 555 560

Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg

565 570 575

Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro

580 585 590

Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala

595 600 605

Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His

610 615 620

Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp

625 630 635 640

Ala Leu His Met Gln Ala Leu Pro Pro Arg

645 650

20

469

PRT

人工序列(Artificial sequence)

20

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Ser Thr Ser Ser Ser Val Ser Tyr Met

20 25 30

His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Arg Leu Leu Ile Tyr

35 40 45

Ser Thr Ser Asn Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

50 55 60

Gly Ser Gly Thr Asp Phe Thr Phe Thr Ile Ser Ser Leu Gln Pro Glu

65 70 75 80

Asp Ile Ala Thr Tyr Tyr Cys His Gln Trp Ser Ser Tyr Pro Thr Phe

85 90 95

Gly Gln Gly Thr Lys Val Glu Ile Lys Gly Ser Thr Ser Gly Ser Gly

100 105 110

Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Gln Val Gln Leu Gln

115 120 125

Glu Ser Gly Pro Gly Leu Val Arg Pro Ser Gln Thr Leu Ser Leu Thr

130 135 140

Cys Thr Val Ser Gly Phe Thr Ile Ser Ser Gly Tyr Ser Trp His Trp

145 150 155 160

Val Arg Gln Pro Pro Gly Arg Gly Leu Glu Trp Ile Gly Tyr Ile Gln

165 170 175

Tyr Ser Gly Ile Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr

180 185 190

Met Leu Val Asp Thr Ser Lys Asn Gln Phe Ser Leu Arg Leu Ser Ser

195 200 205

Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Glu Asp Tyr

210 215 220

Asp Tyr His Trp Tyr Phe Asp Val Trp Gly Gln Gly Ser Thr Val Thr

225 230 235 240

Val Ser Ser Lys Pro Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro

245 250 255

Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys

260 265 270

Arg Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala

275 280 285

Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu

290 295 300

Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys Val Lys Arg Gly Arg Lys

305 310 315 320

Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr

325 330 335

Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu

340 345 350

Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro

355 360 365

Ala Tyr Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly

370 375 380

Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro

385 390 395 400

Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr

405 410 415

Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly

420 425 430

Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln

435 440 445

Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln

450 455 460

Ala Leu Pro Pro Arg

465

21

467

PRT

人工序列(Artificial sequence)

21

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Ser Thr Ser Ser Ser Val Ser Tyr Met

20 25 30

His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Arg Leu Leu Ile Tyr

35 40 45

Ser Thr Ser Asn Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

50 55 60

Gly Ser Gly Thr Asp Phe Thr Phe Thr Ile Ser Ser Leu Gln Pro Glu

65 70 75 80

Asp Ile Ala Thr Tyr Tyr Cys His Gln Trp Ser Ser Tyr Pro Thr Phe

85 90 95

Gly Gln Gly Thr Lys Val Glu Ile Lys Gly Ser Thr Ser Gly Ser Gly

100 105 110

Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Gln Val Gln Leu Gln

115 120 125

Glu Ser Gly Pro Gly Leu Val Arg Pro Ser Gln Thr Leu Ser Leu Thr

130 135 140

Cys Thr Val Ser Gly Phe Thr Ile Ser Ser Gly Tyr Ser Trp His Trp

145 150 155 160

Val Arg Gln Pro Pro Gly Arg Gly Leu Glu Trp Ile Gly Tyr Ile Gln

165 170 175

Tyr Ser Gly Ile Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr

180 185 190

Met Leu Val Asp Thr Ser Lys Asn Gln Phe Ser Leu Arg Leu Ser Ser

195 200 205

Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Glu Asp Tyr

210 215 220

Asp Tyr His Trp Tyr Phe Asp Val Trp Gly Gln Gly Ser Thr Val Thr

225 230 235 240

Val Ser Ser Lys Pro Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro

245 250 255

Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Arg

260 265 270

Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Asp

275 280 285

Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu

290 295 300

Ser Leu Val Ile Thr Leu Tyr Cys Val Lys Arg Gly Arg Lys Lys Leu

305 310 315 320

Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln

325 330 335

Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly

340 345 350

Cys Glu Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr

355 360 365

Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg

370 375 380

Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met

385 390 395 400

Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu

405 410 415

Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys

420 425 430

Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu

435 440 445

Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu

450 455 460

Pro Pro Arg

465



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3