用于鉴定、评价、预防和治疗卵巢癌的核酸分子和蛋白质的制作方法-j9九游会真人

文档序号:5879174阅读:263来源:国知局
专利名称:用于鉴定、评价、预防和治疗卵巢癌的核酸分子和蛋白质的制作方法
技术领域
本发明的领域为卵巢癌,包括卵巢癌的诊断、表征、处理和治疗。
背景技术
卵巢癌在全世界人群中引起显著的发病率和死亡率。卵巢癌根据临床和病理学特征分为三类,即上皮卵巢癌(eoc;占西方国家中卵巢癌的90%以上),生殖细胞瘤(占卵巢癌的大约2-3%),和间质卵巢癌(占卵巢癌的大约5%;ozols et al.,1997,cancer principles andpractice of oncology,5thed.,devita et al.,eds.pp.1502)。与eoc相比,生殖细胞瘤和间质卵巢癌更容易早期检测和治疗,也即患有这两类卵巢癌的患者有较高/较好的生存率。
有许多类型的卵巢肿瘤,其中一些是良性的,另一些是恶性的。治疗(包括非治疗)选择和对患者后果的预测取决于卵巢癌的准确分类。卵巢癌根据癌症起源细胞的类型以及卵巢癌是良性的还是恶性的来命名。公认的组织学肿瘤类型包括,例如,浆液性、粘液性、子宫内膜样和透明细胞肿瘤。另外,卵巢癌也根据公认的分级和分期标准来分类。
在i级中,肿瘤组织分化良好。在ii级中,肿瘤组织分化中度良好。在iii级中,肿瘤组织分化差。该级比i级和ii级的预后较差。i期通常限于围绕一侧(ia期)或两侧(ib期)卵巢的囊内,尽管在某些i期(即ic期)癌症中,在腹水、腹膜漂洗液或卵巢表面可以检测到恶性细胞。ii期涉及肿瘤从一侧或两侧卵巢向其他骨盆结构扩散或转移。在iia期中,肿瘤扩散或转移到子宫、输卵管或这两者中。iib期涉及肿瘤向骨盆的扩散。iic期是iia期或iib期,其中在腹水、腹膜漂洗液或卵巢表面可以检测到恶性细胞。在iii期中,肿瘤包括至少一个向小肠或网膜的恶性扩散,形成显微镜下可见(iiia期)或肉眼可见(直径<2厘米,iiib期;直径>2厘米,iiic期)大小的骨盆外腹膜植入物,或者已经转移到腹膜后或腹股沟淋巴结(iiic期的另一个指征)。在iv期中,能够检测到远端(即非腹膜)肿瘤转移。
卵巢癌各期的持续时间目前还不知道,但是一般认为各为至少约一年(richart et al.,1969,am.j.obstet.gynecol.105386)。随着分期提高,预后变差。例如,诊断为i、ii、iii、iv期卵巢癌的患者的5年存活率分别为80%、57%、25%和8%。
尽管卵巢癌是第三大普遍的妇科癌症,但却是妇科癌症中排第一位的死亡原因。卵巢癌的这种不成比例的死亡率是由于早期卵巢癌患者基本上没有症状,并且难以早期诊断卵巢癌。卵巢癌患者最常有非特异性的主诉,如异常阴道出血、胃肠道症状、尿道症状、下腹痛和广泛腹胀。这些患者极少表现副肿瘤性症状或清楚表明其患病的症状。目前,不到约40%的卵巢癌患者表现为i期或ii期。当治疗更普遍有效时,如果卵巢癌能够早期检测,该病的处置将显著改善。
通过从患者获得常规病史,并对患者进行体检、x线检查及化学和血液学研究,可以部分地诊断卵巢癌。可以指示患者中卵巢癌的血液学检验包括被称为ca125和df3的蛋白质的血清水平和溶血磷脂酸(lpa)血浆水平的分析。卵巢触诊和超声波技术(尤其包括阴道内超声波和彩色多普勒流动超声波技术)能够帮助检测卵巢肿瘤和从良性卵巢囊肿向卵巢癌的分化。但是,卵巢癌的确诊一般需要对患者行剖腹探查术。
可能的卵巢癌检测实验(例如筛查、反射或监测)可以通过大量因素来表征。试验的“灵敏性”是指该试验在卵巢癌患病个体中产生阳性结果的概率。试验的“特异性”是指该试验在未患卵巢癌个体中产生阴性结果的概率。试验的“阳性预测值”(ppv)是真阳性结果(即卵巢癌患者的阳性测定结果)与所有阳性结果(即卵巢癌患者的阳性测定结果 未患卵巢癌的患者的阳性测定结果)的比值。已经估计到,为了使一个试验成为适当人群范围的卵巢癌筛查工具,该试验必须具有至少约为10%的ppv(rosenthal et al.,1998,sem.oncol.25315-325)。因此对于检测患者卵巢癌的筛查试验,具有高灵敏性和高ppv是理想的。监测和反射试验也需要适当的说明。
由于已知卵巢癌检测方法的成本、有限的灵敏性和有限的特异性,当前不对普遍人群进行筛查。另外,为了诊断筛查卵巢癌指征阳性患者的卵巢癌而需要行剖腹术限制了普遍人群筛查的需求,因此高于10%的ppv是理想的。
现在使用血清ca125水平作为卵巢癌的诊断标志表明该方法的特异性不足以用作普遍筛查方法。使用精细算法来说明从患者中获得的系列回顾标本中的ca125水平提高了该方法的特异性,而没有将卵巢癌检测移至较早阶段(skakes,1995,cancer 762004)。为了检测包括卵巢癌在内的妇科癌症而筛查lpa显示大约96%的灵敏性和大约89%的特异性。但是,基于ca125的筛查方法和基于lpa的筛查方法分别受到卵巢癌以外疾病患者血清中存在ca125和lpa的影响。例如,已知血清ca125水平与月经、妊娠、胃肠道疾病和肝病如结肠炎和肝硬化、心包炎、肾病和各种非卵巢恶性肿瘤有关。已知血清lpa受到例如存在非卵巢妇科恶性肿瘤的影响。比当前对ca125和lpa的筛查方法具有更高特异性的卵巢癌筛查方法能够提供对早期卵巢癌的广泛人群的筛查。
当前患者中诊断的约60%以上的卵巢癌为iii期或iv期癌症。该阶段的治疗主要限于细胞减积术(可行时)和化疗,这两种治疗的目的都在于减慢转移癌的扩散和发展。实际上所有晚期卵巢癌患者现在都进行联合化疗作为主要的治疗,通常是铂类化合物与紫杉类药物联合。反应性患者的中位存活率约为一年。相对于单药治疗,使用诸如阿霉素、环磷酰胺、顺铂、六甲密胺、紫杉醇和氨甲喋呤等药物的联合化疗可以提高这些组的存活率。当前开发的各种化疗剂和治疗方案也已经证明可用于治疗晚期卵巢癌。例如,使用拓扑异构酶i抑制剂topectan,使用氨磷汀使化疗的副作用最小化,以及对具有腹膜植入肿瘤的患者使用腹膜内化疗,已经证明至少有有限的效用。但是,目前iii期卵巢癌患者的5年存活率为25%,iv期卵巢癌患者的存活率为8%。
总之,检测卵巢癌越早,治疗性干预的侵入性和治疗性干预的副作用就越小。更重要的是,检测癌症越早,卵巢癌患者的存活率和生活质量就越高。因此,迫切需要尽早检测卵巢癌的方法。也需要检测卵巢癌复发的方法,以及预测和监测治疗的效果的方法。进而需要治疗卵巢癌的新治疗方法。本发明满足了这些需要。

发明内容
本发明涉及癌症标志(下文称为“标志”或“本发明标志”),它们在表1中列出。本发明提供该标志编码的或相对应的核酸和蛋白质(下文分别称为“标志核酸”和“标志蛋白”)。本发明还提供与这些蛋白质和/或蛋白质片段特异性结合的抗体、抗体衍生物和抗体片段。
一方面,本发明涉及各种与卵巢癌检测和治疗有关的诊断、监测、检验和其他方法。在一个实施方案中,本发明提供一种评估患者是否患有卵巢癌或者其发展为卵巢癌的危险是否高于正常的诊断方法,该方法包括如下步骤将本发明标志在患者标本中的表达水平与该标志在对照(例如来自未患卵巢癌的患者的标本)中的正常表达水平进行比较。该标志在患者标本中的表达水平显著高于正常水平,是该患者患有卵巢癌或者发展为卵巢癌的危险高于正常的指示。
在该诊断方法的一个优选实施方案中,在至少约20%的i期卵巢癌患者、ii期卵巢癌患者、iii期卵巢癌患者、iv期卵巢癌患者、i级卵巢癌患者、ii级卵巢癌患者、iii级卵巢癌患者、上皮卵巢癌患者、间质卵巢癌患者、生殖细胞卵巢癌患者、恶性卵巢癌患者、良性卵巢癌患者、浆液肿瘤卵巢癌患者、粘液肿瘤卵巢癌患者、子宫内膜样肿瘤卵巢癌患者和/或透明细胞肿瘤卵巢癌患者中,该标志过量表达至少2倍。
本发明的诊断方法尤其可用于具有确定的与卵巢癌有关的骨盆腔肿瘤或症状的患者。本发明的方法也能够特别用于发展卵巢癌危险升高的患者(例如具有卵巢癌家族史的患者,鉴定具有突变癌基因的患者,和至少约50岁的患者)。
在评估患者是否患有卵巢癌的一个优选诊断方法(例如新的检测(“筛查”),复发的检测,反射测定)中,该方法包括将本发明标志在患者标本中的表达水平与该标志在对照非卵巢癌标本中的正常表达水平进行比较。该标志在患者标本中的表达水平显著高于正常水平表明该患者患有卵巢癌。
本发明也提供用于评估一种疗法抑制患者卵巢癌的疗效的诊断方法。该方法包括将对患者提供至少一部分治疗之前从患者中获得的第一标本中本发明标志的表达与实施该部分治疗后从患者中获得的第二标本中该标志的表达进行比较。该标志在第二标本中的表达水平显著低于在第一标本中的表达水平表明该疗法对于抑制患者卵巢癌是有效的。
应当理解,在这些方法中,“疗法”可以是治疗卵巢癌的任何疗法,包括但不限于化疗、放疗、手术切除肿瘤组织、基因治疗和生物治疗,如施用抗体和趋化因子。因此,本发明的方法可以用于在治疗之前、期间及之后评价患者,例如评价肿瘤负荷的减少。
在一个优选实施方案中,本发明的诊断方法是针对采用化学剂或生物剂的治疗。这些方法包括将从患者中获得并在化学剂或生物剂存在下保存的第一标本中本发明标志的表达与从患者中获得并在不含上述药剂条件下保存的第二标本中该标志的表达进行比较。该标志在第一标本中的表达水平显著低于在第二标本中的表达水平表明该药剂在抑制患者卵巢癌上有效。在一个实施方案中,第一和第二标本可以是从患者中获得的一种标本的部分,或者是从患者中获得的合并标本的部分。
本发明另外还提供一种用于评估患者中卵巢癌进展的监测方法,该方法包括检测第一时间点的患者标本中本发明标志的表达;在后一时间点及时重复这种检测;比较检测的表达水平,由此监测患者中卵巢癌的进展。该标志在后一时间点标本中的表达水平显著高于在第一时间点标本中的表达水平表明卵巢癌已经进展,而表达水平显著较低则表明卵巢癌已经消退。
本发明进一步提供一种用于确定卵巢癌是否已经转移或者是否有可能在以后转移的诊断方法,该方法包括将本发明标志在患者标本中的表达水平与该标志在对照标本中的正常表达水平(或未转移水平)进行比较。在患者标本中的表达水平显著高于正常水平(或未转移水平)表明卵巢癌已经转移或者在以后有可能转移。
本发明还提供一种选择用于抑制患者卵巢癌的组合物/化合物的试验方法。该方法包括从患者中获得含癌细胞的标本;在多种试验组合物/化合物存在下分开保存该标本的等份;比较本发明标志在各等份中的表达;然后选择一种试验组合物/化合物,相对于该标志在其他试验组合物/化合物存在下的表达水平,所选试验组合物/化合物显著降低该标志在含该试验组合物/化合物的等份中的表达水平。
本发明另外提供一种评估化合物的致卵巢癌能力的试验方法。该方法包括在存在及不存在该化合物的条件下分开保存卵巢细胞等份;比较本发明标志在各等份中的表达。在该化合物存在下保存的等份中该标志的表达水平显著高于在不含该化合物条件下保存的等份中的表达水平表明该化合物具有致卵巢癌能力。
另外,本发明进一步提供一种抑制患者卵巢癌的方法。该方法包括从患者中获得含癌细胞的标本;在多种组合物/化合物存在下分开保存该标本等份;然后比较本发明标志在各等份中的表达;最后对患者施用其中至少一种组合物/化合物,相对于该标志在其他组合物/化合物存在下的表达水平,该组合物/化合物显著降低该标志在含该组合物/化合物的等份中的表达水平。
在上述方法中,标本或患者标本包含从患者中获得的细胞。该细胞可存在于例如通过卵巢组织活检或组织切片采集的卵巢组织标本中。在一个实施方案中,患者标本是卵巢相关体液。该体液包括,例如,血液、淋巴、腹水、妇科液、囊液、尿和通过腹膜漂洗采集的液体。在另一实施方案中,该标本包含从患者中获得的细胞。在该实施方案中,细胞可存在于选自通过腹膜漂洗采集的液体、通过子宫漂洗采集的液体、子宫液、子宫渗出液、胸水和卵巢渗出液的液体中。在另一实施方案中,患者标本是体内标本。
根据本发明,本发明标志在标本中的表达水平例如可以通过检测标本中是否存在下列物质来评估相应的标志蛋白(例如具有如下序列之一的蛋白质seq idno2、seq id no4、seq id no6、seq id no8、seq idno10、seq id no12、seq id no14、seq id no16、seq idno18、seq id no20、seq id no22、seq id no24、seq idno26、seq id no28、seq id no30、seq id no32、seq idno34、seq id no36、seq id no38、seq id no40、seq idno42或seq id no44)或蛋白质片段(例如通过使用特异性结合该蛋白质或蛋白质片段的试剂,例如抗体、抗体衍生物、抗体片段或单链抗体);相应的标志核酸(例如具有如下序列之一的核酸seq idno1、seq id no3、seq id no5、seq id no7、seq idno9、seq id no11、seq id no13、seq id no15、seq idno17、seq id no19、seq id no21、seq id no23、seq idno25、seq id no27、seq id no29、seq id no31、seq idno33、seq id no35、seq id no37、seq id no39、seq idno41或seq id no43)或核酸片段(例如通过将从标本中获得的转录多核苷酸与一种基质相接触,该基质上附着有一种或多种具有完整的该序列或序列片段或其互补序列的核酸);或相应标志蛋白直接(即催化)或间接产生的代谢物。
根据本发明,上述任何方法都可以使用多种(例如2、3、5或10种或更多)卵巢癌标志进行,包括本领域公知的卵巢癌标志。在该方法中,将标本中多种标志(其中至少一个是本发明的标志)各自的表达水平与从未患卵巢癌的对照人体中获得的同类标本中所述多种标志各自的正常或对照表达水平进行比较。一种或多种本发明标志或其一定组合在标本中的表达水平相对于该标志的相应正常水平显著改变(即升高或降低,如使用一种标记的上述方法所说明的),表明该患者患有卵巢癌。对于所有上述方法,优选选择标志,使该方法的阳性预测值至少约为10%。
另一方面,本发明提供了与标志蛋白(例如具有如下任一序列的蛋白质seq id no2、seq id no4、seq id no6、seq idno8、seq id no10、seq id no12、seq id no14、seq idno16、seq id no18、seq id no20、seq id no22、seq idno24、seq id no26、seq id no28、seq id no30、seq idno32、seq id no34、seq id no36、seq id no38、seq idno40、seq id no42或seq id no44)或该蛋白质的片段特异性结合的抗体、抗体衍生物或抗体片段。本发明也提供制备这些抗体、抗体衍生物和抗体片段的方法。这些方法可包括用包含标志蛋白的全部或10个或10个以上或更多氨基酸的片段的蛋白质或肽免疫哺乳动物,其中该蛋白质或肽可以从细胞获得或者可以通过化学合成获得。本发明的方法也包括制备单克隆或单链抗体,进一步包括从免疫的哺乳动物中分离脾细胞,将分离的脾细胞与永生细胞系相融合,形成杂交瘤,筛选杂交瘤,选择产生与标志蛋白(例如具有如下任一序列的蛋白质seq id no2、seq id no4、seq id no6、seq idno8、seq id no10、seq id no12、seq id no14、seq idno16、seq id no18、seq id no20、seq id no22、seq idno24、seq id no26、seq id no28、seq id no30、seq idno32、seq id no34、seq id no36、seq id no38、seq idno40、seq id no42或seq id no44)或该蛋白质的片段特异性结合的抗体的杂交瘤。
另一方面,本发明涉及多种诊断和检测试剂盒。在一个实施方案中,本发明提供一种评估患者是否患有卵巢癌的试剂盒。该试剂盒包括用于评估本发明标志的表达的试剂。在另一实施方案中,本发明提供一种评估化学剂或生物剂是否适于抑制患者卵巢癌的试剂盒。该试剂盒包括用于评估本发明标志的表达的试剂,也可以包括一种或多种这样的化学剂或生物剂。在另一实施方案中,本发明提供用于评估卵巢癌细胞是否存在或者用于治疗卵巢癌的试剂盒。该试剂盒包括与标志蛋白或蛋白质片段特异性结合的抗体、抗体衍生物或抗体片段。该试剂盒也可包括多种抗体、抗体衍生物或抗体片段,其中所述多种抗体物质与标志蛋白或其片段特异性结合。
在另一实施方案中,本发明也提供用于评估卵巢癌细胞是否存在的试剂盒,其中该试剂盒包括与标志核酸或其片段特异性结合的核酸探针。该试剂盒也可包括多种探针,其中各种探针都与标志核酸或其片段特异性结合。
另一方面,本发明涉及治疗卵巢癌患者或具有发展卵巢癌危险的患者的方法。该方法可以包括减少本发明标志的表达和/或干扰其生物学功能。在一个实施方案中,该方法包括对患者提供与标志核酸互补的反义寡核苷酸或多核苷酸或其片段。例如,可以通过给予表达标志核酸或其片段的反义多核苷酸的载体而对患者提供反义多核苷酸。在另一实施方案中,该方法包括对患者提供与标志蛋白或其片段特异性结合的抗体、抗体衍生物或抗体片段。在一个优选实施方案中,抗体、抗体衍生物或抗体片段与具有表1所列任一标志序列的蛋白质或该蛋白质的片段特异性结合。
应当理解,本发明的方法和试剂盒也可以包括已知的癌症标志,包括已知的卵巢癌标志。应当进一步理解,该方法和试剂盒可以用于鉴定除卵巢癌以外的癌症。
另一方面,本发明表征了编码标志蛋白或标志多肽例如标志蛋白的生物活性部分的核酸分子。在一个优选实施方案中,分离的核酸分子编码具有如下氨基酸序列的标志多肽seq id no2、seq idno4、seq id no6、seq id no8、seq id no10、seq idno12、seq id no14、seq id no16、seq id no18、seq idno20、seq id no22、seq id no24、seq id no26、seq idno28、seq id no30、seq id no32、seq id no34、seq idno36、seq id no38、seq id no40、seq id no42或seq idno44。在其他一些实施方案中,本发明提供分离的具有如下所示核苷酸序列的标志核酸分子seq id no1、seq id no3、seq idno5、seq id no7、seq id no9、seq id no11、seq idno13、seq id no15、seq id no17、seq id no19、seq idno21、seq id no23、seq id no25、seq id no27、seq idno29、seq id no31、seq id no33、seq id no35、seq idno37、seq id no39、seq id no41或seq id no43。在另外其他一些实施方案中,本发明提供与如下所示核苷酸序列基本上相同(例如天然发生的等位基因变体)的核酸分子seq id no1、seqid no3、seq id no5、seq id no7、seq id no9、seq idno11、seq id no13、seq id no15、seq id no17、seq idno19、seq id no21、seq id no23、seq id no25、seq idno27、seq id no29、seq id no31、seq id no33、seq idno35、seq id no37、seq id no39、seq id no41或seq idno43。在其他实施方案中,本发明提供在如本文所述的严格杂交条件下与包含下列核苷酸序列的核酸分子杂交的核酸分子seq id no1、seq id no3、seq id no5、seq id no7、seq id no9、seq id no11、seq id no13、seq id no15、seq id no17、seq id no19、seq id no21、seq id no23、seq id no25、seq id no27、seq id no29、seq id no31、seq id no33、seq id no35、seq id no37、seq id no39、seq id no41或seq id no43,其中所述核酸编码全长标志蛋白或其活性片段。
在一个相关方案中,本发明进一步提供包含本文所述标志核酸分子的核酸构建体。在某些实施方案中,本发明的核酸分子与天然或异源调节序列可操作地连接。还包括含有本发明标志核酸分子的载体和宿主细胞,例如适于产生多肽的载体和宿主细胞。
在另一相关方案中,本发明提供适合作为用于检测标志编码核酸的引物或杂交探针的核酸片段。
在另一相关方案中,提供与标志编码核酸分子反义的分离的核酸分子。
在其他实施方案中,本发明提供标志多肽,例如具有如下氨基酸序列的标志多肽seq id no2、seq id no4、seq id no6、seqid no8、seq id no10、seq id no12、seq id no14、seq idno16、seq id no18、seq id no20、seq id no22、seq idno24、seq id no26、seq id no28、seq id no30、seq idno32、seq id no34、seq id no36、seq id no38、seq idno40、seq id no42或seq id no44所示的氨基酸序列;与如下所示氨基酸序列基本相同的氨基酸序列seq id no2、seq idno4、seq id no6、seq id no8、seq id no10、seq idno12、seq id no14、seq id no16、seq id no18、seq idno20、seq id no22、seq id no24、seq id no26、seq idno28、seq id no30、seq id no32、seq id no34、seq idno36、seq id no38、seq id no40、seq id no42或seq idno44;或者由具有如下核苷酸序列的核酸分子编码的氨基酸序列,该核酸分子在本文所述的严格杂交条件下与包含seq id no(nts)核苷酸序列的核酸分子杂交,其中该核酸编码全长标志蛋白或基活性片段。
在一个相关的方案中,本发明进一步提供包含本文所述标志核酸分子的核酸构建体。
在一个相关的方案中,本发明提供与非标志多肽可操作连接从而形成融合蛋白的标志多肽或片段。
另一方面,本发明表征了与标志多肽反应,更优选地,特异性或选择性结合的抗体及其抗原结合片段。
本发明涉及新发现的与卵巢细胞的癌性状态有关的标志,其在表1中列出。现发现,任何该标志或该标志组合的表达水平高于正常,与患者存在卵巢癌有关。提供了检测标本中卵巢癌的存在、标本中卵巢癌不存在、卵巢癌分期、评估乳腺癌是否已经转移、预测乳腺癌患者可能的临床结果的方法,以及利用与患者卵巢癌预防、诊断、表征和治疗有关的卵巢癌其他特性的方法。也提供了治疗卵巢癌的方法。
表1列出了全部本发明的标志,与正常(即非癌)卵巢细胞相比,它们在卵巢癌细胞中过量表达。在该表中,所述标志用名称(“标志”)、适当时公知的基因名称(“基因名称”)、标志编码或相对应的核苷酸转录物cdna序列的序列表编号(“seq id no(nts)”)、核苷酸转录物编码的蛋白质氨基酸序列的序列表编号(“seq id no(aas)”)和蛋白质编码序列在cdna序列中的位置(“cds”)来区别。
表1.卵巢癌标志

定义本文中使用的下列所有术语具有与其在该章节中有关的含义。
本文中使用的“一种”是指一种或一种以上(即至少一种)的语法上的对象。例如,“一种成分”是指一种成分或一种以上的成分。
“标志”是一种基因,其在组织或细胞中的表达水平与在正常或健康组织中的表达水平相比的改变与疾病状态如癌症有关。“标志核酸”是本发明标志编码的或相对应的核酸(例如mrna、cdna)。这些标志核酸包括包含以下任一序列的完整或部分序列的dna(例如cdna)seq id no1、seq id no3、seq id no5、seq idno7、seq id no9、seq id no11、seq id no13、seq idno15、seq id no17、seq id no19、seq id no21、seq idno23、seq id no25、seq id no27、seq id no29、seq idno31、seq id no33、seq id no35、seq id no37、seq idno39、seq id no41或seq id no43。标志核酸也可包括包含对应于以下任一序列的完整或部分序列的rnaseq id no1、seqid no3、seq id no5、seq id no7、seq id no9、seq idno11、seq id no13、seq id no15、seq id no17、seq idno19、seq id no21、seq id no23、seq id no25、seq idno27、seq id no29、seq id no31、seq id no33、seq idno35、seq id no37、seq id no39、seq id no41或seq idno43,或该序列的互补序列,其中所有胸腺嘧啶核苷残基都被尿嘧啶核苷残基取代。“标志蛋白”是本发明标志所编码的或相对应的蛋白质。标志蛋白包含以下任一序列的完整或部分序列seq idno2、seq id no4、seq id no6、 seq id no8、seq idno10、seq id no12、seq id no14、seq id no16、seq idno18、seq id no20、seq id no22、seq id no24、seq idno26、seq id no28、seq id no30、seq id no32、seq idno34、seq id no36、seq id no38、seq id no40、seq idno42或seq id no44。术语“蛋白质”和“多肽”可互换使用。
“标志组”是一组一种以上的标志。
术语“探针”是指能够选择性结合特定靶分子例如标志编码的或对应的核苷酸转录物或蛋白质的任何分子。探针既可以由本领域技术人员合成,也可以来源于适当的生物制品。为了检测靶分子,如本文所述,探针可以特别设计为标记探针。能够用作探针的分子的例子包括但不限于rna、dna、蛋白质、抗体和有机分子。
本文使用的“卵巢癌”包括癌(例如原位癌、浸润性癌、转移癌)和恶化前状况。
“卵巢相关”体液是一种液体,当其在患者体内时接触或者通过卵巢细胞,或者从卵巢细胞例如卵巢上皮脱落的细胞或蛋白质能够进入其中。卵巢相关体液的例子包括血液、淋巴、腹水、妇科液体、囊液、尿,以及通过腹膜漂洗采集的液体。
“标本”或“患者标本”包括从患者中获得的细胞,例如块状活检物、体液,包括血液、淋巴和囊液,以及乳头吸取物。在另一实施方案中,患者标本为体内标本。
标志的“正常”表达水平是标志在未患卵巢癌的受试者或患者卵巢细胞中的表达水平。
标志的“过量表达”或“显著高水平的表达”是指在检测标本中的表达水平高于用来评估表达的试验的标准误差,并且是该标志在对照标本(例如来自未患该标志相关疾病的健康受试者的标本)中表达水平-优选是该标志在几种对照标本中的平均表达水平-的优选至少2倍,更优选3、4、5或10倍。
本文使用的术语“启动子/调节序列”是指与启动子/调节序列可操作连接的基因产物表达所需的核酸序列。在某些情况下,该序列可以是核心启动子序列,在另外一些情况下,该序列也可以包括增强子序列和基因产物表达所需的其他调节元件。启动子/调节序列例如可以是以组织特异性方式表达基因产物的序列。
“组成型”启动子是一种核苷酸序列,当与编码或确定基因产物的多核苷酸可操作地连接时,它使得在细胞的大多数或所有生理条件下,在活人类细胞中产生基因产物。
“诱导型”启动子是一种核苷酸序列,当与编码或确定基因产物的多核苷酸可操作地连接时,它使得基本上只有在细胞中存在对应于该启动子的诱导物时,才在活人类细胞中产生基因产物。
“组织特异性”启动子是一种核苷酸序列,当与编码或确定基因产物的多核苷酸可操作地连接时,它使得基本上只有在细胞是对应于该启动子的组织类型的细胞时,才在活人类细胞中产生基因产物。
“转录的多核苷酸”或“核苷酸转录物”是与成熟mrna的全部或一部分互补或同源的多核苷酸(例如mrna、hnrna、cdna或该rna或cdna的类似物),该成熟mrna是通过本发明标志的转录及(如果有的话)rna转录物的正常转录后加工(例如剪切)和rna转录物的逆转录而获得的。
“互补”是指两条核酸链的区域之间或同一核酸链的两个区域之间序列互补性的较宽概念。众所周知,第一核酸区的腺嘌呤残基能够与反平行于第一区的第二核酸区的残基(如果该残基是胸腺嘧啶或尿嘧啶的话)形成特定的氢键(“碱基配对”)。同样众所周知,第一核酸链的胞嘧啶残基能够与反平行于第一链的第二核酸链的残基(如果该残基是鸟嘌呤的话)碱基配对。如果当核酸的第一区与相同或不同核酸的第二区以反平行方式排列时,第一区的至少一个核苷酸残基能够与第二区的一个碱基配对,则这两个区互补。优选地,该第一区包含第一部分,第二区包含第二部分,由此当第一部分和第二部分以反平行方式排列时,第一部分中至少约50%,优选至少约75%,至少约90%,或至少约95%的核苷酸残基能够与第二部分中的核苷酸残基碱基配对。更优选地,第一部分的所有核苷酸残基都能够与第二部分的核苷酸残基碱基配对。
本文使用的“同源”是指同一核酸链的两个区之间或两个不同核苷酸链的区之间核苷酸序列的相似性。当两个区中的一个核苷酸残基位点被相同核苷酸残基占据时,则两个区在该位点处同源。如果第一区和第二区的至少一个核苷酸残基位点被相同残基占据,则这两个区同源。两个区之间的同源性以两个区被相同核苷酸残基占据的核苷酸残基位点的比例来表示。例如,具有核苷酸序列5′-attgcc-3′的区和具有核苷酸序列5′-tatggc-3′的区具有50%的同源性。优选地,第一区包含第一部分,第二区包含第二部分,从而每个部分有至少约50%,优选至少约75%,至少约90%,或至少约95%的核苷酸残基位点被相同的核苷酸残基所占据。更优选地,每个部分的所有核苷酸残基位点都被相同的核苷酸残基所占据。
如果一种分子与基质共价或非共价结合,该基质能够用液体(例如标准枸椽酸盐水,ph 7.4)漂洗,而没有显著部分的分子从基质上脱离下来,则称该分子“固定”或“附着”于该基质上。
本文使用的“天然存在的”核酸分子是指具有在自然界发现的生物中存在的核苷酸序列的rna或dna分子。
如果癌症的至少一种症状得到缓解、终止、减慢或阻止,则称癌症得到“抑制”。在本文中,如果癌症的复发或转移得到减少、减慢、延迟或阻止,也称卵巢癌得到“抑制”。
试剂盒是包含至少一种用于特异性检测本发明标志表达的试剂例如探针的任何产品(例如包装或容器)。试剂盒可以作为一个单元推销、分发或销售,用于实施本发明的方法。
“本发明的蛋白质”包括标志蛋白及其片段;变异标志蛋白及其片段;包含标志蛋白或变异标志蛋白的至少15个氨基酸片段的肽和多肽;以及包含标志蛋白或变异标志蛋白,或标志蛋白或变异标志蛋白的至少15个氨基酸片段的融合蛋白。
除非本文中另外指明,术语“抗体”广泛地包括天然存在的抗体形式(例如igg、iga、igm、ige)和重组抗体,如单链抗体、嵌合和人源化抗体和多特异性抗体,以及所有上述抗体的片段和衍生物,这些片段和衍生物具有至少一个抗原结合位点。抗体衍生物可以包括与抗体部分偶联的蛋白质或化学部分。
本发明部分地基于新鉴定的标志,相比在正常(非癌)卵巢细胞中的表达,该标志在卵巢癌细胞中过量表达。一种或多种标志在卵巢细胞中的表达提高在此与该组织的癌性状态有关。本发明提供用于评估卵巢细胞(例如从人体获得的细胞,培养的人体细胞,存档或保藏的人体细胞,和体内细胞)癌性状态以及治疗卵巢癌患者的组合物、试剂盒和方法。
本发明的组合物、试剂盒和方法尤其具有如下用途评估患者是否患有卵巢癌;评估患者中卵巢癌的分期;评估患者中卵巢癌的分级;评估患者卵巢癌的良性或恶性性质;评估患者卵巢癌的转移可能性;确定乳腺癌是否已经转移;预测乳腺癌患者的临床结果;评估与患者卵巢癌有关的新生物(neoplasm)(例如浆液、粘液、子宫内膜样或透明细胞新生物)的组织学类型;制备用于治疗卵巢癌和/或评估患者是否患有卵巢癌的抗体、抗体片段或抗体衍生物;评估卵巢癌细胞的存在;评估一种或多种试验化合物抑制患者卵巢癌的效果;评估一种治疗方法抑制卵巢癌的效果;监测患者卵巢癌的进展;筛选抑制患者卵巢癌的组合物或治疗方法;治疗卵巢癌患者;抑制患者的卵巢癌;评估试验化合物的致卵巢癌能力;以及预防具有发展卵巢癌危险的患者的卵巢癌发病。
本发明因此包括评估患者是否患有卵巢癌的方法,包括评估患者是否具有转移前卵巢癌。该方法将本发明标志(表1中所列)在患者标本中的表达水平与该标志在对照例如非卵巢癌标本中的正常表达水平进行比较。该标志在患者标本中的表达水平显著高于正常水平表明该患者患有卵巢癌。
本发明也提供了基因输送载体、宿主细胞和组合物(均在此描述),其含有含如下任一序列的全部或其15个或更多核苷酸片段的核酸seq id no1、seq id no3、seq id no5、seq id no7、seq id no9、seq id no11、seq id no13、seq id no15、seq id no17、seq id no19、seq id no21、seq id no23、seq id no25、seq id no27、seq id no29、seq id no31、seq id no33、seq id no35、seq id no37、seq id no39、seq id no41或seq id no43,或这些序列的互补序列,以及包含如下任一序列的全部或10个或更多氨基酸片段的多肽seq idno2、seq id no4、seq id no6、seq id no8、seq idno10、seq id no12、seq id no14、seq id no16、seq idno18、seq id no20、seq id no22、seq id no24、seq idno26、seq id no28、seq id no30、seq id no32、seq idno34、seq id no36、seq id no38、seq id no40、seq idno42、seq id no44。
如本文所述,患者的卵巢癌与一种或多种本发明标志的表达水平升高有关。尽管如上所述,某些这样的表达水平改变是卵巢癌复发引起的,但是其他改变诱导、保持和促进了卵巢癌细胞的癌性状态。因此,特征在于一种或多种本发明标志表达水平升高的卵巢癌能够通过减少和/或干扰该标志的表达和/或这些标志编码的蛋白质的功能而得到抑制。
本发明标志的表达能够以本领域公知的许多方法进行抑制。例如,能够向卵巢癌细胞提供反义寡核苷酸,从而抑制标志的转录、翻译或转录及翻译。或者,可以向细胞提供编码特异性结合标志蛋白的抗体、抗体衍生物或抗体片段并且与适当启动子/调节区可操作连接的多核苷酸,从而产生抑制蛋白质功能或活性的细胞内抗体。用特异性结合标志蛋白的抗体、抗体衍生物或抗体片段处理卵巢癌细胞也可以抑制标志的表达和/或功能。使用本文所述的方法,能够筛选多种分子,特别包括小到足以能够穿过细胞膜的分子,以鉴定抑制标志表达或抑制标志蛋白功能的分子。可以向患者提供这样鉴定的化合物,从而抑制患者的卵巢癌细胞。
本发明的任何标志或标志组合,以及任何已知的标志联合本发明的标志,都可以在本发明的组合物、试剂盒和方法中使用。通常,优选使用在卵巢癌细胞中的表达水平与在正常卵巢细胞中的表达水平差距尽可能大的标志。尽管这种差距可能小到用于评估该标志表达的方法的检测限度,但是优选该差距至少高于该评估方法的标准误差,并且优选与同一标志在正常卵巢组织中的表达水平相差至少2、3、4、5、6、7、8、9、10、15、20、25、100、500、1000倍或更多。
已经公认某些标志蛋白从卵巢细胞(即正常细胞和/或癌细胞)分泌到细胞周围的细胞外间隙中。这些标志优选用于本发明组合物、试剂盒和方法的某些实施方案,其原因为如下事实能够在比组织活检标本更易从患者采集的卵巢相关体液标本中检测到这些标志蛋白。另外,检测标志蛋白的优选体内技术包括向受试者中导入针对该蛋白质的标记抗体。例如,抗体可以用一种放射性标记物标记,该放射性标记物在受试者中的存在和定位可以用标准成像技术来检测。
对于本领域技术人员而言,确定任一特定标志蛋白是否是一种分泌蛋白质是一件简单的事情。为了进行这种确定,例如在哺乳动物细胞中,优选在人类卵巢细胞系中表达该标志蛋白,采集细胞外液,评估细胞外液中该蛋白质的存在与否(例如利用特异性结合该蛋白质的标记抗体)。
以下是能够用来检测蛋白质分泌的方法的一个例子。大约8×105293t细胞在含有培养基(dulbecco改良eagle培养基{dmem},补充10%胎牛血清)的孔中在5%(v/v)co2,95%空气气氛下37℃孵育,至大约60-70%汇合。然后用标准转染混合物转染细胞,该混合物每孔含有2微克含编码该蛋白质的表达载体的dna和10微升lipofectaminetm(gibco/brl目录号18342-012)。转染混合物保持大约5小时,然后更换为新鲜培养基,保持在空气气氛中。各孔用不含甲硫氨酸或半胱氨酸的dmem(dmem-mc;icn目录号16-424-54)轻轻漂洗两次。向每孔加入约1毫升dmem-mc和约50微居里trans-35stm试剂(icn目录号51006)。各孔在上述5%co2气氛下保持,并在37℃下孵育持续选择的时间。孵育后,除去150微升条件培养基,离心除去漂浮细胞和碎片。上清液中存在该蛋白质表明该蛋白质被分泌。
卵巢相关体液的例子包括血液(例如全血、血清、除去血小板的血液等)、淋巴、腹水、妇科液(例如卵巢、输卵管和子宫分泌物、月经、阴道灌洗液、用于漂洗卵巢细胞标本的液体等等)、囊液、尿和通过腹膜漂洗采集的液体(例如在腹腔镜检查过程中使用和采集的液体,或灌入患者腹膜腔及从中取出的液体)。在这些实施方案中,标志的表达水平可以通过评估从患者获得的卵巢相关体液中该标志蛋白的量(例如绝对量或浓度)来估计。在估计体液中该标志的量之前,当然可以对该体液进行多种众所周知的采集后制备和贮存技术(例如贮存、冷冻、超滤、浓缩、蒸发、离心等)。
许多卵巢相关体液(即通常不包括尿)可含有卵巢细胞,例如卵巢上皮,特别是当卵巢细胞是癌细胞时,更特别的是当卵巢癌转移时。可含有卵巢癌细胞的含细胞体液包括但不限于腹膜腹水、通过腹膜漂洗采集的液体、通过子宫漂洗采集的液体、子宫液,如子宫渗出物和月经、胸膜液和卵巢渗出物。因此,本发明的组合物、试剂盒和方法可以用于检测至少一部分展示于表达它的细胞表面上的标志蛋白的表达。对于本领域技术人员而言,确定标志蛋白或其部分是否暴露于细胞表面是一件容易的事情。例如,免疫学方法可以用来检测全细胞上的这些蛋白质,或者众所周知的基于计算机的序列分析方法(例如signalp程序;nielsen et al.,1997,protein engineering 101-6)可以用来预测至少一种胞外域的存在(即,既包括分泌的蛋白质又包括含有至少一个细胞表面域的蛋白质)。不必溶解细胞即可检测至少一部分展示于表达它的细胞表面上的标志蛋白的表达(例如使用特异性结合蛋白质细胞表面域的标记抗体)。
本发明标志的表达可以采用多种众所周知的用于检测转录核酸或蛋白质表达的方法中的任一种来评估。该方法的非限制性例子包括用于检测分泌的、细胞表面、细胞质或核蛋白质的免疫学方法,蛋白质纯化方法,蛋白质功能或活性测定,核酸杂交方法,核酸逆转录方法,和核酸扩增方法。
在一个优选实施方案中,标志表达的评估使用特异性结合标志蛋白或其片段-包括经受全部或部分正常翻译后修饰的标志蛋白-的抗体(例如放射性标记的、生色团标记的、荧光团标记的或酶标记的抗体)、抗体衍生物(例如与底物或与蛋白质-配体对{例如生物素-链亲和素}的蛋白质或配体偶联的抗体)或抗体片段(例如单链抗体,分离的抗体超变区等)或衍生物。
在另一优选实施方案中,标志的表达如下评估由患者标本中的细胞制备mrna/cdna(即转录的多核苷酸),并且将该mrna/cdna与作为标志核酸互补体的参照多核苷酸或其片段进行杂交。任选地,cdna在与参照多核苷酸杂交之前可以用多种聚合酶链反应方法中的任何一种进行扩增;优选不进行扩增。一种或多种标志的表达也可以用定量pcr进行检测,以估计标志的表达水平。或者,也可以使用检测本发明标志的突变或变异(例如单核苷酸多态性、缺失等)的任一公知方法来检测一种标志在患者中的存在。
在一个有关实施方案中,从标本中获得的转录多核苷酸混合物与基质接触,该基质上固定了与标志核酸至少一部分(例如至少7、10、15、20、25、30、40、50、100、500或更多核苷酸残基)互补或同源的多核苷酸。如果与几种标志核酸互补或同源的多核苷酸在基质上可差别地检测到(例如可用不同生色团或荧光团检测,或者固定于选择的不同位置),则多种标志的表达水平能够用一种基质(例如固定于选定位置的多核苷酸的“基因芯片”微阵列)同时评估。当使用的评估标志表达的方法涉及一种核酸与另一种核酸杂交时,优选在严格杂交条件下进行杂交。
因为本发明的组合物、试剂盒和方法依赖于检测一种或多种本发明标志的表达水平的差异,因此优选标志的表达水平显著高于用来评估在至少一种正常卵巢细胞和癌性卵巢细胞中表达的方法的最低检测限值。
应当理解,通过使用一种或多种本发明的标志常规筛选其它患者标本,将认识到某些标志在不同类型的癌症中过量表达,包括特定卵巢癌,以及其他癌症,如乳腺癌、子宫颈癌等。例如,将会证实某些本发明的标志在大多数(即50%或以上)或基本上全部(即80%或以上)卵巢癌中过量表达。此外也证实,某些本发明的标志与不同分期(即i、ii、iii、iv期卵巢癌,以及ia、ib、ic、iia、iib、iic、iiia、iiib和iiic亚类,使用用于原发性卵巢癌的figo分期系统;1987,am.j.obstet.gynecol.156236)、不同组织亚型(例如浆液、粘液、子宫内膜样和透明细胞亚型,以及亚类和其他类别,腺癌、乳头状腺癌、乳头状囊腺癌、表面乳头状癌、恶性腺纤维瘤、囊腺纤维瘤、腺癌、囊腺癌、腺棘皮瘤、子宫内膜样间质肉瘤、中胚层(müllerian)混合瘤、中肾样瘤、恶性癌症、布伦纳瘤、混合上皮肿瘤和未分化癌,使用用于恶性卵巢肿瘤分类的who/figo系统;scully,atlas of tumor pathology,3d series,washington dc)和不同分级(即i级{分化良好},ii级{分化中度良好},iii级{由周围正常组织分化较差})的卵巢癌有关。另外,通过对较大数量的患者标本评估本发明标志的表达的改变,并且将获得标本的各个患者的结果相关联,也证实本发明某些标志的表达改变与恶性肿瘤高度相关,并且本发明其他一些标志的表达改变与良性肿瘤高度相关。本发明的组合物、试剂盒和方法因此可用于表征患者卵巢癌的分期、分级、组织学类型和良性/恶性中的一种或多种。另外,这些组合物、试剂盒和方法也能够用于检测和辨别上皮、间质和生殖细胞卵巢癌。
当本发明的组合物、试剂盒和方法用于表征患者卵巢癌的分期、分级、组织学类型和良性/恶性中的一种或多种时,优选选择本发明的标志或一组标志,以便在至少约20%,,优选至少约40%、60%或80%及更多的,优选在基本上全部的相应分期、分级、组织学类型或良性/恶性的卵巢癌患者中获得阳性结果。优选选择本发明的标志或一组标志,以便在普通人群中获得高于约10%的阳性预测值(ppv)(更优选地同时有高于99.5%的测定特异性)。
当本发明的组合物、试剂盒和方法中使用多种本发明标志时,可以在一种反应混合物(即使用用于各种标志的试剂,例如不同荧光探针)中或在对应于一种或多种标志的各种反应混合物中,将患者标本中各标志的表达水平与相同类型的非癌标本中多种标志各自的正常表达水平进行比较。在一个实施方案中,多种标志中一种以上的标志在标本中的表达水平显著高于相应的正常水平表明该患者患有卵巢癌。当使用多种标志时,优选使用2、3、4、5、8、10、12、15、20、30或50种或更多的标志,其中优选较少的标志。
为了使本发明的组合物、试剂盒和方法的灵敏性最大化(即患者标本中非卵巢来源的细胞引起的干扰),优选此处使用的本发明的标志是具有限制组织分布的标志,例如在非上皮组织中通常不表达,更优选在非卵巢组织中通常不表达的标志。
只知道有少量标志与卵巢癌有关(例如akt2、ki-ras、erbb2、c-myc、rbi和tp53;lynch,同上)。这些标志当然不包括在本发明的标志之内,尽管它们可以例如在一组标志中与一种或多种本发明的标志一起使用。众所周知,某些基因类型,例如癌基因、肿瘤抑制基因、生长因子样基因、蛋白酶样基因和蛋白激酶样基因,通常与各种类型癌症的发展有关。因此,在本发明的标志中,优选使用相应于类似已知癌基因和肿瘤抑制基因所编码蛋白质的标志,和相应于类似生长因子、蛋白酶和蛋白激酶的标志。
已确认,本发明的组合物、试剂盒和方法尤其对发展卵巢癌危险高的患者以及他们的医学顾问有用。认为发展卵巢癌危险高的患者包括,例如,具有卵巢癌家族史的患者,确定为具有突变癌基因(即至少一个等位基因)的患者,和高龄患者(即大约50或60岁以上的女性)。
一种标志在正常(即非癌)人类卵巢组织中的表达水平可以用多种方法评估。在一个实施方案中,这种正常表达水平的评估方法包括评估该标志在显示为非癌细胞的卵巢细胞一部分中的表达水平,将该正常表达水平与在怀疑为癌细胞的卵巢细胞一部分中的表达水平进行比较。例如,当腹腔镜检查术或其他医学手段揭示在患者卵巢的一部分上存在肿块,但在同一卵巢的另一部分或另一卵巢上没有肿块时,可以利用未累及的卵巢和/或累及卵巢的未累及部分来评估标志的正常表达水平,该正常表达水平可以与同一标志在累及卵巢的累及部分(即肿块)中的表达水平进行比较。另外并且特别地,由于常规进行本文所述的方法可以获得进一步的信息,本发明标志的正常表达可以使用人群平均值。在其他实施方案中,标志的“正常”表达水平可以如下确定评估从非癌患者获得的患者标本中、在怀疑患者卵巢癌发病之前从患者中获得的患者标本中、存档患者标本等中该标志的表达。
本发明包括用于评估标本(例如存档组织标本或从患者中获得的标本)中是否存在卵巢癌细胞的组合物、试剂盒和方法。这些组合物、试剂盒和方法基本与上述相同,不同之处在于必要时该组合物、试剂盒和方法可适当修改以使用患者标本之外的标本。例如,当使用的标本是石蜡处理的存档的人类组织标本时,调节本发明组合物、本发明试剂盒中化合物的比例,或用于评估标本中标志表达水平的方法可能是必要的。这些方法在本领域中公知,并且在本领域技术人员的技能之内。
本发明包括用于评估(例如在标本如患者标本中)卵巢癌细胞的存在的试剂盒。该试剂盒包括多种试剂,各种试剂都能够特异性结合一种标志核酸或蛋白。适于结合标志蛋白的试剂包括抗体、抗体衍生物、抗体片段等。适于结合标志核酸(例如基因组dna、mrna、剪切mrna、cdna等)的试剂包括互补核酸。例如,核酸试剂可包括固定于基质上的寡核苷酸(标记或非标记的)、未与基质结合的标记寡核苷酸、pcr引物对、分子信标探针等。
本发明的试剂盒可以任选地包括用于进行本发明方法的其他成分。例如,该试剂盒可包括适合退火互补核酸或将抗体与特异性结合的蛋白质相结合的液体(例如ssc缓冲液),一个或多个标本腔室,讲述本发明方法性能的说明材料,正常卵巢细胞标本,卵巢癌细胞标本,等等。
本发明也包括制备分离的杂交瘤的方法,该杂交瘤产生用于评估患者是否患有卵巢癌的抗体。在该方法中,合成或分离包含标志蛋白全部或片段的蛋白质或肽(例如从表达细胞中纯化,或者应用已知方法在体内或体外转录和翻译编码该蛋白质或肽的核酸)。脊椎动物,优选哺乳动物,如小鼠、大鼠、兔或绵羊,用该蛋白质或肽免疫。该脊椎动物任选(且优选地)可以用该蛋白质或肽进行至少另一次免疫,以使该脊椎动物具有对该蛋白质或肽的加强的免疫应答。从免疫的脊椎动物中分离脾细胞,使用本领域公知的多种方法中的任何一种,将其与永生细胞系融合,形成杂交瘤。这样形成的杂交瘤然后用标准方法筛选,从而鉴定出一种或多种产生特异性结合该标志蛋白或其片段的抗体的杂交瘤。本发明也包括利用该方法制备的杂交瘤和利用该杂交瘤制备的抗体。
本发明也包括用于评估试验化合物抑制卵巢癌细胞的效果的方法。如上所述,本发明标志的表达水平的差异与卵巢细胞的癌性状态有关。虽然公认本发明某些标志的表达水平的改变可能是卵巢细胞的癌性状态引起的,但是同样公认,本发明其他标志的表达水平的改变诱导、保持和促进了这些细胞的癌性状态。因此,抑制患者中卵巢癌的化合物将使一种或多种本发明标志的表达水平变化为更接近于该标志的正常表达水平(即该标志在非癌卵巢细胞中的表达水平)。
该方法因此包括将在试验化合物存在下保存的第一卵巢细胞标本中一种标志的表达与在不含该试验化合物条件下保存的第二卵巢细胞标本中该标志的表达进行比较。在试验化合物存在下本发明标志的表达显著降低表明该试验化合物抑制卵巢癌。卵巢细胞标本例如可以是从患者中获得的一种正常卵巢细胞标本的等份,从患者中获得的正常卵巢细胞的合并标本,正常卵巢细胞系细胞,从患者中获得的一种卵巢癌细胞标本的等份,从患者中获得的卵巢癌细胞的合并标本,卵巢癌细胞系细胞,等等。在一个实施方案中,标本是从患者中获得的卵巢癌细胞,并且检测已知有效抑制各种卵巢癌的多种化合物,以鉴定最有可能抑制患者卵巢癌的化合物。
该方法同样可以用于评估一种疗法抑制患者卵巢癌的疗效。在该方法中,评估一种或多种本发明标志在一对标本(一种经过治疗,另一种没有经过治疗)中的表达水平。如同评估试验化合物效果的方法一样,如果这种疗法诱导本发明标志的表达水平显著降低,则这种疗法对于抑制卵巢癌是有效的。如上所述,如果在该方法中使用来自选定患者的标本,则可以在体外评估备选疗法,以选择最可能有效抑制患者卵巢癌的疗法。
如上所述,人类卵巢细胞的癌性状态与本发明标志的表达水平的变化有关。本发明包括评估试验化合物致人卵巢细胞癌的能力的方法。该方法包括在存在及不存在试验化合物的条件下分开保存人卵巢细胞等份。比较本发明标志在各等份中的表达。(与不存在试验化合物条件下保存的等份相比)在试验化合物存在下保存的等份中本发明标志的表达水平明显更高表明该试验化合物具有致人卵巢细胞癌的能力。不同试验化合物的相对致癌能力的评估方法包括比较有关标志表达水平提高或抑制的程度,比较表达水平提高或抑制的标志的数量,或者以上两者都比较。
本发明的各个方面在下面的部分中进一步详细描述。
分离的核酸分子本发明一方面涉及分离的核酸分子,包括编码标志蛋白或其一部分的核酸。本发明的分离的核酸也包括足以用作杂交探针来鉴定标志核酸分子以及标志核酸分子片段的核酸分子,例如适合作为标志核酸分子扩增或突变的pcr引物的那些。本文使用的术语“核酸分子”包括dna分子(例如cdna或基因组dna)和rna分子(例如mrna)和用核苷酸类似物产生的dna或rna的类似物。核酸分子可以是单链或双链的,但优选是双链dna。
“分离的”核酸分子是从该核酸分子天然来源中存在的其他核酸分子中分离出来的核酸分子。优选地,“分离的”核酸分子不含在衍生该核酸的生物基因组dna中天然位于该核酸侧翼的序列(优选蛋白质编码序列)(即位于该核酸5′和3′末端的序列)。例如,在不同实施方案中,分离的核酸分子可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在衍生该核酸的细胞基因组dna中天然位于该核酸分子之侧的核苷酸序列。而且,“分离的”核酸分子,如cdna分子,基本不含其他细胞材料,或者当利用重组技术产生时基本不含培养基,或者当化学合成时基本不含化学前体或其他化学物质。
本发明的核酸分子可以利用标准分子生物学技术和本文所述数据库中记录的序列信息来分离。利用这些核酸序列的全部或一部分,本发明的核酸分子可以利用标准杂交和克隆技术(例如,sambrook et al.,ed.,molecular cloninga laboratory manual,2nd ed.,cold springharbor laboratory press,cold spring harbor,ny,1989所述的方法)分离。
本发明的核酸分子可以用cdna、mrna或基因组dna作为模板并且使用合适的寡核苷酸引物按照标准pcr扩增技术来扩增。可将这样扩增的核酸克隆到合适的载体中,并且通过dna序列分析进行表征。此外,对应于本发明核酸分子的全部或一部分的核苷酸也可以利用标准合成技术制备,例如用自动dna合成仪制备。
在另一优选实施方案中,本发明的分离的核酸分子包括一种核酸分子,其具有与标志核酸核苷酸序列互补或与编码标志蛋白的核酸的核苷酸序列互补的核苷酸序列。与给定核苷酸序列互补的核酸分子是与给定核苷酸序列完全互补,因此能够与给定核苷酸序列杂交从而形成稳定双链体的核酸分子。
另外,本发明的核酸分子可以只含有一部分核酸序列,其中全长核酸序列包含一种标志核酸或编码一种标志蛋白。该核酸例如可以用作探针或引物。探针/引物一般使用一种或多种基本上纯化的寡核苷酸。该寡核苷酸一般包含一个核苷酸序列区,该区在严格条件下与本发明核酸的至少约7个,优选约15个,更优选约25、50、75、100、125、150、175、200、250、300、350或400个或更多连续核苷酸杂交。
基于本发明核酸分子序列的探针能够用于检测对应于一种或多种本发明标志的转录物或基因组序列。探针含有与之连接的标记基团,例如放射性同位素、荧光化合物、酶或酶辅因子。这些探针可以用作鉴定错误表达该蛋白质的细胞或组织的诊断检测试剂盒的一部分,例如通过测定在来自受试者的细胞标本中编码该蛋白质的核酸分子的水平,例如检测mrna水平或检测编码该蛋白质的基因是否已经突变或缺失。
本发明进一步包括由于遗传密码子简并性而与编码标志蛋白的核酸的核苷酸序列不同的核酸分子,因此其编码相同的蛋白质。
本领域技术人员应当理解,导致氨基酸序列变化的dna序列多态性可能存在于一个群体(例如人群)中。由于自然等位基因变异,这种遗传多态性可能存在于一个群体内的个体之间。等位基因是在给定基因座处存在的一组基因中的一个。另外,应当理解,也可能存在影响rna表达水平的dna多态性,其可以影响该基因的总体表达水平(例如通过影响调节或降解)。
本文使用的短语“等位基因变体”是指在指定基因座处发生的核苷酸序列,或者是指该核苷酸序列编码的多肽。
本文使用的术语“基因”和“重组基因”是指包含编码对应于本发明标志的多肽的开放阅读框的核酸分子。这种天然等位基因变异一般可导致特定基因核苷酸序列中1-5%的变化。替代的等位基因可以通过对大量不同个体中的目标基因进行测序来鉴定。使用杂交探针鉴定多个个体中的同一基因座能够容易地进行这种鉴定。天然等位基因变异导致的、未改变功能活性的所有这些核苷酸变异和产生的氨基酸多态性或变异,都在本发明的范围之内。
在另一实施方案中,本发明的分离的核酸分子长度至少为7、15、20、25、30、40、60、80、100、150、200、250、300、350、400、450、550、650、700、800、900、1000、1200、1400、1600、1800、2000、2200、2400、2600、2800、3000、3500、4000、4500个或更多的核苷酸,并且在严格条件下与标志核酸或与编码标志蛋白的核酸杂交。本文使用的术语“在严格条件下杂交”是指这样的杂交和洗涤条件,在该条件下彼此至少60%(65%、70%,优选75%)相同的核苷酸序列仍然彼此杂交。这种严格条件为本领域技术人员所公知,并且可见于current protocols in molecular biology,john wiley &sons,n.y.(1989)的第6.3.1-6.3.6节。严格杂交条件的一个优选的非限制性实例是在大约45℃下在6x氯化钠/柠檬酸钠(ssc)中杂交,然后在50-65℃下用0.2x ssc,0.1%sds洗涤一次或数次。
除了群体中可能存在的本发明核酸分子的天然存在的等位基因变体之外,本领域技术人员应当进一步理解,可以通过突变引入序列改变,从而使其编码的蛋白质的氨基酸序列改变,而不改变其编码的蛋白质的生物活性。例如,可以进行核苷酸置换,在“非必需”氨基酸残基处引起氨基酸置换。“非必需”氨基酸残基是可能与野生型序列不同但不改变生物活性的残基,而“必需”氨基酸残基是生物活性所必需的。例如,在不同种的同源物之间不保守或仅仅半保守的氨基酸残基对于活性可能是非必需的,因此可能是改变的目标。另外,在不同种(例如鼠和人类)的同源物之间保守的氨基酸残基对于活性可能是必需的,因此不能作为改变的目标。
因此,本发明的另一方面涉及编码变异标志蛋白的核酸分子,该变异标志蛋白在对于活性非必需的氨基酸残基中具有改变。该变异标志蛋白在氨基酸序列上不同于天然存在的标志蛋白,但仍保留生物活性。在一个实施方案中,这种变异标志蛋白具有与标志蛋白的氨基酸序列至少大约40%、50%、60%、70%、80%、90%、95%或98%相同的氨基酸序列。
编码变异标志蛋白的分离的核酸分子可以如下产生向标志核酸的核苷酸序列中引入一个或多个核苷酸置换、添加或缺失,从而向其编码的蛋白质中引入一个或多个氨基酸残基置换、添加或缺失。突变可以利用标准技术如定点诱变和pcr介导的诱变来引入。优选地,在一个或多个预测的非必需氨基酸残基处进行保守氨基酸置换。“保守氨基酸置换”是氨基酸残基被置换为具有相似侧链的另一氨基酸残基的置换。具有相似侧链的氨基酸残基的家族在本领域中已经明确。这些家族包括具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。或者,也可以沿编码序列的全部或一部分,例如通过饱和诱变随机引入突变,获得的突变体可以根据生物活性进行筛选,以鉴定出保留活性的突变体。诱变后,可以重组表达编码的蛋白质,并且可以测定该蛋白质的活性。
本发明包括反义核酸分子,即与本发明的有义核酸互补的分子,例如与双链标志cdna分子的编码链互补,或者与标志mrna序列互补的分子。因此,本发明的反义核酸可以与本发明的有义核酸形成氢键(即退火)。反义核酸可以互补于整个编码链,或者只互补于其中一部分,例如蛋白质编码区(或开放阅读框)的全部或一部分。反义核酸分子也可以与编码标志蛋白的核苷酸序列编码链的非编码区的全部或一部分反义。非编码区(″5′和3′非翻译区″)是位于编码区之侧的5′和3′序列,不能翻译为氨基酸。
反义寡核苷酸的长度例如可以是大约5、10、15、20、25、30、35、40、45或50个或更多个核苷酸。本发明的反义核酸可以利用化学合成及酶连接反应采用本领域公知的程序来构建。例如,反义核酸(例如反义寡核苷酸)可以利用天然存在的核苷酸或不同修饰的核苷酸化学合成,这种修饰核苷酸设计为提高该分子的生物学稳定性或提高反义与有义核酸形成的双链体的物理稳定性,例如可以使用硫逐磷酸酯衍生物和吖啶取代的核苷酸。能够用于产生反义核酸的修饰核苷酸的例子包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫尿核苷,5-羧甲基氨甲基尿嘧啶、二氢尿嘧啶、β-d-半乳糖基q核苷、肌苷、n6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、n6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨甲基尿嘧啶、5-甲氧基氨甲基-2-硫尿嘧啶、β-d-甘露糖基q核苷、5′-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-n6-异戊烯腺嘌呤、尿嘧啶-5-氧乙酸(v)、怀丁苷(wybutoxosine)、假尿嘧啶、q核苷、2-巯基胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-n-2-羧丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。或者,反义核酸也可以利用表达载体以生物学方法产生,该表达载体中已经以反义方向亚克隆了核酸(即由插入核酸转录的rna与靶核酸为反义方向,在以下部分中进一步描述)。
本发明的反义核酸分子一般对受试者施用,或者在原位产生,使其与编码标志蛋白的细胞mrna和/或基因组dna杂交或结合,从而抑制该标志的表达,例如通过抑制转录和/或翻译来实现。杂交可以利用常规核苷酸互补性来形成稳定的双链体,或者例如在结合dna双链体的反义核酸分子的情况中,通过双螺旋大沟中的特异性相互作用来实现。本发明反义核酸分子的给药途径的例子包括在组织部位直接注射,或者将反义核酸输注到卵巢相关体液中。或者,也可以为了靶向于选定的细胞而修饰反义核酸分子,然后全身给药。例如,为了全身给药,可以修饰反义分子,使其特异性结合在所选细胞表面表达的受体或抗原,例如,将反义核酸分子与结合细胞表面受体或抗原的肽或抗体相连接。也可以利用此处所述的载体将反义核酸分子导入细胞中。为了达到反义分子足够的细胞内浓度,优选反义核酸分子置于pol ii或pol iii强启动子控制下的载体构建体。
本发明的反义核酸分子可以是α-异头核酸分子。α-异头核酸分子与互补rna形成特定的双链杂合体,其中与通常的α-单元不同,两条链彼此平行(gaultier et al.,1987,nucleic acids res.156625-6641)。反义核酸分子也可以包含2′-o-甲基核糖核苷酸(inoue et al.,1987,nucleic acids res.156131-6148)或嵌合rna-dna类似物(inoueet al.,1987,febs lett.215327-330)。
本发明也包括核酶。核酶是具有核糖核酸酶活性的催化性rna分子,它能够切割与其具有互补区的单链核酸,如mrna。因此,核酶(例如haselhoff和gerlach,1988,nature 334585-591所述的锤头状核酶)能够用于催化性切割mrna转录物,从而抑制mrna编码的蛋白质的翻译。对编码标志蛋白的核酸分子具有特异性的核酶可以根据对应于该标志的cdna的核苷酸序列来设计。例如,可以构建四膜虫属(tetrahymena)l-19 ivs rna的衍生物,其中活性部位的核苷酸序列与将要切割的核苷酸序列互补(参见cech et al.美国专利no.4,987,071;和cech et al.美国专利no.5,116,742)。或者,能够利用编码本发明多肽的mrna从rna分子库中选择具有特异性核糖核酸酶活性的催化性rna(参见,例如bartel和szostak,1993,science2611411-1418)。
本发明也包括形成三股螺旋结构的核酸分子。例如,靶向与编码标志核酸或蛋白的基因的调节区(例如启动子和/或增强子)互补的核苷酸序列,形成阻止基因在靶细胞中转录的三股螺旋结构,能够抑制本发明标志的表达。一般地参见helene(1991)anticancer drug des.6(6)569-84;helene(1992)ann.n.y.acad.sci.66027-36;和maher(1992)bioassays 14(12)807-15。
在不同的实施方案中,可以在碱基部分、糖部分或磷酸骨架上修饰本发明的核酸分子,以提高例如分子的稳定性、杂交或溶解性。例如,可以修饰核酸的脱氧核糖磷酸骨架,产生肽核酸(参见hyrup etal.,1996,bioorganic & medicinal chemistry 4(1)5-23)。本文使用的术语“肽核酸”或“pna”是指脱氧核糖磷酸骨架被假肽骨架所取代并且只保留了4种天然核碱基的核酸模拟物,例如dna模拟物。已经证实,pna的中性骨架允许dna和rna在低离子强度条件下特异性杂交。pna寡聚体的合成可以利用hyrup et al.(1996),同上;perry-o′keefe et al.(1996)proc.natl.acad.sci.usa 9314670-675所述的标准固相肽合成方案进行。
pna可用于治疗和诊断用途。例如,pna可以作为反义试剂或抗基因剂用于序列特异性地调节基因表达,例如通过诱导转录或翻译停滞或抑制复制。pna也可以用于例如基因中单碱基对突变的分析,例如通过pna引导的pcr锁止技术(pcr clamping);在与其他酶例如s1核酸酶联合使用时作为人工限制性内切酶(hyrup(1996),同上);或者作为dna序列和杂交的探针或引物(hyrup,1996,同上;perry-o′keefe et al.,1996,proc.natl.acad.sci.usa 9314670-675)。
在另一实施方案中,可以修饰pna,例如提高其稳定性或细胞摄取,修饰方法包括将亲脂性或其他辅助基团与pna连接,形成pna-dna嵌合体,或者使用脂质体或本领域公知的其他给药技术。例如,可以生成pna-dna嵌合体,该嵌合体能够结合pna和dna的有利特性。该嵌合体允许dna识别酶,例如rnase h和dna聚合酶,与dna部分相互作用,而pna部分提供高结合亲和力和特异性。pna-dna嵌合体可以用根据碱基堆积、核碱基间键的数量和方向选择的适当长度的接头连接(hyrup,1996,同上)。pna-dna嵌合体的合成可以如hyrup(1996),同上,和finn et al.(1996)nucleic acidsres.24(17)3357-63所述进行。例如,可以利用标准亚磷酰胺偶合化学法和修饰核苷类似物在固体支持体上合成dna链。化合物,如5′-(4-甲氧三苯甲基)氨基-5′-脱氧-胸苷亚磷酰胺,可以用作pna与dna5′末端之间的连接物(mag et al.,1989,nucleic acids res.175973-88)。pna单体然后以逐步的方式偶合,产生具有5′pna片段和3′dna片段的嵌合分子(finn et al.,1996,nucleic acids res.24(17)3357-63)。或者,也可以合成具有5′dna片段和3′pna片段的嵌合分子(peterseret al.,1975,bioorganic med.chem.lett.51119-11124)。
在其他实施方案中,寡核苷酸可以包括其他附加基团,例如肽(例如用于靶向体内宿主细胞受体),或有利于穿过细胞膜(参见,例如letsinger et al.,1989,proc.natl.acad.sci.usa 866553-6556;lemaitre et al.,1987,proc.natl.acad.sci.usa 84648-652;pct公布号wo 88/09810)或血脑屏障(参见,例如pct公布号wo 89/10134)转运的试剂。另外,寡核苷酸也可以用杂交触发的切割剂(参见,例如krol et al.,1988,bio/techniques 6958-976)或嵌入剂(参见,例如zon,1988,pharm.res.5539-549)修饰。为此,寡核苷酸可以偶联到另一分子,例如肽、杂交触发的交联剂、转运载体、杂交触发的切割剂等。
本发明也包括分子信标核酸,其具有至少一个与本发明的核酸互补的区,因此该分子信标可用于定量本发明的核酸在标本中的存在。“分子信标”核酸是包含一对互补区并且结合有荧光团和荧光猝灭剂的核酸。荧光团和猝灭剂与核酸的不同部分结合,其方向为,当互补区彼此退火时,荧光团的荧光被猝灭剂猝灭。当核酸的互补区彼此不退火时,荧光团的荧光猝灭程度较低。分子信标核酸例如在美国专利5,876,930中记载。
分离的蛋白质和抗体本发明一个方面涉及分离的标志蛋白及其生物活性部分,以及适于作为免疫原来产生针对标志蛋白或其片段的抗体的多肽片段。在一个实施方案中,天然标志蛋白可以采用标准蛋白质纯化技术按照适当纯化方案从细胞或组织来源中分离。在另一实施方案中,含有标志蛋白全部或片段的蛋白质或肽通过重组dna技术产生。作为重组表达的替代方法,该蛋白质或肽可以采用标准肽合成技术化学合成。
“分离的”或“纯化的”蛋白质或其生物活性部分基本不含来自衍生该蛋白质的细胞或组织来源的细胞材料或其他污染蛋白质,或者在化学合成时基本不含化学前体或其他化学物质。短语“基本不含细胞材料”指蛋白质制品中该蛋白质与分离或重组产生该蛋白质的来源细胞的细胞成分相分离。因此,基本不含细胞材料的蛋白质包括含有少于约30%、20%、10%或5%(干重)异源蛋白质(在此也称为“污染蛋白质”)的蛋白质制品。当蛋白质或其生物活性部分重组产生时,也优选基本不含培养基,即培养基占蛋白质制品体积的不到约20%、10%或5%。当蛋白质通过化学合成产生时,优选基本不含化学前体或其他化学物质,即与化学前体或蛋白质合成相关的其他化学物质分离。因此,这些蛋白质制品含有低于约30%、20%、10%、5%(干重)的化学前体或目标多肽以外的化合物。
标志蛋白的生物活性部分包括含有与该标志蛋白氨基酸序列有足够的同一性或来源于该标志蛋白氨基酸序列的氨基酸序列的多肽,其包含比全长蛋白质更少的氨基酸,并且具有相应全长蛋白质的至少一种活性。一般地,生物活性部分包含具有相应全长蛋白质的至少一种活性的结构域或基序。本发明标志蛋白的生物活性部分可以是长度为例如10、25、50、100个或更多氨基酸的多肽。而且,其他生物活性部分,其中标志蛋白的其他区缺失,可以利用重组技术制备,并且针对标志蛋白天然形式的一种或多种功能活性进行评价。
优选的标志蛋白由包含表1所列序列的核苷酸序列编码。其他有用的蛋白质与这些序列之一具有实质的同一性(例如至少约40%,优选50%、60%、70%、80%、90%、95%或99%相同),并且保留天然存在的相应标志蛋白的功能活性,然而由于天然等位基因变异或诱变其在氨基酸序列上不同。
为了测定两种氨基酸序列或两种核酸的百分同一性,将序列进行比对以便进行最佳比较(例如,为了与第二氨基酸或核酸序列进行最佳比对,可以在第一氨基酸或核酸序列中引入缺口)。然后比较相应氨基酸位点或核苷酸位点处的氨基酸残基或核苷酸。当第一序列中的一个位点被与第二序列中相应位点处相同的氨基酸残基或核苷酸占据时,该分子在该位点处相同。两种序列之间的百分同一性是序列共有的相同位点数的函数(即%同一性=相同位点数/位点(例如重叠位点)总数×100)。在一个实施方案中,两个序列长度相同。
两个序列之间百分同一性的确定可以用数学算法实现。用于比较两个序列的数学算法的一个优选的非限制性例子是karlin和altschul(1990)proc.natl.acad.sci.usa 872264-2268的算法,karlin和altschul(1993)proc.natl.acad.sci.usa 905873-5877对其进行了改良。该算法并入altschul,et al.(1990)j.mol.biol.215403-410的blastn和blastx程序中。blast核苷酸检索可以用blastn程序进行,得分=100,字长=12,获得与本发明的核酸分子同源的核苷酸序列。blast蛋白质检索可以用blastp程序进行,得分=50,字长=3,获得与本发明的蛋白质分子同源的氨基酸序列。为了获得有缺口的比对以进行比较,可以如altschul et al.(1997)nucleicacids res.253389-3402所述使用较新版本的blast算法,称为缺口blast,它能够进行缺口局部比对,用于blastn、blastp和blastx程序。或者,也能够利用psi-blast进行迭代检索,检测分子之间的远缘关系。当使用blast、缺口blast和psi-blast程序时,可以使用相应程序(例如blastx和blastn)的缺省参数。用于序列比较的数学算法的另一优选的非限制性例子是myers和miller,(1988)cabios 411-17的算法。该算法被并入align程序(版本2.0)中,该程序是gcg序列比对软件包的一部分。当使用align程序比较氨基酸序列时,可以使用pam120重量残基表、空位长度罚分为12、空位罚分为4。用于鉴定局部序列相似性区和进行比对的另一种有用的算法是如pearson和lipman(1988)proc.natl.acad.sci.usa852444-2448所述的fasta算法。当使用fasta算法比较核苷酸或氨基酸序列时,pam120重量残基表例如可以使用k-元组值为2。
两个序列之间的百分同一性可以用与以上所述类似、允许或不允许空位的技术来测定。在计算百分同一性时,只计数准确的匹配。
本发明也提供包含标志蛋白或其片段的嵌合或融合蛋白。本文使用的“嵌合蛋白”或“融合蛋白”包含与异源多肽(即标志蛋白以外的多肽)可操作连接的标志蛋白的全部或部分(优选生物活性部分)。用于融合蛋白时,术语“可操作连接”是指标志蛋白或其片段和异源多肽彼此在阅读框内融合。异源多肽可以与标志蛋白或片段的氨基端或羧基端融合。
一种有用的融合蛋白是gst融合蛋白,其中标志蛋白或片段与gst序列的羧基端融合。该融合蛋白可能有利于本发明的重组多肽的纯化。
在另一实施方案中,融合蛋白在其氨基端含有异源信号序列。例如,标志蛋白的天然信号序列可以除去以及置换为来自另一种蛋白质的信号序列。例如,杆状病毒包膜蛋白的gp67分泌序列可以用作异源信号序列(ausubel et al.,ed.,current protocols in molecular biology,john wiley & sons,ny,1992)。真核生物异源信号序列的其他例子包括蜂毒肽和人胎盘碱性磷酸酶的分泌序列(stratagene;la jolla,california)。在另一个例子中,有用的原核生物异源信号序列包括phoa分泌信号(sambrook et al.,同上)和蛋白a分泌信号(pharmaciabiotech;piscataway,new jersey)。
在另一实施方案中,融合蛋白是免疫球蛋白融合蛋白,其中标志蛋白的全部或一部分与来源于该免疫球蛋白家族成员的序列融合。本发明的免疫球蛋白融合蛋白可以加入到药物组合物中,对受试者施用,来抑制配体(可溶性的或膜结合的)与细胞表面上蛋白质(受体)之间的相互作用,从而抑制体内信号转导。免疫球蛋白融合蛋白可以用来影响标志蛋白关连配体的生物利用度。配体/受体相互作用的抑制可能在治疗上有用,既可用于治疗增生性和分化性疾病,又可用于调节(例如促进或抑制)细胞存活率。而且,本发明的免疫球蛋白融合蛋白能够作为免疫原用于在受试者中产生抗标志蛋白的抗体,纯化配体,以及在筛选试验中用来鉴定抑制标志蛋白与配体相互作用的分子。
本发明的嵌合蛋白和融合蛋白可以通过标准重组dna技术制备。在另一实施方案中,融合基因可以利用常规技术合成,包括使用自动dna合成仪。或者,可以用锚引物进行基因片段的pcr扩增,该引物在两个连续基因片段之间产生互补的突出部分(overhang),之后可以退火并再次扩增,产生嵌合基因序列(参见,例如ausubelet al.,同上)。另外,许多表达载体在商业上可以获得,它们已经编码融合部分(例如gst多肽)。可以将编码本发明多肽的核酸克隆到这种表达载体中,使融合部分与本发明的多肽在阅读框内连接。
可以利用信号序列促进标志蛋白的分泌和分离。信号序列的特征一般在于疏水性氨基酸的核心,通常在一个或多个切割事件中在分泌过程中从成熟蛋白上切下。该信号肽含有加工位点,该加工位点允许在其通过分泌途径时从成熟蛋白上切下信号序列。因此,本发明涉及具有信号序列的标志蛋白、融合蛋白或其片段,以及已经蛋白水解切割下信号序列的蛋白质(即切割产物)。在一个实施方案中,编码信号序列的核酸序列可以在表达载体中与目标蛋白质如标记蛋白或其片段可操作地连接。信号序列引导蛋白质的分泌,如从表达载体转化的原核宿主中分泌,信号序列后来或者同时被切下。然后可以通过本领域公知的方法容易地从胞外基质中纯化该蛋白质。或者,可以利用有利于纯化的序列,如利用gst域,将信号序列与目标蛋白质连接。
本发明也涉及标志蛋白的变体。该变体具有改变的氨基酸序列,其可以作为激动剂(模拟)或拮抗剂。变体可以通过诱变例如不连续点突变或截短而产生。激动剂可保留与天然存在的蛋白质形式基本相同的生物活性,或其一部分活性。蛋白质的拮抗剂能够抑制该蛋白质天然存在形式的一种或多种活性,例如通过竞争性结合到包括目标蛋白质的细胞信号级联的下游或上游成员上产生这种抑制。因此,用有限功能的变体处理能够引发特定的生物效应。用具有该蛋白质天然存在形式的一部分生物活性的变体处理受试者可能比用该蛋白质天然存在形式处理在受试者中产生较少的副作用。
作为激动剂(模拟)或拮抗剂的标志蛋白的变体可以通过对激动剂或拮抗剂活性筛查本发明蛋白质的突变体例如截短突变体的组合文库来鉴定。在一个实施方案中,多样化(variegated)变体文库通过在核酸水平上组合诱变而产生,并且被多样化基因文库编码。例如,将合成寡核苷酸的混合物酶学连接到基因序列中,使一组简并的可能蛋白质序列表达为各种多肽,或者表达为一组较大的融合蛋白(例如用于噬菌体展示),能够产生多样化变体文库。有多种方法能够用于由简并寡核苷酸序列产生标志蛋白可能变体的文库。合成简并寡核苷酸的方法在本领域公知(参见,例如narang,1983,tetrahedron 393;itakura et al.,1984,annu.rev.biochem.53323;itakura et al.,1984,science 1981056;ike et al.,1983 nucleic acid res.11477)。
另外,可以利用标志蛋白片段文库产生一群多样化的多肽,用于筛选及随后选择变异标志蛋白或其片段。例如,编码序列片段文库可以如下产生在每个分子仅产生大约一个切口的条件下用核酸酶处理目标编码序列的双链pcr片段,变性该双链dna,将该dna复性,形成包括来自不同切口产物的有义/反义对的双链dna,通过s1核酸酶处理从重新形成的双链体中除去单链部分,将产生的片段文库连接到表达载体中。利用该方法能够产生表达文库,其编码目标蛋白质的不同大小的氨基末端和内部片段。
有几种技术在本领域公知用于筛查通过点突变或截短制备的组合文库的基因产物,以及用于筛查cdna文库以筛选具有选择的性质的基因产物。适合高通量分析、用于筛查大基因文库的最广泛应用的技术通常包括,将基因文库克隆到复制型表达载体中,用得到的载体文库转化合适的细胞,以及在一定条件下表达该组合基因,在该条件下对某活性的检测有利于分离编码所检测产物之基因的载体。递归系综诱变(rem)是一种提高文库中功能突变体频率的技术,可以与筛查试验联合应用,用来鉴定本发明的蛋白质的变体(arkin和yourvan,1992,proc.natl.acad.sci.usa 897811-7815;delgrave et al.,1993,proteinengineering 6(3)327-331)。
本发明的另一个方面涉及抗本发明蛋白质的抗体。在优选实施方案中,抗体特异性结合标志蛋白或其片段。本文使用的术语“抗体”是指免疫球蛋白分子及其片段和衍生物,其包含免疫球蛋白分子的免疫活性部分(即该部分含有抗原结合位点,该位点特异性结合抗原,如标志蛋白,例如标志蛋白质的表位)。特异性结合本发明蛋白质的抗体是与该蛋白质结合但是基本不与天然含有该蛋白质的样品例如生物样品中的其他分子结合的抗体。免疫球蛋白分子的免疫活性部分的例子包括但不限于单链抗体(scab)、f(ab)和f(ab′)2片段。
分离的本发明的蛋白质或其片段可以作为免疫原用于产生抗体。可以使用全长蛋白质,或者本发明提供抗原肽片段用作免疫原。本发明蛋白质的抗原肽包含本发明蛋白质之一的氨基酸序列的至少8个(优选10、15、20或30个或更多)氨基酸残基,并且包含至少一个该蛋白质的表位,从而抗该肽的抗体与该蛋白质形成特异性免疫复合物。抗原肽包含的优选表位是位于蛋白质表面上的区域,例如亲水区。疏水性序列分析,亲水性序列分析,或类似的分析,能够用来鉴定亲水区。在优选实施方案中,用分离的标志蛋白或其片段作为免疫原。
一般利用免疫原,通过免疫合适的(即免疫活性)受试者,如兔、山羊、小鼠或其他哺乳动物或脊椎动物,来制备抗体。合适的免疫原性制品可能包含,例如重组表达的或化学合成的蛋白质或肽。该制品可进一步包含佐剂,如弗氏完全或不完全佐剂,或类似的免疫刺激剂。优选的免疫原组合物不含其他人类蛋白质,例如利用用于重组表达本发明蛋白质的非人类宿主细胞制备的免疫原组合物。在这种情况下,产生的抗体组合物没有或者具有减少的本发明蛋白质以外的人类蛋白质的结合。
本发明提供多克隆和单克隆抗体。本文使用的术语“单克隆抗体”或“单克隆抗体组合物”是指一组抗体分子,其只含一种能够与特定表位免疫反应的抗原结合位点。优选的多克隆和单克隆抗体组合物是为筛选抗本发明蛋白质的抗体而获得的那些。特别优选的多克隆和单克隆抗体制剂是只含抗标志蛋白或其片段的抗体的那些。
多克隆抗体可以通过用本发明的蛋白质作为免疫原免疫合适的受试者来制备。免疫受试者中的抗体效价可以利用标准技术随时间变化监测,例如采用应用固定多肽的酶联免疫吸附测定(elisa)。在免疫后适当的时间,例如当特异性抗体效价最高时,可以从受试者中获得抗体产生细胞,并且用来通过标准技术制备单克隆抗体(mab),该标准技术例如最早由kohler和milstein(1975)nature256495-497描述的杂交瘤技术,人b细胞杂交瘤技术(参见kozbor et al.,1983,immunol. today 472),ebv-杂交瘤技术(参见cole et al.,pp.77-96 inmonoclonal antibodies and cancer therapy,alan r. liss,inc.,1985)或三源杂交瘤(trioma)技术。产生杂交瘤的技术众所周知(一般参见current protocols in immunology,coligan et al. ed.,john wiley & sons,new york,1994)。例如利用标准elisa试验,通过筛查杂交瘤培养上清液中结合目标多肽的抗体,检测产生本发明的单克隆抗体的杂交瘤细胞。
作为制备分泌单克隆抗体的杂交瘤的替代方法,也可以用目标多肽筛查重组组合免疫球蛋白文库(例如抗体噬菌体展示文库)来鉴定和分离抗本发明蛋白质的单克隆抗体。用于制备和筛查噬菌体展示文库的试剂盒在商业上可以获得(例如pharmacia重组噬菌体抗体系统,目录号27-9400-01;和stratagene surfzap噬菌体展示试剂盒,目录号240612)。另外,特别适用于制备和筛查抗体展示文库的方法和试剂的例子可见例如美国专利no.5,223,409;pct公布号wo 92/18619;pct公布号wo 91/17271;pct公布号wo 92/20791;pct公布号wo92/15679;pct公布号wo 93/01288;pct公布号wo 92/01047;pct公布号wo 92/09690;pct公布号wo 90/02809;fuchs et al.(1991)bio/technology 91370-1372;hay et al.(1992)hum.antibod.hybridomas 381-85;huse et al.(1989)science 2461275-1281;griffiths et al.(1993)embo j.12725-734。
本发明也提供特异性结合本发明蛋白质的重组抗体。在优选实施方案中,该重组抗体特异性结合标志蛋白或其片段。重组抗体包括但不限于包含人类和非人类部分的嵌合和人源化单克隆抗体,单链抗体和多特异性抗体。嵌合抗体是不同部分来源于不同动物种的分子,例如具有来源于鼠的可变区和人免疫球蛋白恒定区的分子。(参见,例如cabilly et al.,美国专利no.4,816,567;和boss et al.,美国专利no.4,816,397,其全文在此引作参考)。单链抗体具有抗原结合位点,并且由一种多肽组成。它们可以利用本领域公知的技术制备,例如利用ladner等人的美国专利no.4,946,778(其全文在此引作参考);bird etal.,(1988)science 242423-426;whitlow et al.,(1991)methods inenzymology 21-9;whitlow et al.,(1991)methods in enzymology 297-105;和huston et al.,(1991)methods in enzymology molecular designand modelingconcepts and applications 20346-88所述的方法制备。多特异性抗体是具有至少两个抗原结合位点的抗体分子,这些位点特异性结合不同的抗原。这类分子可以利用本领域公知的技术制备,例如利用segal的美国专利no.4,676,980(其全文在此引作参考);holliger et al.,(1993)proc.natl. acad.sci.usa 906444-6448;whitlowet al.,(1994)protein eng.71017-1026和美国专利no.6,121,424所述的方法制备。
人源化抗体是这样的抗体分子其来自非人类物种,具有一个或多个来自非人类物种的互补决定区(cdr)和来自人免疫球蛋白分子的框架区。(参见,例如queen,美国专利no.5,585,089,其全文在此引作参考)。人源化单克隆抗体可以利用本领域公知的重组dna技术制备,例如采用pct公布号wo 87/02671;欧洲专利申请184,187;欧洲专利申请171,496;欧洲专利申请173,494;pct公布号wo 86/01533;美国专利no.4,816,567;欧洲专利申请125,023;better et al.(1988)science 2401041-1043;liu et al.(1987)proc.natl.acad.sci.usa843439-3443;liu et al.(1987)j.immunol.1393521-3526;sun et al.(1987)proc.natl.acad. sci.usa 84214-218;nishimura et al.(1987)cancer res.47999-1005;wood et al.(1985)nature 314446-449;shawet al.(1988)j.natl.cancer inst.801553-1559);morrison(1985)science 2291202-1207;oi et al.(1986)bio/techniques 4214;美国专利5,225,539;jones et al.(1986)nature 321552-525;verhoeyan et al.(1988)science 2391534;和beidler et al.(1988)j.immunol.1414053-4060中所述的方法制备。
更特别地,人源化抗体例如可以周转基因小鼠产生,该转基因小鼠不能表达内源免疫球蛋白重链和轻链基因,但是能够表达人重链和轻链基因。用选定的抗原,例如对应于本发明标志的多肽的全部或一部分,按照正常方式免疫该转基因小鼠。抗该抗原的单克隆抗体可以用常规杂交瘤技术获得。转基因小鼠携带的人免疫球蛋白转基因在b细胞分化过程中重排,随后经历类转换和体细胞突变。因此,采用该技术,能够产生治疗上有用的igg、iga和ige抗体。关于这种制备人抗体的技术的综述,参见lonberg和huszar(1995)int.rev.immunol.1365-93。关于这种制备人抗体和人单克隆抗体的技术和制备该抗体的方案的详细记载,参见,例如美国专利5,625,126;美国专利5,633,425;美国专利5,569,825;美国专利5,661,016;和美国专利5,545,806。另外,诸如abgenix,inc.(freemont,ca)等公司能够利用与上述类似的技术提供抗选定抗原的人抗体。
识别选定表位的完全人抗体可以利用一种被称为“指导选择”的技术制备。在该方法中,利用选择的非人单克隆抗体,例如鼠抗体,指导选择识别同一表位的完全人抗体(jespers et al.,1994,bio/technology 12899-903)。
本发明的抗体可以在(例如从受试者血液或血清中)产生或合成后分离,并进一步用众所周知的技术纯化。例如,igg抗体可以利用蛋白a层析法纯化。本发明蛋白质的特异性抗体可以利用例如亲和层析法来选择或(例如部分纯化)或纯化。例如,重组表达并纯化的(或部分纯化的)本发明的蛋白质如此处所述制备,并且共价或非共价偶联到固体支持物,例如层析柱上。然后可以用该柱从含有抗大量不同表位的抗体的样品中亲和纯化本发明蛋白质的特异性抗体,从而产生基本纯化的抗体组合物,即基本不含污染抗体的组合物。基本纯化的抗体组合物在本文中是指抗体样品最多只含有30%(干重)抗本发明所需蛋白质表位之外的表位的污染抗体,该样品中优选最多20%,更优选最多10%,最优选最多5%(干重)是污染抗体。纯化的抗体组合物是指该组合物中至少99%的抗体是抗本发明所需蛋白质的抗体。
在一个优选实施方案中,基本纯化的本发明的抗体可以特异性结合本发明蛋白质的信号肽、分泌序列、胞外域、跨膜区或胞浆区或细胞质膜。在一个特别优选的实施方案中,基本纯化的本发明的抗体特异性结合本发明蛋白质的氨基酸序列的分泌序列或胞外域。在一个更优选的实施方案中,基本纯化的本发明的抗体特异性结合标志蛋白氨基酸序列的分泌序列或胞外域。
可以通过标准技术,例如亲和层析或沉淀法,利用抗本发明蛋白质的抗体分离该蛋白质。另外,也可以利用这种抗体检测(例如细胞裂解液或细胞上清液中的)标志蛋白或其片段,从而评价该标志的表达水平和模式。也可以在诊断上应用这些抗体监测组织或体液(例如卵巢有关的体液)中的蛋白质水平,作为临床检验程序的一部分,例如确定特定治疗方案的效果。利用包含偶联到可检测物质上的本发明抗体的抗体衍生物可有利于检测。可检测物质的例子包括各种酶、辅基、荧光物质、发光物质、生物发光物质和放射性物质。合适的酶的例子包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶;合适的辅基复合物的例子包括链亲和素/生物素和亲和素/生物素;合适的荧光物质的例子包括伞形酮、荧光素、异硫氰酸荧光素、罗丹明、二氯三嗪胺荧光素、丹磺酰氯或藻红蛋白;发光物质的例子包括鲁米诺;生物发光物质的例子包括萤光素酶、萤光素和水母蛋白;合适的放射性物质的例子包括125i、131i、35s或3h。
本发明的抗体也可以用作治疗癌症的治疗剂。在一个优选实施方案中,本发明的完全人类抗体用于治疗人类癌症患者,特别是卵巢癌患者。在另一优选实施方案中,能与标志蛋白或其片段特异性结合的抗体用于治疗。另外,这些治疗性抗体也可以是抗体衍生物或免疫毒素,其含有与治疗性部分如细胞毒素、治疗剂或放射性金属离子偶联的抗体。细胞毒素或细胞毒性剂包括对细胞有害的任何药剂。例子包括紫杉醇、松胞菌素b、短杆菌肽d、溴乙锭、依米丁、丝裂霉素、依托泊苷、tenoposide、长春新碱、长春碱、秋水仙素、阿霉素、柔红霉素、二羟基炭疽菌素二酮、米托蒽醌、光辉霉素、放线菌素d、1-去氢睾酮、糖皮质激素类、普鲁卡因、丁卡因、利多卡因、普萘洛尔和嘌呤霉素及其类似物或同源物。治疗剂包括但不限于抗代谢物(例如,氨甲喋呤、6-巯基嘌呤、6-硫代鸟嘌呤、阿糖胞苷、5-氟尿嘧啶甲氮咪胺)、烷化剂(例如,氮芥、三胺硫磷(thioepa)、苯丁酸氮芥、苯丙氨酸氮芥、卡莫司汀(bsnu)和洛莫司汀(ccnu)、环磷酰胺、白消安、二溴甘露醇、链脲霉素、丝裂霉素c和顺-二氯二胺铂(ii)(ddp)顺铂)、蒽环霉素类(例如柔红霉素(以前称为道诺霉素)和多柔比星)、抗生素(例如放线菌素d(以前称为放线菌素)、博来霉素、光辉霉素和安曲霉素(amc)),和抗有丝分裂剂(例如长春新碱和长春碱)。
本发明的偶联抗体可以用于修饰特定生物学应答,因为药物部分不限于经典化学治疗剂。例如,药物部分可以是具有需要的生物活性的蛋白质或多肽。这样的蛋白质可包括,例如毒素,如核糖体抑制蛋白(参见better等人的美国专利no.6,146,631,其公开内容在此全文引作参考)、相思豆毒蛋白、蓖麻毒蛋白a、假单胞菌外毒素或白喉毒素;蛋白质,如肿瘤坏死因子、α-干扰素、β-干扰素、神经生长因子、血小板衍生的生长因子、组织纤维蛋白溶酶原激活剂;或生物反应修饰剂,例如淋巴因子、白介素-1(″il-1″)、白介素-2(″il-2″)、白介素-6(″il-6″)、粒细胞巨噬细胞集落刺激因子(″gm-csf″)、粒细胞集落刺激因子(″g-csf″)或其他生长因子。
将治疗性部分与抗体进行偶联的技术众所周知,参见,例如arnon et al.,″monoclonal antibodies for immunotargeting of drugs incancer therapy″,in monoclonal antibodies and cancer therapy,reisfeld et al.(eds.),pp. 243-56(alan r.liss,inc.1985);hellstrom etal.,″antibodies for drug delivery″,in controlled drug delivery(2nded.),robinson et al.(eds.),pp.623-53(marcel dekker,inc.1987);thorpe,″antibody carriers of cytotoxic agents in cancer therapyareview″,in monoclonal antibodies′84biological and clinicalapplications,pinchera et al.(eds.),pp.475-506(1985);″analysis,results,and future prospective of the therapeutic use ofradiolabeled antibody in cancer therapy″,in monoclonal antibodiesfor cancer detection and therapy,baldwin et al.(eds.),pp.303-16(academic press 1985),和thorpe et al.,″the preparation andcytotoxic properties of antibody-toxin conjugates″,immunol.rev.,62119-58(1982)。
因此,在一个方面,本发明提供基本纯化的抗体、抗体片段和衍生物,它们全都特异性结合本发明的蛋白质,优选标志蛋白。在不同实施方案中,基本纯化的本发明的抗体或其片段或衍生物可以是人、非人、嵌合和/或人源化抗体。在另一个方面,本发明提供非人抗体、抗体片段和衍生物,它们全都特异性结合本发明的蛋白质,优选标志蛋白。这样的非人抗体可以是山羊、小鼠、绵羊、马、鸡、兔或大鼠抗体。或者,本发明的非人抗体可以是嵌合和/或人源化抗体。另外,本发明的非人抗体可以是多克隆抗体或单克隆抗体。在又另一个方面,本发明提供单克隆抗体、抗体片段和衍生物,它们全都特异性结合本发明的蛋白质,优选标志蛋白。单克隆抗体可以是人、人源化、嵌合和/或非人抗体。
本发明也提供一种试剂盒,其包括与可检测物质偶联的本发明的抗体,和使用说明。本发明的再一方面是一种药物组合物,其含有本发明的抗体和药物可接受的载体。在优选实施方案中,药物组合物含有本发明的抗体、治疗性部分和药物可接受的载体。
重组表达载体和宿主细胞本发明的另一方面涉及载体,优选表达载体,其含有编码标志蛋白(或该蛋白的一部分)的核酸。本文使用的术语“载体”是指能够转运与之连接的另一种核酸的核酸分子。一种类型的载体是“质粒”,它是指可以向其中连接其他dna片段的环状双链dna环。另一种类型的载体是病毒载体,其中其他dna片段可以连接到病毒基因组中。某些载体能够在引入它们的宿主细胞中自发复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在引入宿主细胞后整合到宿主细胞基因组中,从而与宿主基因组一起复制。而且,某些载体,即表达载体,能够引导与它们可操作连接的基因的表达。通常,在重组dna技术中使用的表达载体常常为质粒形式(载体)。但是,本发明预期包括行使同等功能的其他形式的表达载体,例如病毒载体(例如复制缺陷型逆转录病毒、腺病毒和腺伴随病毒)。
本发明的重组表达载体包含本发明的核酸,其形式适于在宿主细胞中表达该核酸。意思是重组表达载体包括一个或多个调节序列,该调节序列是根据用于表达的宿主细胞选择的,与将要表达的核酸序列可操作地连接。在重组表达载体内,“可操作地连接”是指目标核苷酸序列以允许该核苷酸序列表达的方式与调节序列连接(例如在体外转录/翻译系统中,或者当向宿主细胞中引入该载体时在宿主细胞中)。术语“调节序列”包括启动子、增强子和其他表达控制元件(例如聚腺苷酸化信号)。这些调节序列例如在goeddel,methods inenzymologygene expression techno1ogy vol.185,academic press,sandiego,ca(1991)中记载。调节序列包括引导核苷酸序列在多种类型宿主细胞中组成型表达的那些,和引导核苷酸序列只在特定宿主细胞中表达的那些(例如组织特异性调节序列)。本领域技术人员应当理解,表达载体的设计将取决于诸如将要转化的宿主细胞的选择、需要的蛋白质表达水平等因素。本发明的表达载体可以导入宿主细胞中,从而产生如本文所述的核酸编码的蛋白质或肽,包括融合蛋白或肽。
本发明的重组表达载体可以设计用于标志蛋白或其片段在原核(例如大肠杆菌)或真核细胞(例如昆虫细胞{利用杆状病毒表达载体}、酵母细胞或哺乳动物细胞)中表达。合适的宿主细胞进一步记载在goeddel,同上中。或者,重组表达载体也可以在体外转录和翻译,例如应用t7启动子调节序列和t7聚合酶。
蛋白质在原核生物中的表达最常使用含有引导融合或非融合蛋白表达的组成型或诱导型启动子的载体在大肠杆菌中进行。融合载体向本文所述编码的蛋白质中,通常向重组蛋白的氨基端添加许多氨基酸。该融合载体一般用于三个目的1)提高重组蛋白的表达;2)提高重组蛋白的可溶性;和3)通过在亲和纯化中作为配体来帮助重组蛋白的纯化。在融合表达载体中,通常在融合部分和重组蛋白的连接处引入一个蛋白水解切割位点,从而能够在融合蛋白纯化后将重组蛋白与融合部分分离。这样的酶,及其关连识别序列,包括因子xa、凝血酶和肠激酶。典型的融合表达载体包括pgex(pharmacia biotech inc;smith和johnson,1988,gene 6731-40)、pmal(new england biolabs,beverly,ma)和prit5(pharmacia,piscataway,nj),它们分别将谷胱甘肽s-转移酶(gst)、麦芽糖e结合蛋白或蛋白a与靶重组蛋白相融合。
合适的诱导型非融合大肠杆菌表达载体的例子包括ptrc(amannet al.,1988,gene 69301-315)和pet 11d(studier et al.,p.60-89,ingene expression technologymethods in enzymology vol.185,academicpress,san diego,ca,1991)。由ptrc载体表达靶基因依赖于从杂合trp-lac融合启动子开始的宿主rna聚合酶转录。由pet 11d载体表达靶基因依赖于由共表达的病毒rna聚合酶(t7 gnl)介导的从t7gn10-lac融合启动子开始的转录。该病毒聚合酶由宿主株bl21(de3)或hms174(de3)从驻留的原噬菌体提供,该原噬菌体携带处于lacuv 5启动子转录控制下的t7 gnl基因。
一种使重组蛋白在大肠杆菌中的表达最大化的策略是在蛋白水解该重组蛋白能力受损的宿主细菌中表达该蛋白质(gottesman,p.119-128,in gene expression technologymethods in enzymology vol.185,academic press,san diego,ca,1990)。另一种策略是改变将要插入到表达载体内的核酸的核酸序列,使每个氨基酸的各个密码子是大肠杆菌偏好的(wada et al.,1992,nucleic acids res.202111-2118)。本发明的核酸序列的这种改变可以采用标准dna合成技术进行。
在另一实施方案中,表达载体是酵母表达载体。用于在酿酒酵母(s.cerevisiae)中表达的载体的例子包括pyepsecl(baldari et al.,1987,embo j.6229-234)、pmfa(kurjan和herskowitz,1982,cell30933-943)、pjry88(schultz et al.,1987,gene 54113-123)、pyes2(invitrogen corporation,san diego,ca)和ppicz(invitrogen corp,sandiego,ca)。
或者,表达载体是杆状病毒表达载体。可以获得的用于在培养的昆虫细胞(例如sf9细胞)中表达蛋白质的杆状病毒载体包括pac系列(smith et al.,1983,mol.cell biol.32156-2165)和pvl系列(lucklow和summers,1989,virology 17031-39)。
在另一实施方案中,使用哺乳动物表达载体在哺乳动物细胞中表达本发明的核酸。哺乳动物表达载体的例子包括pcdm8(seed,1987,nature 329840)和pmt2pc(kaufman et al.,1987,embo j.6187-195)。当在哺乳动物细胞中使用时,表达载体的控制功能通常由病毒调节元件提供。例如,常用的启动子来源于多瘤、腺病毒2、巨细胞病毒和猿猴病毒40。关于适用于原核和真核细胞的其他表达系统,见sambrook et al.,同上的第16、17章。
在另一实施方案中,重组哺乳动物表达载体能够引导核酸优先在特定细胞型中表达(例如利用组织特异性调节元件表达核酸)。组织特异性调节元件在本领域中公知。合适的组织特异性启动子的例子包括但不限于白蛋白启动子(肝特异性的;pinkert et al.,1987,genes dev.1268-277),淋巴特异性启动子(calame和eaton,1988,adv.immunol.43235-275),特别是t细胞受体(winoto和baltimore,1989,embo j.8729-733)和免疫球蛋白(banerji et al.,1983,cell 33729-740;queen和baltimore,1983,cell 33741-748)的启动子,神经元特异性启动子(例如神经丝启动子;byrne和ruddle,1989,proc.natl.acad.sci.usa 865473-5477),胰特异性启动子(edlund et al.,1985,science230912-916),和乳腺特异性启动子(例如乳清启动子;美国专利no.4,873,316和欧洲申请公布号264,166)。也包括发育调节的启动子,例如鼠hox启动子(kessel和gruss,1990,science 249374-379)和甲胎蛋白启动子(camper和tilghman,1989,genes dev.3537-546)。
本发明还提供一种重组表达载体,其包含以反义方向克隆到该表达载体内的本发明的dna分子。即,该dna分子与调节序列可操作地连接,其连接方式允许相对于编码本发明多肽的mrna反义的rna分子表达(通过dna分子的转录)。可以选择以反义方向与克隆的核酸可操作连接的调节序列,其引导反义rna分子在多种细胞型中的连续表达,例如病毒启动子和/或增强子,或者可以选择引导反义rna的组成型、组织特异性或细胞型特异性表达的调节序列。反义表达载体可以是重组质粒、噬菌粒或减毒病毒的形式,其中反义核酸在高效调节区控制下产生,其活性取决于导入该载体的细胞型。关于使用反义基因调节基因表达的讨论,参见weintraub et al.,1986,trends in genetics,vol.1(1)。
本发明另一方面涉及已经导入本发明的重组表达载体的宿主细胞。术语“宿主细胞”和“重组宿主细胞”在此可交换使用。应当理解,这些术语不仅指特定受试细胞,而且指该细胞的后代或可能的后代。由于突变或环境影响在连续几代中可能发生某些变化,因此这些后代实际上可能与母细胞不同,但是仍然包括在本文所用术语的范围内。
宿主细胞可以是任何原核(例如大肠杆菌)或真核细胞(例如昆虫细胞、酵母或哺乳动物细胞)。
可以通过常规转化或转染技术将载体dna导入原核或真核细胞中。本文使用的术语“转化”和“转染”是指本领域公知的向宿主细胞中引入外源核酸的多种技术,包括磷酸钙或氯化钙共沉淀、deae-葡聚糖-介导的转染、脂转染或电穿孔。适于转化或转染宿主细胞的方法可见sambrook,et al.(同上)和其他实验室手册所述。
对于哺乳动物细胞的稳定转染,众所周知,根据使用的表达载体和转染技术,只有少部分细胞可以将外源dna整合到其基因组中。为了鉴定和选择这些整合体,通常与目标基因一起向宿主细胞中引入编码选择性标记(例如抗生素抗性)的基因。优选的选择性标记包括提供药物抗性,例如g418、 潮霉素和氨甲喋呤抗性的标记。用引入的核酸稳定转染的细胞可以通过药物筛选来鉴定(例如,引入选择性标志基因的细胞将存活,而其他细胞将死亡)。
本发明的宿主细胞,如培养的原核或真核宿主细胞,可以用来产生标志蛋白或其片段。因此,本发明进一步提供利用本发明的宿主细胞产生标志蛋白或其片段的方法。在一个实施方案中,该方法包括在适当的培养基中培养本发明的宿主细胞(其中已经引入了编码标志蛋白或其片段的重组表达载体),从而使其产生。在另一实施方案中,该方法进一步包括从培养基或宿主细胞中分离该标志蛋白或其片段。
也可以利用本发明的宿主细胞产生非人转基因动物。例如,在一个实施方案中,本发明的宿主细胞是已经引入编码标志蛋白或其片段的序列的受精卵母细胞或胚胎干细胞。然后可以用该宿主细胞产生已经向其基因组中导入编码本发明标志蛋白的外源序列的非人转基因动物,或编码标志蛋白的内源基因已经改变的同源重组动物。这些动物可用于研究该标志蛋白的功能和/或活性,以及鉴定和/或评价该标志蛋白的调节剂。本文使用的“转基因动物”是非人动物,优选哺乳动物,更优选啮齿类动物,如大鼠或小鼠,其中该动物的一个或多个细胞包含转基因。转基因动物的其他例子包括非人灵长类动物、绵羊、狗、牛、山羊、鸡、两栖动物等。转基因是整合到细胞基因组内的外源dna,由该细胞发展为转基因动物,并且该转基因保留在成熟动物基因组内,从而引导编码的基因产物在该转基因动物的一种或多种细胞型或组织中表达。本文使用的“同源重组动物”是非人类动物,优选哺乳动物,更优选小鼠,其中在发育为动物之前,通过内源基因与引入动物细胞例如动物胚胎细胞内的外源dna分子之间的同源重组,该内源基因已经改变。
本发明的转基因动物可以如下产生例如通过显微注射、逆转录病毒转染,以及使卵母细胞在假孕雌性代孕动物中发育,将编码标志蛋白的核酸导入受精卵母细胞的雄性原核内。内含子序列和聚腺苷酸化信号也可以包含在转基因中来提高转基因的表达效率。组织特异性调节序列可以与转基因可操作连接,以使本发明多肽的表达针对特定细胞。通过胚胎操作和显微注射产生转基因动物,特别是如小鼠等动物的方法在本领域中已经成为常规,例如在美国专利no.4,736,866和4,870,009,美国专利no.4,873,191和hogan,manipulating the mouseembryo,cold spring harbor laboratory press,cold spring harbor,n.y.,1986中描述。类似的方法用于其他转基因动物的产生。转基因起始(founder)动物可以根据转基因在其基因组中的存在和/或编码转基因的mrna在动物组织或细胞中的表达来鉴定。然后可以用转基因起始动物繁殖携带该转基因的其他动物。另外,携带该转基因的转基因动物可以进一步与携带其他转基因的其他转基因动物繁殖。
为了产生同源重组动物,制备一种载体,该载体含有编码标志蛋白的基因的至少一部分,该部分中已经引入了缺失、添加或置换,从而改变-例如功能破坏-了该基因。在一个优选实施方案中,该载体设计为内源基因在同源重组后被功能破坏(即不再编码功能蛋白质;也被称为“敲除”载体)。或者,该载体也可以设计为内源基因在同源重组后突变或者以其他方式改变,但是仍然编码功能蛋白质(例如可以改变上游调节区,从而改变内源蛋白质的表达)。在该同源重组载体中,改变的基因部分在5′端和3′端之侧为该基因的其他核酸,允许在该载体携带的外源基因与胚胎干细胞中的内源基因之间发生同源重组。其他侧翼核酸序列的长度足以成功地与内源基因同源重组。载体中一般包含几千个碱基的侧翼dna(在5′端和3′端)(关于同源重组载体的描述,参见,例如,thomas和capecchi,1987,cell 51503)。将该载体导入胚胎干细胞系中(例如通过电穿孔),选择导入基因已经与内源基因同源重组的细胞(参见,例如li et al.,1992,cell 69915)。然后将选择的细胞注射到动物(例如小鼠)的胚囊中,形成聚集嵌合体(参见,例如bradley,teratocarcinomas and embryonic stem cellsapractical approach,robertson,ed.,irl,oxford,1987,pp.113-152)。然后可以将嵌合胚植入合适的假孕雌性代孕动物中,使胚胎发育。在生殖细胞中携带同源重组dna的后代可以用来繁殖动物,其中通过转基因的种系传递,动物的所有细胞都含有同源重组dna。构建同源重组载体和同源重组动物的方法在bradley(1991)current opinionin bio/technology 2823-829和pct公布号wo 90/11354、wo91/01140、wo 92/0968和wo 93/04169中记载。
在另一实施方案中,可以产生转基因非人动物,其含有选择的允许转基因调节表达的系统。该系统的一个例子是噬菌体p1的cre/loxp重组酶系统。关于cre/loxp重组酶系统的描述,参见,例如lakso etal.(1992)proc.natl.acad.sci.usa 896232-6236。重组酶系统的另一个例子是酿酒酵母flp重组酶系统(o′gorman et al.,1991,science2511351-1355)。如果利用cre/loxp重组酶系统调节转基因的表达,需要含有编码cre重组酶和选定蛋白质的两种转基因的动物。可以通过构建“双”转基因动物提供这样的动物,例如使两个转基因动物交配,其中一个含有编码选定蛋白质的转基因,另一个含有编码重组酶的转基因。
本文所述的非人转基因动物的克隆也可以按照wilmut et al.(1997)nature 385810-813和pct公布号wo 97/07668和wo 97/07669所述的方法产生。
药物组合物本发明的核酸分子、多肽和抗体(在此也被称为“活性化合物”)可以掺入适于施用的药物组合物中。该组合物一般含有核酸分子、蛋白质或抗体和药物可接受的载体。本文使用的短语“药物可接受的载体”包括与给药相容的任何和所有溶剂、分散介质、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂,等等。这些介质和药剂用于药学活性物质的用途在本领域公知。除非任何常规介质或药剂与活性化合物不相容,它们可以用于本发明组合物中。也可以在组合物中掺入补充活性化合物。
本发明包括制备用于调节标志核酸或蛋白的表达或活性的药物组合物的方法。该方法包括将药学可接受的载体与调节标志核酸或蛋白的表达或活性的药剂进行配制。该组合物可进一步包含其他活性剂。因此,本发明进一步包括将药学可接受的载体与调节标志核酸或蛋白的表达或活性的药剂和一种或多种其他活性化合物进行配制而制备药物组合物的方法。
本发明也提供用于鉴定调节剂,即候选或试验化合物或药剂(例如肽、拟肽、类肽、小分子或其他药物)的方法(在此也称为“筛选试验”),要鉴定的调节剂(a)与标志结合,或者(b)对标志的活性具有调节(例如刺激或抑制)作用,或者更特别地,(c)对标志与一种或多种天然底物(例如肽、蛋白质、激素、辅因子或核酸)的相互作用具有调节作用,或者(d)对标志的表达具有调节作用。该试验一般包括标志与一种或多种测定成分的反应。其他成分可以是试验化合物本身,或试验化合物与标志的天然结合配偶体的组合。
本发明的试验化合物可以从任何可获得的来源中获得,包括天然和/或合成化合物的系统文库。试验化合物也可以利用本领域公知的组合文库方法中的任一手段获得,包括生物学文库,类肽文库(分子文库,该分子具有肽的功能,但是具有新的非肽骨架,其对酶降解有抗性,但是仍然具有生物活性;参见,例如,zuckermann et al.,1994,j.med.chem.372678-85);可空间定位的平行固相或溶液相文库;需要重叠合(deconvolution)的合成文库方法;“一珠一化合物”文库法;和采用亲和层析筛选的合成文库法。生物文库和类肽文库法仅限于肽库,而其他四种方法适于化合物的肽、非肽寡聚体或小分子文库(lam,1997,anticancer drug des.12145)。
用于分子文库合成的方法的例子在本领域中可见,例如dewittet al.(1993)proc.natl.acad.sci.us.a.906909;erb et al.(1994)proc.natl.acad.sci.usa 9111422;zuckermann et al.(1994).j.med.chem.372678;cho et al.(1993)science 2611303;carrell et al.(1994)angew.chem.int.ed.engl.332059;carell et al.(1994)angew.chem.int.ed.engl.332061;和gallop et al.(1994)j.med.chem.371233。
化合物文库可以存在于溶液中(例如houghten,1992,biotechniques 13412-421)或珠(lam,1991,nature 35482-84)、芯片(fodor,1993,nature 364555-556)、细菌和/或孢子(ladner,usp5,223,409)、质粒(cull et al,1992,proc natl acad sci usa 891865-1869)或噬菌体(scott和smith,1990,science 249386-390;deviin,1990,science 249404-406;cwirla et al,1990,proc.natl.acad.sci.876378-6382;felici,1991,j.mol.biol.222301-310;ladner,同上)上。
在一个实施方案中,本发明提供用于筛选候选或试验化合物的试验,该化合物是一种标志或其生物活性部分所编码的或对应于它的蛋白质的底物。在另一实施方案中,本发明提供用于筛选候选或试验化合物的试验,该化合物与一种标志或其生物活性部分所编码的或对应于它的蛋白质结合。确定试验化合物直接结合一种蛋白质的能力可以如下实现,例如,将该化合物与放射性同位素或酶标记偶联,使该化合物与标志的结合可以通过检测复合物中的标记标志化合物来测定。例如,化合物(例如标志底物)可以用125i、35s、14c或3h直接或间接标记,放射性同位素通过直接计数放射性发射或通过闪烁计数来检测。或者,测定成分可以用例如辣根过氧化物酶、碱性磷酸酶或萤光素酶进行酶标记,通过测定适当底物向产物的转化检测酶标记。
在另一实施方案中,本发明提供用于筛选候选或试验化合物的试验,该化合物调节标志的表达或标志或其生物活性部分所编码的或对应于它的蛋白质的活性。在所有的可能性中,该标志所编码的或对应于它的蛋白质能够在体内与一种或多种分子相互作用,这些分子例如但不限于肽、蛋白质、激素、辅因子和核酸。为进行讨论,这些细胞和细胞外分子在此被称为“结合配偶体”或标志“底物”。
为了有利于这种筛选,本发明的一个必要的实施方案是使用标志所编码的或对应于它的蛋白质鉴定蛋白质的天然体内结合配偶体。实现这一点可使用本领域技术人员公知的多种方法。一个例子是在双杂交试验或三杂交试验中使用标志蛋白作为“饵蛋白”(参见,例如,美国专利no.5,283,317;zervos et al,1993,cell 72223-232;madura et al,1993,j.biol.chem.26812046-12054;bartel et al,1993,biotechniques14920-924;iwabuchi et al,1993 oncogene 81693-1696;brentwo94/10300),用来鉴定与该标志结合或相互作用(结合配偶体)因此可能与该标志天然功能有关的其他蛋白质。该标志结合配偶体也可能通过标志蛋白或标志蛋白介导的信号传导途径的下游元件来参与信号的传送。此外也发现该标志蛋白结合配偶体是标志蛋白的抑制剂。
双杂交系统基于大多数转录因子的模块性质,由可分开的dna结合域和活化域组成。简而言之,该试验使用两种不同的dna构建体。在一种构建体中,编码标志蛋白的基因与编码已知转录因子(例如gal-4)的dna结合域的基因融合。在另一构建体中,来自dna序列文库的编码未确定蛋白质(“猎物”或“样品”)的dna序列与编码已知转录因子活化域的基因融合。如果“诱饵”和“猎物”蛋白能够在体内相互作用,形成依赖于标志的复合物,则该转录因子的dna结合域和活化域紧密接近。这种接近性允许与对转录因子具有反应性的转录调节位点可操作连接的报道基因(例如lacz)转录。报道基因的表达能够容易地检测,含有功能转录因子的细胞集落能够分离,并且用来获得编码与标志蛋白相互作用的蛋白质的克隆基因。
在另一实施方案中,可以利用本发明设计试验,用于鉴定调节(例如正或负影响)标志蛋白与其底物和/或结合配偶体之间相互作用的化合物。这样的化合物包括但不限于分子,如抗体、肽、激素、寡核苷酸、核酸及其类似物。这样的化合物也可以从任何可获得的来源获得,包括天然和/或合成化合物的系统文库。用于该实施方案的优选试验成分是此处鉴定的卵巢癌标志蛋白,其已知的结合配偶体和/或底物,和试验化合物。试验化合物可以来自任何来源。
用来鉴定干扰标志蛋白与其结合配偶体之间相互作用的化合物的试验系统的基本原则包括制备含有该标志蛋白及其结合配偶体的反应混合物,置于使两种产物相互作用和结合的条件及时间下,从而形成复合物。为了检测药剂的抑制活性,在存在及不存在试验化合物的情况下制备反应混合物。试验化合物可以在开始时即包含在反应混合物中,或者可以在添加标志蛋白及其配偶体之后添加。对照反应混合物在不含试验化合物的条件下或者与安慰剂一起孵育。然后检测标志蛋白及其配偶体之间任何复合物的形成。若在对照反应中形成复合物,但在含有试验化合物的反应混合物中不形成或者形成很少,则表明该化合物干扰标志蛋白与其结合配偶体的相互作用。相反,若在化合物存在下比在对照反应中形成更多复合物,则表明该化合物可增强标志蛋白与其结合配偶体的相互作用。
对干扰标志蛋白与其结合配偶体相互作用的化合物的测定可以以非均相或均相形式进行。非均相测定包括将标志蛋白或其结合配偶体锚定在固相上,在反应结束时检测锚定在固相上的复合物。在均相测定中,整个反应都在液相中进行。在每一种方法中,为了获得关于所测化合物的不同信息,反应物的添加顺序可以不同。例如,干扰标志蛋白与其结合配偶体的相互作用(例如通过竞争)的试验化合物可以如下鉴定在试验物质的存在下进行反应,即在标志及其反应性结合配偶体之前或同时将试验物质加入反应混合物中。或者,破坏形成的复合物的试验化合物,例如具有替换复合物中一种成分的较高结合常数的化合物,可以在形成复合物之后将试验化合物加入反应混合物中进行检测。各种形式在下面简述。
在一种非均相测定系统中,标志蛋白或其结合配偶体锚定于固相或基质上,而另一相应的非锚定成分可以直接或间接标记。在实际中,该方法通常使用微量滴定板。锚定的物质可以利用许多方法非共价或共价固定,这些方法一般是实施该技术的人员所公知的。非共价连接通常可以通过将固体表面上包被标志蛋白或其结合配偶体的溶液并且干燥而简单地实现。另外,对将要锚定的测定成分特异性的固定抗体也可以用于该目的。所述表面通常可以提前准备并贮存起来。
在相关实施方案中,可以提供增加了一个结构域的融合蛋白,该结构域允许一种或两种测定成分锚定在基质上。例如,谷胱甘肽-s-转移酶/标志融合蛋白或谷胱甘肽-s-转移酶/结合配偶体可以吸附到谷胱甘肽sepharose珠(sigma chemical,st.louis,mo)或谷胱甘肽衍化的微量滴定板上,然后与试验化合物混合,或者试验化合物和未吸附的标志或其结合配偶体,和混合物在有利于复合物形成的条件(例如生理条件)下孵育。孵育后,洗涤珠或微量滴定板孔,除去任何未结合的测定成分,固定的复合物直接或间接评估,例如如上所述。或者,复合物也可以从基质上解离下来,用标准技术测定标志的结合水平或活性。
在本发明的筛选试验中也可以使用用于将蛋白质固定在基质上的其他技术。例如,标志蛋白或标志蛋白结合配偶体可以利用生物素和链亲和素的偶联来固定。生物素化标志蛋白或靶分子可以利用本领域公知的技术(例如生物素化试剂盒,pierce chemicals,rockford,il)由生物素-nhs(n-羟基-琥珀酰亚胺)制备,并且固定在链亲和素包被的96孔板(pierce chemical)的孔中。在一些实施方案中,蛋白质固定的表面可以提前准备并贮存起来。
为了进行该试验,固定的测定成分的相应配偶体在含有或不含试验化合物的情况下暴露于包被表面。反应结束后,除去(例如通过洗涤)未反应的测定成分,而形成的任何复合物仍将固定在固体表面上。锚定在固体表面上的复合物的检测可以用多种方法完成。当未固定的成分预先标记时,检测到固定于表面上的标记则表明复合物形成。当未固定的成分未预先标记时,可以利用间接标记检测锚定在该表面上的复合物;例如,使用对开始时未固定物质特异性的标记抗体(该抗体可以直接标记或者利用例如标记的抗ig抗体间接标记)。根据反应成分的添加顺序,可以检测调节(抑制或增强)复合物形成或破坏形成的复合物的试验化合物。
在本发明的一个替代实施方案中,可以采用均相测定。这一般是同以上所述类似的反应,其在存在或不存在试验化合物的液相中进行。形成的复合物然后与未反应的成分分开,测定形成复合物的量。如非均相测定系统所述,向液相中添加反应物的顺序可以获得关于哪种试验化合物调节(抑制或增强)复合物形成以及哪种破坏形成的复合物的信息。
在这样的均相测定中,可以利用大量标准技术之一将反应产物与未反应的测定成分相分离,这些技术包括但不限于差速离心、层析法、电泳和免疫沉淀。在差速离心中,由于复合物根据其大小和密度不同而沉降平衡不同,通过一系列离心步骤,分子的复合物可以与未复合的分子分离(参见,例如rivas,g.和minton,a.p.,trends biochemsci 1993 aug;18(8)284-7)。也可以利用标准层析技术将复合的分子与未复合的分子分离。例如,凝胶过滤层析利用适当的凝胶过滤树脂以柱的形式根据大小分离分子,例如相对较大的复合物可以与相对较小的未复合的成分分离。类似地,可以利用复合物与未复合分子相比相对不同的电荷性质来差异分离该复合物与剩余的各种反应物,例如,使用离子交换层析树脂。这些树脂和层析技术是本领域技术人员公知的(参见,例如,heegaard,1998,j mol.recognit 11141-148;hage和tweed,1997,j.chromatogr.b.biomed.sci.appl.,699499-525)。也可以利用凝胶电泳分离复合分子与未结合的分子(参见,例如,ausubelet al(编),如current protocols in molecular biology,j.wiley & sons,new york.1999所述)。在该技术中,例如根据大小或电荷分离蛋白质或核酸复合物。为了在电泳过程中保持结合相互作用,通常优选不含还原剂的非变性凝胶,但是适合特定相互作用物的条件是本领域技术人员公知的。免疫沉淀法是用于从溶液中分离蛋白质-蛋白质复合物的另一种常用技术(参见,例如,ausubel et al(eds.),incurrentprotocols in molecular biology,j.wiley & sons,new york.1999)。在该技术中,通过将一种结合分子的特异性抗体与易于离心收集的聚合物珠相偶联,从溶液中沉淀与该抗体结合的所有蛋白质。从珠上释放结合的测定成分(通过特异性蛋白质水解或本领域周知的不干扰复合物中蛋白质-蛋白质相互作用的其他技术),进行第二个免疫沉淀步骤,这次使用相应不同相互作用的测定成分的特异性抗体。这样,只有形成的复合物保持连接到珠上。可以比较在存在及不存在试验化合物条件下复合物形成的不同,从而提供关于该化合物调节标志蛋白与其结合配偶体间相互作用的能力的信息。
本发明范围内也包括不需进一步样品处理即在均相或非均相测定系统中直接检测标志蛋白与其结合配偶体和/或试验化合物之间相互作用的方法。例如,可以采用荧光能量转移技术(参见,例如lakowicz等人的美国专利no.5,631,169;stavrianopoulos等人的美国专利no.4,868,103)。该技术通常包括在第一“供体”分子(例如标志或试验化合物)上添加荧光团标记,使其发射的荧光能量被第二“受体”分子(例如标志或试验化合物)上的荧光标记吸收,第二“受体”分子又由于吸收了能量而能够发荧光。或者,“供体”蛋白质分子可以只利用色氨酸残基的天然荧光能量。选择发出不同波长光的标记,使“受体”分子标记可以与“供体”分子标记区别开来。由于标记之间的能量转移效率与分子间距有关,因此能够估测分子之间的空间关系。在分子之间发生结合的情况中,试验中“受体”分子标记的荧光发射应当最大。fet结合事件可以通过本领域公知的标准荧光检测手段(例如使用荧光计)常规测定。增强或阻碍一种物质加入预先形成的复合物中的试验物质将导致产生不同于背景的信号。这样,可以用控制试验鉴定能调节标志与其结合配偶体之间相互作用的试验物质。
在另一实施方案中,用一种方法鉴定标志表达的调节剂,在该方法中,将细胞接触一种候选化合物,测定细胞中标志mrna或蛋白质的表达。将在该候选化合物存在下标志mrna或蛋白质的表达水平与不存在该候选化合物条件下标志mrna或蛋白质的表达水平进行比较。根据这种比较,该候选化合物可以鉴定为标志表达的调节剂。例如,当在该候选化合物存在下标志mrna或蛋白质的表达高于(统计学上显著高于)不存在该候选化合物的情况时,该候选化合物被鉴定为标志mrna或蛋白质表达的刺激剂。相反,当在该候选化合物存在下标志mrna或蛋白质的表达低于(统计学上显著低于)不存在该候选化合物的情况时,该候选化合物被鉴定为标志mrna或蛋白质表达的抑制剂。细胞中标志mrna或蛋白质的表达水平可以用本文所述的检测标志mrna或蛋白质的方法来测定。
在另一方面,本发明涉及两种或多种本文所述试验的组合。例如,可以利用基于细胞的试验或不含细胞的试验鉴定调节剂,而该调节剂调节标志蛋白活性的能力可以进一步在体内证实,例如在用于细胞转化和/或肿瘤发生的完整动物模型中证实。
本发明进一步涉及通过上述筛选试验鉴定的新药剂。因此,本发明范围内进一步包括在合适的动物模型中使用如本文所述鉴定的药剂。例如,如本文所述鉴定的药剂(例如标志调节剂,反义标志核酸分子,标志特异性抗体,或标志结合配偶体)可以用于动物模型中,用来确定该药剂治疗的效果、毒性或副作用。另外,如本文所述鉴定的药剂也可以在动物模型中用于确定该药剂的作用机理。另外,本发明涉及通过上述筛选试验鉴定的新药剂用于本文所述治疗的用途。
应当理解,小分子药物和蛋白质或多肽剂的适当剂量取决于医生、兽医或研究人员所知的许多因素。这些药剂的剂量因以下因素而不同,例如所治疗的受试者或样品的身份、大小和状况,进一步地,组合物施用途径,以及适用时,医生所希望的该药剂对本发明核酸或多肽的作用。小分子剂量的例子包括每千克受试者或样品体重毫克或微克的量(例如约每千克1微克至约每千克500毫克,约每千克100微克至约每千克5毫克,或者约每千克1微克至约每千克50微克)。蛋白质或多肽的剂量的例子包括每千克受试者或样品体重克、毫克或微克的量(例如约每千克1微克至约每千克5克,约每千克100微克至约每千克500毫克,或者约每千克1毫克至约每千克50毫克)。还应当理解,一种这样的药剂的适当剂量取决于该药剂调节表达或活性的能力。这种适当的剂量可以用此处所述的试验来确定。当对动物(例如人)施用一种或多种这样的药剂,以调节本发明的多肽或核酸的表达或活性时,医生、兽医或研究人员可以,例如,先开具相对低的剂量,然后再提高剂量,直到获得合适的应答。另外,应当理解,对于任何特定受试动物的特定剂量水平将取决于多种因素,包括所用特定药剂的活性,受试者的年龄、体重、一般健康情况、性别和饮食,给药时间,给药途径,排泄率,任何药物联用,以及要调节的表达或活性的程度。
本发明的药物组合物配制成与预期给药途径相适合的形式。给药途径的例子包括肠胃外给药,例如静脉、皮内、皮下、经口(例如吸入)、经皮(局部)、经粘膜和直肠给药。用于肠胃外、皮内或皮下施用的溶液或悬浮液可包括如下成分无菌稀释液,如注射用水、盐水溶液、非挥发油、聚乙二醇、甘油、丙二醇或其他合成溶剂;抗菌剂,如苯甲醇或对羟基苯甲酸甲酯;抗氧化剂,如抗坏血酸或亚硫酸氢钠;螯合剂,如乙二胺四乙酸;缓冲剂,如乙酸盐、柠檬酸盐或磷酸盐缓冲液,和用于调节张度的药剂,如氯化钠或葡萄糖。ph可以用酸或碱调节,如使用盐酸或氢氧化钠。肠胃外制剂可以包封在由玻璃或塑料制成的安瓿、一次性注射器或多剂量瓶中。
适合注射使用的药物组合物包括无菌水溶液(水溶性的)或分散液,和用于即时配制无菌注射溶液或分散液的无菌粉末。对于静脉给药,合适的载体包括生理盐水、抑菌水、聚氧乙烯蓖麻油(basf;parsippany,nj)或磷酸盐缓冲液(pbs)。在所有情况下,组合物必须是无菌的,并且应当是易于注射的流体。在生产和贮存条件下必须稳定,必须能够抵御微生物如细菌和真菌的污染作用。载体可以是溶剂或分散介质,其含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)及其适当的混合物。保持适当的流动性,例如,使用包衣如卵磷脂,对于分散液的情况保持需要的颗粒大小,和使用表面活性剂。微生物作用的防止可以用各种抗细菌剂和抗真菌剂实现,例如对羟苯甲酸酯、三氯叔丁醇、苯酚、抗坏血酸、硫柳汞等。在许多情况下,组合物中优选包含等渗剂,例如糖、多元醇,如甘露醇、山梨醇,或氯化钠。注射组合物的延时吸收可以通过在该组合物中包含延迟吸收的药剂例如单硬脂酸铝和明胶来实现。
无菌注射溶液可以如下制备将活性化合物(例如多肽或抗体)以所需的量加入适当的溶剂中,需要时加入以上列举的一种成分或成分组合,接下来过滤除菌。分散液通常如下制备将活性化合物掺入含有基本分散介质的无菌载体中,然后掺入选自以上列举的所需的其他成分。对于用于制备无菌注射溶液的无菌粉末,优选的制备方法是真空干燥和冷冻干燥,该方法由预先无菌过滤的溶液产生活性成分加需要的任何其他成分的粉末。
口服组合物通常包含惰性稀释剂或可食用载体。它们可以包封在明胶胶囊中或者压制成片剂。为了治疗性口服给药,活性化合物可以与赋形剂掺合,以片剂、糖锭或胶囊的形式使用。口服组合物也可以用一种用作漱口剂的液体载体制备,其中该液体载体中的化合物经口施用、漱口(swish)和吐出或吞咽。
可以包含药物相容的结合剂,和/或佐剂物质,作为组合物的一部分。片剂、丸剂、胶囊、糖锭等可以含有任何下列成分,或具有类似性质的化合物粘合剂,如微晶纤维素、西黄蓍胶或明胶;赋形剂,如淀粉或乳糖;崩解剂,如海藻酸、primogel或玉米淀粉;润滑剂,如硬脂酸镁或sterotes;助流剂,如二氧化硅胶体,甜味剂,如蔗糖或糖精;或调味剂,如薄荷、水杨酸甲酯或橙味调味剂。
为了吸入给药,化合物以喷雾剂的形式施用,该喷雾剂来自压力容器或含有适当的推进剂,例如气体,如二氧化碳的分液器或雾化器。
全身给药也可以通过经粘膜或经皮方式实现。为了经粘膜或经皮给药,在制剂中使用适合于所要渗透的障碍物的渗透剂。该渗透剂在本领域中公知,包括例如用于经粘膜给药的去污剂、胆汁盐和夫西地酸衍生物。经粘膜给药可以使用鼻腔喷剂或栓剂来实现。为了经皮给药,活性化合物配制成本领域公知的软膏、药膏、凝胶或乳膏。
该化合物也可以制备成用于直肠给药的栓剂(例如含有常规栓剂基质,如可可脂和其他甘油酯)或保留灌肠剂的形式。
在一个实施方案中,活性化合物用保护化合物免遭身体快速清除的载体制备,例如控释制剂,包括埋植剂和微囊给药系统。可以使用生物可降解的、生物相容的聚合物,例如乙烯乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚正酯和聚乳酸。制备这类制剂的方法对于本领域技术人员是显而易见的。这些材料也可以商业上从alza corporation和nova pharmaceuticals,inc.获得。脂质体悬浮液(包括向其中或其上掺入单克隆抗体的脂质体)也可以用作药物可接受的载体。它们可以按照本领域技术人员公知的方法制备,例如美国专利no.4,522,811所述。
特别有利的是以剂量单位形式配制口服或肠胃外组合物,以易于给药和剂量的均匀性。本文使用的剂量单位形式是指适于作为单一剂量用于所治疗的受试者的物理上分散的单位;每单位含有预定量的活性化合物,该预定量计算为与需要的药物载体相结合产生理想的疗效。本发明的剂量单位形式的规格直接取决于活性化合物的独特性质和所要达到的特定疗效,以及在制备用于个体治疗的活性化合物的技术中固有的限制。
对于抗体,优选剂量是0.1mg/kg至100mg/kg体重(通常10mg/kg至20mg/kg)。如果抗体在脑中起作用,50mg/kg至100mg/kg的剂量通常是合适的。部分人抗体和完全人抗体在人体内通常比其他抗体具有更长的半衰期。因此,较低的剂量和较低频率的给药常常是可能的。可以利用修饰如脂化来稳定抗体以及提高摄入和组织渗透(例如向卵巢上皮内渗透)。cruikshank et al.(1997)j.acquired immunedeficiency syndromes and human retrovirology 14193描述了一种脂化抗体的方法。
本发明也提供用于预防和/或治疗卵巢癌的疫苗组合物。本发明提供一种卵巢癌疫苗组合物,其中为了刺激针对卵巢癌的免疫应答,向受试者中引入表1中的标志蛋白或其组合。本发明也提供一种卵巢癌疫苗组合物,其中向受试者中引入表达表1所列标志或标志片段的基因表达构建体,从而使受试者中的转染细胞以高于正常的水平产生表1中标志所编码的蛋白质或蛋白质片段,并且引发免疫应答。
在一个实施方案中,提供一种卵巢癌疫苗并作为用于预防卵巢癌的免疫治疗剂使用。在另一实施方案中,提供一种卵巢癌疫苗并作为用于治疗卵巢癌的免疫治疗剂使用。
例如,一种由表1的标志蛋白组成的卵巢癌疫苗可以用于通过经多种途径例如皮内、皮下或肌肉内施用疫苗,预防和/或治疗受试者中的卵巢癌。另外,卵巢癌疫苗可以与佐剂和/或免疫调节剂一起施用,以加强疫苗的活性和受试者的应答。在一个实施方案中,适合持续或间歇释放的含有该疫苗的装置和/或组合物可以植入体内,或者局部应用,以便相对较慢地向体内释放该物质。为了产生在消除癌症上将会更有效的应答,卵巢癌疫苗可以与能够改变产生免疫应答类型的免疫调节化合物一起引入。
在另一实施方案中,通过注射到肌肉内,或者包衣到微粒上,以及使用设计为将颗粒高速射入皮肤内的装置,可以引入由表1中标志的表达构建体组成的卵巢癌疫苗。受试者的细胞于是表达表1的标志的蛋白质或蛋白质片段,并且诱导免疫应答。另外,为了产生在消除癌症上将会更有效的应答,卵巢癌疫苗可以与免疫调节分子如细胞因子的表达构建体一起引入,该免疫调节分子可以增强免疫应答或调节产生的免疫应答类型。
本发明的标志核酸分子也可以插入载体中,并且用作基因治疗载体。基因治疗载体可以通过例如静脉注射、局部给药(美国专利5,328,470)或立体定向注射(参见,例如,chen et al.,1994,proc.natl.acad.sci.usa 913054-3057)对受试者施用。基因治疗载体的药物制剂可包括在可接受稀释剂中的基因治疗载体,或者可包含包埋有基因输送载体的缓释基质。或者,当能够从重组细胞中完整产生整个基因输送载体,例如逆转录病毒载体时,该药物制剂可包含一种或多种产生该基因输送系统的细胞。
药物组合物可以与使用说明一起包含在容器、包装或分配器中。
预测医学本发明涉及预测医学领域,其中诊断试验、预后试验、药物基因组学和监测临床试验用于预后(预测)目的,从而预防性地处置个体。因此,本发明的一个方面涉及一种诊断试验,其用于测定一种或多种标志蛋白或核酸的表达水平,从而确定个体是否具有发展卵巢癌的危险。该试验可以用于预后或预测目的,从而在癌症发病之前预防性地处置个体。
本发明的另一个方面是在临床试验中监测药剂(例如用于抑制卵巢癌或治疗或预防其他任何疾病{即为了理解这种治疗可能具有的任何致卵巢癌作用}的药物或其他化合物)对本发明标志的表达或活性的影响。这些及其他药剂在以下部分中进一步详细描述。
a.诊断试验检测生物标本中是否存在标志蛋白或核酸的方法的一个例子包括从受试者中获得生物标本(例如卵巢相关体液),将生物标本接触能够检测多肽或核酸(例如mrna、基因组dna或cdna)的化合物或试剂。本发明的检测方法因此可以用于例如在体内及体外检测生物标本中的mrna、蛋白质、cdna或基因组dna。例如,用于检测mrna的体外技术包括酶联免疫吸附测定(elisa)、蛋白质印迹分析、免疫沉淀和免疫荧光法。用于检测基因组dna的体外技术包括southern杂交。此外,用于检测标志蛋白的体内技术包括向受试者中引入抗该蛋白质或其片段的标记抗体。例如,抗体可以用一种放射性标记进行标记,该标记在受试者中的存在和定位可以通过标准成像技术来检测。
这些诊断和预后试验的一个共同原则包括制备样品或反应混合物,其中可含有一种标志,和探针,在足以使标志和探针相互作用及结合的适当条件下和一定时间内,从而在反应混合物中形成能够取出和/或检测的复合物。这些试验可以用多种方式进行。
例如,一种进行这种测定的方法包括将标志或探针锚定在固相支持体上,其也被称为基质,并且在反应结束时检测锚定在固相上的靶标志/探针复合物。在这种方法的一个实施方案中,来自受试者的标本,将测定其中标志的存在和/或浓度,可以锚定在载体或固相支持体上。在另一实施方案中,相反的情况是可能的,其中探针可以锚定在固相上,来自受试者的标本可以作为未锚定的测定成分进行反应。
有多种已建立的方法用于将测定成分锚定在固相上。包括但不限于通过生物素和链亲和素偶联而固定的标志或探针分子。这些生物素化的测定成分可以利用本领域公知的方法(例如生物素化试剂盒,pierce chemicals,rockford,il)由生物素-nhs(n-羟基-琥珀酰亚胺)制备,并且固定在链亲和素包被的96孔板(pierce chemical)的孔中。在某些实施方案中,固定有测定成分的表面可以提前制备好并贮存起来。
用于这些试验的其他合适的载体或固相支持体包括能够结合标志或探针所属分子类别的任何材料。众所周知的支持体或载体包括但不限于玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、天然及改性纤维素、聚丙烯酰胺、辉长岩和磁铁矿石。
为了用上述方法进行试验,将未固定的成分加到上面锚定了第二成分的固相上。反应结束后,可以在形成的任何复合物将保持固定在固相上的条件下除去(例如洗涤)未复合的成分。锚定在固相上的标志/探针复合物的检测可以用本文所述的许多方法进行。
在一个优选实施方案中,当探针是未锚定的测定成分时,可以为试验的检测和读数目的而用本文所述的及本领域技术人员公知的可检测标记直接或间接标记该探针。
也可以直接检测标志/探针复合物的形成,而无需进一步操作或标记每种成分(标志或探针),例如,利用荧光能量转移技术(参见,例如,lakowicz等人的美国专利no.5,631,169;stavrianopoulos等人的美国专利no.4,868,103)。选择第一“供体”分子上的荧光团标记,使其在用适当波长的入射光激发后,发射的荧光能量将被第二“受体”分子上的荧光标记吸收,第二“受体”分子由于吸收了能量又能够发出荧光。或者,“供体”蛋白质分子可以只利用色氨酸残基的天然荧光能量。选择发出不同波长光的标记,使“受体”分子标记可以与“供体”分子标记区别开来。由于标记之间的能量转移效率与分子间距有关,因此能够估测分子之间的空间关系。在分子之间发生结合的情况中,试验中“受体”分子标记的荧光发射应当最大。fet结合事件可以通过本领域公知的标准荧光检测手段(例如使用荧光计)常规测定。
在另一实施方案中,可以不标记每种测定成分(探针或标志),利用如实时生物分子相互作用分析(bia)(参见,例如,sjolander,s.和urbaniczky,c.,1991,anal.chem.632338-2345,和szabo et al.,1995,curr.opin.struct.biol.5699-705)等技术来确定探针识别标志的能力。如本文使用的“bia”或“表面等离振子共振”是用于实时研究生物特异性相互作用的技术,无需标记任何相互作用物(例如biacore)。结合表面质量的改变(指示结合事件)导致靠近表面的光折射率改变(表面等离振子共振(spr)的光学现象),产生可检测信号,该信号可以用作生物分子之间实时反应的指示。
此外,在另一实施方案中,可以用标志和探针作为液相中的溶质进行类似的诊断和预后试验。在这种试验中,利用许多标准技术中的任一种将复合的标志和探针与未复合的成分分离开来,这些标准技术包括但不限于差速离心、层析、电泳和免疫沉淀。在差速离心中,由于复合物根据不同的大小和密度而有不同的沉降平衡,可以通过一系列离心步骤将标志/探针复合物与未复合的测定成分分离开来(参见,例如,rivas,g.和minton,a.p.,1993,trends biochem sci.18(8)284-7)。标准层析技术也可以用来分离复合的分子与未复合的分子。例如,凝胶过滤层析法通过以柱形式使用适当的凝胶过滤树脂,根据大小分离分子,例如,相对较大的复合物可以与相对较小的未复合的成分相分离。同样,可以利用标志/探针复合物与未复合的成分相比相对不同的电荷性质来区别复合物与未复合的成分,例如使用离子交换层析树脂。这些树脂和层析技术是本领域技术人员公知的(参见,例如,heegaard,n.h.,1998,j.mol.recognit.winter 11(1-6)141-8;hage,d.s.和tweed,s.a.j chromatogr b biomed sci appl 1997 oct10;699(1-2)499-525)。也可以利用凝胶过滤分离复合的测定成分与未结合的成分(参见,例如ausubel et al.,ed.,current protocols inmolecular biology,john wiley & sons,new york,1987-1999)。在该技术中,蛋白质或核酸复合物例如根据大小或电荷分离。为了在电泳过程中保持结合相互作用,一般优选不使用还原剂的非变性凝胶基质材料和条件。适于特定试验的条件及其成分是本领域技术人员公知的。
在一个特定实施方案中,生物标本中的标志mrna的水平可以使用本领域公知的方法通过原位和体外形式测定。术语“生物标本”包括从受试者中分离的组织、细胞、生物液体及其分离物,以及存在于受试者体内的组织、细胞和液体。有许多表达检测方法使用分离的rna。对于体外方法,任何不是针对mrna分离进行选择的rna分离技术都可以用于从卵巢细胞中纯化rna(参见,例如,ausubel etal.,ed.,current protocols in molecuar biology,john wiley & sons,new york 1987-1999)。另外,大量组织标本能够用本领域技术人员公知的技术,例如chomczynski(1989,美国专利no.4,843,155)的一步rna分离法来处理。
分离的mrna可以在杂交或扩增试验中使用,这些试验包括但不限于southern或northern分析、聚合酶链反应分析和探针阵列。用于检测mrna水平的一种优选诊断方法包括将分离的mrna接触一种核酸分子(探针),该核酸分子能够与被检测的基因所编码的mrna杂交。该核酸分子探针可以是,例如,全长cdna或其部分,如长度为至少7、15、30、50、100、250或500个核苷酸且在严格条件下足以与编码本发明标志的mrna或基因组dna特异性杂交的寡核苷酸。本文描述了其他适合在本发明的诊断试验中使用的探针。mrna与探针杂交表明所述标志得到表达。
在一种形式中,mrna固定在固体表面上,并且与探针接触,例如通过在琼脂糖凝胶上电泳分离的mrna,并将mrna从凝胶转移到膜如硝酸纤维素膜上。在一种替代形式中,探针固定在固体表面上,mrna与例如affymetrix基因芯片阵列中的探针接触。本领域技术人员能够容易地修改已知的mrna检测方法,用于检测本发明标志编码的mrna的水平。
测定标本中mrna标志水平的一种替代方法包括如下步骤核酸扩增,例如通过rtpcr(mullis,1987,美国专利no.4,683,202中所述的实验实施方案),连接酶链反应(barany,1991,proc.natl.acad.sci.usa,88189-193),自动维持序列复制(guatelli et al.,1990,proc.natl.acad.sci.usa 871874-1878),转录扩增系统(kwoh et al.,1989,proc.natl.acad.sci.usa 861173-1177),q-beta复制酶(lizardi et al.,1988,bio/technology 61197),滚环复制(lizardi等人的美国专利no.5,854,033),或其他任何核酸扩增方法,之后使用本领域技术人员公知的技术检测扩增的分子。这些检测方案尤其可用于检测以极低量存在的核酸分子。本文使用的扩增引物被定义为一对核酸分子,它可以与基因的5’或3’区退火(分别是正链和负链,或者相反),并且在之间含有一个短区。通常,扩增引物长度为约10到30个核苷酸,并且位于长度约50到200个核苷酸的区之侧。在适当条件下及使用适当试剂,这些引物允许包含侧翼为该引物的核苷酸序列的核酸分子扩增。
对于原位方法,mrna不需要在检测前从卵巢细胞中分离。在这些方法中,利用已知的组织学方法制备/处理细胞或组织标本。然后将标本固定于支持物上,一般是载玻片,然后使其接触能够与编码该标志的mrna杂交的探针。
作为根据标志的绝对表达水平进行确定的替代方法,也可以根据标准化的标志表达水平进行确定。表达水平的标准化方法是,通过将其表达与不是标志的基因,例如组成型表达的管家基因的表达进行比较,修正标志的绝对表达水平。适合用于标准化的基因包括管家基因,如肌动蛋白基因,或上皮细胞特异性的基因。这种标准化允许将一种样品例如患者标本中的表达水平与另一种标本例如非卵巢癌标本中的表达水平进行比较,或者在来自不同来源的标本之间进行比较。
另外,表达水平也可以用相对表达水平来表征。为了确定标志的相对表达水平,在测定所述标本的表达水平之前,测定正常细胞和癌细胞分离物的各10个或更多标本,优选50个或更多标本的标志表达水平。确定在大量标本中测定的各个基因的平均表达水平,用其作为该标志的基线表达水平。然后将测定的试验标本的标志表达水平(绝对表达水平)除以获得的该标志的平均表达值。从而得到相对表达水平。
优选地,在基线测定中使用的标本来自于卵巢癌或卵巢组织的非卵巢癌细胞。细胞来源的选择取决于相对表达水平的使用。利用正常组织中的表达作为平均表达得分有助于确认测定的标志是否是卵巢特异性的(相对于正常细胞)。另外,随着更多数据的积累,可以修正平均表达值,根据积累的数据提供修正的相对表达值。来自卵巢细胞的表达数据提供用于对卵巢癌状态的严重程度进行分级的手段。
在本发明的另一实施方案中,检测标志蛋白。用于检测本发明标志蛋白的一种优选试剂是能够结合该蛋白质或其片段的抗体,优选具有可检测标记的抗体。抗体可以是多克隆抗体,或者更优选地,可以是单克隆抗体。可以使用完整的抗体,或其片段或衍生物(例如fab或f(ab′)2)。术语“标记”用于探针或抗体时包括通过偶联(即物理连接)可检测物质与探针或抗体来直接标记探针或抗体,以及通过与直接标记的另一试剂反应来间接标记探针或抗体。间接标记的例子包括利用荧光标记的第二抗体检测第一抗体,以及用生物素末端标记dna探针,使其能够用荧光标记的链亲和素检测。
来源于卵巢细胞的蛋白质可以用本领域公知的技术来分离。采用的蛋白质分离方法可以是,例如harlow和lane(harlow和lane,1988,antibodiesa laboratory manual,cold spring harbor laboratorypress,cold spring harbor,new york)所述的方法。
可以利用多种形式确定一种标本是否含有能够结合特定抗体的蛋白质。这类形式的例子包括但不限于酶免疫测定(eia)、放射免疫测定(ria)、蛋白质印迹分析和酶联免疫吸附测定(elisa)。本领域技术人员能够容易地修改已知的蛋白质/抗体检测方法,用于确定卵巢细胞是否表达本发明的标志。
在一种形式中,抗体或抗体片段或衍生物可以在诸如蛋白质印迹或免疫荧光技术等方法中使用,用来检测表达的蛋白质。在这些用途中,通常优选将抗体或蛋白质固定在固体支持体上。合适的固相支持体或载体包括能够结合抗原或抗体的任何支持体。众所周知的支持体或载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、天然及改性纤维素、聚丙烯酰胺、辉长岩和磁铁矿石。
本领域技术人员应当知道许多其他的适于结合抗体或抗原的载体,并且能够将这些支持体用于本发明。例如,从卵巢细胞中分离的蛋白质可以进行聚丙烯酰胺凝胶电泳,并固定在固相支持体如硝酸纤维素上。该支持体然后可以用适当的缓冲液洗涤,接着用可检测标记的抗体处理。该固相支持体然后可以用缓冲液第二次洗涤,除去未结合的抗体。然后可以用常规方法检测固体支持体上结合的标记的量。
本发明也包括用于检测生物标本(例如卵巢相关体液,如尿样)中是否存在标志蛋白或核酸的试剂盒。该试剂盒能够用来确定受试者是否患有卵巢癌或者发展卵巢癌的危险提高。例如,该试剂盒可包含能够检测生物标本中标志蛋白或核酸的标记化合物或试剂,以及用于确定标本中蛋白质或mrna的量的工具(例如,能够结合该蛋白质或其片段的抗体,或能够结合编码该蛋白质的dna或mrna的寡核苷酸探针)。试剂盒也可包含用于说明使用该试剂盒获得的结果的说明书。
对于基于抗体的试剂盒,该试剂盒可包含,例如(1)第一抗体(例如连接到固体支持体上),其能够结合标志蛋白;和任选地,(2)不同的第二抗体,其能够结合该蛋白质或第一抗体,并且与可检测标记偶联。
对于基于寡核苷酸的试剂盒,该试剂盒可包含,例如(1)寡核苷酸,例如可检测标记了的寡核苷酸,它与编码标志蛋白的核酸序列杂交,或(2)用于扩增标志核酸分子的一对引物。该试剂盒也可包含,例如缓冲剂、防腐剂或蛋白质稳定剂。该试剂盒可进一步包含检测可检测标记所必需的成分(例如酶或底物)。该试剂盒也可含有可以测定并与检测标本进行比较的对照样品或一系列对照样品。该试剂盒的每种成分都可以包含在各自容器内,所有各容器都可以与用于说明使用该试剂盒进行试验的结果的说明书一起置于一个包装内。
b.药物基因组学为了处理(预防或治疗性)患者中的卵巢癌,可以对个体施用对本发明标志的表达具有刺激或抑制作用的药剂或调节剂。关于这种处理,可以考虑个体的药物基因组学(即关于个体基因型与个体对外源化合物或药物的应答之间的关系的研究)。治疗剂代谢上的差异可以改变药理学活性药物的剂量与血液浓度之间的关系,而导致严重毒性或治疗失败。因此,个体的药物基因组学允许基于个体基因型的考虑来选择用于预防或治疗性处理的有效药剂(例如药物)。该药物基因组学能够进一步用于确定适当的剂量和治疗方案。因此,可以确定个体中本发明标志的表达水平,从而选择用于治疗或预防性处理个体的合适的药剂。
药物基因组学涉及由于改变药物处置和患者中的异常作用引起的对药物应答的临床显著变化。参见,例如,linder(1997)clin.chem.43(2)254-266。通常可以区分两种类型的药物遗传学条件。作为单因素改变药物作用于身体的方式的遗传条件被称为“改变的药物作用”。作为单因素改变身体作用于药物的方式的遗传条件被称为“改变的药物代谢”。这些药理遗传条件可以作为罕见的缺陷或作为多态性发生。例如,葡萄糖-6-磷酸脱氢酶(g6pd)缺陷是一种常见的遗传性酶病,其主要的临床并发症是摄入氧化剂药物(抗疟药、磺胺类药物、镇痛药、硝基呋喃类药物)及食用蚕豆后溶血。
作为一个说明性的实施方案,药物代谢酶的活性是药物作用强度和持续时间的一个主要决定因素。药物代谢酶(例如n-乙酰转移酶2(nat 2)和细胞色素p450酶cyp2d6和cyp2c19)的遗传多态性的发现已经对为什么一些患者无法获得预期药物效果或者在使用标准且安全剂量的药物后显示过度的药物应答和严重毒性提供了一种解释。这些多态性在人群中以两种表型表达,强代谢者(em)和弱代谢者(pm)。pm的普遍程度在不同群体中不同。例如,编码cyp2d6的基因具有高度多态性,并且在pm中已经鉴定出几个突变,这些突变均导致功能性cyp2d6的缺乏。cyp2d6和cyp2c19的弱代谢者当接受标准剂量时非常经常地表现出过度的药物应答和副作用。如果代谢物是活性治疗性部分,pm将不表现治疗响应,可待因通过其cyp2d6-形成的代谢物吗啡介导的镇痛作用证实了这一点。另一极端情况是所谓的超快速代谢者,他们对标准剂量没有响应。最近,超快速代谢的分子基础已经被确定为是由于cyp2d6基因扩增。
因此,可以确定个体中本发明标志的表达水平,从而选择用于治疗或预防性处理个体的合适药剂。另外,药物遗传学研究也能够用来将编码药物代谢酶的多态性等位基因的基因分型用于鉴定个体的药物响应表型。当用本发明标志的表达调节剂处理受试者时,用这些知识选择剂量或药物,可以避免不良反应或治疗失败,因而提高了治疗或预防效率。
c.监测临床试验监测药剂(例如药物化合物)对本发明标志的表达水平的影响不仅可以在基本药物筛选中使用,而且可以在临床试验中使用。例如,可以在接受卵巢癌治疗的受试者的临床试验中监测一种药剂影响标志表达的有效性。在一个优选实施方案中,本发明提供一种方法,用于监测用药剂(例如激动剂、拮抗剂、拟肽、蛋白质、肽、核酸、小分子或其他候选药物)处理受试者的效果,该方法包括如下步骤(i)在施用所述药剂前从受试者中获得施用前标本;(ii)检测施用前标本中选择的一种或多种本发明标志的表达水平;(iii)从受试者获得一种或多种施用后标本;(iv)检测施用后标本中该标志的表达水平;(v)将施用前标本中该标志的表达水平与施用后标本中该标志的表达水平进行比较;和(vi)改变对受试者施用药剂。例如,处理过程中标志基因的表达提高可能表明剂量无效及希望提高剂量。相反,标志基因的表达降低可能表明处理有效,并且不需要改变剂量。
d.电子设备可读介质和阵列也提供了包括本发明标志的电子设备可读介质。本文使用的“电子设备可读介质”是指用于存储、保存或容纳数据或信息的任何合适的介质,这些数据或信息可以被电子设备直接读取和访问。这类介质包括但不限于磁性存储介质,如软盘、硬盘存储介质和磁带;光存储介质,如光盘;电子存储介质,如ram、rom、eprom、eeprom等;普通硬盘,和这些种类的混合体,例如磁性/光存储介质。该介质修改或构造为用于在上面记录本发明的标志。
本文使用的术语“电子设备”包括任何合适的计算或处理设备或其他构造或改变成存储数据或信息的装置。适合本发明使用的电子设备的例子包括单机计算设备;网络,包括局域网(lan)、广域网(wan)、互联网、内联网和外联网;电子用品,如个人数字助理(pda)、移动电话、寻呼机等;以及当地的和分布的处理系统。
本文使用的“记录”是指在电子设备可读介质上存储或编码信息的过程。本领域技术人员可以容易地采用任何当前已知的方法用于在已知介质上记录信息,从而产生包含本发明标志的制品。
有多种软件程序和格式可以用于在电子设备可读介质上存储本发明的标志信息。例如,标志核酸序列可以记录在为商业上可获得的软件如wordperfect和microsoft word格式的字处理文本文件中,或者记录为ascii文件形式,存储在数据库中,如db2、sybase、oracle等,以及其他形式。为了获得或产生上面记录着本发明标志的介质,可以使用任意数量的数据处理器构成格式(例如文本文件或数据库)。
通过以可读形式提供本发明的标志,人们能够为了多种目的常规获取标志序列信息。例如,本领域技术人员可以使用可读形式的本发明的核苷酸或氨基酸序列,将靶序列或靶结构基序与存储在数据存储工具内的序列信息进行比较。利用研究工具鉴定与特定靶序列或靶基序匹配的本发明序列的片段或区域。
本发明因此提供一种介质,其用于保存运行一种方法的指令,该方法用于确定受试者是否患有卵巢癌或者易患卵巢癌,其中该方法包括以下步骤确定是否存在一种标志,根据该标志的存在与否确定受试者是否患有卵巢癌或易患卵巢癌,和/或推荐用于卵巢癌或卵巢癌前病变的具体治疗方法。
本发明进一步在电子系统和/或网络中提供一种方法,该方法用于确定受试者是否患有卵巢癌或者易患与一种标志有关的卵巢癌,其中该方法包括以下步骤确定是否存在一种标志,根据该标志的存在与否确定受试者是否患有卵巢癌或易患卵巢癌,和/或推荐对于卵巢癌或卵巢癌前病变的具体治疗方法。该方法可以进一步包括以下步骤接受与该受试者有关的表型信息,和/或从网络上获取与该受试者有关的表型信息。
本发明也在网络上提供一种方法,该方法用于确定受试者是否患有卵巢癌或者易患与一种标志有关的卵巢癌,该方法包括以下步骤接受与该标志有关的信息,接受与该受试者有关的表型信息,从网络上获取对应于该标志和/或卵巢癌的信息,并且根据一种或多种表型信息、标志和获得的信息,确定该受试者是否患有卵巢癌或易患卵巢癌。该方法可进一步包括推荐用于卵巢癌或卵巢癌前病变的具体治疗方法的步骤。
本发明也提供一种用于确定受试者是否患有卵巢癌或者易患卵巢癌的商业方法,该方法包括以下步骤接受与标志有关的信息,接受与该受试者有关的表型信息,从网络上获取对应于该标志和/或卵巢癌的信息,并且根据一种或多种表型信息、标志和获得的信息,确定该受试者是否患有卵巢癌或易患卵巢癌。该方法可进一步包括推荐用于卵巢癌或卵巢癌前病变的具体治疗方法的步骤。
本发明也包括一种包含本发明标志的阵列。该阵列可以用来在阵列中测定一种或多种基因的表达。在一个实施方案中,该阵列可以用来在阵列中测定组织中的基因表达,从而确定基因的组织特异性。利用这种方法,可以同时测定最高大约7600个基因的表达。这允许形成一个图谱,其显示在一种或多种组织中特异性表达的一组基因。
除了这些定性检测以外,本发明还允许对基因表达定量。因此,不仅一组基因的组织特异性,而且其在组织中的表达水平,都可以确定。因此,基因可以根据其组织表达本身以及在该组织中的表达水平来分类。例如,在确定组织之间基因表达的关系时,这是有用的。因此,可以干扰一种组织,而测定对第二组织中基因表达的影响。在本文中,可以测定一种细胞型响应生物学刺激对另一种细胞型的作用。这种测定例如可用于在基因表达水平上获知细胞-细胞相互作用的效应。如果治疗性地施用一种药剂来处理一种细胞型但是对另一种细胞型有不希望的作用,则本发明提供一种用于确定这种不希望的作用的分子基础的试验,从而提供同时施用对抗剂或者以其他方式处理这种不希望的作用的机会。同样,甚至在单细胞型内,也可以在分子水平上确定不希望的生物效应。因此,一种药剂对靶基因以外基因表达的作用可以确定并对抗。
在另一实施方案中,可以利用阵列监测一种或多种基因的表达的时程。其可能在如本文所述的各种生物事件中发生,例如,卵巢癌的发展,卵巢癌的进展,和过程,与卵巢癌有关的细胞转化。
阵列也可以用于确定一种基因的表达对同一细胞中或不同细胞中其他基因表达的影响。这提供了,例如,如果最终或下游靶标不能调节,则为治疗性干预选择替代分子靶标。
阵列也可用于确定一种或多种基因在正常和异常细胞中的不同表达模式。这提供了一组基因,它们能用作诊断或治疗性干预的分子靶标。
e.替代标志本发明的标志可以作为一种或多种紊乱或疾病状态或可导致疾病状态特别是卵巢癌的状况的替代标志。本文使用的“替代标志”是一种客观生化标志,它与是否患有疾病或紊乱有关,或者与疾病或紊乱的进展有关(例如与是否具有肿瘤有关)。该标志的存在或量独立于疾病。因此,这些标志可用来说明特定治疗过程是否可有效缓解疾病状态或紊乱。当疾病状态或紊乱的存在或程度难以用标准方法评估时(例如早期肿瘤),或者当在达到可能危险的临床终点之前希望评价疾病进展时,替代标志特别有用(例如,在心肌梗塞或完全发展的aids的不良临床结果之前,可以用胆固醇水平作为替代标志进行心血管疾病的评价,以及可以用hiv rna水平作为替代标志进行hiv感染的分析)。本领域中替代标志的用途的例子包括koomen et al.(2000)j.mass.spectrom.35258-264;和james(1994)aids treatmentnews archive 209。
本发明的标志也用作药效学标志。本文使用的“药效学标志”是与药物疗效明确相关的客观生物化学标志。药效学标志的存在或数量与给药治疗的疾病状态或紊乱无关;因此,该标志的存在或数量指示该药物在受试者中的存在或活性。例如,药效学标志可以指示该药物在生物学组织中的浓度,因为该标志在该组织中表达或转录或不表达或转录与药物水平有关。以这种方式,药物的分布或摄取可以用药效学标志监测。同样,药效学标志的存在或量可能与药物代谢产物的存在或量有关,因此标志的存在或量表示药物的体内相对分解率。药效学标志尤其用于提高药物疗效检测的灵敏度,特别是在低剂量给药时。由于甚至少量药物也可能足以激活多轮标志转录或表达,扩增的标志的量可能比药物本身更容易检测。另外由于标志本身的性质,标志也可能更容易检测;例如,使用本文所述的方法,可以在基于免疫的蛋白质标志检测系统中使用抗体,或者可以利用标志特异性的放射性标记探针检测mrna标志。而且,药效学标志的使用还可以允许基于机理地预测超出可直接观测范围以外的药物治疗引起的危险。本领域使用药效学标志的例子包括matsuda et al.us 6,033,862;hattis etal.(1991)env.health perspect.90229-238;schentag(1999)am.j.health-syst.pharm.56 suppl.3s21-s24;和nicolau(1999)am,j.health-syst.pharm.56 suppl.3s16-s20。
实施例1通过cdna和组织的微阵列鉴定卵巢癌标志材料与方法标本采集与rna制备采集卵巢组织并在液氮中骤冻。在进行rna提取前证实该组织的组织学和细胞组成。使用trizol试剂(life technologies)从冷冻组织中提取总rna,然后用qiagen’s rneasy试剂盒进行第二次纯化步骤,以提高rna探针的标记效率(qiagen,valencia ca)。该研究中只使用28s/18s核糖体rna比值至少为1.0的rna,该比值是根据琼脂糖凝胶电泳后rna的乙锭染色计算的。
cdna微阵列杂交在尼龙滤膜上形成含有来自research genetics(hunstville,al)的30,732个unigene克隆的cdna微阵列。用总共4-6μg总rna作为模板,使用33p-dctp、oligo dt-30引物和superscript ii逆转录酶(life technologies)通过逆转录产生放射性标记的cdna。为了减少非特异性杂交,33p-标记的第一链cdna与cot-1 dna和聚-da 40-60(pharmacia,peapack,nj)预退火。在65℃下每个滤膜与约6×106计数的标记探针在含7%十二烷基硫酸钠(sds)、250mm na3po4(ph7.2)、1mm edta、o.5%酪蛋白-hammerstein和o.1mg/ml变性鲑精dna的缓冲液中杂交16小时。滤膜用4%和1%sds洗涤缓冲液(20mm na3po4(ph 7.2),1mm edta和4%或1%sds)洗涤后,将其暴露于fuji磷成像仪屏,并用fuji扫描仪bas 2500扫描。用millennium pharmaceuticals,inc.开发的自动阵列分析程序grid guruv1.0对斑点进行定量。
标志评分算法和数据分析为了修正杂交效率的差异,用滤膜上所有斑点的密度中位数标准化来自每个微阵列滤膜的数字化数据。进行基于阵列的和基于基因的分级群聚,并用stanford’s基因簇和基因树显示软件显现出来。通过计算每个基因的标志得分排列差异表达的基因。
为了计算标志得分,将标本分为对照组和检测组。标志得分的起点是检测标本高于对照标本的平均倍数改变(比值)。得分旨在反映显示差异表达的检测标本的改变程度(表达比)和数量,而不是被具有极高数值的少部分检测标本所主导。为了减少这种“离群值”效应,将表达比高于10的基因处理为与表达比为10的基因没有实质不同。在得到检测标本间的平均倍数改变之前,用渐近压缩函数转化检测对照表达比,来实现标志得分的这种理想的表现。当检测标本看起来没有比对照更高表达时标志得分的值为1,在其他情况下该值大于1。所有基因的标志得分都不能超过10的值。
因此基因g的标志得分sg如下计算为各检测标本的加权强度与对照水平的比值的平均值sg=(∑sgs)/n检测sgs=c(xgs/(k xgq)),其中sgs代表基因g和标本s的标志得分,c(r)r≥1时,是压缩函数c(r)=a(1-e-r/a),r<1时是c(r)=1,a是倍数改变值(我们使用10)上的上渐进线,xgs是标本s上的基因g的表达值,xgq是对照标本表达值的第q百分位数;一般q=50,k是一个常数,其反映数据中的可加噪声,即重复测量中变异的固定成分。使用微阵列技术由校准实验得到的该参数的数值为0.25。
n检测检测标本数。
结果标志选择表1中列出的所有标志都通过如材料与方法部分中所述的转录序型分析(profiling)来鉴定。来自标志m138、m437、m445、m452a、m712、m472、m590a、m713、m458、m714、m715、m185a、m476、m716、m717和m724的mrna获自67个不同组织型和阶段的卵巢肿瘤和96个非卵巢肿瘤组织,包括正常卵巢上皮、良性状况、其他正常组织和其他异常组织。在至少10%的卵巢肿瘤中的表达比在非卵巢肿瘤组织中的表达至少高3倍的克隆被指定为卵巢癌特异性标志。选择这些cdna克隆,测定它们的蛋白质编码转录物序列。
来自标志ov32a、ov33a、ov52a、ov51a、ov55和ov65的mrna获自9个正常卵巢上皮、11个i/ii期卵巢癌肿瘤和25个iii/iv期卵巢癌肿瘤。在至少4个肿瘤标本中选择在卵巢肿瘤中的表达比在非卵巢肿瘤组织中的表达至少高2倍的克隆,测定它们的蛋白质编码转录物序列。
为了测定所选cdna克隆的全长蛋白质编码转录物,用所选克隆的序列检索公开的和专有的序列数据库,以鉴定具有显著重叠的其他est序列或簇。简言之,将已知与各种克隆有关的est序列对公开的和专有的序列数据库均进行blast分析,该分析直接进行或者在自动高严格性装配的连续序列范围内进行。对应于克隆的蛋白质序列通过获得下列情形之一来鉴定1)在6个可能的翻译之一中,蛋白质序列与至少一个est序列之间直接匹配;2)对应于蛋白质序列的mrna的核苷酸序列与至少一个est序列之间直接匹配;
3)在6个可能的翻译之一中,蛋白质序列与该est序列和在数据库中可获得的其他est序列的连续装配体(叠连群)之间匹配;或4)在6个可能的翻译之一中,对应于蛋白质序列的mrna的核苷酸序列与该est序列和在数据库中可获得的其他est序列的连续装配体之间匹配。
然后,将连续est序列和/或簇装配为蛋白质编码转录物。对要求保护的所有标志的转录物分析如下进行1)利用任一给定标志基因的已知核苷酸序列在人类基因组序列上的现有作图,并且通过另外将任意给定标志基因的新核苷酸序列在人类基因组序列上作图(例如使用类似于“ucsc基因组浏览器”的资源或具有类似功能的内部资源,结合类似于blat的算法,blat允许快速、精确地将搜索序列在基因组序列上作图),建立标志基因的外显子-内含子结构,另外考虑与该同一基因匹配的est序列。
2)设计pcr引物用于从目标组织和对照标本中扩增给定标志基因的编码序列。源于该分析的具有改变编码序列可能性的标志基因的任何5’或3’末端都导致设计出对该末端特异性的另一引物。
3)将使用来自卵巢肿瘤标本的cdna模板获得的pcr产物克隆到质粒载体中,并且通过dna序列分析来表征。通过pcr产物的限制性消化和凝胶电泳或者通过dna序列分析分析了96个克隆。
4)将代表以2%或更高频率发生的基因转录物的克隆进行测序。
5)在从患者组织标本中制备的cdna中,鉴定的转录物的差异基因表达通过taqman定量pcr(applied biosystems)证实。为每种转录物设计剪切型特异性的taqman引物和探针试剂组,用每种基因的所有试剂组获得了类似的扩增效率。
6)对应于这些转录物的蛋白质序列如下鉴定根据所有可获得的序列鉴定包含在手工装配体(叠连群)内的开放阅读框(orf)。
实施例2通过终点pcr的基因表达分析材料与方法简言之,合并来自不同标本的总rna,将其用作产生第一链cdna的模板。卵巢组包括“卵巢肿瘤库”的患者标本(4个肿瘤标本,包括浆液和透明细胞卵巢肿瘤)和“卵巢正常库”的标本(3个正常卵巢上皮)。
使用trizol试剂按照使用说明书(invitrogen)通过一步提取法从患者标本中制备总rna。每种rna制品都用dnase i(ambion)在37℃下处理1小时。将来自每个患者标本的rna并入两个库之一,例如卵巢肿瘤库和卵巢正常库。利用thermoscript rt-pcr系统(invitrogen,san diego,ca)从每个库中获得cdna。简言之,按照使用说明书所述,1μg rna在65℃下在10μl体积中用1μl 50μmoligo(dt)20引物变性5分钟。在85℃下孵育5分钟终止反应。终产物用水稀释至终体积为100μl。
基因特异性引物设计为恰好在开放阅读框之外(如表2中项目“终点pcr引物1”和“终点pcr引物2”所示)。对引物和预期的产物大小优化pcr条件。在降落循环条件的20μl反应中使用2μl cdna。产物在含溴化乙锭的琼脂糖凝胶上电泳。然后对凝胶图进行半定量分析和评分。
对组织组进行的终点pcr的溴化乙锭琼脂糖凝胶图按照1-5的等级进行评分。每张图由三个人根据目测条带强度独立评分,并汇总结果。将得分进行比较,以证实全部三个人在条带相对强度上一致,必要时进行修正。然后记录三个得分的中位数作为最终得分。
如表2所示,在终点pcr中检测的本发明的每个标志在卵巢肿瘤库中都比在卵巢正常库中以更高水平表达。
结果表2.终点pcr数据

其他实施方案本领域技术人员应当认识到,或者仅利用常规实验就能够确定,与本文所述的本发明具体实施方案相当的许多实施方案。这些相当的实施方案包括在权利要求书的范围内。
序列表<110>千年药品公司等<120>用于鉴定、评价、预防和治疗卵巢癌的核酸分子和蛋白质<130>mri-065pc<150>60/509,171<151>2003-10-07<160>44<170>fastseq for windows版本4.0<210>1<211>1257<212>dna<213>人(homo sapien)<220>
<221>cds<222>(27)...(863)<400>1gaggcgcgcg ggtgaaaggc gcattg atg cag cct gcg gcg gcc tcg gag cgc 53met gln pro ala ala ala ser glu arg1 5ggc gga gca gac gct gac cac gtt cct ctc ctc ggt ctc ctc cgc ctc101gly gly ala asp ala asp his val pro leu leu gly leu leu arg leu10 15 20 25cag ctc cgc gct gcc cgg cag ccg gga gcc atg cga ccc cag ggc ccc149gln leu arg ala ala arg gln pro gly ala met arg pro gln gly pro30 35 40gcc gcc tcc ccg cag cgg ctc cgc ggc ctc ctg ctg ctc ctg ctg ctg197ala ala ser pro gln arg leu arg gly leu leu leu leu leu leu leu45 50 55cag ctg ccc gcg ccg tcg agc gcc tct gag atc ccc aag ggg aag caa245gln leu pro ala pro ser ser ala ser glu ile pro lys gly lys gln60 65 70aag gcg cag ctc cgg cag agg gag gtg gtg gac ctg tat aat gga atg293lys ala gln leu arg gln arg glu val val asp leu tyr asn gly met75 80 85tgc tta caa ggg cca gca gga gtg cct ggt cga gac ggg agc cct ggg341cys leu gln gly pro ala gly val pro gly arg asp gly ser pro gly90 95 100 105gcc aat ggc att ccg ggt aca cct ggg atc cca ggt cgg gat gga ttc389ala asn gly ile pro gly thr pro gly ile pro gly arg asp gly phe110 115 120aaa gga gaa aag ggg gaa tgt ctg agg gaa agc ttt gag gag tcc tgg437lys gly glu lys gly glu cys leu arg glu ser phe glu glu sar trp
125 130 135aca ccc aac tac aag cag tgt tca tgg agt tca ttg aat tat ggc ata485thr pro asn tyr lys gln cys ser trp ser ser leu asn tyr gly ile140 145 150gat ctt ggg aaa att gcg gag tgt aca ttt aca aag atg cgt tca aat533asp leu gly lys ile ala glu cys thr phe thr lys met arg ser asn155 160 165agt gct cta aga gtt ttg ttc agt ggc tca ctt cgg cta aaa tgc aga581ser ala leu arg val leu phe ser gly ser leu arg leu lys cys arg170 175 180 185aat gca tgc tgt cag cgt tgg tat ttc aca ttc aat gga gct gaa tgt629asn ala cys cys gln arg trp tyr phe thr phe asn gly ala glu cys190 195 200tca gga cct ctt ccc att gaa gct ata att tat ttg gac caa gga agc677ser gly pro leu pro ile glu ala ile ile tyr leu asp gln gly ser205 210 215cct gaa atg aat tca aca att aat att cat cgc act tct tct gtg gaa725pro glu met asn ser thr ile asn ile his arg thr ser ser val glu220 225 230gga ctt tgt gaa gga att ggt gct gga tta gtg gat gtt gct atc tgg773gly leu cys glu gly ile gly ala gly leu val asp val ala ile trp235 240 245gtt ggc act tgt tca gat tac cca aaa gga gat gct tct act gga tgg821val gly thr cys ser asp tyr pro lys gly asp ala ser thr gly trp250 255 260 265aat tca gtt tct cgc atc att att gaa gaa cta cca aaa taa863asn ser val ser arg ile ile ile glu glu leu pro lys *270 275atgctttaat tttcatttgc tacctctttt tttattatgc cttggaatgg ttcacttaaa 923tgacatttta aataagttta tgtatacatc tgaatgaaaa gcaaagctaa atatgtttac 983agaccaaagt gtgatttcac actgttttta aatctagcat tattcatttt gcttcaatca 1043aaagtggttt caatattttt tttagttggt tagaatactt tcttcatagt cacattctct 1103caacctataa tttggaatat tgttgtggtc ttttgttttt tctcttagta tagcattttt 1163aaaaaaatat aaaagctacc aatctttgta caatttgtaa atgttaagaa ttttttttat 1223atctgttaaa taaaaattat ttccaacaac ctta 1257<210>2<211>278<212>prt<213>人<400>2met gln pro ala ala ala ser glu arg gly gly ala asp ala asp his1 5 10 15val pro leu leu gly leu leu arg leu gln leu arg ala ala arg gln20 25 30pro gly ala met arg pro gln gly pro ala ala ser pro gln arg leu35 40 45arg gly leu leu leu leu leu leu leu gln leu pro ala pro ser ser50 55 60
ala ser glu ile pro lys gly lys gln lys ala gln leu arg gln arg65 70 75 80glu val val asp leu tyr asn gly met cys leu gln gly pro ala gly85 90 95val pro gly arg asp gly ser pro gly ala asn gly ile pro gly thr100 105 110pro gly ile pro gly arg asp gly phe lys gly glu lys gly glu cys115 120 125leu arg glu ser phe glu glu ser trp thr pro asn tyr lys gln cys130 135 140ser trp ser ser leu asn tyr gly ile asp leu gly lys ile ala glu145 150 155 160cys thr phe thr lys met arg ser asn ser ala leu arg val leu phe165 170 175ser gly ser leu arg leu lys cys arg asn ala cys cys gln arg trp180 185 190tyr phe thr phe asn gly ala glu cys ser gly pro leu pro ile glu195 200 205ala ile ile tyr leu asp gln gly ser pro glu met asn ser thr ile210 215 220asn ile his arg thr ser ser val glu gly leu cys glu gly ile gly225 230 235 240ala gly leu val asp val ala ile trp val gly thr cys ser asp tyr245 250 255pro lys gly asp ala ser thr gly trp asn ser val ser arg ile ile260 265 270ile glu glu leu pro lys275<210>3<211>4039<212>dna<213>人<220>
<221>cds<222>(28)...(1815)<400>3cgccatcgtt ccctggctgc ttactaa gtt gga tcc gga att tct ttt caa ccg 54val gly ser gly ile ser phe gln pro1 5gga gcc att ggt gtc gaa gtg tct gca atg aac ccc gtg aat gct act102gly ala ile gly val glu val ser ala met asn pro val asn ala thr10 15 20 25gct ctc tac att tcc gcg agc cgc cta gtg ctc aac tac gac ccc gga150ala leu tyr ile ser ala ser arg leu val leu asn tyr asp pro gly30 35 40gac ccc aag gcg ttt act gag att aac agg ctc ttg cct tac ttc cga198asp pro lys ala phe thr glu ile asn arg leu leu pro tyr phe arg45 50 55cag tcc ctt tcg tgc tgt gtt tgc gga cat ttg cta caa gat cct att246gln ser leu ser cys cys val cys gly his leu leu gln asp pro ile60 65 70gca ccc acc aac tcc acc tgc caa cat tat gtc tgc aaa act tgt aaa294
ala pro thr asn ser thr cys gln his tyr val cys lys thr cys lys75 80 85ggc aag aaa atg atg atg aaa cct tcc tgt agc tgg tgc aaa gac tat342gly lys lys met met met lys pro ser cys ser trp cys lys asp tyr90 95 100 105gag cag ttt gag gaa aac aag cag tta agc atc cta gtg aac tgc tac390glu gln phe glu glu asn lys gln leu ser ile leu val asn cys tyr110 115 120aaa aaa cta tgc gag tat ata aca cag act aca ctg gca cgg gat ata438lys lys leu cys glu tyr ile thr gln thr thr leu ala arg asp ile125 130 135ata gaa gca gtt gac tgt tct tct gat att ttg gct ttg ctt aat gat486ile glu ala val asp cys ser ser asp ile leu ala leu leu asn asp140 145 150gga tca ttg ttt tgt gag gag aca gaa aaa ccc tca gat tca tcc ttt534gly ser leu phe cys glu glu thr glu lys pro ser asp ser ser phe155 160 165act ttg tgt ttg aca cat tcc cct tta cct tca acc tca gaa ccc aca582thr leu cys leu thr his ser pro leu pro ser thr ser glu pro thr170 175 180 185act gat cct caa gct agt tta tct cca atg tct gaa agc acc ctc agc630thr asp pro gln ala ser leu ser pro met ser glu ser thr leu ser190 195 200att gct att ggc agt tct gtt atc aat ggt ttg cct act tat aat ggg678ile ala ile gly ser ser val ile asn gly leu pro thr tyr asn gly205 210 215ctt tca ata gat aga ttt ggt ata aat att cct tca cct gaa cat tca726leu ser ile asp arg phe gly ile asn ile pro ser pro glu his ser220 225 230aat acg att gac gta tgt aat act gtt gac ata aaa act gag gat ctg774asn thr ile asp val cys asn thr val asp ile lys thr glu asp leu235 240 245tct gac agc ctg cca ccc gtt tgt gac aca gta gcc act gac tta tgt822ser asp ser leu pro pro val cys asp thr val ala thr asp leu cys250 255 260 265tcc aca ggc att gat atc tgc agt ttc agt gaa gat ata aaa cct gga870ser thr gly ile asp ile cys ser phe ser glu asp ile lys pro gly270 275 280gac tct ctg tta ctg agt gtt gag gaa gta ctc cgc agc tta gaa act918asp ser leu leu leu ser val glu glu val leu arg ser leu glu thr285 290 295gtt tca aat aca gag gtc tgt tgc cct aat ttg cag ccg aac ttg gaa966val ser asn thr glu val cys cys pro asn leu gln pro asn leu glu300 305 310gcc act gta tcc aat gga cct ttt ctg cag ctt tct tcc cag tct ctt1014ala thr val ser asn gly pro phe leu gln leu ser ser gln ser leu
315 320 325agc cat aat gtt ttt atg tcc acc agt cct gca ctt cat ggg tta tca 1062ser his asn val phe met ser thr ser pro ala leu his gly leu ser330 335 340 345tgt aca gca gca act ccg aag ata gca aaa ttg aat aga aaa cga tcc 1110cys thr ala ala thr pro lys ile ala lys leu asn arg lys arg ser350 355 360aga tca gag agt gac agt gag aaa gtt cag cca ctt cca att tct acc 1158arg ser glu ser asp ser glu lys val gln pro leu pro ile ser thr365 370 375att atc cga ggc cca aca ctg ggg gca tct gct cct gtg aca gtg aaa 1206ile ile arg gly pro thr leu gly ala ser ala pro val thr val lys380 385 390cgg gag agc aaa att tct ctt caa cct ata gca act gtt ccc aat gga 1254arg glu ser lys ile ser leu gln pro ile ala thr val pro asn gly395 400 405ggc aca aca cct aaa atc agc aaa act gta ctt tta tct act aaa agc 1302gly thr thr pro lys ile ser lys thr val leu leu ser thr lys ser410 415 420 425atg aaa aag agt cat gaa cat gga tcc aag aaa tct cac tct aaa acc 1350met lys lys ser his glu his gly ser lys lys ser his ser lys thr430 435 440aag cca ggt att ctt aaa aaa gac aaa gca gta aag gaa aag att cct 1398lys pro gly ile leu lys lys asp lys ala val lys glu lys ile pro445 450 455agt cat cat ttt atg cca gga agt cct acc aag act gtg tac aaa aaa 1446ser his his phe met pro gly ser pro thr lys thr val tyr lys lys460 465 470ccc cag gaa aag aaa ggg tgt aaa tgt ggg cgt gct act caa aat cca 1494pro gln glu lys lys gly cys lys cys gly arg ala thr gln asn pro475 480 485agt gtt ctt aca tgc cga ggc caa cgc tgc cct tgc tac tct aac cgc 1542ser val leu thr cys arg gly gln arg cys pro cys tyr ser asn arg490 495 500 505aaa gcc tgc tta gat tgt ata tgt cgt ggc tgc caa aac tcc tat atg 1590lys ala cys leu asp cys ile cys arg gly cys gln asn ser tyr met510 515 520gcc aat ggg gag aag aag ctg gag gca ttt gcc gtg cca gaa aag gcc 1638ala asn gly glu lys lys leu glu ala phe ala val pro glu lys ala525 530 535ttg gag cag acc agg ctc act ttg ggc att aac gtg act agc att gct 1686leu glu gln thr arg leu thr leu gly ile asn val thr ser ile ala540 545 550gtg cgt aac gct agt acc agc acc agt gta ata aat gtc aca ggg tcc 1734val arg asn ala ser thr ser thr ser val ile asn val thr gly ser
555 560 565cca gta acg acg ttt tta gct gcc agt aca cat gat gat aaa agt ttg 1782pro val thr thr phe leu ala ala ser thr his asp asp lys ser leu570 575 580 585gat gaa gct ata gac atg aga ttc gac tgt taa atcagtgggt cttttaaacc 1835asp glu ala ile asp met arg phe asp cys *590 595tactcctggt agggaaatag ctacagtttt acggcagcta tggttctgtt ggtttaactt 1895gccggagctc ctgcatatag atcacttgta tcaagtgttt tcattgctaa gttatatgtg 1955ttagtgtcgg ggaaatagtt tgcagataat ggaggagtaa ccctacaact atatgtcctt 2015agttcttaca gaacctcata gtttgagaac aaagctgatg caactgattt atacaaaatg 2075aactttggca agaaaaataa cattaacctc attgtttatg gccatgcttt gtgcataatc 2135aaagtttatg attaaatgta aggaagtggt atctagtcag tccataaaga ttgtgctaat 2195ttttttgtgg aaaagtagcc attagttcag gaaactcagt gctgccttca gatgtcattg 2255atgtttctcc tgttggaaag ctgatgtgtc cagctcaacc tttgtgctga catcatacca 2315tttctgatca tgaaatattg gctactggtg tatgtagcag ttcttaaatc agcagtatta 2375tgaaaaaaaa ttccccctca ttagaatgtt taagaaatct ttttaaaaag taaaattctg 2435tcagactaca aatgtttagc tgttactcat ttctagggaa gaaattctaa atccctcctt 2495cactttgagc agtgttctaa ttggataaat gaaggagagt agttttattc tgaaggtaat 2555taaatttaga ctatgtagta tgtgacagaa tttttttaaa attataaaaa gattttattt 2615agtaattggg atttacttaa aataattttg gaataatgct cccagacttg cccagatttg 2675tgtattgtac ttattgccac tggccgccac tttgacttat tttctctaat agtttatttg 2735ccacagtctt tattttgaat atgctcctag ttttttttta gggtgctgtt cattatgaag 2795gcttctttat agaggcctaa taagaatgcc tttttataaa gcctgtgcat ttaggtaggt 2855tgaagctagg aggattttct ttagaatgct cttttgcatg taaagcacaa agtatgtttc 2915agtttaaatg cacttcttcc ggttaatttt tatggggaag acaagtgagt cacaaacatt 2975ctgttgaagg gaaatctagt cagttgcttg aaagagcaca gcccaaataa aacaaggact 3035gactaggtgt aatgaaataa cctgtgattt aaaagaagag ctgcagcttt gacagtgctt 3095atttaaagaa aaatactgct ggaaaatttc caatttctac tacgttcacc atctctagta 3155agatctgaca tatgctgaag ttatgttttg atttggcaca cagcatgttc aatgatggtt 3215actcgcctag tacaagacat ggagaagaaa cctttggaca cagagcagat gacacctcct 3275tctgttttgt agtgtatcct ggtgtcattt tctgtgaatg tggtcaggta gagttgtttt 3335tgttgttgtt gttgggcttt tttttctttt tttttttttg gtctcttttg gtggggtggg 3395ggtgggctaa agccatagga agaaaaatgt gatgtgtcca gtatgtacta ttttgttttt 3455gttttgcaag aagagttgaa ctatttttga taacaagagt aaatggtgga aaatgcttct 3515tagttgtctt gtctttattt gctttccaag atttggaatt ttatttaatt cctttaagtg 3575ttagcagtgt cttatgaaac atgtatttac ctaacgtttg taacagtttt gtgttgaacc 3635cagatgccct gctatataaa gttgtaaatc tgttctttat tcactaatga tcactgcaaa 3695aatgattaga aatgagattg tacacatgga tgaggatata ttttgcaaat cgaccaaact 3755ttcctaatat tatgatctta aaattcatag agtactttat tgcttcccaa gtttgataat 3815cttgtgggtt tttttttttt ttgatgcatg ggaggttggc aatatagaca aagtggaaat 3875cattagtatg tgagggcctt gattgttatg taatattgcc aatgatgaat tcaggttgtt 3935tttagcacaa gtttctcttt tttatgctgg tattctcact gccacatttt tggaaacctg 3995tattacacct taaatctatc aataaatgat agttttctaa ttct 4039<210>4<211>595<212>prt<213>homo sapien<400>4val gly ser gly ile ser phe gln pro gly ala ile gly val glu val1 5 10 15ser ala met asn pro val asn ala thr ala leu tyr ile ser ala ser20 25 30arg leu val leu asn tyr asp pro gly asp pro lys ala phe thr glu35 40 45ile asn arg leu leu pro tyr phe arg gln ser leu ser cys cys val
50 55 60cys gly his leu leu gln asp pro ile ala pro thr asn ser thr cys65 70 75 80gln his tyr val cys lys thr cys lys gly lys lys met met met lys85 90 95pro ser cys ser trp cys lys asp tyr glu gln phe glu glu asn lys100 105 110gln leu ser ile leu val asn cys tyr lys lys leu cys glu tyr ile115 120 125thr gln thr thr leu ala arg asp ile ile glu ala val asp cys ser130 135 140ser asp ile leu ala leu leu asn asp gly ser leu phe cys glu glu145 150 155 160thr glu lys pro ser asp ser ser phe thr leu cys leu thr his ser165 170 175pro leu pro ser thr ser glu pro thr thr asp pro gln ala ser leu180 185 190ser pro met ser glu ser thr leu ser ile ala ile gly ser ser val195 200 205ile asn gly leu pro thr tyr asn gly leu ser ile asp arg phe gly210 215 220ile asn ile pro ser pro glu his ser asn thr ile asp val cys asn225 230 235 240thr val asp ile lys thr glu asp leu ser asp ser leu pro pro val245 250 255cys asp thr val ala thr asp leu cys ser thr gly ile asp ile cys260 265 270ser phe ser glu asp ile lys pro gly asp ser leu leu leu ser val275 280 285glu glu val leu arg ser leu glu thr val ser asn thr glu val cys290 295 300cys pro asn leu gln pro asn leu glu ala thr val ser asn gly pro305 310 315 320phe leu gln leu ser ser gln ser leu ser his asn val phe met ser325 330 335thr ser pro ala leu his gly leu ser cys thr ala ala thr pro lys340 345 350ile ala lys leu asn arg lys arg ser arg ser glu ser asp ser glu355 360 365lys val gln pro leu pro ile ser thr ile ile arg gly pro thr leu370 375 380gly ala ser ala pro val thr val lys arg glu ser lys ile ser leu385 390 395 400gln pro ile ala thr val pro asn gly gly thr thr pro lys ile ser405 410 415lys thr val leu leu ser thr lys ser met lys lys ser his glu his420 425 430gly ser lys lys ser his ser lys thr lys pro gly ile leu lys lys435 440 445asp lys ala val lys glu lys ile pro ser his his phe met pro gly450 455 460ser pro thr lys thr val tyr lys lys pro gln glu lys lys gly cys465 470 475 480lys cys gly arg ala thr gln asn pro ser val leu thr cys arg gly485 490 495gln arg cys pro cys tyr ser asn arg lys ala cys leu asp cys ile500 505 510cys arg gly cys gln asn ser tyr met ala asn gly glu lys lys leu515 520 525glu ala phe ala val pro glu lys ala leu glu gln thr arg leu thr530 535 540
leu gly ile asn val thr ser ile ala val arg asn ala ser thr ser545 550 555 560thr ser val ile asn val thr gly ser pro val thr thr phe leu ala565 570 575ala ser thr his asp asp lys ser leu asp glu ala ile asp met arg580 585590phe asp cys595<210>5<211>2611<212>dna<213>人<220>
<221>cds<222>(21)...(473)<400>5cttttttcac ctcgtctgaa atg gct gcc tcc cag tgt ctc tgc tgc tca aaa 53met ala ala ser gln cys leu cys cys ser lys1 5 10ttt ctc ttc cag aga cag aac ctc gcc tgt ttc ctc aca aac cca cac101phe leu phe gln arg gln asn leu ala cys phe leu thr asn pro his15 20 25tgt ggc agc ctt gtt aat gca gat ggc cat ggt gaa gtg tgg aca gac149cys gly ser leu val asn ala asp gly his gly glu val trp thr asp30 35 40tgg aat aat atg tcc aag ttt ttc cag tat gga tgg cga tgc acc act197trp asn asn met ser lys phe phe gln tyr gly trp arg cys thr thr45 50 55aat gag aat acc tat tca aac cgt acc ctg atg ggc aac tgg aac cag245asn glu asn thr tyr ser asn arg thr leu met gly asn trp asn gln60 65 70 75gaa aga tat gac ctg agg aat atc gtg cag ccc aaa ccc ttg cct tcc293glu arg tyr asp leu arg asn ile val gln pro lys pro leu pro ser80 85 90cag ttt gga cac tac ttt gaa aca aca tat gat aca agc tac aac aac341gln phe gly his tyr phe glu thr thr tyr asp thr ser tyr asn asn95 100 105aaa atg cca ctt tca aca cat aga ttt aag cga gag cct cac tgg ttc389lys met pro leu ser thr his arg phe lys arg glu pro his trp phe110 115 120cca gga cat caa cct gaa ctg gat cct ccc cga tac aaa tgc aca gaa437pro gly his gln pro glu leu asp pro pro arg tyr lys cys thr glu125 130 135aag tca act tac atg aat agc tat tca aag cct taa attgggcatc 483lys ser thr tyr met asn ser tyr ser lys pro *140 145 150actcaggatg tgtataagat cttaatattg atagtttcac atccaggttt ctaagaaatg 543
ataagatact tcacttttcc agagtgaaat gtaggaggga gcacattcta agtacagcta 603aaaatttagc tcactgtaac acagtttcac tctctgaata aataaagcaa aaaacacagt 663aaatattctt tatccctttt tttgttgttg ttttaaccaa gatttaaatg tcaaatttaa 723tacagcaact cagttctaca tttggggtgt tgtagaaggg ccttaaaaag aattatttta 783ggccaggcac ggtggctcat gcctgtaatc ccagcacttt gggaggccga ggcaggtgga 843tcacgtgagg tcaggagttc gagaccagcc tgaccaacat ggtgaaacac tgtctctact 903aaaaacacaa aaattagctg agcatggtgg ctcacgcctg taatcccagc tactcaggag 963gctgaggcag gggaatcgct tgaacctgag aagtggaggt tgtggtgagc tgagatcatg 1023ccactgcact ttagcctggg tgacagagcg agactctgtc tcaaaaaaaa aaaaaaaaaa 1083agaattattt ctctgaagtc tacaaccact gtggtcttcc cttccttctg tcgtagcaag 1143acctcagaat ctagcataac ttaggctagg tttggctaga tgctttctgg gtataagcca 1203gagtcgtata gtgcaacttt gctgtgacct tagtgaacat cccctcttga ggactacaaa 1263aacaaacgta actttttaaa attattatgg agaattttac gtaaaacaaa agtagacagg 1323ctagtctaat gaactcccat gtatcattac ccagcatcaa ctatttatga ctaatcttac 1383ctacttctac tttgtcttat tgaattaatt ttggagcaga tcttagaaat agaatttaat 1443ctataaaaat cttggtgggc tgggtacggt ggctcatgcc tgtaatccca gcactttggg 1503aggctgaggt gggtggatca cctgaggtca ggagtccaag accagcctgg ccaatgtggt 1563gaaactccat ctcttctaaa aatacaaaaa ttagctggtc ttggtggcgg gcgcctgtaa 1623tcccagctac ttgggaggct gaggcaggag aattgcttga acccaggaag cagaggttgc 1683agtgagctga gacggtgcca ttgctctcca gcctgggcga caagagcgaa actccgtctc 1743aaaaaaaaaa aagaaaagaa aaagaaaaaa aaaatcttgg tatactggct gggcacagtg 1803gctcacacct aatcccagca ctttgggagg ctgaggcagg aggatagctt gaggctggga 1863gttcaaaacc agcctgggca acatagcaag accccatctc taccaaaaaa aattttttta 1923aagatttcag gtatatttct caaaaagata aggactgtca attgtctact cccccccaac 1983aaaggtcact aaggaaacct gttgactaaa caaagctcat taaacctatt gtagtgtagc 2043aaaggagacc atcaacttga cacagagtct tggtaatgat tcaaagggag gatgttagag 2103taaggtattt ataaggattt gagataaggg tccaactggt ttaaaatgag tcaaaatagg 2163gaactagtag agactgagaa agggttgtga atagcttagg tttggtaaac ttaggaaatc 2223aacagtttta attttaatat ggttaaactg attagtattt cctatttttt tatctactgt 2283gtaagaagac cctataatat atgggcatta ctgagagata ctgcccatat gttgtcctcg 2343taagcaagga gatatttttt atctcccata tattaccttt caaacctttg ttactttagt 2403ttcgagatat agatccagtt tatgttgtta ctcagtagtg aggaagtttc tttttttttt 2463ttaaatggct atcaagttgt ccccccatta gttattgaaa agaccataat tttttcactc 2523ctattcaatg ccatttttat tgtaaataaa ctatgtacat gtaaaaaaaa aaaaaaaaaa 2583aaaaaaaaaa aaaaaaaaaa aaaaaaaa2611<210>6<211>150<212>prt<213>人<400>6met ala ala ser gln cys leu cys cys ser lys phe leu phe gln arg1 5 10 15gln asn leu ala cys phe leu thr asn pro his cys gly ser leu val20 25 30asn ala asp gly his gly glu val trp thr asp trp asn asn met ser35 40 45lys phe phe gln tyr gly trp arg cys thr thr asn glu asn thr tyr50 55 60ser asn arg thr leu met gly asn trp asn gln glu arg tyr asp leu65 70 75 80arg asn ile val gln pro lys pro leu pro ser gln phe gly his tyr85 90 95phe glu thr thr tyr asp thr ser tyr asn asn lys met pro leu ser100 105 110thr his arg phe lys arg glu pro his trp phe pro gly his gln pro115 120 125glu leu asp pro pro arg tyr lys cys thr glu lys ser thr tyr met130 135 140asn ser tyr ser lys pro
145 150<210>7<211>3296<212>dna<213>人<220>
<221>cds<222>(65)...(1735)<400>7cggaggaggc gaggagcgcc gggtaccggg ccgggggagc cgcgggctct cggggaagag 60acgg atg atg aac aag ctt tac atc ggg aac ctg agc ccc gcc gtc acc 109met met asn lys leu tyr ile gly asn leu ser pro ala val thr1 5 10 15gcc gac gac ctc cgg cag ctc ttt ggg gac agg aag ctg ccc ctg gcg157ala asp asp leu arg gln leu phe gly asp arg lys leu pro leu ala20 25 30gga cag gtc ctg ctg aag tcc ggc tac gcc ttc gtg gac tac ccc gac205gly gln val leu leu lys ser gly tyr ala phe val asp tyr pro asp35 40 45cag aac tgg gcc atc cgc gcc atc gag acc ctc tcg ggt aaa gtg gaa253gln asn trp ala ile arg ala ile glu thr leu ser gly lys val glu50 55 60ttg cat ggg aaa atc atg gaa gtt gat tac tca gtc tct aaa aag cta301leu his gly lys ile met glu val asp tyr ser val ser lys lys leu65 70 75agg agc agg aaa att cag att cga aac atc cct cct cac ctg cag tgg349arg ser arg lys ile gln ile arg asn ile pro pro his leu gln trp80 85 90 95gag gtg ttg gat gga ctt ttg gct caa tat ggg aca gtg gag aat gtg397glu val leu asp gly leu leu ala gln tyr gly thr val glu asn val100 105 110gaa caa gtc aac aca gac aca gaa acc gcc gtt gtc aac gtc aca tat445glu gln val asn thr asp thr glu thr ala val val asn val thr tyr115 120 125gca aca aga gaa gaa gca aaa ata gcc atg gag aag cta agc ggg cat493ala thr arg glu glu ala lys ile ala met glu lys leu ser gly his130 135 140cag ttt gag aac tac tcc ttc aag att tcc tac atc ccg gat gaa gag541gln phe glu asn tyr ser phe lys ile ser tyr ile pro asp glu glu145 150 155gtg agc tcc cct tcg ccc cct cag cga gcc cag cgt ggg gac cac tct589val ser ser pro ser pro pro gln arg ala gln arg gly asp his ser160 165 170 175tcc cgg gag caa ggc cac gcc cct ggg ggc act tct cag gcc aga cag637ser arg glu gln gly his ala pro gly gly thr ser gln ala arg gln180 185 190
att gat ttc ccg ctg cgg atc ctg gtc ccc acc cag ttt gtt ggt gcc685ile asp phe pro leu arg ile leu val pro thr gln phe val gly ala195 200 205atc atc gga aag gag ggc ttg acc ata aag aac atc act aag cag acc733ile ile gly lys glu gly leu thr ile lys asn ile thr lys gln thr210 215 220cag tcc cgg gta gat atc cat aga aaa gag aac tct gga gct gca gag781gln ser arg val asp ile his arg lys glu asn ser gly ala ala glu225 230 235aag cct gtc acc atc cat gcc acc cca gag ggg act tct gaa gca tgc829lys pro val thr ile his ala thr pro glu gly thr ser glu ala cys240 245 250 255cgc atg att ctt gaa atc atg cag aaa gag gca gat gag acc aaa cta877arg met ile leu glu ile met gln lys glu ala asp glu thr lys leu260 265 270gcc gaa gag att cct ctg aaa atc ttg gca cac aat ggc ttg gtt gga925ala glu glu ile pro leu lys ile leu ala his asn gly leu val gly275 280 285aga ctg att gga aaa gaa ggc aga aat ttg aag aaa att gaa cat gaa973arg leu ile gly lys glu gly arg asn leu lys lys ile glu his glu290 295 300aca ggg acc aag ata aca atc tca tct ttg cag gat ttg agc ata tac1021thr gly thr lys ile thr ile ser ser leu gln asp leu ser ile tyr305 310 315aac ccg gaa aga acc atc act gtg aag ggc aca gtt gag gcc tgt gcc1069asn pro glu arg thr ile thr val lys gly thr val glu ala cys ala320 325 330 335agt gct gag ata gag att atg aag aag ctg cgt gag gcc ttt gaa aat1117ser ala glu ile glu ile met lys lys leu arg glu ala phe glu asn340 345 350gat atg ctg gct gtt aac acc cac tcc gga tac ttc tcc agc ctg tac1165asp met leu ala val asn thr his ser gly tyr phe ser ser leu tyr355 360 365ccc cat cac cag ttt ggc ccg ttc ccg cat cat cac tct tat cca gag1213pro his his gln phe gly pro phe pro his his his ser tyr pro glu370 375 380cag gag att gtg aat ctc ttc atc cca acc cag gct gtg ggc gcc atc1261gln glu ile val asn leu phe ile pro thr gln ala val gly ala ile385 390 395atc ggg aag aag ggg gca cac atc aaa cag ctg gcg aga ttc gcc gga1309ile gly lys lys gly ala his ile lys gln leu ala arg phe ala gly400 405 410 415gcc tct atc aag att gcc cct gcg gaa ggc cca gac gtc agc gaa agg1357ala ser ile lys ile ala pro ala glu gly pro asp val ser glu arg420 425 430
atg gtc atc atc acc ggg cca ccg gaa gcc cag ttc aag gcc cag gga 1405met val ile ile thr gly pro pro glu ala gln phe lys ala gln gly435 440 445cgg atc ttt ggg aaa ctg aaa gag gaa aac ttc ttt aac ccc aaa gaa 1453arg ile phe gly lys leu lys glu glu asn phe phe asn pro lys glu450 455 460gaa gtg aag ctg gaa gcg cat atc aga gtg ccc tct tcc aca gct ggc 1501glu val lys leu glu ala his ile arg val pro ser ser thr ala gly465 470 475cgg gtg att ggc aaa ggt ggc aag acc gtg aac gaa ctg cag aac tta 1549arg val ile gly lys gly gly lys thr val asn glu leu gln asn leu480 485 490 495acc agt gca gaa gtc atc gtg cct cgt gac caa acg cca gat gaa aat 1597thr ser ala glu val ile val pro arg asp gln thr pro asp glu asn500 505 510gag gaa gtg atc gtc aga att atc ggg cac ttc ttt gct agc cag act 1645glu glu val ile val arg ile ile gly his phe phe ala ser gln thr515 520 525gca cag cgc aag atc agg gaa att gta caa cag gtg aag cag cag gag 1693ala gln arg lys ile arg glu ile val gln gln val lys gln gln glu530 535 540cag aaa tac cct cag gga gtc gcc tca cag cgc agc aag tga 1735gln lys tyr pro gln gly val ala ser gln arg ser lys *545 550 555ggctcccaca ggcaccagca aaacaacgga tgaatgtagc ccttccaaca cctgacagaa 1795tgagaccaaa cgcagccagc cagatcggga gcaaaccaaa gaccatctga ggaatgagaa 1855gtctgcggag gcggccaggg actctgccga ggccctgaga accccagggg ccgaggaggg 1915gcggggaagg tcagccaggt ttgccagaac caccgagccc cgcctcccgc cccccagggc 1975ttctgcaggc ttcagccatc cacttcacca tccactcgga tctctcctga actcccacga 2035cgctatccct tttagttgaa ctaacatagg tgaacgtgtt caaagccaag caaaatgcac 2095accctttttc tgtggcaaat cgtctctgta catgtgtgta catattagaa agggaagatg 2155ttaagatatg tggcctgtgg gttacacagg gtgcctgcag cggtaatata ttttagaaat 2215aatatatcaa ataactcaac taactccaat ttttaatcaa ttattaattt ttttttcttt 2275ttaaagagaa agcaggcttt tctagacttt aaagaataaa gtctttggga ggtctcacgg 2335tgtagagagg agctttgagg ccacccgcac aaaattcacc cagagggaaa tctcgtcgga 2395aggacactca cggcagttct ggatcacctg tgtatgtcaa cagaagggat accgtctcct 2455tgaagaggaa actctgtcac tcctcatgcc tgtctagctc atacacccat ttctctttgc 2515ttcacaggtt ttaaactggt tttttgcata ctgctatata attctctgtc tctctctgtt 2575tatctctccc ctccctcccc tccccttctt ctccatctcc attcttttga atttcctcat 2635ccctccatct caatcccgta tctacgcacc cccccccccc aggcaaagca gtgctctgag 2695tatcacatca cacaaaagga acaaaagcga aacacacaaa ccagcctcaa cttacacttg 2755gttactcaaa agaacaagag tcaatggtac ttgtcctagc gttttggaag aggaaaacag 2815gaacccacca aaccaaccaa tcaaccaaac aaagaaaaaa ttccacaatg aaagaatgta 2875ttttgtcttt ttgcattttg gtgtataagc catcaatatt cagcaaaatg attcctttct 2935ttaaaaaaaa aaaatgtgga ggaaagtaga aatttaccaa ggttgttggc ccagggcgtt 2995aaattcacag atttttttaa cgagaaaaac acacagaaga agctacctca ggtgttttta 3055cctcagcacc ttgatcttgt gtttccctta gagattttgt aaagctgata gttggagcat 3115ttttttattt ttttaataaa aatgagttgg aaaaaaaata agatatcaac tgccagcctg 3175gagaaggtga cagtccaagt gtgcaacagc tgttctgaat tgtcttccgc tagccaagaa 3235cctatatggc cttcttttgg acaaaccttg aaaatgttta tttaaaaaaa aaaaaaaaaa 3295a 3296
<210>8<211>556<212>prt<213>人<400>8met met asn lys leu tyr ile gly asn leu ser pro ala val thr ala1 5 10 15asp asp leu arg gln leu phe gly asp arg lys leu pro leu ala gly20 25 30gln val leu leu lys ser gly tyr ala phe val asp tyr pro asp gln35 40 45asn trp ala ile arg ala ile glu thr leu ser gly lys val glu leu50 55 60his gly lys ile met glu val asp tyr ser val ser lys lys leu arg65 70 75 80ser arg lys ile gln ile arg asn ile pro pro his leu gln trp glu85 90 95val leu asp gly leu leu ala gln tyr gly thr val glu asn val glu100 105 110gln val asn thr asp thr glu thr ala val val asn val thr tyr ala115 120 125thr arg glu glu ala lys ile ala met glu lys leu ser gly his gln130 135 140phe glu asn tyr ser phe lys ile ser tyr ile pro asp glu glu val145 150 155 160ser ser pro ser pro pro gln arg ala gln arg gly asp his ser ser165 170 175arg glu gln gly his ala pro gly gly thr ser gln ala arg gln ile180 185 190asp phe pro leu arg ile leu val pro thr gln phe val gly ala ile195 200 205ile gly lys glu gly leu thr ile lys asn ile thr lys gln thr gln210 215 220ser arg val asp ile his arg lys glu asn ser gly ala ala glu lys225 230 235 240pro val thr ile his ala thr pro glu gly thr ser glu ala cys arg245 250 255met ile leu glu ile met gln lys glu ala asp glu thr lys leu ala260 265 270glu glu ile pro leu lys ile leu ala his asn gly leu val gly arg275 280 285leu ile gly lys glu gly arg asn leu lys lys ile glu his glu thr290 295 300gly thr lys ile thr ile ser ser leu gln asp leu ser ile tyr asn305 310 315 320pro glu arg thr ile thr val lys gly thr val glu ala cys ala ser325 330 335ala glu ile glu ile met lys lys leu arg glu ala phe glu asn asp340 345 350met leu ala val asn thr his ser gly tyr phe ser ser leu tyr pro355 360 365his his gln phe gly pro phe pro his his his ser tyr pro glu gln370 375 380glu ile val asn leu phe ile pro thr gln ala val gly ala ile ile385 390 395 400gly lys lys gly ala his ile lys gln leu ala arg phe ala gly ala405 410 415ser ile lys ile ala pro ala glu gly pro asp val ser glu arg met
420 425 430val ile ile thr gly pro pro glu ala gln phe lys ala gln gly arg435 440 445ile phe gly lys leu lys glu glu asn phe phe asn pro lys glu glu450 455 460val lys leu glu ala his ile arg val pro ser ser thr ala gly arg465 470 475 480val ile gly lys gly gly lys thr val asn glu leu gln asn leu thr485 490 495ser ala glu val ile val pro arg asp gln thr pro asp glu asn glu500 505 510glu val ile val arg ile ile gly his phe phe ala ser gln thr ala515 520 525gln arg lys ile arg glu ile val gln gln val lys gln gln glu gln530 535 540lys tyr pro gln gly val ala ser gln arg ser lys545 550 555<210>9<211>3164<212>dna<213>人<220>
<221>cds<222>(65)...(1603)<400>9cggaggaggc gaggagcgcc gggtaccggg ccgggggagc cgcgggctct cggggaagag 60acgg atg atg aac aag ctt tac atc ggg aac ctg agc ccc gcc gtc acc 109met met asn lys leu tyr ile gly asn leu ser pro ala val thr1 5 10 15gcc gac gac ctc cgg cag ctc ttt ggg gac agg aag ctg ccc ctg gcg157ala asp asp leu arg gln leu phe gly asp arg lys leu pro leu ala20 25 30gga cag gtc ctg ctg aag tcc ggc tac gcc ttc gtg gac tac ccc gac205gly gln val leu leu lys ser gly tyr ala phe val asp tyr pro asp35 40 45cag aac tgg gcc atc cgc gcc atc gag acc ctc tcg ggt aaa gtg gaa253gln asn trp ala ile arg ala ile glu thr leu ser gly lys val glu50 55 60ttg cat ggg aaa atc atg gaa gtt gat tac tca gtc tct aaa aag cta301leu his gly lys ile met glu val asp tyr ser val ser lys lys leu65 70 75agg agc agg aaa att cag att cga aac atc cct cct cac ctg cag tgg349arg ser arg lys ile gln ile arg asn ile pro pro his leu gln trp80 85 90 95gag gtg ttg gat gga ctt ttg gct caa tat ggg aca gtg gag aat gtg397glu val leu asp gly leu leu ala gln tyr gly thr val glu asn val100 105 110gaa caa gtc aac aca gac aca gaa acc gcc gtt gtc aac gtc aca tat445glu gln val asn thr asp thr glu thr ala val val asn val thr tyr115 120 125
gca aca aga gaa gaa gca aaa ata gcc atg gag aag cta agc ggg cat493ala thr arg glu glu ala lys ile ala met glu lys leu ser gly his130 135 140cag ttt gag aac tac tcc ttc aag att tcc tac atc ccg gat gaa gag541gln phe glu asn tyr ser phe lys ile ser tyr ile pro asp glu glu145 150 155ttt gtt ggt gcc atc atc gga aag gag ggc ttg acc ata aag aac atc589phe val gly ala ile ile gly lys glu gly leu thr ile lys asn ile160 165 170 175act aag cag acc cag tcc cgg gta gat atc cat aga aaa gag aac tct637thr lys gln thr gln ser arg val asp ile his arg lys glu asn ser180 185 190gga gct gca gag aag cct gtc acc atc cat gcc acc cca gag ggg act685gly ala ala glu lys pro val thr ile his ala thr pro glu gly thr195 200 205tct gaa gca tgc cgc atg att ctt gaa atc atg cag aaa gag gca gat733ser glu ala cys arg met ile leu glu ile met gln lys glu ala asp210 215 220gag acc aaa cta gcc gaa gag att cct ctg aaa atc ttg gca cac aat781glu thr lys leu ala glu glu ile pro leu lys ile leu ala his asn225 230 235ggc ttg gtt gga aga ctg att gga aaa gaa ggc aga aat ttg aag aaa829gly leu val gly arg leu ile gly lys glu gly arg asn leu lys lys240 245 250 255att gaa cat gaa aca ggg acc aag ata aca atc tca tct ttg cag gat877ile glu his glu thr gly thr lys ile thr ile ser ser leu gln asp260 265 270ttg agc ata tac aac ccg gaa aga acc atc act gtg aag ggc aca gtt925leu ser ile tyr asn pro glu arg thr ile thr val lys gly thr val275 280 285gag gcc tgt gcc agt gct gag ata gag att atg aag aag ctg cgt gag973glu ala cys ala ser ala glu ile glu ile met lys lys leu arg glu290 295 300gcc ttt gaa aat gat atg ctg gct gtt aac acc cac tcc gga tac ttc1021ala phe glu asn asp met leu ala val asn thr his ser gly tyr phe305 310 315tcc agc ctg tac ccc cat cac cag ttt ggc ccg ttc ccg cat cat cac1069ser ser leu tyr pro his his gln phe gly pro phe pro his his his320 325 330 335tct tat cca gag cag gag att gtg aat ctc ttc atc cca acc cag gct1117ser tyr pro glu gln glu ile val asn leu phe ile pro thr gln ala340 345 350gtg ggc gcc atc atc ggg aag aag ggg gca cac atc aaa cag ctg gcg1165val gly ala ile ile gly lys lys gly ala his ile lys gln leu ala355 360 365
aga ttc gcc gga gcc tct atc aag att gcc cct gcg gaa ggc cca gac 1213arg phe ala gly ala ser ile lys ile ala pro ala glu gly pro asp370 375 380gtc agc gaa agg atg gtc atc atc acc ggg cca ccg gaa gcc cag ttc 1261val ser glu arg met val ile ile thr gly pro pro glu ala gln phe385 390 395aag gcc cag gga cgg atc ttt ggg aaa ctg aaa gag gaa aac ttc ttt 1309lys ala gln gly arg ile phe gly lys leu lys glu glu asn phe phe400 405 410 415aac ccc aaa gaa gaa gtg aag ctg gaa gcg cat atc aga gtg ccc tct 1357asn pro lys glu glu val lys leu glu ala his ile arg val pro ser420 425 430tcc aca gct ggc cgg gtg att ggc aaa ggt ggc aag acc gtg aac gaa 1405ser thr ala gly arg val ile gly lys gly gly lys thr val asn glu435 440 445ctg cag aac tta acc agt gca gaa gtc atc gtg cct cgt gac caa acg 1453leu gln asn leu thr ser ala glu val ile val pro arg asp gln thr450 455 460cca gat gaa aat gag gaa gtg atc gtc aga att atc ggg cac ttc ttt 1501pro asp glu asn glu glu val ile val arg ile ile gly his phe phe465 470 475gct agc cag act gca cag cgc aag atc agg gaa att gta caa cag gtg 1549ala ser gln thr ala gln arg lys ile arg glu ile val gln gln val480 485 490 495aag cag cag gag cag aaa tac cct cag gga gtc gcc tca cag cgc agc 1597lys gln gln glu gln lys tyr pro gln gly val ala ser gln arg ser500 505 510aag tga ggctcccaca ggcaccagca aaacaacgga tgaatgtagc ccttccaaca1653lys *cctgacagaa tgagaccaaa cgcagccagc cagatcggga gcaaaccaaa gaccatctga 1713ggaatgagaa gtctgcggag gcggccaggg actctgccga ggccctgaga accccagggg 1773ccgaggaggg gcggggaagg tcagccaggt ttgccagaac caccgagccc cgcctcccgc 1833cccccagggc ttctgcaggc ttcagccatc cacttcacca tccactcgga tctctcctga 1893actcccacga cgctatccct tttagttgaa ctaacatagg tgaacgtgtt caaagccaag 1953caaaatgcac accctttttc tgtggcaaat cgtctctgta catgtgtgta catattagaa 2013agggaagatg ttaagatatg tggcctgtgg gttacacagg gtgcctgcag cggtaatata 2073ttttagaaat aatatatcaa ataactcaac taactccaat ttttaatcaa ttattaattt 2133ttttttcttt ttaaagagaa agcaggcttt tctagacttt aaagaataaa gtctttggga 2193ggtctcacgg tgtagagagg agctttgagg ccacccgcac aaaattcacc cagagggaaa 2253tctcgtcgga aggacactca cggcagttct ggatcacctg tgtatgtcaa cagaagggat 2313accgtctcct tgaagaggaa actctgtcac tcctcatgcc tgtctagctc atacacccat 2373ttctctttgc ttcacaggtt ttaaactggt tttttgcata ctgctatata attctctgtc 2433tctctctgtt tatctctccc ctccctcccc tccccttctt ctccatctcc attcttttga 2493atttcctcat ccctccatct caatcccgta tctacgcacc cccccccccc aggcaaagca 2553gtgctctgag tatcacatca cacaaaagga acaaaagcga aacacacaaa ccagcctcaa 2613cttacacttg gttactcaaa agaacaagag tcaatggtac ttgtcctagc gttttggaag 2673aggaaaacag gaacccacca aaccaaccaa tcaaccaaac aaagaaaaaa ttccacaatg 2733aaagaatgta ttttgtcttt ttgcattttg gtgtataagc catcaatatt cagcaaaatg 2793attcctttct ttaaaaaaaa aaaatgtgga ggaaagtaga aatttaccaa ggttgttggc 2853ccagggcgtt aaattcacag atttttttaa cgagaaaaac acacagaaga agctacctca 2913
ggtgttttta cctcagcacc ttgatcttgt gtttccctta gagattttgt aaagctgata 2973gttggagcat ttttttattt ttttaataaa aatgagttgg aaaaaaaata agatatcaac 3033tgccagcctg gagaaggtga cagtccaagt gtgcaacagc tgttctgaat tgtcttccgc 3093tagccaagaa cctatatggc cttcttttgg acaaaccttg aaaatgttta tttaaaaaaa 3153aaaaaaaaaa a 3164<210>10<211>512<212>prt<213>人<400>10met met asn lys leu tyr ile gly asn leu ser pro ala val thr ala1 5 10 15asp asp leu arg gln leu phe gly asp arg lys leu pro leu ala gly20 25 30gln val leu leu lys ser gly tyr ala phe val asp tyr pro asp gln35 40 45asn trp ala ile arg ala ile glu thr leu ser gly lys val glu leu50 55 60his gly lys ile met glu val asp tyr ser val ser lys lys leu arg65 70 75 80ser arg lys ile gln ile arg asn ile pro pro his leu gln trp glu85 90 95val leu asp gly leu leu ala gln tyr gly thr val glu asn val glu100 105 110gln val asn thr asp thr glu thr ala val val asn val thr tyr ala115 120 125thr arg glu glu ala lys ile ala met glu lys leu ser gly his gln130 135 140phe glu asn tyr ser phe lys ile ser tyr ile pro asp glu glu phe145 150 155 160val gly ala ile ile gly lys glu gly leu thr ile lys asn ile thr165 170 175lys gln thr gln ser arg val asp ile his arg lys glu asn ser gly180 185 190ala ala glu lys pro val thr ile his ala thr pro glu gly thr ser195 200 205glu ala cys arg met ile leu glu ile met gln lys glu ala asp glu210 215 220thr lys leu ala glu glu ile pro leu lys ile leu ala his asn gly225 230 235 240leu val gly arg leu ile gly lys glu gly arg asn leu lys lys ile245 250 255glu his glu thr gly thr lys ile thr ile ser ser leu gln asp leu260 265 270ser ile tyr asn pro glu arg thr ile thr val lys gly thr val glu275 280 285ala cys ala ser ala glu ile glu ile met lys lys leu arg glu ala290 295 300phe glu asn asp met leu ala val asn thr his ser gly tyr phe ser305 310 315 320ser leu tyr pro his his gln phe gly pro phe pro his his his ser325 330 335tyr pro glu gln glu ile val asn leu phe ile pro thr gln ala val340 345 350gly ala ile ile gly lys lys gly ala his ile lys gln leu ala arg355 360 365phe ala gly ala ser ile lys ile ala pro ala glu gly pro asp val370 375 380ser glu arg met val ile ile thr gly pro pro glu ala gln phe lys
385 390 395 400ala gln gly arg ile phe gly lys leu lys glu glu asn phe phe asn405 410 415pro lys glu glu val lys leu glu ala his ile arg val pro ser ser420 425 430thr ala gly arg val ile gly lys gly gly lys thr val asn glu leu435 440 445gln asn leu thr ser ala glu val ile val pro arg asp gln thr pro450 455 460asp glu asn glu glu val ile val arg ile ile gly his phe phe ala465 470 475 480ser gln thr ala gln arg lys ile arg glu ile val gln gln val lys485 490 495gln gln glu gln lys tyr pro gln gly val ala ser gln arg ser lys500 505 510<210>11<211>1580<212>dna<213>人<220>
<221>cds<222>(220)...(1050)<400>11catcctgcca cccctagcct tgctggggac gtgaaccctc tccccgcgcc tgggaagcct 60tcttggcacc gggacccgga gaatccccac ggaagccagt tccaaaaggg atgaaaaggg 120ggcgtttcgg gcactgggag aagcctgtat tccagggccc ctcccagagc aggaatctgg 180gacccaggag tgccagcctc acccacgcag atcctggcc atg aga gct ccg cac 234met arg ala pro his1 5ctc cac ctc tcc gcc gcc tct ggc gcc cgg gct ctg gcg aag ctg ctg282leu his leu ser ala ala ser gly ala arg ala leu ala lys leu leu10 15 20ccg ctg ctg atg gcg caa ctc tgg gcc gca gag gcg gcg ctg ctc ccc330pro leu leu met ala gln leu trp ala ala glu ala ala leu leu pro25 30 35caa aac gac acg cgc ttg gac ccc gaa gcc tat ggc tcc ccg tgc gcg378gln asn asp thr arg leu asp pro glu ala tyr gly ser pro cys ala40 45 50cgc ggc tcg cag ccc tgg cag gtc tcg ctc ttc aac ggc ctc tcg ttc426arg gly ser gln pro trp gln val ser leu phe asn gly leu ser phe55 60 65cac tgc gcg ggt gtc ctg gtg gac cag agt tgg gtg ctg acg gcc gcg474his cys ala gly val leu val asp gln ser trp val leu thr ala ala70 75 80 85cac tgc gga aac aag cca ctg tgg gct cga gta ggg gat gac cac ctg522his cys gly asn lys pro leu trp ala arg val gly asp asp his leu90 95 100ctg ctt ctt cag gga gag cag ctc cgc cgg acc act cgc tct gtt gtc570leu leu leu gln gly glu gln leu arg arg thr thr arg ser val val105 110 115
cat ccc aag tac cac cag ggc tca ggc ccc atc ctg cca agg cga acg618his pro lys tyr his gln gly ser gly pro ile leu pro arg arg thr120 125 130gat gag cac gat ctc atg ttg ctg aag ctg gcc agg ccc gta gtg ctg666asp glu his asp leu met leu leu lys leu ala arg pro val val leu135 140 145ggg ccc cgc gtc cgg gcc ctg cag ctt ccc tac cgc tgt gct cag ccc714gly pro arg val arg ala leu gln leu pro tyr arg cys ala gln pro150 155 160 165gga gac cag tgc cag gtt gct ggc tgg ggc acc acg gcc gcc cgg aga762gly asp gln cys gln val ala gly trp gly thr thr ala ala arg arg170 175 180gtg aag tac aac aag ggc ctg acc tgc tcc agc atc act atc ctg agc810val lys tyr asn lys gly leu thr cys ser ser ile thr ile leu ser185 190 195cct aaa gag tgt gag gtc ttc tac cct ggc gtg gtc acc aac aac atg858pro lys glu cys glu val phe tyr pro gly val val thr asn asn met200 205 210ata tgt gct gga ctg gac cgg ggc cag gac cct tgc cag agt gac tct906ile cys ala gly leu asp arg gly gln asp pro cys gln ser asp ser215 220 225gga ggc ccc ctg gtc tgt gac gag acc ctc caa ggc atc ctc tcg tgg954gly gly pro leu val cys asp glu thr leu gln gly ile leu ser trp230 235 240 245ggt gtt tac ccc tgt ggc tct gcc cag cat cca gct gtc tac acc cag1002gly val tyr pro cys gly ser ala gln his pro ala val tyr thr gln250 255 260atc tgc aaa tac atg tcc tgg atc aat aaa gtc ata cgc tcc aac tga1050ile cys lys tyr met ser trp ile asn lys val ile arg ser asn *265 270 275tccagatgct acgctccagc tgatccagat gttatgctcc tgctgatcca gatgcccaga 1110ggctccatcg tccatcctct tcctccccag tcggctgaac tctccccttg tctgcactgt 1170tcaaacctct gccgccctcc acacctctaa acatctcccc tctcacctca ttcccccacc 1230tatccccatt ctctgcctgt actgaagctg aaatgcagga agtggtggca aaggtttatt 1290ccagagaagc caggaagccg gtcatcaccc agcctctgag agcagttact ggggtcaccc 1350aacctgactt cctctgccac tccctgctgt gtgactttgg gcaagccaag tgccctctct 1410gaacctcagt ttcctcatct gcaaaatggg aacaatgacg tgcctacctc ttagacatgt 1470tgtgaggaga ctatgatata acatgtgtat gtaaatcttc atggtgattg tcatgtaagg 1530cttaacacag tgggtggtga gttctgacta aaggttacct gttgtcgtga 1580<210>12<211>276<212>prt<213>人<400>12met arg ala pro his leu his leu ser ala ala ser gly ala arg ala1 5 10 15leu ala lys leu leu pro leu leu met ala gln leu trp ala ala glu20 25 30
ala ala leu leu pro gln asn asp thr arg leu asp pro glu ala tyr35 40 45gly ser pro cys ala arg gly ser gln pro trp gln val ser leu phe50 55 60asn gly leu ser phe his cys ala gly val leu val asp gln ser trp65 70 75 80val leu thr ala ala his cys gly asn lys pro leu trp ala arg val85 90 95gly asp asp his leu leu leu leu gln gly glu gln leu arg arg thr100 105 110thr arg ser val val his pro lys tyr his gln gly ser gly pro ile115 120 125leu pro arg arg thr asp glu his asp leu met leu leu lys leu ala130 135 140arg pro val val leu gly pro arg val arg ala leu gln leu pro tyr145 150 155 160arg cys ala gln pro gly asp gln cys gln val ala gly trp gly thr165 170 175thr ala ala arg arg val lys tyr asn lys gly leu thr cys ser ser180 185 190ile thr ile leu ser pro lys glu cys glu val phe tyr pro gly val195 200 205val thr asn asn met ile cys ala gly leu asp arg gly gln asp pro210 215 220cys gln ser asp ser gly gly pro leu val cys asp glu thr leu gln225 230 235 240gly ile leu ser trp gly val tyr pro cys gly ser ala gln his pro245 250 255ala val tyr thr gln ile cys lys tyr met ser trp ile asn lys val260 265 270ile arg ser asn275<210>13<211>1512<212>dna<213>人<220>
<221>cds<222>(246)...(980)<400>13aggcggacaa aacccgattg ttcctgggcc ctttccccat cgcgcctggg cctgctcccc 60agcccggggc aggggcgggg gccagtgtgg tgacacacgc tgtagctgtc tccccggctg 120gctggctcgc tctctcctgg ggacacagag gtcggcaggc agcacacaga gggacctacg 180ggcagctgtt ccttcccccg actcaagaat ccccggaggc ccggaggcct gcagcaggag 240cggcc atg aag aag ctg atg gtg gtg ctg agt ctg att gct gca gcc tgg 290met lys lys leu met val val leu ser leu ile ala ala ala trp1 5 10 15gca gag gag cag aat aag ttg gtg cat ggc gga ccc tgc gac aag aca338ala glu glu gln asn lys leu val his gly gly pro cys asp lys thr20 25 30tct cac ccc tac caa gct gcc ctc tac acc tcg ggc cac ttg ctc tgt386ser his pro tyr gln ala ala leu tyr thr ser gly his leu leu cys35 40 45
ggt ggg gtc ctt atc cat cca ctg tgg gtc ctc aca gct gcc cac tgc434gly gly val leu ile his pro leu trp val leu thr ala ala his cys50 55 60aaa aaa ccg aat ctt cag gtc ttc ctg ggg aag cat aac ctt cgg caa482lys lys pro asn leu gln val phe leu gly lys his asn leu arg gln65 70 75agg gag agt tcc cag gag cag agt tct gtt gtc cgg gct gtg atc cac530arg glu ser ser gln glu gln ser ser val val arg ala val ile his80 85 90 95cct gac tat gat gcc gcc agc cat gac cag gac atc atg ctg ttg cgc578pro asp tyr asp ala ala ser his asp gln asp ile met leu leu arg100 105 110ctg gca cgc cca gcc aaa ctc tct gaa ctc atc cag ccc ctt ccc ctg626leu ala arg pro ala lys leu ser glu leu ile gln pro leu pro leu115 120 125gag agg gac tgc tca gcc aac acc acc agc tgc cac atc ctg ggc tgg674glu arg asp cys ser ala asn thr thr ser cys his ile leu gly trp130 135 140ggc aag aca gca gat ggt gat ttc cct gac acc atc cag tgt gca tac722gly lys thr ala asp gly asp phe pro asp thr ile gln cys ala tyr145 150 155atc cac ctg gtg tcc cgt gag gag tgt gag cat gcc tac cct ggc cag770ile his leu val ser arg glu glu cys glu his ala tyr pro gly gln160 165 170 175atc acc cag aac atg ttg tgt gct ggg gat gag aag tac ggg aag gat818ile thr gln asn met leu cys ala gly asp glu lys tyr gly lys asp180 185 190tcc tgc cag ggt gat tct ggg ggt ccg ctg gta tgt gga gac cac ctc866ser cys gln gly asp ser gly gly pro leu val cys gly asp his leu195 200 205cga ggc ctt gtg tca tgg ggt aac atc ccc tgt gga tca aag gag aag914arg gly leu val ser trp gly asn ile pro cys gly ser lys glu lys210 215 220cca gga gtc tac acc aac gtc tgc aga tac acg aac tgg atc caa aaa962pro gly val tyr thr asn val cys arg tyr thr asn trp ile gln lys225 230 235acc att cag gcc aag tga ccctgacatg tgacatctac ctcccgacct 1010thr ile gln ala lys *240accaccccac tggctggttc cagaacgtct ctcacctaga ccttgcctcc cctcctctcc 1070tgcccagctc tgaccctgat gcttaataaa cgcagcgacg tgagggtcct gattctccct 1130ggttttaccc cagctccatc cttgcatcac tggggaggac gtgatgagtg aggacttggg 1190tcctcggtct tacccccacc actaagagaa tacaggaaaa tcccttctag gcatctcctc 1250tccccaaccc ttccacacgt ttgatttctt cctgcagagg cccagccacg tgtctggaat 1310cccagctccg ctgcttactg tcggtgtccc cttgggatgt acctttcttc actgcagatt 1370tctcacctgt aagatgaaga taaggatgat acagtctcca taaggcagtg gctgttggaa 1430agatttaagg tttcacacct atgacataca tggaatagca cctgggccac catgcactca 1490ataaagaatg aattttatta tg 1512
<210>14<211>244<212>prt<213>人<400>14met lys lys leu met val val leu ser leu ile ala ala ala trp ala1 5 10 15glu glu gln asn lys leu val his gly gly pro cys asp lys thr ser20 25 30his pro tyr gln ala ala leu tyr thr ser gly his leu leu cys gly35 40 45gly val leu ile his pro leu trp val leu thr ala ala his cys lys50 55 60lys pro asn leu gln val phe leu gly lys his asn leu arg gln arg65 70 75 80glu ser ser gln glu gln ser ser val val arg ala val ile his pro85 90 95asp tyr asp ala ala ser his asp gln asp ile met leu leu arg leu100 105 110ala arg pro ala lys leu ser glu leu ile gln pro leu pro leu glu115 120 125arg asp cys ser ala asn thr thr ser cys his ile leu gly trp gly130 135 140lys thr ala asp gly asp phe pro asp thr ile gln cys ala tyr ile145 150 155 160his leu val ser arg glu glu cys glu his ala tyr pro gly gln ile165 170 175thr gln asn met leu cys ala gly asp glu lys tyr gly lys asp ser180 185 190cys gln gly asp ser gly gly pro leu val cys gly asp his leu arg195 200 205gly leu val ser trp gly asn ile pro cys gly ser lys glu lys pro210 215 220gly val tyr thr asn val cys arg tyr thr asn trp ile gln lys thr225 230 235 240ile gln ala lys<210>15<211>2892<212>dna<213>人<220>
<221>cds<222>(88)...(618)<400>15gcggcggcgg cggcggcggc aggagcccgg gaggcggagg cgggaggcgg cggcggcgcg 60cggagacgca gcagcggcag cggcagc atg tcg gcc ggc gga gcg tca gtc ccg 114met ser ala gly gly ala ser val pro1 5ccg ccc ccg aac ccc gcc gtg tcc ttc ccg ccg ccc cgg gtc acc ctg162pro pro pro asn pro ala val ser phe pro pro pro arg val thr leu10 15 20 25ccc gcc ggc ccc gac atc ctg cgg acc tac tcg ggc gcc ttc gtc tgc210
pro ala gly pro asp ile leu arg thr tyr ser gly ala phe val cys30 35 40ctg gag att ctg ttc ggg ggt ctt gtc tgg att ttg gtt gcc tcc tcc258leu glu ile leu phe gly gly leu val trp ile leu val ala ser ser45 50 55aat gtt cct cta cct cta cta caa gga tgg gtc atg ttt gtg tcc gtg306asn val pro leu pro leu leu gln gly trp val met phe val ser val60 65 70aca gcg ttt ttc ttt tcg ctc ctc ttt ctg ggc atg ttc ctc tct ggc354thr ala phe phe phe ser leu leu phe leu gly met phe leu ser gly75 80 85atg gtg gct caa att gat gct aac tgg aac ttc ctg gat ttt gcc tac402met val ala gln ile asp ala asn trp asn phe leu asp phe ala tyr90 95 100 105cat ttt aca gta ttt gtc ttc tat ttt gga gcc ttt tta ttg gaa gca450his phe thr val phe val phe tyr phe gly ala phe leu leu glu ala110 115 120gca gcc aca tcc ctg cat gat ttg cat tgc aat aca acc ata acc ggg498ala ala thr ser leu his asp leu his cys asn thr thr ile thr gly125 130 135cag cca ctc ctg agt gat aac cag tat aac ata aac gta gca gcc tca546gln pro leu leu ser asp asn gln tyr asn ile asn val ala ala ser140 145 150att ttt gcc ttt atg acg aca gct tgt tat ggt tgc agt ttg ggt ctg594ile phe ala phe met thr thr ala cys tyr gly cys ser leu gly leu155 160 165gct tta cga aga tgg cga ccg taa cactccttag aaactggcag tcgtatgtta 648ala leu arg arg trp arg pro *170 175gtttcacttg tctactttat atgtctgatc aatttggata ccattttgtc cagatgcaaa 708aacattccaa aagtaatgtg tttagtagag agagactcta agctcaagtt ctggtttatt 768tcatggatgg aatgttaatt ttattatgat attaaagaaa tggcctttta ttttacatct 828ctcccctttt tccctttccc cctttatttt cctccttttc tttctgaaag tttcctttta 888tgtccataaa atacaaatat attgttcata aaaaattagt atcccttttg tttggttgct 948gagtcacctg aaccttaatt ttaattggta attacagccc ctaaaaaaaa cacatttcaa 1008ataggcttcc cactaaactc tatattttag tgtaaaccag gaattggcac acttttttta 1068gaatgggcca gatggtaaat atttatgctt cacggtccat acagtctctg tcacaactat 1128tcagttctgc tagtatagcg tgaaagcagc tatacacaat acagaaatga atgagtgtgg 1188ttatgttcta ataaaactta tttataaaaa caaggggagg ctgggtttag cctgtgggcc 1248atagtttgtc aaccactggt gtaaaacctt agttatatat gatctgcatt ttcttgaact 1308gatcattgaa aacttataaa cctaacagaa aagccacata atatttagtg tcattatgca 1368ataatcacat tgcctttgtg ttaatagtca aatacttacc tttggagaat acttaccttt 1428ggaggaatgt ataaaatttc tcaggcagag tcctggatat aggaaaaagt aatttatgaa 1488gtaaacttca gttgcttaat caaactaatg atagtctaac aactgagcaa gatcctcatc 1548tgagagtgct taaaatggga tccccagaga ccattaacca atactggaac tggtatctag 1608ctactgatgt cttactttga gtttatttat gcttcagaat acagttgttt gccctgtgca 1668tgaatatacc catatttgtg tgtggatatg tgaagctttt ccaaatagag ctctcagaag 1728aattaagttt ttacttctaa ttattttgca ttactttgag ttaaatttga atagagtatt 1788aaatataaag ttgtagattc ttatgtgttt ttgtattagc ccagacatct gtaatgtttt 1848tgcactggtg acagacaaaa tctgttttaa aatcatatcc agcacaaaaa ctatttctgg 1908ctgaatagca cagaaaagta ttttaaccta cctgtagaga tcctcgtcat ggaaaggtgc 1968
caaactgttt tgaatggaag gacaagtaag agtgaggcca cagttcccac cacacgaggg 2028cttttgtatt gttctacttt ttcagccctt tactttctgg ctgaagcatc cccttggagt 2088gccatgtata agttgggcta ttagagttca tggaacatag aacaaccatg aatgagtggc 2148atgatccgtg cttaatgatc aagtgttact tatctaataa tcctctagaa agaaccctgt 2208tagatcttgg tttgtgataa aaatataaag acagaagaca tgaggaaaaa caaaaggttt 2268gaggaaatca ggcatatgac tttatactta acatcagatc ttttctataa tatcctacta 2328ctttggtttt cctagctcca taccacacac ctaaacctgt attatgaatt acatattaca 2388aagtcataaa tgtgccatat ggatatacag tacattctag ttggaatcgt ttactctgct 2448agaatttagg tgtgagattt tttgtttccc aggtatagca ggcttatgtt tggtggcatt 2508aaattggttt ctttaaaatg ctttggtggc acttttgtaa acagattgct tctagattgt 2568tacaaaccaa gcctaagaca catctgtgaa tacttagatt tgtagcttaa tcacattcta 2628gacttgtgag ttgaatgaca aagcagttga acaaaaatta tggcatttaa gaatttaaca 2688tgtcttagct gtaaaaatga gaaagtgttg gttggtttta aaatctggta actccatgat 2748gaaaagaaat ttattttata cgtgttatgt ctctaataaa gtattcattt gataaaaaaa 2808aaaaaaaaaa gggcggccgc tctagaggat ccaagcttac gtacgcgtgc atgcgacgtc 2868atagctcttc tatagtgtca ccta2892<210>16<211>176<212>prt<213>人<400>16met ser ala gly gly ala ser val pro pro pro pro asn pro ala val1 5 10 15ser phe pro pro pro arg val thr leu pro ala gly pro asp ile leu20 25 30arg thr tyr ser gly ala phe val cys leu glu ile leu phe gly gly35 40 45leu val trp ile leu val ala ser ser asn val pro leu pro leu leu50 55 60gln gly trp val met phe val ser val thr ala phe phe phe ser leu65 70 75 80leu phe leu gly met phe leu ser gly met val ala gln ile asp ala85 90 95asn trp asn phe leu asp phe ala tyr his phe thr val phe val phe100 105 110tyr phe gly ala phe leu leu glu ala ala ala thr ser leu his asp115 120 125leu his cys asn thr thr ile thr gly gln pro leu leu ser asp asn130 135 140gln tyr asn ile asn val ala ala ser ile phe ala phe met thr thr145 150 155 160ala cys tyr gly cys ser leu gly leu ala leu arg arg trp arg pro165 170 175<210>17<211>4458<212>dna<213>人<220>
<221>cds<222>(21)...(404)<400>17gtcgacccac gcgtccggcg atg cct cgc tgg ctt ctg ctt tca ttg acc ttt 53met pro arg trp leu leu leu ser leu thr phe1 5 10
gcg ggt ctg ttc ccg ctg cgg cgc cgg cag ctg ctt ggt agt tgc ggg101ala gly leu phe pro leu arg arg arg gln leu leu gly ser cys gly15 20 25ggg cgt gag ggc ggt ggc cca gac caa ccg gct ggc agc cca gct ccg149gly arg glu gly gly gly pro asp gln pro ala gly ser pro ala pro30 35 40ctc cgc ccg ccc ctg cct cgg acc ctg cgc ctg agg aag tat cga ggc197leu arg pro pro leu pro arg thr leu arg leu arg lys tyr arg gly45 50 55aac cct ctg cca ccc gaa gtt cgt ggg tcg ctc cca gag ggc gcg ccc245asn pro leu pro pro glu val arg gly ser leu pro glu gly ala pro60 65 70 75tgg agc cga gcg ccc ttg ggc ggc cat ctg gag gcc agg tgc ggg ccg293trp ser arg ala pro leu gly gly his leu glu ala arg cys gly pro80 85 90cga acc cgc gag gag cgc gcg gcg ggc gcg gcg gcg acg gca gga gga341arg thr arg glu glu arg ala ala gly ala ala ala thr ala gly gly95 100 105ggg gcc ggg agc ccg ggc gcc gcc gaa gga cgc ccc gtc ctc cac atg389gly ala gly ser pro gly ala ala glu gly arg pro val leu his met110 115 120ctg cca ctt ggc tga gccgggcgcc ggcgagaagg cggcgccgct gccctggcag444leu pro leu gly *125ctggactgca ctttgccccc gcccggcctc agctgccgcc cgcccagacg ccagcaagcc 504cccctcccac gacagggctg ctccgggagc ttcggagacc cgccccgggc ctgagcgcag 564gctgcctccg ggaccccacg gctgtccgga cgtgccatgg gcgcgcagct gccgggcaac 624gtgttgtgta agtgaacatc tgggaggtaa acactacacg tgaagagtgg tgaaagggaa 684cattgattac tgaagtgccc tggagaggga aagcactggt caacatcaca tggacaaatt 744tcattgtttt ctaaagatgg cctggaagta gtctttgcca ctgcttcctc cacaaacagc 804tcttcataac atgggctgca tgaaatcaaa gcaaactttc ccatttccta ccatatatga 864aggtgagaag cagcatgaga gtgaagaacc ctttatgcca gaagagagat gtctacctag 924gatggcttct ccagttaatg tcaaagagga agtgaaggaa cctccaggga ccaatattgt 984gatcttggaa tatgcacacc gcctgtctca ggatatcttg tgtgatgcct tgcagcaatg 1044ggcatgcaat aacatcaagt accatgacat tccatacatt gagagtgagg ggccttgagg 1104ctgtaggatg acaacacttt gactgtggag gtgctagttt gaataaatgt gacaaaagca 1164aaaactggtg tgaaaaagta caaataacta tctggattta aaaatgtgtc tacgataatg 1224tcactattat aagaacaact aggatgaaat gcattttaag tacttctatg ttaacagcaa 1284tttctgttta gtcttagatt ttagtcatct gaagggctga acagaggtcc tgtgacaccc 1344aataatcagc tgaatgtcac agcacttctt cctaagtaat ggcatcacca aagaaaatgc 1404taaggaataa aaactgcccc aaattccaat ggttgaagtt tatcctttaa aataacaatt 1464tttgtttata cccaaaaaaa gtccagatat gaaaagggct tttctaaaat ttcttggcga 1524gggaatggca ctcaaatcat agtgattaac agtaagtctt gtttgtttgt caaggatctc 1584tacttcttga cacaaatgaa ccctgtcttt aataagataa gatatttatt tttgtagatg 1644agaagtgtaa ctaccacctt ggacctcagg gccctaacta attacagctg ttactggacg 1704actcagactt tgtgcctaaa gccatcttag agataacagt ttatagaagc catgacatta 1764gtgtttattg cattgaatta agcccagtga tataactata caagaaaaca agtatgggta 1824ccttttacaa agagcaatcc aataaatctt aaaaataaca gaaacttagt ctgcaaggta 1884gaaagtttca gttttaattc tgtattaagc tttactatct cagaggtaca gagggctgga 1944atatgggcat ttatttccag ttttttcttg actagtaagg cggtcaccat taaaatagac 2004cagatgataa tgcatgaaga tttacagttg tattgcaaaa cggaaaagat aaaactgtcc 2064tttgaggaga gtactcgttt tctgggtttt tgttattttt tagtggtaac acaagcctat 2124
agggcattta tagccaccta ttatactgtt tccataagcc tggctacctt ttagggaagc 2184tattttttct ctttcatttt tactgtcaca gcacatacac acacaccttt ttgttttaaa 2244ggattaagta ctgtttgaag atcagtggta acagaaaatt tgggagggag aagaagaaat 2304taagacatga cttgttagaa aattaagact tcagtttcta gaattatctt ttcatcaaga 2364tttggtagac attgagttta aatggaaagg aaattattta agcctgtgta tgttagatcc 2424acaatacacc attggtattg aaatataaag gttaaaaaaa aggcttatga cctctttaat 2484gagataaata tgtatttgtc ttgtaagcag gcagaaaatc tacctctaat tttaacacta 2544atactttgaa acccacaatc aaatagagtg aattctccaa gttacataag caaggaaaac 2604attatttgaa atatgccatg ttttcgttgc ctttggacac ctcatcattc aactctaatt 2664ttaccgagtc ccgggatttg tactgtccca ttgtacttgc aatctacaat ttatataata 2724gaaaaacaac caaacccatt catacaagga tctgaagtta taaggttaag ggcagaaagt 2784ttcccataag tataaaacat ttccaggtca tgaagagtag tttaggttga gtgacaaaag 2844cctaggtgtg gttgtttttc attcattttg catctcacac caagacattt ttgctgcaag 2904gtcatctgct gcttaaaatg tacaattagg tatataaaat aagtacaatg gtgaaaacac 2964aaagccaggt aaagcagcat gccccactaa atttttcagt atacataggg acagacaagt 3024gagttttggt tgtatctaaa tattttaatt tcaggttcct tctgtgccct gggccactat 3084ttcccagggg tgtgacagag atgcctgcca gatccatatc aactagaagt ctgatttctg 3144ttgctgccct tcctcagcaa ctatggcagt atacttttat caccaagcac cactcccttg 3204tccctgaatc acattttaat agagtacaat atcttctgta caatatttct gaaacactta 3264tgtctgaaat atatgctgta ttgtatgtta acccatgaca tatatgaact acaaggcttg 3324cataatcagt gagctagtgg ataaatcaag acaggagcaa atgggagaaa gatgaataaa 3384caaatgaaaa aagatgaata aatgaataag agagatgaat aaacaaattt acattacatg 3444tgatagttat catggtatgg ccttcatgac aagatggatg agaatatcac tgataggata 3504ttagccttct ttcatatctt tatattgaaa tatgggcttt acttcaattt gaaggtcttt 3564catgaacaat aaaagagagt agaaggactg tctgagaagg caggagacat ataaaacaga 3624tgactgaaag actgactagc tcctggaaag ggaaacattt ggaacatcca gagtaaggca 3684aatgggcttc taccagcaca acaaagagcc tccaggtggc aacatggaag caggttatca 3744gagaaaataa atgtgcaaat tccttattta caatgactca cttaacccca caaacatgtt 3804tcactgctgc cttccccagt tgtcgcttat gtactgttgt tacctttcag ttacatgcct 3864ttgatcctaa aattctctac ttttgttgcc ttatcagttc tttgcaatct gcctgtggtt 3924atcagcactt aaagcacaat tttgaagggg aaaaaaatga taatcacctt agtcccaaag 3984aaataatttg tcaaactgcc ttattagtat taaaaacaga cacactgaat gaagtagcat 4044gatacgcata tatcctactc agtatcattg gccttttatc aaatggggaa actatacttt 4104tgtattacat agttttagaa atcgaaagtt agagactctt tataagtaat gtcaaggaac 4164agtaatttaa aaacaaagtt ctaacaaata tattgtttgc ttaatcacaa tgccctcaac 4224ttgtatttga ataactaaat aggacatgtc ttccttggag ctgtgggcat tagttcagaa 4284gcactacctg catcttaatt ttcaaaactt aagttttatt agcaaatcct cttctctgta 4344agacttagct atgaagtggt atattttttc caaatatttt tctgaaaaca tttgttgttg 4404taactgcaca ataaaagtcc agttgcaatt aaaaaaaaaa aaaaaaaaaa aaaa 4458<210>18<211>127<212>prt<213>人<400>18met pro arg trp leu leu leu ser leu thr phe ala gly leu phe pro1 5 10 15leu arg arg arg gln leu leu gly ser cys gly gly arg glu gly gly20 25 30gly pro asp gln pro ala gly ser pro ala pro leu arg pro pro leu35 40 45pro arg thr leu arg leu arg lys tyr arg gly asn pro leu pro pro50 55 60glu val arg gly ser leu pro glu gly ala pro trp ser arg ala pro65 70 75 80leu gly gly his leu glu ala arg cys gly pro arg thr arg glu glu85 90 95arg ala ala gly ala ala ala thr ala gly gly gly ala gly ser pro100 105 110gly ala ala glu gly arg pro val leu his met leu pro leu gly
115 120 125<210>19<211>1127<212>dna<213>人<220>
<221>cds<222>(48)...(851)<400>19accaaatcaa ccataggtcc aagaacaatt gtctctggac ggcagct atg cga ctc56met arg leu1acc gtg ctg tgt gct gtg tgc ctg ctg cct ggc agc ctg gcc ctg ccg104thr val leu cys ala val cys leu leu pro gly ser leu ala leu pro5 10 15ctg cct cag gag gcg gga ggc atg agt gag cta cag tgg gaa cag gct152leu pro gln glu ala gly gly met ser glu leu gln trp glu gln ala20 25 30 35cag gac tat ctc aag aga ttt tat ctc tat gac tca gaa aca aaa aat200gln asp tyr leu lys arg phe tyr leu tyr asp ser glu thr lys asn40 45 50gcc aac agt tta gaa gcc aaa ctc aag gag atg caa aaa ttc ttt ggc248ala asn ser leu glu ala lys leu lys glu met gln lys phe phe gly55 60 65cta cct ata act gga atg tta aac tcc cgc gtc ata gaa ata atg cag296leu pro ile thr gly met leu asn ser arg val ile glu ile met gln70 75 80aag ccc aga tgt gga gtg cca gat gtt gca gaa tac tca cta ttt cca344lys pro arg cys gly val pro asp val ala glu tyr ser leu phe pro85 90 95aat agc cca aaa tgg act tcc aaa gtg gtc acc tac agg atc gta tca392asn ser pro lys trp thr ser lys val val thr tyr arg ile val ser100 105 110 115tat act cga gac tta ccg cat att aca gtg gat cga tta gtg tca aag440tyr thr arg asp leu pro his ile thr val asp arg leu val ser lys120 125 130gct tta aac atg tgg ggc aaa gag atc ccc ctg cat ttc agg aaa gtt488ala leu asn met trp gly lys glu ile pro leu his phe arg lys val135 140 145gta tgg gga act gct gac atc atg att ggc ttt gcg cga gga gct cat536val trp gly thr ala asp ile met ile gly phe ala arg gly ala his150 155 160ggg gac tcc tac cca ttt gat ggg cca gga aac acg ctg gct cat gcc584gly asp ser tyr pro phe asp gly pro gly asn thr leu ala his ala165 170 175
ttt gcg cct ggg aca ggt ctc gga gga gat gct cac ttc gat gag gat632phe ala pro gly thr gly leu gly gly asp ala his phe asp glu asp180 185 190 195gaa cgc tgg acg gat ggt agc agt cta ggg att aac ttc ctg tat gct680glu arg trp thr asp gly ser ser leu gly ile asn phe leu tyr ala200 205 210gca act cat gaa ctt ggc cat tct ttg ggt atg gga cat tcc tct gat728ala thr his glu leu gly his ser leu gly met gly his ser ser asp215 220 225cct aat gca gtg atg tat cca acc tat gga aat gga gat ccc caa aat776pro asn ala val met tyr pro thr tyr gly asn gly asp pro gln asn230 235 240ttt aaa ctt tcc cag gat gat att aaa ggc att cag aaa cta tat gga824phe lys leu ser gln asp asp ile lys gly ile gln lys leu tyr gly245 250 255aag aga agt aat tca aga aag aaa tag aaacttcagg cagaacatcc 871lys arg ser asn ser arg lys lys *260265attcattcat tcattggatt gtatatcatt gttgcacaat cagaattgat aagcactgtt 931cctccactcc atttagcaat tatgtcaccc ttttttattg cagttggttt ttgaatgtct 991ttcactcctt ttattggtta aactccttta tggtgtgact gtgtcttatt ccatctatgav 1051gctttgtcag tgcgcgtaga tgtcaataaa tgttacatac acaaataaat aaaatgttta 1111ttccatggta aattta 1127<210>20<211>267<212>prt<213>人<400>20met arg leu thr val leu cys ala val cys leu leu pro gly ser leu1 5 10 15ala leu pro leu pro gln glu ala gly gly met ser glu leu gln trp20 25 30glu gln ala gln asp tyr leu lys arg phe tyr leu tyr asp ser glu35 40 45thr lys asn ala asn ser leu glu ala lys leu lys glu met gln lys50 55 60phe phe gly leu pro ile thr gly met leu asn ser arg val ile glu65 70 75 80ile met gln lys pro arg cys gly val pro asp val ala glu tyr ser85 90 95leu phe pro asn ser pro lys trp thr ser lys val val thr tyr arg100 105 110ile val ser tyr thr arg asp leu pro his ile thr val asp arg leu115 120 125val ser lys ala leu asn met trp gly lys glu ile pro leu his phe130 135 140arg lys val val trp gly thr ala asp ile met ile gly phe ala arg145 150 155 160gly ala his gly asp ser tyr pro phe asp gly pro gly asn thr leu165 170 175ala his ala phe ala pro gly thr gly leu gly gly asp ala his phe
180 185 190asp glu asp glu arg trp thr asp gly ser ser leu gly ile asn phe195 200 205leu tyr ala ala thr his glu leu gly his ser leu gly met gly his210 215 220ser ser asp pro asn ala val met tyr pro thr tyr gly asn gly asp225 230 235 240pro gln asn phe lys leu ser gln asp asp ile lys gly ile gln lys245 250 255leu tyr gly lys arg ser asn ser arg lys lys260 265<210>21<211>5093<212>dna<213>人<220>
<221>cds<222>(136)...(1935)<400>21aggtgacagc tggagggagg agcgggggtg gagccggggg aagggtgggg aggggatggg 60ctggagctcc gggcagtgtg cgaggcgcac gcacaggagc ctgcactctg cgtcccgcac 120cccagcagcc gcgcc atg agc cgg agt ctc ttg ctc tgg ttc ttg ctg ttc 171met ser arg ser leu leu leu trp phe leu leu phe1 5 10ctg ctc ctg ctc ccg ccg ctc ccc gtc ctg ctc gcg gac cca ggg gcg219leu leu leu leu pro pro leu pro val leu leu ala asp pro gly ala15 20 25ccc acg cca gtg aat ccc tgt tgt tac tat cca tgc cag cac cag ggc267pro thr pro val asn pro cys cys tyr tyr pro cys gln his gln gly30 35 40atc tgt gtc cgc ttc ggc ctt gac cgc tac cag tgt gac tgc acc cgc315ile cys val arg phe gly leu asp arg tyr gln cys asp cys thr arg45 50 55 60acg ggc tat tcc ggc ccc aac tgc acc atc cct ggc ctg tgg acc tgg363thr gly tyr ser gly pro asn cys thr ile pro gly leu trp thr trp65 70 75ctc cgg aat tca ctg cgg ccc agc ccc tct ttc acc cac ttc ctg ctc411leu arg asn ser leu arg pro ser pro ser phe thr his phe leu leu80 85 90act cac ggg cgc tgg ttc tgg gag ttt gtc aat gcc acc ttc atc cga459thr his gly arg trp phe trp glu phe val asn ala thr phe ile arg95 100 105gag atg ctc atg cgc ctg gta ctc aca gtg cgc tcc aac ctt atc ccc507glu met leu met arg leu val leu thr val arg ser asn leu ile pro110 115 120agt ccc ccc acc tac aac tca gca cat gac tac atc agc tgg gag tct555ser pro pro thr tyr asn ser ala his asp tyr ile ser trp glu ser125 130 135 140
ttc tcc aac gtg agc tat tac act cgt att ctg ccc tct gtg cct aaa603phe ser asn val ser tyr tyr thr arg ile leu pro ser val pro lys145 150 155gat tgc ccc aca ccc atg gga acc aaa ggg aag aag cag ttg cca gat651asp cys pro thr pro met gly thr lys gly lys lys gln leu pro asp160 165 170gcc cag ctc ctg gcc cgc cgc ttc ctg ctc agg agg aag ttc ata cct699ala gln leu leu ala arg arg phe leu leu arg arg lys phe ile pro175 180 185gac ccc caa ggc acc aac ctc atg ttt gcc ttc ttt gca caa cac ttc747asp pro gln gly thr asn leu met phe ala phe phe ala gln his phe190 195 200acc cac cag ttc ttc aaa act tct ggc aag atg ggt cct ggc ttc acc795thr his gln phe phe lys thr ser gly lys met gly pro gly phe thr205 210 215 220aag gcc ttg ggc cat ggg gta gac ctc ggc cac att tat gga gac aat843lys ala leu gly his gly val asp leu gly his ile tyr gly asp asn225 230 235ctg gag cgt cag tat caa ctg cgg ctc ttt aag gat ggg aaa ctc aag891leu glu arg gln tyr gln leu arg leu phe lys asp gly lys leu lys240 245 250tac cag gtg ctg gat gga gaa atg tac ccg ccc tcg gta gaa gag gcg939tyr gln val leu asp gly glu met tyr pro pro ser val glu glu ala255 260 265cct gtg ttg atg cac tac ccc cga ggc atc ccg ccc cag agc cag atg987pro val leu met his tyr pro arg gly ile pro pro gln ser gln met270 275 280gct gtg ggc cag gag gtg ttt ggg ctg ctt cct ggg ctc atg ctg tat1035ala val gly gln glu val phe gly leu leu pro gly leu met leu tyr285 290 295 300gcc acg ctc tgg cta cgt gag cac aac cgt gtg tgt gac ctg ctg aag1083ala thr leu trp leu arg glu his asn arg val cys asp leu leu lys305 310 315gct gag cac ccc acc tgg ggc gat gag cag ctt ttc cag acg acc cgc1131ala glu his pro thr trp gly asp glu gln leu phe gln thr thr arg320 325 330ctc atc ctc ata ggg gag acc atc aag att gtc atc gag gag tac gtg1179leu ile leu ile gly glu thr ile lys ile val ile glu glu tyr val335 340 345cag cag ctg agt ggc tat ttc ctg cag ctg aaa ttt gac cca gag ctg1227gln gln leu ser gly tyr phe leu gln leu lys phe asp pro glu leu350 355 360ctg ttc ggt gtc cag ttc caa tac cgc aac cgc att gcc atg gag ttc1275leu phe gly val gln phe gln tyr arg asn arg ile ala met glu phe365 370 375 380
aac cat ctc tac cac tgg cac ccc ctc atg cct gac tcc ttc aag gtg 1323asn his leu tyr his trp his pro leu met pro asp ser phe lys val385 390 395ggc tcc cag gag tac agc tac gag cag ttc ttg ttc aac acc tcc atg 1371gly ser gln glu tyr ser tyr glu gln phe leu phe asn thr ser met400 405 410ttg gtg gac tat ggg gtt gag gcc ctg gtg gat gcc ttc tct cgc cag 1419leu val asp tyr gly val glu ala leu val asp ala phe ser arg gln415 420 425att gct ggc cgg atc ggt ggg ggc agg aac atg gac cac cac atc ctg 1467ile ala gly arg ile gly gly gly arg asn met asp his his ile leu430 435 440cat gtg gct gtg gat gtc atc agg gag tct cgg gag atg cgg ctg cag 1515his val ala val asp val ile arg glu ser arg glu met arg leu gln445 450 455 460ccc ttc aat gag tac cgc aag agg ttt ggc atg aaa ccc tac acc tcc 1563pro phe asn glu tyr arg lys arg phe gly met lys pro tyr thr ser465 470 475ttc cag gag ctc gta gga gag aag gag atg gca gca gag ttg gag gaa 1611phe gln glu leu val gly glu lys glu met ala ala glu leu glu glu480 485 490ttg tat gga gac att gat gcg ttg gag ttc tac cct gga ctg ctt ctt 1659leu tyr gly asp ile asp ala leu glu phe tyr pro gly leu leu leu495 500 505gaa aag tgc cat cca aac tct atc ttt ggg gag agt atg ata gag att 1707glu lys cys his pro asn ser ile phe gly glu ser met ile glu ile510 515 520ggg gct ccc ttt tcc ctc aag ggt ctc cta ggg aat ccc atc tgt tct 1755gly ala pro phe ser leu lys gly leu leu gly asn pro ile cys ser525 530 535 540ccg gag tac tgg aag ccg agc aca ttt ggc ggc gag gtg ggc ttt aac 1803pro glu tyr trp lys pro ser thr phe gly gly glu val gly phe asn545 550 555att gtc aag acg gcc aca ctg aag aag ctg gtc tgc ctc aac acc aag 1851ile val lys thr ala thr leu lys lys leu val cys leu asn thr lys560 565 570acc tgt ccc tac gtt tcc ttc cgt gtg ccg gat gcc agt cag gat gat 1899thr cys pro tyr val ser phe arg val pro asp ala ser gln asp asp575 580 585ggg cct gct gtg gag cga cca tcc aca gag ctc tga ggggcaggaa1945gly pro ala val glu arg pro ser thr glu leu *590 595agcagcattc tggaggggag agctttgtgc ttgtcattcc agagtgctga ggccagggct 2005gatggtctta aatgctcatt ttctggtttg gcatggtgag tgttggggtt gacatttaga 2065actttaagtc tcacccatta tctggaatat tgtgattctg tttattcttc cagaatgctg 2125aactccttgt tagcccttca gattgttagg agtggttctc atttggtctg ccagaatact 2185gggttcttag ttgacaacct agaatgtcag atttctggtt gatttgtaac acagtcattc 2245
taggatgtgg agctactgat gaaatctgct agaaagttag ggggttctta ttttgcattc 2305cagaatcttg actttctgat tggtgattca aagtgttgtg ttcctggctg atgatccaga 2365acagtggctc gtatcccaaa tctgtcagca tctggctgtc tagaatgtgg atttgattca 2425ttttcctgtt cagtgagata tcatagagac ggagatccta aggtccaaca agaatgcatt 2485ccctgaatct gtgcctgcac tgagagggca aggaagtggg gtgttcttct tgggaccccc 2545actaagaccc tggtctgagg atgtagagag aacaggtggg ctgtattcac gccattggtt 2605ggaagctacc agagctctat ccccatccag gtcttgactc atggcagctg tttctcatga 2665agctaataaa attcgctttc taaagttacc tgttatatat ctcttttggt cccatcctct 2725aaagcagagg caacactgga acatggctag cctttcttgt agccatggct gggcgtgcta 2785gaggttgcag catgagactt tctgctggga tccttgggcc catcactgta tagacatgct 2845accactggta cttcctttct ccctgcgggc caggcactgc ccttttcagg aagctctctt 2905aaaataccca ttgccccaga cctggaagat ataacattca gttcccacca tctgattaaa 2965acaacttcct cccttacaga gcatacaaca gagggggcac ccggggagga gagcacatac 3025tgtgttccaa tttcacgctt ttaattctca tttgttctca caccaacagt gtgaagtgcg 3085tggtataatc tccatttcaa aaccaaggaa gcagcctcag agtggtcgag tgacacacct 3145cacgcaggct gagtccagag cttgtgctcc tcttgattcc tggtttgact cagttccagg 3205cctgatcttg cctgtctggc tcagggtcaa agacagaatg gtggagtgta gcctccacct 3265gatattcagg ctactcattc agtcccaaat atgtattttc ctaagtgttt actatgtgcc 3325agttcctgta acaggtgtgg ggacacagca gtgagtaatc aatacagaca aggttctgcc 3385cttatggagc tcacactcca gtggcagaca aacagaccat aaataaggaa acgatgaaat 3445aagatatata caaggtgagt gtgacttccc ttctaacccc ctctgctctg tcctccccta 3505ttgcgctctc aagaccagag acccaacagc agtgatctca gggcagacag ccctccactc 3565cagctctgag acccttttct caggacctct gtaggcagca gagagagagg acagaggggt 3625aagatgaggg gttgagggaa ggttcttcat gatccacact ttgggcttag tatttctcag 3685gaagagctat ggcccagaaa caacagggga aactagagtt cggtctgaca gtccttgggg 3745ttaagtctcc tgtcttatgg tccagaaact cctgtttctc cttagttggc tggaaactgc 3805tcccatcatt ccttctggcc tctgctgaat gcagggaatg caatccttcc ctgctcttgc 3865agttgctctg acgtagaaag atccttcggg tgctggaagt ctccatgaag agcttgtgtc 3925ctgtcctttc ttgcagattc tatttcccct cttctgctaa tacctcttac tttgcttgag 3985aatcctctcc tttcttatta atttcagtct tggtggttct atcaggggtg cattctggcc 4045aaggggtggg cctgtgaatc aatcctgggc aatcagacac cctctcctta aaaactggcc 4105cgtggagact gagatcactg actctgactc atccccacag ctggctctga caagatggtc 4165catttgttcc tgcttccgag atccccaggg cagcctggat ccctgccctt ctcaagactt 4225tagcttttcc ttccatccgg tggcctattc caggaattcc tcttttgctt aaatcagttg 4285gagtttgtgt ctgttgcttg taatcaagcc tttatggctg ctgggctgag tgacacaagc 4345actttaatgg cctggaggga cttttaatca gtgaagatgc aatcagacaa gtgttttgga 4405aagagcaccc tcgagaaggg tggatgacag ggcagagcag gaaggacagg aagctggcag 4465aacggaggag gctgcagccg tggtccaacc aggagctgat ggcagctggg gctaggggaa 4525gggctttgag ggtggaagga tgggatgggt tccagaggta ttcctctctt aaatgcaagt 4585gcctagatta ggtagacttt gcttagtatt gacaactgca catgaaagtt ttgcaaaggg 4645aaacaggcta aatgcaccaa gaaagcttct tcagagtgaa gaatcttaat gcttgtaatt 4705taaacatttg ttcctggagt tttgatttgg tggatgtgat ggttggtttt atttgtcagt 4765ttggttgggc tatagcacac agttatttaa tcaaacagta atctaggtgt ggctgtgaag 4825gtattttgta gatgtgatta acatctacaa tcagttgact ttaagtgaaa gagattactt 4885aaataatttg ggtgagctgc acctgattag ttgaaaggcc tcaagaacaa acactgcagt 4945ttcctggaaa agaagaaact ttgcctcaag actatagcca tcgactcctg cctgagtttc 5005cagcctgcta gtctgcccta tggatttgaa gtttgccaac cccaacaatt gtgtgaatta 5065atttctaaaa ataaagctat atacagcc5093<210>22<211>599<212>prt<213>人<400>22met ser arg ser leu leu leu trp phe leu leu phe leu leu leu leu1 5 10 15pro pro leu pro val leu leu ala asp pro gly ala pro thr pro val20 25 30asn pro cys cys tyr tyr pro cys gln his gln gly ile cys val arg35 40 45
phe gly leu asp arg tyr gln cys asp cys thr arg thr gly tyr ser50 55 60gly pro asn cys thr ile pro gly leu trp thr trp leu arg asn ser65 70 75 80leu arg pro ser pro ser phe thr his phe leu leu thr his gly arg85 90 95trp phe trp glu phe val asn ala thr phe ile arg glu met leu met100 105 110arg leu val leu thr val arg ser asn leu ile pro ser pro pro thr115 120 125tyr asn ser ala his asp tyr ile ser trp glu ser phe ser asn val130 135 140ser tyr tyr thr arg ile leu pro ser val pro lys asp cys pro thr145 150 155 160pro met gly thr lys gly lys lys gln leu pro asp ala gln leu leu165 170 175ala arg arg phe leu leu arg arg lys phe ile pro asp pro gln gly180 185 190thr asn leu met phe ala phe phe ala gln his phe thr his gln phe195 200 205phe lys thr ser gly lys met gly pro gly phe thr lys ala leu gly210 215 220his gly val asp leu gly his ile tyr gly asp asn leu glu arg gln225 230 235 240tyr gln leu arg leu phe lys asp gly lys leu lys tyr gln val leu245 250 255asp gly glu met tyr pro pro ser val glu glu ala pro val leu met260 265 270his tyr pro arg gly ile pro pro gln ser gln met ala val gly gln275 280 285glu val phe gly leu leu pro gly leu met leu tyr ala thr leu trp290 295 300leu arg glu his asn arg val cys asp leu leu lys ala glu his pro305 310 315 320thr trp gly asp glu gln leu phe gln thr thr arg leu ile leu ile325 330 335gly glu thr ile lys ile val ile glu glu tyr val gln gln leu ser340 345 350gly tyr phe leu gln leu lys phe asp pro glu leu leu phe gly val355 360 365gln phe gln tyr arg asn arg ile ala met glu phe asn his leu tyr370 375 380his trp his pro leu met pro asp ser phe lys val gly ser gln glu385 390 395 400tyr ser tyr glu gln phe leu phe asn thr ser met leu val asp tyr405 410 415gly val glu ala leu val asp ala phe ser arg gln ile ala gly arg420 425 430ile gly gly gly arg asn met asp his his ile leu his val ala val435 440 445asp val ile arg glu ser arg glu met arg leu gln pro phe asn glu450 455 460tyr arg lys arg phe gly met lys pro tyr thr ser phe gln glu leu465 470 475 480val gly glu lys glu met ala ala glu leu glu glu leu tyr gly asp485 490 495ile asp ala leu glu phe tyr pro gly leu leu leu glu lys cys his500 505 510pro asn ser ile phe gly glu ser met ile glu ile gly ala pro phe515 520 525
ser leu lys gly leu leu gly asn pro ile cys ser pro glu tyr trp530 535 540lys pro ser thr phe gly gly glu val gly phe asn ile val lys thr545 550 555 560ala thr leu lys lys leu val cys leu asn thr lys thr cys pro tyr565 570 575val ser phe arg val pro asp ala ser gln asp asp gly pro ala val580 585 590glu arg pro ser thr glu leu595<210>23<211>4982<212>dna<213>人<220>
<221>cds<222>(136)...(1824)<400>23aggtgacagc tggagggagg agcgggggtg gagccggggg aagggtgggg aggggatggg 60ctggagctcc gggcagtgtg cgaggcgcac gcacaggagc ctgcactctg cgtcccgcac 120cccagcagcc gcgcc atg agc cgg agt ctc ttg ctc tgg ttc ttg ctg ttc 171met ser arg ser leu leu leu trp phe leu leu phe1 5 10ctg ctc ctg ctc ccg ccg ctc ccc gtc ctg ctc gcg gac cca ggg gcg219leu leu leu leu pro pro leu pro val leu leu ala asp pro gly ala15 20 25ccc acg cca gtg aat ccc tgt tgt tac tat cca tgc cag cac cag ggc267pro thr pro val asn pro cys cys tyr tyr pro cys gln his gln gly30 35 40atc tgt gtc cgc ttc ggc ctt gac cgc tac cag tgt gac tgc acc cgc315ile cys val arg phe gly leu asp arg tyr gln cys asp cys thr arg45 50 55 60acg ggc tat tcc ggc ccc aac tgc acc atc cct ggc ctg tgg acc tgg363thr gly tyr ser gly pro asn cys thr ile pro gly leu trp thr trp65 70 75ctc cgg aat tca ctg cgg ccc agc ccc tct ttc acc cac ttc ctg ctc411leu arg asn ser leu arg pro ser pro ser phe thr his phe leu leu80 85 90act cac ggg cgc tgg ttc tgg gag ttt gtc aat gcc acc ttc atc cga459thr his gly arg trp phe trp glu phe val asn ala thr phe ile arg95 100 105gag atg ctc atg cgc ctg gta ctc aca gtg cgc tcc aac ctt atc ccc507glu met leu met arg leu val leu thr val arg ser asn leu ile pro110 115 120agt ccc ccc acc tac aac tca gca cat gac tac atc agc tgg gag tct555ser pro pro thr tyr asn ser ala his asp tyr ile ser trp glu ser125 130 135 140
ttc tcc aac gtg agc tat tac act cgt att ctg ccc tct gtg cct aaa603phe ser asn val ser tyr tyr thr arg ile leu pro ser val pro lys145 150 155gat tgc ccc aca ccc atg gga acc aaa ggg aag aag cag ttg cca gat651asp cys pro thr pro met gly thr lys gly lys lys gln leu pro asp160 165 170gcc cag ctc ctg gcc cgc cgc ttc ctg ctc agg agg aag ttc ata cct699ala gln leu leu ala arg arg phe leu leu arg arg lys phe ile pro175 180 185gac ccc caa ggc acc aac ctc atg ttt gcc ttc ttt gca caa cac ttc747asp pro gln gly thr asn leu met phe ala phe phe ala gln his phe190 195 200acc cac cag ttc ttc aaa act tct ggc aag atg ggt cct ggc ttc acc795thr his gln phe phe lys thr ser gly lys met gly pro gly phe thr205 210 215 220aag gcc ttg ggc cat ggg gta gac ctc ggc cac att tat gga gac aat843lys ala leu gly his gly val asp leu gly his ile tyr gly asp asn225 230 235ctg gag cgt cag tat caa ctg cgg ctc ttt aag gat ggg aaa ctc aag891leu glu arg gln tyr gln leu arg leu phe lys asp gly lys leu lys240 245 250tac cag gtg ctg gat gga gaa atg tac ccg ccc tcg gta gaa gag gcg939tyr gln val leu asp gly glu met tyr pro pro ser val glu glu ala255 260 265cct gtg ttg atg cac tac ccc cga ggc atc ccg ccc cag agc cag atg987pro val leu met his tyr pro arg gly ile pro pro gln ser gln met270 275 280gct gtg ggc cag gag gtg ttt ggg ctg ctt cct ggg ctc atg ctg tat1035ala val gly gln glu val phe gly leu leu pro gly leu met leu tyr285 290 295 300gcc acg ctc tgg cta cgt gag cac aac cgt gtg tgt gac ctg ctg aag1083ala thr leu trp leu arg glu his asn arg val cys asp leu leu lys305 310 315gct gag cac ccc acc tgg ggc gat gag cag ctt ttc cag acg acc cgc1131ala glu his pro thr trp gly asp glu gln leu phe gln thr thr arg320 325 330ctc atc ctc ata ggg gag acc atc aag att gtc atc gag gag tac gtg1179leu ile leu ile gly glu thr ile lys ile val ile glu glu tyr val335 340 345cag cag ctg agt ggc tat ttc ctg cag ctg aaa ttt gac cca gag ctg1227gln gln leu ser gly tyr phe leu gln leu lys phe asp pro glu leu350 355 360ctg ttc ggt gtc cag ttc caa tac cgc aac cgc att gcc atg gag ttc1275leu phe gly val gln phe gln tyr arg asn arg ile ala met glu phe365 370 375 380aac cat ctc tac cac tgg cac ccc ctc atg cct gac tcc ttc aag atc1323
asn his leu tyr his trp his pro leu met pro asp ser phe lys ile385 390 395ggt ggg ggc agg aac atg gac cac cac atc ctg cat gtg gct gtg gat 1371gly gly gly arg asn met asp his his ile leu his val ala val asp400 405 410gtc atc agg gag tct cgg gag atg cgg ctg cag ccc ttc aat gag tac 1419val ile arg glu ser arg glu met arg leu gln pro phe asn glu tyr415 420 425cgc aag agg ttt ggc atg aaa ccc tac acc tcc ttc cag gag ctc gta 1467arg lys arg phe gly met lys pro tyr thr ser phe gln glu leu val430 435 440gga gag aag gag atg gca gca gag ttg gag gaa ttg tat gga gac att 1515gly glu lys glu met ala ala glu leu glu glu leu tyr gly asp ile445 450 455 460gat gcg ttg gag ttc tac cct gga ctg ctt ctt gaa aag tgc cat cca 1563asp ala leu glu phe tyr pro gly leu leu leu glu lys cys his pro465 470 475aac tct atc ttt ggg gag agt atg ata gag att ggg gct ccc ttt tcc 1611asn ser ile phe gly glu ser met ile glu ile gly ala pro phe ser480 485 490ctc aag ggt ctc cta ggg aat ccc atc tgt tct ccg gag tac tgg aag 1659leu lys gly leu leu gly asn pro ile cys ser pro glu tyr trp lys495 500 505ccg agc aca ttt ggc ggc gag gtg ggc ttt aac att gtc aag acg gcc 1707pro ser thr phe gly gly glu val gly phe asn ile val lys thr ala510 515 520aca ctg aag aag ctg gtc tgc ctc aac acc aag acc tgt ccc tac gtt 1755thr leu lys lys leu val cys leu asn thr lys thr cys pro tyr val525 530 535 540tcc ttc cgt gtg ccg gat gcc agt cag gat gat ggg cct gct gtg gag 1803ser phe arg val pro asp ala ser gln asp asp gly pro ala val glu545 550 555cga cca tcc aca gag ctc tga ggggcaggaa agcagcattc tggaggggag 1854arg pro ser thr glu leu *560agctttgtgc ttgtcattcc agagtgctga ggccagggct gatggtctta aatgctcatt 1914ttctggtttg gcatggtgag tgttggggtt gacatttaga actttaagtc tcacccatta 1974tctggaatat tgtgattctg tttattcttc cagaatgctg aactccttgt tagcccttca 2034gattgttagg agtggttctc atttggtctg ccagaatact gggttcttag ttgacaacct 2094agaatgtcag atttctggtt gatttgtaac acagtcattc taggatgtgg agctactgat 2154gaaatctgct agaaagttag ggggttctta ttttgcattc cagaatcttg actttctgat 2214tggtgattca aagtgttgtg ttcctggctg atgatccaga acagtggctc gtatcccaaa 2274tctgtcagca tctggctgtc tagaatgtgg atttgattca ttttcctgtt cagtgagata 2334tcatagagac ggagatccta aggtccaaca agaatgcatt ccctgaatct gtgcctgcac 2394tgagagggca aggaagtggg gtgttcttct tgggaccccc actaagaccc tggtctgagg 2454atgtagagag aacaggtggg ctgtattcac gccattggtt ggaagctacc agagctctat 2514ccccatccag gtcttgactc atggcagctg tttctcatga agctaataaa attcgctttc 2574taaagttacc tgttatatat ctcttttggt cccatcctct aaagcagagg caacactgga 2634acatggctag cctttcttgt agccatggct gggcgtgcta gaggttgcag catgagactt 2694
tctgctggga tccttgggcc catcactgta tagacatgct accactggta cttcctttct 2754ccctgcgggc caggcactgc ccttttcagg aagctctctt aaaataccca ttgccccaga 2814cctggaagat ataacattca gttcccacca tctgattaaa acaacttcct cccttacaga 2874gcatacaaca gagggggcac ccggggagga gagcacatac tgtgttccaa tttcacgctt 2934ttaattctca tttgttctca caccaacagt gtgaagtgcg tggtataatc tccatttcaa 2994aaccaaggaa gcagcctcag agtggtcgag tgacacacct cacgcaggct gagtccagag 3054cttgtgctcc tcttgattcc tggtttgact cagttccagg cctgatcttg cctgtctggc 3114tcagggtcaa agacagaatg gtggagtgta gcctccacct gatattcagg ctactcattc 3174agtcccaaat atgtattttc ctaagtgttt actatgtgcc agttcctgta acaggtgtgg 3234ggacacagca gtgagtaatc aatacagaca aggttctgcc cttatggagc tcacactcca 3294gtggcagaca aacagaccat aaataaggaa acgatgaaat aagatatata caaggtgagt 3354gtgacttccc ttctaacccc ctctgctctg tcctccccta ttgcgctctc aagaccagag 3414acccaacagc agtgatctca gggcagacag ccctccactc cagctctgag acccttttct 3474caggacctct gtaggcagca gagagagagg acagaggggt aagatgaggg gttgagggaa 3534ggttcttcat gatccacact ttgggcttag tatttctcag gaagagctat ggcccagaaa 3594caacagggga aactagagtt cggtctgaca gtccttgggg ttaagtctcc tgtcttatgg 3654tccagaaact cctgtttctc cttagttggc tggaaactgc tcccatcatt ccttctggcc 3714tctgctgaat gcagggaatg caatccttcc ctgctcttgc agttgctctg acgtagaaag 3774atccttcggg tgctggaagt ctccatgaag agcttgtgtc ctgtcctttc ttgcagattc 3834tatttcccct cttctgctaa tacctcttac tttgcttgag aatcctctcc tttcttatta 3894atttcagtct tggtggttct atcaggggtg cattctggcc aaggggtggg cctgtgaatc 3954aatcctgggc aatcagacac cctctcctta aaaactggcc cgtggagact gagatcactg 4014actctgactc atccccacag ctggctctga caagatggtc catttgttcc tgcttccgag 4074atccccaggg cagcctggat ccctgccctt ctcaagactt tagcttttcc ttccatccgg 4134tggcctattc caggaattcc tcttttgctt aaatcagttg gagtttgtgt ctgttgcttg 4194taatcaagcc tttatggctg ctgggctgag tgacacaagc actttaatgg cctggaggga 4254cttttaatca gtgaagatgc aatcagacaa gtgttttgga aagagcaccc tcgagaaggg 4314tggatgacag ggcagagcag gaaggacagg aagctggcag aacggaggag gctgcagccg 4374tggtccaacc aggagctgat ggcagctggg gctaggggaa gggctttgag ggtggaagga 4434tgggatgggt tccagaggta ttcctctctt aaatgcaagt gcctagatta ggtagacttt 4494gcttagtatt gacaactgca catgaaagtt ttgcaaaggg aaacaggcta aatgcaccaa 4554gaaagcttct tcagagtgaa gaatcttaat gcttgtaatt taaacatttg ttcctggagt 4614tttgatttgg tggatgtgat ggttggtttt atttgtcagt ttggttgggc tatagcacac 4674agttatttaa tcaaacagta atctaggtgt ggctgtgaag gtattttgta gatgtgatta 4734acatctacaa tcagttgact ttaagtgaaa gagattactt aaataatttg ggtgagctgc 4794acctgattag ttgaaaggcc tcaagaacaa acactgcagt ttcctggaaa agaagaaact 4854ttgcctcaag actatagcca tcgactcctg cctgagtttc cagcctgcta gtctgcccta 4914tggatttgaa gtttgccaac cccaacaatt gtgtgaatta atttctaaaa ataaagctat 4974atacagcc 4982<210>24<211>562<212>prt<213>人<400>24met ser arg ser leu leu leu trp phe leu leu phe leu leu leu leu1 5 10 15pro pro leu pro val leu leu ala asp pro gly ala pro thr pro val20 25 30asn pro cys cys tyr tyr pro cys gln his gln gly ile cys val arg35 40 45phe gly leu asp arg tyr gln cys asp cys thr arg thr gly tyr ser50 55 60gly pro asn cys thr ile pro gly leu trp thr trp leu arg asn ser65 70 75 80leu arg pro ser pro ser phe thr his phe leu leu thr his gly arg85 90 95trp phe trp glu phe val asn ala thr phe ile arg glu met leu met100 105 110arg leu val leu thr val arg ser asn leu ile pro ser pro pro thr
115 120 125tyr asn ser ala his asp tyr ile ser trp glu ser phe ser asn val130 135 140ser tyr tyr thr arg ile leu pro ser val pro lys asp cys pro thr145 150 155 160pro met gly thr lys gly lys lys gln leu pro asp ala gln leu leu165 170 175ala arg arg phe leu leu arg arg lys phe ile pro asp pro gln gly180 185 190thr asn leu met phe ala phe phe ala gln his phe thr his gln phe195 200 205phe lys thr ser gly lys met gly pro gly phe thr lys ala leu gly210 215 220his gly val asp leu gly his ile tyr gly asp asn leu glu arg gln225 230 235 240tyr gln leu arg leu phe lys asp gly lys leu lys tyr gln val leu245 250 255asp gly glu met tyr pro pro ser val glu glu ala pro val leu met260 265 270his tyr pro arg gly ile pro pro gln ser gln met ala val gly gln275 280 285glu val phe gly leu leu pro gly leu met leu tyr ala thr leu trp290 295 300leu arg glu his asn arg val cys asp leu leu lys ala glu his pro305 310 315 320thr trp gly asp glu gln leu phe gln thr thr arg leu ile leu ile325 330 335gly glu thr ile lys ile val ile glu glu tyr val gln gln leu ser340 345 350gly tyr phe leu gln leu lys phe asp pro glu leu leu phe gly val355 360 365gln phe gln tyr arg asn arg ile ala met glu phe asn his leu tyr370 375 380his trp his pro leu met pro asp ser phe lys ile gly gly gly arg385 390 395 400asn met asp his his ile leu his val ala val asp val ile arg glu405 410 415ser arg glu met arg leu gln pro phe asn glu tyr arg lys arg phe420 425 430gly met lys pro tyr thr ser phe gln glu leu val gly glu lys glu435 440 445met ala ala glu leu glu glu leu tyr gly asp ile asp ala leu glu450 455 460phe tyr pro gly leu leu leu glu lys cys his pro asn ser ile phe465 470 475 480gly glu ser met ile glu ile gly ala pro phe ser leu lys gly leu485 490 495leu gly asn pro ile cys ser pro glu tyr trp lys pro ser thr phe500 505 510gly gly glu val gly phe asn ile val lys thr ala thr leu lys lys515 520 525leu val cys leu asn thr lys thr cys pro tyr val ser phe arg val530 535 540pro asp ala ser gln asp asp gly pro ala val glu arg pro ser thr545 550 555 560glu leu
<210>25<211>607<212>dna<213>人<220>
<221>cds<222>(114)...(398)<400>25ggactgttga agacaggtct ccacacacag ctccagcagc cacatttgca accttggcca 60tctgtccaga acctgctccc acctcaggcc caggccaacc gtgcactgct gca atg 116met1ggc tct gag ctg gag acg gcg atg gag acc ctc atc aac gtg ttc cac164gly ser glu leu glu thr ala met glu thr leu ile asn val phe his5 10 15gcc cac tcg ggc aaa gag ggg gac aag tac aag ctg agc aag aag gag212ala his ser gly lys glu gly asp lys tyr lys leu ser lys lys glu20 25 30ctg aaa gag ctg ctg cag acg gag ctc tct ggc ttc ctg gat gcc cag260leu lys glu leu leu gln thr glu leu ser gly phe leu asp ala gln35 40 45aag gat gtg gat gct gtg gac aag gtg atg aag gag cta gac gag aat308lys asp val asp ala val asp lys val met lys glu leu asp glu asn50 55 60 65gga gac ggg gag gtg gac ttc cag gag tat gtg gtg ctt gtg gct gct356gly asp gly glu val asp phe gln glu tyr val val leu val ala ala70 75 80ctc aca gtg gcc tgt aac aat ttc ttc tgg gag aac agt tga398leu thr val ala cys asn asn phe phe trp glu asn ser *85 90gcagacagcc acattgggca gcgcccttcc tctccaccct cccagacctg cctcttcccc 458ctgcttccac ctcaccccac ttatccctct ccataacccc acccttgccc accccacccc 518cacccccacc aagggcgcaa gagtagcggt ccaagcctgc aactcatctt tcattaaagg 578cttctctctc accagcaaaa aaaaaaaaa607<210>26<211>94<212>prt<213>人<400>26met gly ser glu leu glu thr ala met glu thr leu ile asn val phe1 5 10 15his ala his ser gly lys glu gly asp lys tyr lys leu ser lys lys20 25 30glu leu lys glu leu leu gln thr glu leu ser gly phe leu asp ala35 40 45gln lys asp val asp ala val asp lys val met lys glu leu asp glu50 55 60asn gly asp gly glu val asp phe gln glu tyr val val leu val ala65 70 75 80ala leu thr val ala cys asn asn phe phe trp glu asn ser
85 90<210>27<211>517<212>dna<213>人<220>
<221>cds<222>(65)...(352)<400>27cctccacagc aacttccttg atccctgcca cgcacgactg aacacagaca gcagccgcct 60cgcc atg aag ctg ctg atg gtc ctc atg ctg gcg gcc ctc ctc ctg cac 109met lys leu leu met val leu met leu ala ala leu leu leu his1 5 1015tgc tat gca gat tct ggc tgc aaa ctc ctg gag gac atg gtt gaa aag157cys tyr ala asp ser gly cys lys leu leu glu asp met val glu lys20 25 30acc atc aat tcc gac ata tct ata cct gaa tac aaa gag ctt ctt caa205thr ile asn ser asp ile ser ile pro glu tyr lys glu leu leu gln35 40 45gag ttc ata gac agt gat gcc gct gca gag gct atg ggg aaa ttc aag253glu phe ile asp ser asp ala ala ala glu ala met gly lys phe lys50 55 60cag tgt ttc ctc aac cag tca cat aga act ctg aaa aac ttt gga ctg301gln cys phe leu asn gln ser his arg thr leu lys asn phe gly leu65 70 75atg atg cat aca gtg tac gac agc att tgg tgt aat atg aag agt aat349met met his thr val tyr asp ser ile trp cys asn met lys ser asn80 85 90 95taa ctttacccaa ggcgtttggc tcagagggct acagactatg gccagaactc 402*atctgttgat tgctagaaac cacttttctt tcttgtgttg tctttttatg tggaaactgc 462tagacaactg ttgaaacctc aaattcattt ccatttcaat aactaactgc aaatc 517<210>28<211>95<212>prt<213>人<400>28met lys leu leu met val leu met leu ala ala leu leu leu his cys1 5 10 15tyr ala asp ser gly cys lys leu leu glu asp met val glu lys thr20 25 30ile asn ser asp ile ser ile pro glu tyr lys glu leu leu gln glu35 40 45phe ile asp ser asp ala ala ala glu ala met gly lys phe lys gln50 55 60cys phe leu asn gln ser his arg thr leu lys asn phe gly leu met65 70 75 80met his thr val tyr asp ser ile trp cys asn met lys ser asn
85 90 95<210>29<211>2192<212>dna<213>人<220>
<221>cds<222>(101)...(2044)<400>29agtctggccc tggacaaccc cagcaaagcc gccctcagcc agcccagaag cactgggcct 60tggccacagc aacacccact gagcacgctg ggagctgagt atg gcg tcc ctg gtc115met ala ser leu val1 5tcg ctg gag ctg ggg ctg ctt ctg gct gtg ctg gtg gtg acg gcg acg163ser leu glu leu gly leu leu leu ala val leu val val thr ala thr10 15 20gcg tcc ccg cct gct ggt ctg ctg agc ctg ctc acc tct ggc cag ggc211ala ser pro pro ala gly leu leu ser leu leu thr ser gly gln gly25 30 35gct ctg gat caa gag gct ctg ggc ggc ctg tta aat acg ctg gcg gac259ala leu asp gln glu ala leu gly gly leu leu asn thr leu ala asp40 45 50cgt gtg cac tgc acc aac ggg ccg tgt gga aag tgc ctg tct gtg gag307arg val his cys thr asn gly pro cys gly lys cys leu ser val glu55 60 65gac gcc ctg ggc ctg ggc gag cct gag ggg tca ggg ctg ccc ccg ggc355asp ala leu gly leu gly glu pro glu gly ser gly leu pro pro gly70 75 80 85ccg gtc ctg gag gcc agg tac gtc gcc cgc ctc agt gcc gcc gcc gtc403pro val leu glu ala arg tyr val ala arg leu ser ala ala ala val90 95 100ctg tac ctc agc aac ccc gag ggc acc tgt gag gac act cgg gct ggc451leu tyr leu ser asn pro glu gly thr cys glu asp thr arg ala gly105 110 115ctc tgg gcc tct cat gca gac cac ctc ctg gcc ctg ctc gag agc ccc499leu trp ala ser his ala asp his leu leu ala leu leu glu ser pro120 125 130aag gcc ctg acc ccg ggc ctg age tgg ctg ctg cag agg atg cag gcc547lys ala leu thr pro gly leu ser trp leu leu gln arg met gln ala135 140 145cgg gct gcc ggc cag acc ccc aag acg gcc tgc gta gat atc cct cag595arg ala ala gly gln thr pro lys thr ala cys val asp ile pro gln150 155 160 165ctg ctg gag gag gcg gtg ggg gcg ggg gct ccg ggc agt gct ggc ggc643leu leu glu glu ala val gly ala gly ala pro gly ser ala gly gly170 175 180
gtc ctg gct gcc ctg ctg gac cat gtc agg agc ggg tct tgc ttc cac691val leu ala ala leu leu asp his val arg ser gly ser cys phe his185 190 195gcc ttg ccg agc cct cag tac ttc gtg gac ttt gtg ttc cag cag cac739ala leu pro ser pro gln tyr phe val asp phe val phe gln gln his200 205 210agc agc gag gtc cct atg acg ctg gcc gag ctg tca gcc ttg atg cag787ser ser glu val pro met thr leu ala glu leu ser ala leu met gln215 220 225cgc ctg ggg gtg ggc agg gag gcc cac agt gac cac agt cat cgg cac835arg leu gly val gly arg glu ala his ser asp his ser his arg his230 235 240 245agg gga gcc agc agc cgg gac cct gtg ccc ctc atc agc tcc agc aac883arg gly ala ser ser arg asp pro val pro leu ile ser ser ser asn250 255 260agc tcc agt gtg tgg gac acg gta tgc ctg agt gcc agg gac gtg atg931ser ser ser val trp asp thr val cys leu ser ala arg asp val met265 270 275gct gca tat gga ctg tcg gaa cag gct ggg gtg acc ccg gag gcc tgg979ala ala tyr gly leu ser glu gln ala gly val thr pro glu ala trp280 285 290gcc caa ctg agc cct gcc ctg ctc caa cag cag ctg agt gga gcc tgc1027ala gln leu ser pro ala leu leu gln gln gln leu ser gly ala cys295 300 305acc tcc cag tcc agg ccc ccc gtc cag gac cag ctc agc cag tca gag1075thr ser gln ser arg pro pro val gln asp gln leu ser gln ser glu310 315 320 325agg tat ctg tac ggc tcc ctg gcc acg ctg ctc atc tgc ctc tgc gcg1123arg tyr leu tyr gly ser leu ala thr leu leu ile cys leu cys ala330 335 340gtc ttt ggc ctc ctg ctg ctg acc tgc act ggc tgc agg ggg gtc gcc1171val phe gly leu leu leu leu thr cys thr gly cys arg gly val ala345 350 355cac tac atc ctg cag acc ttc ctg agc ctg gca gtg ggt gca ctc act1219his tyr ile leu gln thr phe leu ser leu ala val gly ala leu thr360 365 370ggg gac gct gtc ctg cat ctg acg ccc aag gtg ctg ggg ctg cat aca1267gly asp ala val leu his leu thr pro lys val leu gly leu his thr375 380 385cac agc gaa gag ggc ctc agc cca cag ccc acc tgg cgc ctc ctg gct1315his ser glu glu gly leu ser pro gln pro thr trp arg leu leu ala390 395 400 405atg ctg gcc ggg ctc tac gcc ttc ttc ctg ttt gag aac ctc ttc aat1363met leu ala gly leu tyr ala phe phe leu phe glu asn leu phe asn410 415 420
ctc ctg ctg ccc agg gac ccg gag gac ctg gag gac ggg ccc tgc ggc 1411leu leu leu pro arg asp pro glu asp leu glu asp gly pro cys gly425 430 435cac agc agc cat agc cac ggg ggc cac agc cac ggt gtg tcc ctg cag 1459his ser ser his ser his gly gly his ser his gly val ser leu gln440 445 450ctg gca ccc agc gag ctc cgg cag ccc aag ccc ccc cac gag ggc tcc 1507leu ala pro ser glu leu arg gln pro lys pro pro his glu gly ser455 460 465cgc gca gac ctg gtg gcg gag gag agc ccg gag ctg ctg aac cct gag 1555arg ala asp leu val ala glu glu ser pro glu leu leu asn pro glu470 475 480 485ccc agg aga ctg agc cca gag ttg agg cta ctg ccc tat atg atc act 1603pro arg arg leu ser pro glu leu arg leu leu pro tyr met ile thr490 495 500ctg ggc gac gcc gtg cac aac ttc gcc gac ggg ctg gcc gtg ggc gcc 1651leu gly asp ala val his asn phe ala asp gly leu ala val gly ala505 510 515gcc ttc gcg tcc tcc tgg aag acc ggg ctg gcc acc tcg ctg gcc gtg 1699ala phe ala ser ser trp lys thr gly leu ala thr ser leu ala val520 525 530ttc tgc cac gag ttg cca cac gag ctg ggg gac ttc gcc gcc ttg ctg 1747phe cys his glu leu pro his glu leu gly asp phe ala ala leu leu535 540 545cac gcg ggg ctg tcc gtg cgc caa gca ctg ctg ctg aac ctg gcc tcc 1795his ala gly leu ser val arg gln ala leu leu leu asn leu ala ser550 555 560 565gcg ctc acg gcc ttc gct ggt ctc tac gtg gca ctc gcg gtt gga gtc 1843ala leu thr ala phe ala gly leu tyr val ala leu ala val gly val570 575 580agc gag gag agc gag gcc tgg atc ctg gca gtg gcc acc ggc ctg ttc 1891ser glu glu ser glu ala trp ile leu ala val ala thr gly leu phe585 590 595ctc tac gta gca ctc tgc gac atg ctc ccg gcg atg ttg aaa gta cgg 1939leu tyr val ala leu cys asp met leu pro ala met leu lys val arg600 605 610gac ccg cgg ccc tgg ctc ctc ttc ctg ctg cac aac gtg ggc ctg ctg 1987asp pro arg pro trp leu leu phe leu leu his asn val gly leu leu615 620 625ggc ggc tgg acc gtc ctg ctg ctg ctg tcc ctg tac gag gat gac atc 2035gly gly trp thr val leu leu leu leu ser leu tyr glu asp asp ile630 635 640 645acc ttc tga taccctgccc tagtccccca cctttgactt aagatcccac 2084thr phe *
acctcacaaa cctacagccc agaaaccaga agcccctata gaggccccag tcccaactcc 2144agtaaagaca ctcttgtcct tggaaaaaaa aaaaaaaaaa aaaaaaaa 2192<210>30<211>647<212>prt<213>人<400>30met ala ser leu val ser leu glu leu gly leu leu leu ala val leu1 5 10 15val val thr ala thr ala ser pro pro ala gly leu leu ser leu leu20 25 30thr ser gly gln gly ala leu asp gln glu ala leu gly gly leu leu35 40 45asn thr leu ala asp arg val his cys thr asn gly pro cys gly lys50 55 60cys leu ser val glu asp ala leu gly leu gly glu pro glu gly ser65 70 75 80gly leu pro pro gly pro val leu glu ala arg tyr val ala arg leu85 90 95ser ala ala ala val leu tyr leu ser asn pro glu gly thr cys glu100 105 110asp thr arg ala gly leu trp ala ser his ala asp his leu leu ala115 120 125leu leu glu ser pro lys ala leu thr pro gly leu ser trp leu leu130 135 140gln arg met gln ala arg ala ala gly gln thr pro lys thr ala cys145 150 155 160val asp ile pro gln leu leu glu glu ala val gly ala gly ala pro165 170 175gly ser ala gly gly val leu ala ala leu leu asp his val arg ser180 185 190gly ser cys phe his ala leu pro ser pro gln tyr phe val asp phe195 200 205val phe gln gln his ser ser glu val pro met thr leu ala glu leu210 215 220ser ala leu met gln arg leu gly val gly arg glu ala his ser asp225 230 235 240his ser his arg his arg gly ala ser ser arg asp pro val pro leu245 250 255ile ser ser ser asn ser ser ser val trp asp thr val cys leu ser260 265 270ala arg asp val met ala ala tyr gly leu ser glu gln ala gly val275 280 285thr pro glu ala trp ala gln leu ser pro ala leu leu gln gln gln290 295 300leu ser gly ala cys thr ser gln ser arg pro pro val gln asp gln305 310 315 320leu ser gln ser glu arg tyr leu tyr gly ser leu ala thr leu leu325 330 335ile cys leu cys ala val phe gly leu leu leu leu thr cys thr gly340 345 350cys arg gly val ala his tyr ile leu gln thr phe leu ser leu ala355 360 365val gly ala leu thr gly asp ala val leu his leu thr pro lys val370 375 380leu gly leu his thr his ser glu glu gly leu ser pro gln pro thr385 390 395 400trp arg leu leu ala met leu ala gly leu tyr ala phe phe leu phe405 410 415
glu asn leu phe asn leu leu leu pro arg asp pro glu asp leu glu420 425 430asp gly pro cys gly his ser ser his ser his gly gly his ser his435 440 445gly val ser leu gln leu ala pro ser glu leu arg gln pro lys pro450 455 460pro his glu gly ser arg ala asp leu val ala glu glu ser pro glu465 470 475 480leu leu asn pro glu pro arg arg leu ser pro glu leu arg leu leu485 490 495pro tyr met ile thr leu gly asp ala val his asn phe ala asp gly500 505 510leu ala val gly ala ala phe ala ser ser trp lys thr gly leu ala515 520 525thr ser leu ala val phe cys his glu leu pro his glu leu gly asp530 535 540phe ala ala leu leu his ala gly leu ser val arg gln ala leu leu545 550 555 560leu asn leu ala ser ala leu thr ala phe ala gly leu tyr val ala565 570 575leu ala val gly val ser glu glu ser glu ala trp ile leu ala val580 585 590ala thr gly leu phe leu tyr val ala leu cys asp met leu pro ala595 600 605met leu lys val arg asp pro arg pro trp leu leu phe leu leu his610 615 620asn val gly leu leu gly gly trp thr val leu leu leu leu ser leu625 630 635 640tyr glu asp asp ile thr phe645<210>31<211>1910<212>dna<213>人<220>
<221>cds<222>(101)...(1762)<400>31agtctggccc tggacaaccc cagcaaagcc gccctcagcc agcccagaag cactgggcct 60tggccacagc aacacccact gagcacgctg ggagctgagt atg gcg tcc ctg gtc115met ala ser leu val1 5tcg ctg gag ctg gga ctg ctt ctg gct gtg ctg gtg gtg acg gcg acg163ser leu glu leu gly leu leu leu ala val leu val val thr ala thr10 15 20gcg tcc ccg cct gct ggt ctg ctg agc ctg ctc acc tct ggc cag ggc211ala ser pro pro ala gly leu leu ser leu leu thr ser gly gln gly25 30 35gct ctg gat caa gag gct ctg ggc ggc ctg tta aat acg ctg gcg gac259ala leu asp gln glu ala leu gly gly leu leu asn thr leu ala asp40 45 50
cgt gtg cac tgc gcc aac ggg ccg tgt gga aag gcc tgc gta gat atc307arg val his cys ala asn gly pro cys gly lys ala cys val asp ile55 60 65cct cag ctg ctg gag gag gcg gtg ggg gcg ggg gct ccg ggc agt gct355pro gln leu leu glu glu ala val gly ala gly ala pro gly ser ala70 75 80 85ggc ggc gtc ctg gct gcc ctg ctg gac cat gtc agg agc ggg tct tgc403gly gly val leu ala ala leu leu asp his val arg ser gly ser cys90 95 100ttc cac gcc ttg ccg agc cct cag tac ttc gtg gac ttt gtg ttc cag451phe his ala leu pro ser pro gln tyr phe val asp phe val phe gln105 110 115cag cac agc agc gag gtc cct atg acg ctg gcc gag ctg tca gcc ttg499gln his ser ser glu val pro met thr leu ala glu leu ser ala leu120 125 130atg cag cgc ctg ggg gtg ggc agg gag gcc cac agt gac cac agt cat547met gln arg leu gly val gly arg glu ala his ser asp his ser his135 140 145cgg cac agg gga gcc agc agc cgg gac cct gtg ccc ctc atc agc tcc595arg his arg gly ala ser ser arg asp pro val pro leu ile ser ser150 155 160 165agc aac agc tcc agt gtg tgg gac acg gta tgc ctg agt gcc agg gac643ser asn ser ser ser val trp asp thr val cys leu ser ala arg asp170 175 180gtg atg gct gca tat gga ctg tcg gaa cag gct ggg gtg acc ccg gag691val met ala ala tyr gly leu ser glu gln ala gly val thr pro glu185 190 195gcc tgg gcc caa ctg agc cct gcc ctg ctc caa cag cag ctg agt gga739ala trp ala gln leu ser pro ala leu leu gln gln gln leu ser gly200 205 210gcc tgc acc tcc cag tcc agg ccc ccc gtc cag gac cag ctc agc cag787ala cys thr ser gln ser arg pro pro val gln asp gln leu ser gln215 220 225tca gag agg tat ctg tac ggc tcc ctg gcc acg ctg ctc atc tgc ctc835ser glu arg tyr leu tyr gly ser leu ala thr leu leu ile cys leu230 235 240 245tgc gcg gtc ttt ggc ctc ctg ctg ctg acc tgc act ggc tgc agg ggg883cys ala val phe gly leu leu leu leu thr cys thr gly cys arg gly250 255 260gtc acc cac tac atc ctg cag acc ttc ctg agc ctg gca gtg ggt gca931val thr his tyr ile leu gln thr phe leu ser leu ala val gly ala265 270 275gtc act ggg gac gct gtc ctg cat ctg acg ccc aag gtg ctg ggg ctg979val thr gly asp ala val leu his leu thr pro lys val leu gly leu280 285 290cat aca cac agc gaa gag ggc ctc agc cca cag ccc acc tgg cgc ctc1027
his thr his ser glu glu gly leu ser pro gln pro thr trp arg leu295 300 305ctg gct atg ctg gcc ggg ctc tac gcc ttc ttc ctg ttt gag aac ctc 1075leu ala met leu ala gly leu tyr ala phe phe leu phe glu asn leu310 315 320 325ttc aat ctc ctg ctg ccc agg gac ccg gag gac ctg gag gac ggg ccc 1123phe asn leu leu leu pro arg asp pro glu asp leu glu asp gly pro330 335 340tgc ggc cac agc agc cat agc cac ggg ggc cac agc cac ggt gtg tcc 1171cys gly his ser ser his ser his gly gly his ser his gly val ser345 350 355ctg cag ctg gca ccc agc gag ctc cgg cag ccc aag ccc ccc cac gag 1219leu gln leu ala pro ser glu leu arg gln pro lys pro pro his glu360 365 370ggc tcc cgc gca gac ctg gtg gcg gag gag agc ccg gag ctg ctg aac 1267gly ser arg ala asp leu val ala glu glu ser pro glu leu leu asn375 380 385cct gag ccc agg aga ctg agc cca gag ttg agg cta ctg ccc tat atg 1315pro glu pro arg arg leu ser pro glu leu arg leu leu pro tyr met390 395 400 405atc act ctg ggc gac gcc gtg cac aac ttc gcc gac ggg ctg gcc gtg 1363ile thr leu gly asp ala val his asn phe ala asp gly leu ala val410 415 420ggc gcc gcc ttc gcg tcc tcc tgg aag acc ggg ctg gcc acc tcg ctg 1411gly ala ala phe ala ser ser trp lys thr gly leu ala thr ser leu425 430 435gcc gtg ttc tgc cac gag ttg cca cac gag ctg ggg gac ttc gcc gcc 1459ala val phe cys his glu leu pro his glu leu gly asp phe ala ala440 445 450ttg ctg cac gcg ggg ctg tcc gtg cgc caa gca ctg ctg ctg aac ctg 1507leu leu his ala gly leu ser val arg gln ala leu leu leu asn leu455 460 465gcc tcc gcg ctc acg gcc ttc gct ggt ctc tac gtg gca ctc gcg gtt 1555ala ser ala leu thr ala phe ala gly leu tyr val ala leu ala val470 475 480 485gga gtc agc gag gag agc gag gcc tgg atc ctg gca gtg gcc acc ggc 1603gly val ser glu glu ser glu ala trp ile leu ala val ala thr gly490 495 500ctg ttc ctc tac gta gca ctc tgc gac atg ctc ccg gcg atg ttg aaa 1651leu phe leu tyr val ala leu cys asp met leu pro ala met leu lys505 510 515gta cgg gac ccg cgg ccc tgg ctc ctc ttc ctg ctg cac aac gtg ggc 1699val arg asp pro arg pro trp leu leu phe leu leu his asn val gly520 525 530ctg ctg ggc ggc tgg acc gtc ctg ctg ctg ctg tcc ctg tac gag gat 1747leu leu gly gly trp thr val leu leu leu leu ser leu tyr glu asp
535 540 545gac atc acc ttc tga taccctgccc tagtccccca cctttgactt aagatcccac 1802asp ile thr phe *550acctcacaaa cctacagccc agaaaccaga agcccctata gaggccccag tcccaactcc 1862agtaaagaca ctcttgtcct tggaaaaaaa aaaaaaaaaa aaaaaaaa 1910<210>32<211>553<212>prt<213>人<400>32met ala ser leu val ser leu glu leu gly leu leu leu ala val leu1 5 10 15val val thr ala thr ala ser pro pro ala gly leu leu ser leu leu20 25 30thr ser gly gln gly ala leu asp gln glu ala leu gly gly leu leu35 40 45asn thr leu ala asp arg val his cys ala asn gly pro cys gly lys50 55 60ala cys val asp ile pro gln leu leu glu glu ala val gly ala gly65 70 75 80ala pro gly ser ala gly gly val leu ala ala leu leu asp his val85 90 95arg ser gly ser cys phe his ala leu pro ser pro gln tyr phe val100 105 110asp phe val phe gln gln his ser ser glu val pro met thr leu ala115 120 125glu leu ser ala leu met gln arg leu gly val gly arg glu ala his130 135 140ser asp his ser his arg his arg gly ala ser ser arg asp pro val145 150 155 160pro leu ile ser ser ser asn ser ser ser val trp asp thr val cys165 170 175leu ser ala arg asp val met ala ala tyr gly leu ser glu gln ala180 185 190gly val thr pro glu ala trp ala gln leu ser pro ala leu leu gln195 200 205gln gln leu ser gly ala cys thr ser gln ser arg pro pro val gln210 215 220asp gln leu ser gln ser glu arg tyr leu tyr gly ser leu ala thr225 230 235 240leu leu ile cys leu cys ala val phe gly leu leu leu leu thr cys245 250 255thr gly cys arg gly val thr his tyr ile leu gln thr phe leu ser260 265 270leu ala val gly ala val thr gly asp ala val leu his leu thr pro275 280 285lys val leu gly leu his thr his ser glu glu gly leu ser pro gln290 295 300pro thr trp arg leu leu ala met leu ala gly leu tyr ala phe phe305 310 315 320leu phe glu asn leu phe asn leu leu leu pro arg asp pro glu asp325 330 335leu glu asp gly pro cys gly his ser ser his ser his gly gly his340 345 350ser his gly val ser leu gln leu ala pro ser glu leu arg gln pro
355 360 365lys pro pro his glu gly ser arg ala asp leu val ala glu glu ser370 375 380pro glu leu leu asn pro glu pro arg arg leu ser pro glu leu arg385 390 395 400leu leu pro tyr met ile thr leu gly asp ala val his asn phe ala405 410 415asp gly leu ala val gly ala ala phe ala ser ser trp lys thr gly420 425 430leu ala thr ser leu ala val phe cys his glu leu pro his glu leu435 440 445gly asp phe ala ala leu leu his ala gly leu ser val arg gln ala450 455 460leu leu leu asn leu ala ser ala leu thr ala phe ala gly leu tyr465 470 475 480val ala leu ala val gly val ser glu glu ser glu ala trp ile leu485 490 495ala val ala thr gly leu phe leu tyr val ala leu cys asp met leu500 505 510pro ala met leu lys val arg asp pro arg pro trp leu leu phe leu515 520 525leu his asn val gly leu leu gly gly trp thr val leu leu leu leu530 535 540ser leu tyr glu asp asp ile thr phe545 550<210>33<211>598<212>dna<213>人<220>
<221>cds<222>(23)...(421)<400>33cagagtcact cctgccttca cc atg aag tcc agc ggc ctc ttc ccc ttc ctg 52met lys ser ser gly leu phe pro phe leu1 5 10gtg ctg ctt gcc ctg gga act ctg gca cct tgg gct gtg gaa ggc tct100val leu leu ala leu gly thr leu ala pro trp ala val glu gly ser15 20 25gga aag tcc ttc aaa gct gga gtc tgt cct cct aag aaa tct gcc cag148gly lys ser phe lys ala gly val cys pro pro lys lys ser ala gln30 35 40tgc ctt aga tac aag aaa cct gag tgc cag agt gac tgg cag tgt cca196cys leu arg tyr lys lys pro glu cys gln ser asp trp gln cys pro45 50 55ggg aag aag aga tgt tgt cct gac act tgt ggc atc aaa tgc ctg gat244gly lys lys arg cys cys pro asp thr cys gly ile lys cys leu asp60 65 70cct gtt gac acc cca aac cca aca agg agg aag cct ggg aag tgc cca292pro val asp thr pro asn pro thr arg arg lys pro gly lys cys pro75 80 85 90
gtg act tat ggc caa tgt ttg atg ctt aac ccc ccc aat ttc tgt gag340val thr tyr gly gln cys leu met leu asn pro pro asn phe cys glu95 100 105atg gat ggc cag tgc aag cgt gac ttg aag tgt tgc atg ggc atg tgt388met asp gly gln cys lys arg asp leu lys cys cys met gly met cys110 115 120ggg aaa tcc tgc gtt tcc cct gtg aaa gct tga ttcctgccat atggaggagg 441gly lys ser cys val ser pro val lys ala *125 130ctctggagtc ctgctctgtg tggtccaggt cctttccacc ctgagacttg gctccaccac 501tgatatcctc ctttggggaa aggcttggca cacagcaggc tttcaagaag tgccagttga 561tcaatgaata aataaacgag cctatttctc tttgcac 598<210>34<211>132<212>prt<213>人<400>34met lys ser ser gly leu phe pro phe leu val leu leu ala leu gly1 5 10 15thr leu ala pro trp ala val glu gly ser gly lys ser phe lys ala20 25 30gly val cys pro pro lys lys ser ala gln cys leu arg tyr lys lys35 40 45pro glu cys gln ser asp trp gln cys pro gly lys lys arg cys cys50 55 60pro asp thr cys gly ile lys cys leu asp pro val asp thr pro asn65 70 75 80pro thr arg arg lys pro gly lys cys pro val thr tyr gly gln cys85 90 95leu met leu asn pro pro asn phe cys glu met asp gly gln cys lys100 105 110arg asp leu lys cys cys met gly met cys gly lys ser cys val ser115 120 125pro val lys ala130<210>35<211>3079<212>dna<213>人<220>
<221>cds<222>(25)...(2448)<400>35ggcacaaagt tgggggccgc gaag atg agg ctg tcc ccg gcg ccc ctg aag 51met arg leu ser pro ala pro leu lys1 5ctg agc cgg act ccg gca ctg ctg gcc ctg gcg ctg ccc ctg gcc gcg99leu ser arg thr pro ala leu leu ala leu ala leu pro leu ala ala10 15 20 25gcg ctg gcc ttc tcc gac gag acc ctg gac aaa gtg ccc aag tca gag147
ala leu ala phe ser asp glu thr leu asp lys val pro lys ser glu30 35 40ggc tac tgt agc cgt atc ctg cgc gcc cag ggc acg cgg cgc gag ggc195gly tyr cys ser arg ile leu arg ala gln gly thr arg arg glu gly45 50 55tac acc gag ttc agc ctc cgc gtg gag ggc gac ccc gac ttc tac aag243tyr thr glu phe ser leu arg val glu gly asp pro asp phe tyr lys60 65 70ccg gga acc agc tac cgc gta aca ctt tca gct gct cct ccc tcc tac291pro gly thr ser tyr arg val thr leu ser ala ala pro pro ser tyr75 80 85ttc aga gga ttc aca tta att gcc ctc aga gag aac aga gag ggt gat339phe arg gly phe thr leu ile ala leu arg glu asn arg glu gly asp90 95 100 105aag gaa gaa gac cat gct ggg acc ttc cag atc ata gac gaa gaa gaa387lys glu glu asp his ala gly thr phe gln ile ile asp glu glu glu110 115 120act cag ttt atg agc aat tgc cct gtt gca gtc act gaa agc act cca435thr gln phe met ser asn cys pro val ala val thr glu ser thr pro125 130 135cgg agg agg acc cgg atc cag gtg ttt tgg ata gca cca cca gcg gga483arg arg arg thr arg ile gln val phe trp ile ala pro pro ala gly140 145 150aca ggc tgc gtg att ctg aag gcc agc atc gta caa aaa cgc att att531thr gly cys val ile leu lys ala ser ile val gln lys arg ile ile155 160 165tat ttt caa gat gag ggc tct ctg acc aag aaa ctt tgt gaa caa gat579tyr phe gln asp glu gly ser leu thr lys lys leu cys glu gln asp170 175 180 185tcc aca ttt gat ggg gtg act gac aaa ccc atc tta gac tgc tgt gcc627ser thr phe asp gly val thr asp lys pro ile leu asp cys cys ala190 195 200tgc gga act gcc aag tac aga ctc aca ttt tat ggg aat tgg tcc gag675cys gly thr ala lys tyr arg leu thr phe tyr gly asn trp ser glu205 210 215aag aca cac cca aag gat tac cct cgt cgg gcc aac cac tgg tct gcg723lys thr his pro lys asp tyr pro arg arg ala asn his trp ser ala220 225 230atc atc gga gga tcc cac tcc aag aat tat gta ctg tgg gaa tat gga771ile ile gly gly ser his ser lys asn tyr val leu trp glu tyr gly235 240 245gga tat gcc agc gaa ggc gtc aaa caa gtt gca gaa ttg ggc tca ccc819gly tyr ala ser glu gly val lys gln val ala glu leu gly ser pro250 255 260 265gtg aaa atg gag gaa gaa att cga caa cag agt gat gag gtc ctc acc867val lys met glu glu glu ile arg gln gln ser asp glu val leu thr
270 275 280gtc atc aaa gcc aaa gcc caa tgg cca gcc tgg cag cct ctc aac gtg 915val ile lys ala lys ala gln trp pro ala trp gln pro leu asn val285 290 295aga gca gca cct tca gct gaa ttt tcc gtg gac aga acg cgc cat tta 963arg ala ala pro ser ala glu phe ser val asp arg thr arg his leu300 305 310atg tcc ttc ctg acc atg atg ggc cct agt ccc gac tgg aac gta ggc 1011met ser phe leu thr met met gly pro ser pro asp trp asn val gly315 320 325tta tct gca gaa gat ctg tgc acc aag gaa tgt ggc tgg gtc cag aag 1059leu ser ala glu asp leu cys thr lys glu cys gly trp val gln lys330 335 340 345gtg gtg caa gac ctg att ccc tgg gac gct ggc acc gac agc ggg gtg 1107val val gln asp leu ile pro trp asp ala gly thr asp ser gly val350 355 360acc tat gag tca ccc aac aaa ccc acc att ccc cag gag aaa atc cgg 1155thr tyr glu ser pro asn lys pro thr ile pro gln glu lys ile arg365 370 375ccc ctg acc agc ctg gac cat cct cag agt cct ttc tat gac cca gag 1203pro leu thr ser leu asp his pro gln ser pro phe tyr asp pro glu380 385 390ggt ggg tcc atc act caa gta gcc aga gtt gtc atc gag aga atc gca 1251gly gly ser ile thr gln val ala arg val val ile glu arg ile ala395 400 405cgg aag ggt gaa caa tgc aat att gta cct gac aat gtc gat gat att 1299arg lys gly glu gln cys asn ile val pro asp asn val asp asp ile410 415 420 425gta gct gac ctg gct cca gaa gag aaa gat gaa gat gac acc cct gaa 1347val ala asp leu ala pro glu glu lys asp glu asp asp thr pro glu430 435 440acc tgc atc tac tcc aac tgg tcc cca tgg tcc gcc tgc agc tcc tcc 1395thr cys ile tyr ser asn trp ser pro trp ser ala cys ser ser ser445 450 455acc tgt gac aaa ggc aag agg atg cga cag cgc atg ctg aaa gca cag 1443thr cys asp lys gly lys arg met arg gln arg met leu lys ala gln460 465 470ctg gac ctc agc gtc ccc tgc cct gac acc cag gac ttc cag ccc tgc 1491leu asp leu ser val pro cys pro asp thr gln asp phe gln pro cys475 480 485atg ggc cct ggc tgc agt gac gaa gac ggc tcc acc tgc acc atg tcc 1539met gly pro gly cys ser asp glu asp gly ser thr cys thr met ser490 495 500 505gag tgg atc acc tgg tcg ccc tgc agc atc tcc tgc ggc atg ggc atg 1587glu trp ile thr trp ser pro cys ser ile ser cys gly met gly met510 515 520
agg tcc cgg gag agg tat gtg aag cag ttc ccg gag gac ggc tcc gtg 1635arg ser arg glu arg tyr val lys gln phe pro glu asp gly ser val525 530 535tgc acg ctg ccc act gag gaa atg gag aag tgc acg gtc aac gag gag 1683cys thr leu pro thr glu glu met glu lys cys thr val asn glu glu540 545 550tgc tct ccc agc agc tgc ctg atg acc gag tgg ggc gag tgg gac gag 1731cys ser pro ser ser cys leu met thr glu trp gly glu trp asp glu555 560 565tgc agc gcc acc tgc ggc atg ggc atg aag aag cgg cac cgc atg atc 1779cys ser ala thr cys gly met gly met lys lys arg his arg met ile570 575 580 585aag atg aac ccc gca gat ggc tcc atg tgc aaa gcc gag aca tca cag 1827lys met asn pro ala asp gly ser met cys lys ala glu thr ser gln590 595 600gca gag aag tgc atg atg cca gag tgc cac acc atc cca tgc ttg ctg 1875ala glu lys cys met met pro glu cys his thr ile pro cys leu leu605 610 615tcc cca tgg tcc gag tgg agt gac tgc agc gtg acc tgc ggg aag ggc 1923ser pro trp ser glu trp ser asp cys ser val thr cys gly lys gly620 625 630atg cga acc cga cag cgg atg ctc aag tct ctg gca gaa ctt gga gac 1971met arg thr arg gln arg met leu lys ser leu ala glu leu gly asp635 640 645tgc aat gag gat ctg gag cag gtg gag aag tgc atg ctc cct gaa tgc 2019cys asn glu asp leu glu gln val glu lys cys met leu pro glu cys650 655 660 665ccc att gac tgt gag ctc acc gag tgg tcc cag tgg tcg gaa tgt aac 2067pro ile asp cys glu leu thr glu trp ser gln trp ser glu cys asn670 675 680aag tca tgt ggg aaa ggc cac gtg att cga acc cgg atg atc caa atg 2115lys ser cys gly lys gly his val ile arg thr arg met ile gln met685 690 695gag cct cag ttt gga ggt gca ccc tgc cca gag act gtg cag cga aaa 2163glu pro gln phe gly gly ala pro cys pro glu thr val gln arg lys700 705 710aag tgc cgc atc cga aaa tgc ctt cga aat cca tcc atc caa aag cca 2211lys cys arg ile arg lys cys leu arg asn pro ser ile gln lys pro715 720 725cgc tgg agg gag gcc cga gag agc cgg cgg agt gag cag ctg aag gaa 2259arg trp arg glu ala arg glu ser arg arg ser glu gln leu lys glu730 735 740 745gag tct gaa ggg gag cag ttc cca ggt tgt agg atg cgc cca tgg acg 2307glu ser glu gly glu gln phe pro gly cys arg met arg pro trp thr750 755 760
gcc tgg tca gaa tgc acc aaa ctg tgc gga ggt gga att cag gaa cgt 2355ala trp ser glu cys thr lys leu cys gly gly gly ile gln glu arg765 770 775tac atg act gta aag aag aga ttc aaa agc tcc cag ttt acc agc tgc 2403tyr met thr val lys lys arg phe lys ser ser gln phe thr ser cys780 785 790aaa gac aag aag gag atc aga gca tgc aat gtt cat cct tgt tag 2448lys asp lys lys glu ile arg ala cys asn val his pro cys *795 800 805caagggtacg agttccccag ggctgcactc tagattccag agtcaccaat ggctggatta 2508tttgcttgtt taagacaatt taaattgtgt acgctagttt tcatttttgc agtgtggttc 2568gcccagtagt cttgtggatg ccagagacat cctttctgaa tacttcttga tgggtacagg 2628ctgagtgggg cgccctcacc tccagccagc ctcttcctgc agaggagtag tgtcagccac 2688cttgtactaa gctgaaacat gtccctctgg agcttccacc tggccaggga ggacggagac 2748tttgacctac tccacatgga gaggcaacca tgtctggaag tgactatgcc tgagtcccag 2808ggtgcggcag gtaggaaaca ttcacagatg aagacagcag attccccaca ttctcatctt 2868tggcctgttc aatgaaacca ttgtttgccc atctcttctt agtggaactt taggtctctt 2928ttcaagtctc ctcagtcatc aatagttcct ggggaaaaac agagctggta gacttgaaga 2988ggagcattga tgttgggtgg cttttgttct ttcactgaga aattcggaat acatttgtct 3048cacccctgat attggttcct gatgccccag c3079<210>36<211>807<212>prt<213>人<400>36met arg leu ser pro ala pro leu lys leu ser arg thr pro ala leu1 5 10 15leu ala leu ala leu pro leu ala ala ala leu ala phe ser asp glu20 25 30thr leu asp lys val pro lys ser glu gly tyr cys ser arg ile leu35 40 45arg ala gln gly thr arg arg glu gly tyr thr glu phe ser leu arg50 55 60val glu gly asp pro asp phe tyr lys pro gly thr ser tyr arg val65 70 75 80thr leu ser ala ala pro pro ser tyr phe arg gly phe thr leu ile85 90 95ala leu arg glu asn arg glu gly asp lys glu glu asp his ala gly100 105 110thr phe gln ile ile asp glu glu glu thr gln phe met ser asn cys115 120 125pro val ala val thr glu ser thr pro arg arg arg thr arg ile gln130 135 140val phe trp ile ala pro pro ala gly thr gly cys val ile leu lys145 150 155 160ala ser ile val gln lys arg ile ile tyr phe gln asp glu gly ser165 170 175leu thr lys lys leu cys glu gln asp ser thr phe asp gly val thr180 185 190asp lys pro ile leu asp cys cys ala cys gly thr ala lys tyr arg195 200 205leu thr phe tyr gly asn trp ser glu lys thr his pro lys asp tyr210 215 220pro arg arg ala asn his trp ser ala ile ile gly gly ser his ser225 230 235 240lys asn tyr val leu trp glu tyr gly gly tyr ala ser glu gly val
245 250 255lys gln val ala glu leu gly ser pro val lys met glu glu glu ile260 265 270arg gln gln ser asp glu val leu thr val ile lys ala lys ala gln275 280 285trp pro ala trp gln pro leu asn val arg ala ala pro ser ala glu290 295 300phe ser val asp arg thr arg his leu met ser phe leu thr met met305 310 315 320gly pro ser pro asp trp asn val gly leu ser ala glu asp leu cys325 330 335thr lys glu cys gly trp val gln lys val val gln asp leu ile pro340 345 350trp asp ala gly thr asp ser gly val thr tyr glu ser pro asn lys355 360 365pro thr ile pro gln glu lys ile arg pro leu thr ser leu asp his370 375 380pro gln ser pro phe tyr asp pro glu gly gly ser ile thr gln val385 390 395 400ala arg val val ile glu arg ile ala arg lys gly glu gln cys asn405 410 415ile val pro asp asn val asp asp ile val ala asp leu ala pro glu420 425 430glu lys asp glu asp asp thr pro glu thr cys ile tyr ser asn trp435 440 445ser pro trp ser ala cys ser ser ser thr cys asp lys gly lys arg450 455 460met arg gln arg met leu lys ala gln leu asp leu ser val pro cys465 470 475 480pro asp thr gln asp phe gln pro cys met gly pro gly cys ser asp485 490 495glu asp gly ser thr cys thr met ser glu trp ile thr trp ser pro500 505 510cys ser ile ser cys gly met gly met arg ser arg glu arg tyr val515 520 525lys gln phe pro glu asp gly ser val cys thr leu pro thr glu glu530 535 540met glu lys cys thr val asn glu glu cys ser pro ser ser cys leu545 550 555 560met thr glu trp gly glu trp asp glu cys ser ala thr cys gly met565 570 575gly met lys lys arg his arg met ile lys met asn pro ala asp gly580 585 590ser met cys lys ala glu thr ser gln ala glu lys cys met met pro595 600 605glu cys his thr ile pro cys leu leu ser pro trp ser glu trp ser610 615 620asp cys ser val thr cys gly lys gly met arg thr arg gln arg met625 630 635 640leu lys ser leu ala glu leu gly asp cys asn glu asp leu glu gln645 650 655val glu lys cys met leu pro glu cys pro ile asp cys glu leu thr660 665 670glu trp ser gln trp ser glu cys asn lys ser cys gly lys gly his675 680 685val ile arg thr arg met ile gln met glu pro gln phe gly gly ala690 695 700pro cys pro glu thr val gln arg lys lys cys arg ile arg lys cys705 710 715 720leu arg asn pro ser ile gln lys pro arg trp arg glu ala arg glu725 730 735
ser arg arg ser glu gln leu lys glu glu ser glu gly glu gln phe740 745 750pro gly cys arg met arg pro trp thr ala trp ser glu cys thr lys755 760 765leu cys gly gly gly ile gln glu arg tyr met thr val lys lys arg770 775 780phe lys ser ser gln phe thr ser cys lys asp lys lys glu ile arg785 790 795 800ala cys asn val his pro cys805<210>37<211>2805<212>dna<213>人<220>
<221>cds<222>(616)...(1587)<400>37cgggtctgat agtccctacc tgtcaggact ggtgttagga tgagataatg tttgtgaact 60gtaaacatat ataaacgtgt gctactgtga gaactggaac aaagaagaga gggagtgaga 120gaaatcaagg gagggctggg gctgggaaag aacgaaaagg gagtcgcgta tagaggagag 180gcgacagtcg cgagccacac tttgcaatga aactctttag actttctgcc gggagagcgg 240cccagacgcg ccaggtctgt agcaggaggc cgcgagggcg ggtccccaga agcctacagg 300tgagtatcgg ttctcccctt cccggctttc ggtccggagg aggcgggagc agcttccctg 360ttctgatcct atcgcgggcg gcgcagggcc ggcttggcct tccgtgggac ggggaggggg 420gcgggatgtg tcacccaaat accagtgggg acggtcggtg gtggaaccag ccgggcaggt 480cgggtagagt ataagagccg gagggagcgg ccggggcgca gacgcctgca gaccatccca 540gacgccggag cccgagcccc gacgagtccc cgcgcctcat ccgcccgcgt ccggtccgcg 600ttcctccgcc ccacc atg gct cgg ggc ccc ggc ctc gcg ccg cca ccg ctg 651met ala arg gly pro gly leu ala pro pro pro leu1 5 10cgg ctg ccg ctg ctg ctg ctg gtg ctg gcg gcg gtg acc ggc cac acg699arg leu pro leu leu leu leu val leu ala ala val thr gly his thr15 20 25gcc gcg cag gac aac tgc acg tgt ccc acc aac aag atg acc gtg tgc747ala ala gln asp asn cys thr cys pro thr asn lys met thr val cys30 35 40agc ccc gac ggc ccc ggc ggc cgc tgc cag tgc cgc gcg ctg ggc tcg795ser pro asp gly pro gly gly arg cys gln cys arg ala leu gly ser45 50 55 60ggc atg gcg gtc gac tgc tcc acg ctg acc tcc aag tgt ctg ctg ctc843gly met ala val asp cys ser thr leu thr ser lys cys leu leu leu65 70 75aag gcg cgc atg agc gcc ccc aag aac gcc cgc acg ctg gtg cgg ccg891lys ala arg met ser ala pro lys asn ala arg thr leu val arg pro80 85 90agt gag cac gcg ctc gtg gac aac gat ggc ctc tac gac ccc gac tgc939ser glu his ala leu val asp asn asp gly leu tyr asp pro asp cys95 100 105gac ccc gag ggc cgc ttc aag gcg cgc cag tgc aac cag acg tcg gtg987
asp pro glu gly arg phe lys ala arg gln cys asn gln thr ser val110 115 120tgc tgg tgc gtg aac tcg gtg ggc gtg cgc cgc acg gac aag ggc gac 1035cys trp cys val asn ser val gly val arg arg thr asp lys gly asp125 130 135 140ctg agc cta cgc tgc gat gag ctg gtg cgc acc cac cac atc ctc att 1083leu ser leu arg cys asp glu leu val arg thr his his ile leu ile145 150 155gac ctg cgc cac cgc ccc acc gcc ggc gcc ttc aac cac tca gac ctg 1131asp leu arg his arg pro thr ala gly ala phe asn his ser asp leu160 165 170gac gcc gag ctg agg cgg ctc ttc cgc gag cgc tat cgg ctg cac ccc 1179asp ala glu leu arg arg leu phe arg glu arg tyr arg leu his pro175 180 185aag ttc gtg gcg gcc gtg cac tac gag cag ccc acc atc cag atc gag 1227lys phe val ala ala val his tyr glu gln pro thr ile gln ile glu190 195 200ctg cgg cag aac acg tct cag aag gcc gcc ggt gaa gtg gat atc ggc 1275leu arg gln asn thr ser gln lys ala ala gly glu val asp ile gly205 210 215 220gat gcc gcc tac tac ttc gag agg gac atc aag ggc gag tct cta ttc 1323asp ala ala tyr tyr phe glu arg asp ile lys gly glu ser leu phe225 230 235cag ggc cgc ggc ggc ctg gac ttg cgc gtg cgc gga gaa ccc ctg cag 1371gln gly arg gly gly leu asp leu arg val arg gly glu pro leu gln240 245 250gtg gag cgc acg ctc atc tat tac ctg gac gag att ccc ccg aag ttc 1419val glu arg thr leu ile tyr tyr leu asp glu ile pro pro lys phe255 260 265tcc atg aag cgc ctc acc gcc ggc ctc atc gcc gtc atc gtg gtg gtc 1467ser met lys arg leu thr ala gly leu ile ala val ile val val val270 275 280gtg gtg gcc ctc gtc gcc ggc atg gcc gtc ctg gtg atc acc aac cgg 1515val val ala leu val ala gly met ala val leu val ile thr asn arg285 290 295 300aga aag tcg ggg aag tac aag aag gtg gag atc aag gaa ctg ggg gag 1563arg lys ser gly lys tyr lys lys val glu ile lys glu leu gly glu305 310 315ttg aga aag gaa ccg agc ttg tag gtacccggcg gggcagggga tggggtgggg 1617leu arg lys glu pro ser leu *320taccggattt cggtatcgtc ccagacccaa gtgagtcacg cttcctgatt cctcggcgca 1677aaggagacgt ttatcctttc aaattcctgc cttccccctc ccttttgcgc acacaccagg 1737tttaatagat cctggcctca gggtctcctt tctttctcac ttctgtcttg agggaagcat 1797ttctaaaatg tatccccttt cggtccaaca acaggaaacc tgactggggc agtgaaggaa 1857gggatggcac agcgttatgt gtaaaaaaca agtatctgta tgacaacccg ggatcgtttg 1917caagtaactg aatccattgc gacattgtga aggcttaaat gagtttagat gggaaatagc 1977
gttgttatcg ccttgggttt aaattatttg atgagttcca cttgtatcat ggcctacccg 2037aggagaagag gagtttgtta actgggccta tgtagtagcc tcatttacca tcgtttgtat 2097tactgaccac atatgcttgt cactgggaaa gaagcctgtt tcagctgcct gaacgcagtt 2157tggatgtctt tgaggacaga cattgcccgg aaactcagtc tatttattct tcagcttgcc 2217cttactgcca ctgatattgg taatgttctt ttttgtaaaa tgtttgtaca tatgttgtct 2277ttgataatgt tgctgtaatt ttttaaaata aaacacgaat ttaataaaat atgggaaagg 2337cacaaaccag aagtcggcat ttgtgaaaag tccctccaga tttctatcac tttggtctct 2397aatttcccaa gacttgtatt ttttttttat ttcaaattat aacacttttt tttcccccag 2457aagtgggtgt ttcatgttgc tactctggtg tgtcccaaga tatcctaact ggccagtgta 2517aatgctattc tttctaaata agattatttg gaaacttcct tcaaactgca ggagggcgag 2577ctctgagggc acgagaagct aaaactagct gcttttgatg aaaaagagtg ccagtctttg 2637gtcatctcta aacaaggctt atcaccaatg gagacagaaa actctagttc aagagctgta 2697cctcctttga atcccagccc tactcgaaat aagtggtact atttccattt agcctttgag 2757caaatcactt aactcaaagg cgttgtggct ctaagattaa acgacttt 2805<210>38<211>323<212>prt<213>人<400>38met ala arg gly pro gly leu ala pro pro pro leu arg leu pro leu1 5 10 15leu leu leu val leu ala ala val thr gly his thr ala ala gln asp20 25 30asn cys thr cys pro thr asn lys met thr val cys ser pro asp gly35 40 45pro gly gly arg cys gln cys arg ala leu gly ser gly met ala val50 55 60asp cys ser thr leu thr ser lys cys leu leu leu lys ala arg met65 70 75 80ser ala pro lys asn ala arg thr leu val arg pro ser glu his ala85 90 95leu val asp asn asp gly leu tyr asp pro asp cys asp pro glu gly100 105 110arg phe lys ala arg gln cys asn gln thr ser val cys trp cys val115 120 125asn ser val gly val arg arg thr asp lys gly asp leu ser leu arg130 135 140cys asp glu leu val arg thr his his ile leu ile asp leu arg his145 150 155 160arg pro thr ala gly ala phe asn his ser asp leu asp ala glu leu165 170 175arg arg leu phe arg glu arg tyr arg leu his pro lys phe val ala180 185 190ala val his tyr glu gln pro thr ile gln ile glu leu arg gln asn195 200 205thr ser gln lys ala ala gly glu val asp ile gly asp ala ala tyr210 215 220tyr phe glu arg asp ile lys gly glu ser leu phe gln gly arg gly225 230 235 240gly leu asp leu arg val arg gly glu pro leu gln val glu arg thr245 250 255leu ile tyr tyr leu asp glu ile pro pro lys phe ser met lys arg260 265 270leu thr ala gly leu ile ala val ile val val val val val ala leu275 280 285val ala gly met ala val leu val ile thr asn arg arg lys ser gly290 295 300lys tyr lys lys val glu ile lys glu leu gly glu leu arg lys glu305 310 315 320
pro ser leu<210>39<211>590<212>dna<213>人<220>
<221>cds<222>(28)...(402)<400>39acctgcaccc cgcccgggca tagcacc atg cct gct tgt cgc cta ggc ccg cta 54met pro ala cys arg leu gly pro leu1 5gcc gcc gcc ctc ctc ctc agc ctg ctg ctg ttc ggc ttc acc cta gtc102ala ala ala leu leu leu ser leu leu leu phe gly phe thr leu val10 15 20 25tca ggc aca gga gca gag aag act ggc gtg tgc ccc gag ctc cag gct150ser gly thr gly ala glu lys thr gly val cys pro glu leu gln ala30 35 40gac cag aac tgc acg caa gag tgc gtc tcg gac agc gaa tgc gcc gac198asp gln asn cys thr gln glu cys val ser asp ser glu cys ala asp45 50 55aac ctc aag tgc tgc agc gcg ggc tgt gcc acc ttc tgc tct ctg ccc246asn leu lys cys cys ser ala gly cys ala thr phe cys ser leu pro60 65 70aat gat aag gag ggt tcc tgc ccc cag gtg aac att aac ttt ccc cag294asn asp lys glu gly ser cys pro gln val asn ile asn phe pro gln75 80 85ctc ggc ctc tgt cgg gac cag tgc cag gtg gac agc cag tgt cct ggc342leu gly leu cys arg asp gln cys gln val asp ser gln cys pro gly90 95 100 105cag atg aaa tgc tgc cgc aat ggc tgt ggg aag gtg tcc tgt gtc act390gln met lys cys cys arg asn gly cys gly lys val ser cys val thr110 115 120ccc aat ttc tga gctccagcca ccaccaggct gagcagtgag gagagaaagt442pro asn phe *ttctgcctgg ccctgcatct ggttccagcc cacctgccct cccctttttc ggactctgt 502attccctctt gggctgacca cagcttctcc ctttcccaac caataaagta accactttca 562gcaaaaaaaa aaaaaaaaaa aaaaaaaa 590<210>40<211>124<212>prt<213>人<400>40
met pro ala cys arg leu gly pro leu ala ala ala leu leu leu ser1 5 10 15leu leu leu phe gly phe thr leu val ser gly thr gly ala glu lys20 25 30thr gly val cys pro glu leu gln ala asp gln asn cys thr gln glu35 40 45cys val ser asp ser glu cys ala asp asn leu lys cys cys ser ala50 55 60gly cys ala thr phe cys ser leu pro asn asp lys glu gly ser cys65 70 75 80pro gln val asn ile asn phe pro gln leu gly leu cys arg asp gln85 90 95cys gln val asp ser gln cys pro gly gln met lys cys cys arg asn100 105 110gly cys gly lys val ser cys val thr pro asn phe115 120<210>41<211>450<212>dna<213>人<220>
<221>cds<222>(67)...(288)<400>41cccaagatgg actcaggcag gcagctctgc tgtatgtgaa gcccagtgag gggcagtggg 60ggggcc atg ctg cag gta caa gtt aat ctc cct gta tcg cct ctg ccc 108met leu gln val gln val asn leu pro val ser pro leu pro1 5 10act tac cct tac tcc ttt ttc tac cca gat aag gag ggt tcc tgc ccc156thr tyr pro tyr ser phe phe tyr pro asp lys glu gly ser cys pro15 20 25 30cag gtg aac att aac ttt ccc cag ctc ggc ctc tgt cgg gac cag tgc204gln val asn ile asn phe pro gln leu gly leu cys arg asp gln cys35 40 45cag gtg gac agc cag tgt cct ggc cag atg aaa tgc tgc cgc aat ggc252gln val asp ser gln cys pro gly gln met lys cys cys arg asn gly50 55 60tgt ggg aag gtg tcc tgt gtc act ccc aat ttc tga ggtccagcca 298cys gly lys val ser cys val thr pro asn phe *65 70ccaccaggct gagcagtgag gagagaaagt ttctgcctgg ccctgcatct ggttccagcc 358cacctgccct cccctttttc gggactctgt attccctctt gggctgacca cagcttctcc 418ctttcccaac caataaagta accactttca gc450<210>42<211>73<212>prt<213>人<400>42met leu gln val gln val asn leu pro val ser pro leu pro thr tyr1 5 10 15
pro tyr ser phe phe tyr pro asp lys glu gly ser cys pro gln val20 25 30asn ile asn phe pro gln leu gly leu cys arg asp gln cys gln val35 40 45asp ser gln cys pro gly gln met lys cys cys arg asn gly cys gly50 55 60lys val ser cys val thr pro asn phe65 70<210>43<211>705<212>dna<213>人<220>
<221>cds<222>(339)...(626)<400>43ctgccgcccg cccagacgcc agcaagcccc cctcccacga cagggctgct ccgggagctt 60cggagacccg ccccgggcct gagcgcaggc tgcctccggg accccacggc tgtccggacg 120tgccatgggc gcgcagctgc cgggcaacgt gttgtgtaag tgaacatctg ggaggtaaac 180actacacgtg aagagtggtg aaagggaaca ttgattactg aagtgccctg gagagggaaa 240gcactggtca acatcacatg gacaaatttc attgttttct aaagatggcc tggaagtagt 300ctttgccact gcttcctcca caaacagctc ttcataac atg ggc tgc atg aaa tca 356met gly cys met lys ser1 5aag caa act ttc cca ttt cct acc ata tat gaa ggt gag aag cag cat404lys gln thr phe pro phe pro thr ile tyr glu gly glu lys gln his10 15 20gag agt gaa gaa ccc ttt atg cca gaa gag aga tgt cta cct agg atg452glu ser glu glu pro phe met pro glu glu arg cys leu pro arg met25 30 35gct tct cca gtt aat gtc aaa gag gaa gtg aag gaa cct cca ggg acc500ala ser pro val asn val lys glu glu val lys glu pro pro gly thr40 45 50aat att gtg atc ttg gaa tat gca cac cgc ctg tct cag gat atc ttg548asn ile val ile leu glu tyr ala his arg leu ser gln asp ile leu55 60 65 70tgt gat gcc ttg cag caa tgg gca tgc aat aac atc aag tac cat gac596cys asp ala leu gln gln trp ala cys asn asn ile lys tyr his asp75 80 85att cca tac att gag agt gag ggg cct tga ggctgtagga tgacaacact 646ile pro tyr ile glu ser glu gly pro *90 95ttgactgtgg aggtgctagt ttgaataaat gtgacaaaag caaaaaaaaa aaaaaaaaa 705<210>44<211>95<212>prt<213>人<400>44
met gly cys met lys ser lys gln thr phe pro phe pro thr ile tyr1 5 10 15glu gly glu lys gln his glu ser glu glu pro phe met pro glu glu20 25 30arg cys leu pro arg met ala ser pro val asn val lys glu glu val35 40 45lys glu pro pro gly thr asn ile val ile leu glu tyr ala his arg50 55 60leu ser gln asp ile leu cys asp ala leu gln gln trp ala cys asn65 70 75 80asn ile lys tyr his asp ile pro tyr ile glu ser glu gly pro85 90 9权利要求
1.一种评估患者是否患有卵巢癌的方法,该方法包括如下步骤a)测定患者标本中一种标志的表达水平,其中该标志选自表1中所列的标志;b)测定该标志在未患卵巢癌或未患卵巢肿瘤的对照者标本中的表达水平;和c)比较该标志在患者标本中与对照者标本中的表达水平,其中该标志在患者标本与对照者标本中的表达水平的显著性差异是该患者患有乳腺癌的指示。
2.权利要求1的方法,其中由所述显示非癌症的患者的卵巢细胞确定对照者的表达水平。
3.权利要求1的方法,其中利用非卵巢癌人群的平均表达水平预先确定对照者的表达水平。
4.权利要求1的方法,其中所述标志对应于一种分泌的蛋白质。
5.权利要求1的方法,其中所述标志对应于一种转录的多核苷酸或其部分,其中该多核苷酸含有该标志。
6.权利要求1的方法,其中所述标本包括从患者获得的细胞。
7.权利要求6的方法,其中所述细胞存在于选自下组的液体中血液、淋巴、腹水、妇科液体、囊液、尿以及通过腹膜漂洗收集的液体。
8.权利要求1的方法,其中标本中所述标志的表达水平通过检测标本中对应于该标志的蛋白质的存在来评定。
9.权利要求8的方法,其中所述蛋白质的存在用特异性结合该蛋白质的试剂来检测。
10.权利要求9的方法,其中所述试剂选自抗体、抗体衍生物和抗体片段。
11.权利要求1的方法,其中标本中所述标志的表达水平通过检测标本中转录多核苷酸或其部分的存在来估计,其中该转录多核苷酸包含该标志。
12.权利要求11的方法,其中所述转录多核苷酸是mrna或cdna。
13.权利要求11的方法,其中所述检测步骤进一步包括扩增所述转录多核苷酸。
14.权利要求1的方法,其中标本中所述标志的表达水平通过检测标本中转录多核苷酸的存在来评定,该转录多核苷酸在严格杂交条件下与该标志退火或者与包含该标志的多核苷酸的一部分退火。
15.权利要求1的方法,其中标本中所述标志的表达水平与未患卵巢癌者中该标志的正常表达水平相差至少大约2倍。
16.权利要求1的方法,其中标本中所述标志的表达水平与未患卵巢癌者中该标志的正常表达水平相差至少大约5倍。
17.一种评估患者是否患有卵巢癌的方法,该方法包括如下步骤a)测定标本中多个标志各自的表达水平,这些标志独立地选自表1中所列的标志;b)测定未患卵巢癌的对照者标本中所述多个标志各自的表达水平;和c)比较该标志在患者标本中与对照者标本中的表达水平;其中一种以上的标志的表达水平相对于该标志的相应对照表达水平显著改变,是该患者患有卵巢癌的指示。
18.权利要求17的方法,其中由所述显示非癌症的患者的卵巢细胞确定对照者的表达水平。
19.权利要求17的方法,其中利用非卵巢癌人群的平均表达水平预先确定对照者的表达水平。
20.权利要求17的方法,其中所述多种标志包括至少三种标志。
21.权利要求17的方法,其中所述多种标志包括至少五种标志。
22.一种确定患者是否患有已经转移的或者可能转移的卵巢癌的方法,该方法包括比较a)表1所列一种标志在该患者标本中的表达水平,和b)该标志在患未转移卵巢癌或未患卵巢癌的对照者标本中的表达水平,c)其中,患者标本中的表达水平显著高于对照者标本中的水平,是卵巢癌已经转移或者可能转移的指示。
23.一种评估试验化合物抑制患者卵巢癌效果的方法,该方法包括比较a)从该患者中获得并且暴露于试验化合物的第一标本中一种标志的表达,其中该标志选自表1中所列的标志,和b)从该患者中获得的第二标本中该标志的表达,其中该标本未暴露于该试验化合物,c)其中,第一标本中该标志的表达水平显著低于第二标本,是该试验化合物对抑制患者卵巢癌有效的指示。
24.权利要求23的方法,其中所述第一和第二标本是从患者中获得的一个标本的一部分。
25.权利要求23的方法,其中所述第一和第二标本是从患者中获得的合并标本的一部分。
26.一种评估治疗方法抑制患者卵巢癌的效果的方法,该方法包括比较a)在对患者施以至少一部分治疗之前从患者中获得的第一标本中一种标志的表达,其中该标志选自表1中所列的标志,和b)施行该部分治疗后从患者中获得的第二标本中该标志的表达,c)其中,第二标本中该标志的表达水平显著低于第一标本,是该治疗方法对抑制患者卵巢癌有效的指示。
27.一种筛选用于抑制患者卵巢癌的组合物/化合物的方法,该方法包括a)从患者中获得包括癌细胞的标本;b)在多种试验组合物/化合物的存在下分别暴露该标本的各等份;c)比较各等份中一种标志的表达,其中该标志选自表1中所列的标志;和d)选择至少一种试验组合物/化合物,与其他试验组合物/化合物相比,该试验组合物/化合物在含有该试验组合物/化合物的等份中诱导该标志较低水平的表达。
28.一种抑制患者卵巢癌的方法,该方法包括a)从患者中获得包括癌细胞的标本;b)在多种试验组合物/化合物的存在下分别保存该标本的各等份;c)比较各等份中一种标志的表达,其中该标志选自表1中所列的标志;和向患者施用至少一种试验组合物/化合物,与其它试验组合物/化合物相比,该试验组合物/化合物在含有该试验组合物/化合物的等份中诱导该标志较低水平的表达。
29.一种评估试验组合物/化合物的致卵巢细胞癌能力的方法,该方法包括a)在存在及不存在试验组合物/化合物的情况下保存卵巢癌细胞的不同等份;和b)比较各等份中一种标志的表达,其中该标志选自表1中所列的标志,其中在试验组合物/化合物存在下保存的等份中该标志的表达水平显著提高是该试验组合物/化合物具有致人卵巢细胞癌能力的指示。
30.一种用于评价患者是否患有卵巢癌的试剂盒,该试剂盒包含用于评价选自表1所列标志的多种标志表达的试剂。
31.一种用于评价是否存在卵巢癌细胞的试剂盒,该试剂盒包含多种核酸探针,其中该探针与对应于选自表1所列标志的多种标志的转录多核苷酸特异性结合。
32.一种用于评价是否存在卵巢癌细胞的试剂盒,该试剂盒包含多种抗体,其中该抗体与对应于选自表1所列标志的多种标志的蛋白质特异性结合。
33.一种用于评价多种化合物各自是否适于抑制患者卵巢癌的试剂盒,该试剂盒包含多种化合物;和用于评价一种标志表达的试剂,该标志选自表1中所列的标志。
34.一种在具有发展卵巢癌危险的患者中抑制卵巢癌的方法,该方法包括抑制对应于一种标志的基因的表达,该标志选自表1中所列的标志。
35.一种分离的核酸分子,其包含seq id no7、seq id no9、seq id no17、seq id no31、seq id no39或seq idno41的核苷酸序列。
36.一种分离的多肽,其包含seq id no10、seq id no32、seq id no40或seq id no42的氨基酸序列。
37.一种选择性结合权利要求36的多肽的抗体。
全文摘要
本发明涉及新发现的与卵巢癌有关的核酸分子和蛋白质。提供了用于检测、表征、预防和治疗人类卵巢癌的组合物、试剂盒和方法。
文档编号g01n33/574gk1964986sq200480033173
公开日2007年5月16日 申请日期2004年10月7日 优先权日2003年10月7日
发明者威尔逊·o·恩迪格, 唐娜·福特, 曼朱拉·甘纳瓦拉普, 卡伦·格拉特, 塞巴斯蒂安·赫尔施, 舒布汉吉·卡马特卡, 约翰·e·莫纳汉, 罗伯特·施莱格尔, y·徐, x·赵 申请人:千年药品公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图