专利名称:在卵巢癌中作为预后和治疗靶标而被调控的基因的制作方法
技术领域:
本发明属于医学领域并涉及基因组分析以评估和治疗卵巢癌的用途。具体地,本发明涉及通过测量基因表达模式确定病人组织中卵巢癌的存在。
背景技术:
卵巢癌是影响美国妇女的最常见癌症类型之一,有大约1/70的终生危险。见whittemore,gynecol.oncol.,卷55,no.3,第2部分,s15-s19页(1994)。它是通常很晚才检测到的快速致死疾病,仍然没有好的预防方法。卵巢癌最大的危险因素是该疾病的家族史,这提示了遗传学的强烈影响。见schildkraut和thompson,am.j.epidemiol.,卷128,no.3,456-466页(1988)。其他因素如人口统计学因素、生活方式因素和生殖因素也显示促进卵巢癌的危险。
已经进行了若干卵巢活检组织和细胞系微阵列表达分析,以鉴定在卵巢癌中特异过表达的基因。见schummer等,gene,第238卷,no.2,375-385页(1999)。其他研究尝试将基因表达水平与特定的肿瘤类型联系起来。见bayani等,cancer res.,卷62,no.12,3466-3476页(2002);welsh等,proc.natl.acad.sci.usa,卷98,no.3,1176-1181页(2001);和ono等,cancer res.,卷60,no.18,5007-5011页(2000)。
这种针对促进我们理解肿瘤发生分子机制和一些情况下更佳肿瘤分类的研究,提供了在分析中很少重叠的一系列基因。一些技术差异可部分地解释研究之间明显缺乏一致性或低重复性,这些差异如样品质量、信使核糖核酸(mrna)的扩增和不同的微阵列平台。然而,有可能肿瘤的异质性是促成研究之间观察到的差异的关键因素,特别在那些很少被分析肿瘤的研究中。此外,基于微阵列实验的基因表达水平比较传统上使用信号强度比例(倍数变化)来进行,使用有限的统计学方法并缺乏额外样品的验证。
然而,明显高水平表达的或表达量变化最大的基因可能不总是最相关的;可以想象即使是低表达水平时,基因的非常严谨调节的细微破坏也可能产生可观的后果。
因此需要鉴定在卵巢癌中表达程度持续且可靠地变化的基因。这样的列表可以对卵巢肿瘤发育和增长提供新的洞察力,并提出可能的新药物靶标以及诊断、监控和治疗该疾病的生物学标记物。
发明内容
在本发明中,统计学检验和最近描述的留一法(leave-one-out)(见van’t veer等,nature,第415卷,no.6871,530-536页(2002))的组合应用允许分析肿瘤和正常卵巢组织的表达谱,还能够在多种体液(包括但不限于血和血清)中的基因表达产物中鉴定这些模式。见上文van′t veer等。
两个独立样品组(测试组和验证组)的研究证实了若干已知基因与卵巢肿瘤发生的相关性,并鉴定了新基因。这些发现对卵巢肿瘤发生和发展提供新的洞察力,并提示了可能的新药物靶标以及诊断、监控和治疗该疾病的生物学标记物。
在一个实施方案中,本发明提供确定病人是否遭受卵巢癌的方法,包括a)获得来自所述病人的样品;b)在来自病人的样品中测定两个或更多表9所列基因的表达水平;c)将在(b)中测定的两个或更多基因的表达水平与表1中所列相同基因的表达水平比较;d)测定(c)中测定的两个或更多基因的表达水平之间的相似度(dos);和e)根据两个或更多基因的基因表达水平间的dos确定样品显示病人具有卵巢癌的证据的可能性。
在优选的实施方案中,本发明提供了方法,其中测定了表9所列基因的子集(包括表9中1-28号基因)的基因表达水平。
在另一实施方案中,本发明使用包含病人细胞的样品。可为来自所述病人实体瘤的细胞,或在优选的实施方案中,样品包含取自所述病人的血细胞和血清。在最优选的实施方案中,样品包含取自病人的体液。
在优选的实施方案中,本发明使用测定基因表达水平的方法,其包括测量来自病人的样品中的蛋白质表达产物。可通过多种途径实施,包括(但不限于)使用特异结合蛋白质的试剂检测蛋白质表达产物的存在和水平,其中该试剂可选自抗体、抗体衍生物和抗体片段。
在另一实施方案中,本发明提供了通过测量两个或更多表9中基因转录的多核苷酸在样品中的水平来评估样品中的表达水平的方法。这些转录的多核苷酸可是mrna或者互补的dna(cdna)。
在优选的实施方案中,该方法还将包括扩增转录的多核苷酸的步骤。
在另一实施方案中,本发明包括治疗遭受卵巢癌的受试者的方法,该方法包括向受试者细胞提供与表8中所列在卵巢癌中表达上调的一个或多个基因互补的反义寡核苷酸。
另外,本发明提供在有发生卵巢癌风险的病人中抑制卵巢癌的方法,该方法包括抑制表8所示在卵巢癌中将上调的一个或多个基因的表达。
本发明还提供用于确定针对具有可疑卵巢癌病人的治疗策略的试剂盒,其包含a)能够识别并结合两个或更多表9中基因多肽表达产物的大量(例如两种或更多)抗体;b)适于盛放所述抗体和来自所述个体的体液样品的容器,其中如果两个或更多表9所示基因表达多肽产物存在,则抗体可与之接触;c)检测所述抗体与两个或更多表9所示基因表达的多肽的结合的方法;d)使用说明书和试剂盒结果解释。
在另一个实施方案中,本发明提供用于检测病人中存在或不存在卵巢癌的试剂盒,其包含a)能够识别并结合两个或更多表9中基因mrna表达产物的大量(例如两个或更多)多核苷酸;b)适于盛放所述多核苷酸和来自所述个体体液样品的容器,其中如果存在mrna,则所述多核苷酸可与之接触;c)检测所述多核苷酸与来自两个或更多表9所示基因的mrna结合水平的方法;和d)使用说明书和试剂盒结果解释。
图表简述
图1(a)使用数量更多的探针组重新分类样品。
图1(b)错误曲线,它是用于确定分类基因最佳数的探针组数量的函数。通过提高来自前6到前55(a)或到全部900(b)的单个探针组的数量来计算数值。箭头指出最小化分组错误的最小数量的探针组(n=28)。
图2用于卵巢状态分类的cc值阈值的确定。
图3测试和验证活组织检查谱与平均正常谱不同大小探针组的相关性。n或t分别表示正常或肿瘤状态。“r”为相应活检组织样品与平均正常谱(第1组)的探针组谱pcc值。样品由最高cc排列至最低。
图4、不同大小探针组活组织检查谱与所有正常谱平均值的相关性。n或t分别表示正常或肿瘤状态。“r”为相应活检组织样品与所有正常样品谱均值的探针组谱pcc值。样品由最高cc排列至最低。
实施本发明的模式本发明提供确定来自病人的样品是否含有存在卵巢癌的证据的方法,样品包括(但不限于)来自病人的活检组织或血液、血清或其他体液。
本发明部分根据大约900个与正常组织相比在卵巢癌组织中有差异表达的基因的发现。本发明的该方法包含测量大约900或更少与正常组织相比在卵巢癌组织中有差异表达的基因活性。
在优选的实施方案中,这900个基因只有一小部分被测量。这些测量在多种实施方案中可在来自活体等的组织自身内,或在优选的实施方案中可以更间接的基因表达测量实施,包括(但不限于)在包括血液或其他体液在内的多种组织中测量crna或多肽表达产物。
在未知组织状态的个体中对这900个基因中两个或更多的表达率的直接或间接的测量可以和相同的两个或更多基因在卵巢癌组织或正常组织中测量的表达值相比较。
然后,确定未知的两个或更多基因的表达值与癌症组织和正常组织的“相似度”(dos)。
dos可以通过任一方法确定,该方法产生结果的值是两组数值(即两个或更多基因在卵巢癌状况未知或待确定的个体组织中测量的基因表达值,和相同的两个或更多基因在已知组织中患有卵巢癌的个体和已知组织中未患有卵巢癌的个体中测定的基因表达值)之间dos的已知函数。
文中使用术语“dos”旨在表示基因表达值模式相似或数字上相似的程度,如通过比较直接或间接方法测定的基因表达值来衡量。
在优选的实施方案中,dos通过产生相关系数(cc)的数学计算来确定。在特别优选的实施方案中将确定皮尔逊(pearson)相关系数(pcc),但可使用任一其他所产生结果的值为两组数值之间dos的已知函数的数学方法。
所计算的dos(pcc)值可与组织样品是来自患有或未患有卵巢癌的病人的可能性直接相关。也就是说,与未患有卵巢癌的病人中基因表达值相比病人的dos(cc或pcc)越高,或与患有卵巢癌的病人中基因表达值相比dos(cc或pcc)越高,则病人分别未患有或患有卵巢癌的可能性就越大。
因此,在给定的案例中,可使用dos值确定卵巢癌存在的可能性。本领域技术人员会理解每个病人的临床表现会指导使用dos(pcc)值作为捷径或对关于特定病人的临床决策起帮助。例如,在一个实施方案中,期望以最佳准确度确定一组患有卵巢癌的病人的数量。这意味着既最小化假阳性(无卵巢癌被错误归类为卵巢癌)又同时最小化假阴性(卵巢癌被错误归类为无卵巢癌)。
在本发明一个优选的实施方案中,如图3所示使用28个预测的探针组(如下所述)是可行的。如果基因表达谱与平均正常(无卵巢癌)谱以cc≤0.920相关,组织样品含有卵巢癌的可能是如果cc>0.920的63倍以上[优势比(or)=63,95%置信区间(ci)3.3-1194.7]。
在本发明的一个实施方案中使用该阈值,基因表达谱与平均未患卵巢癌表达谱相比到达pcc>0.920的病人将被归入未患卵巢癌组并被假定为未患有卵巢癌,而表达谱pcc≤0.920的病人将被归入卵巢癌组并被认为很可能患有卵巢癌。
在另一优选的实施方案中,可以设定pcc以产生任选的灵敏度。即产生最小可能数量的假阴性(卵巢癌被错误归类为无卵巢癌)。在卵巢癌必须以可获得的最高确定性被排除的情况下,将标明这样的最佳灵敏度设定。在该实施方案中,该阈值通过设定pcc>0.955来确定。在这种情况下,在给定的实例中,使用表9所示的28个预测探针(表9所示探针组1-28),与无卵巢癌组相比cc>0.955的病人100%不患有卵巢癌,与无卵巢癌组相比cc<0.870的病人100%患有卵巢癌。
如实施例中所示,本领域技术人员可以选择或者最大化灵敏度或者最大化特异性或产生任一所需比例的假阳性或假阴性的pcc。本领域技术人员可根据临床表现容易地调整他们对pcc的选择来为病人提供最大的益处和安全。
本发明的另一方面为治疗卵巢癌的方法。这些方法由抑制发现在卵巢癌中上调的基因的过量基因表达的多种尝试组成。这些基因在表8中列出。降低这些基因过量表达的方法包括(但不限于)使用反义dna、sirna和络合并失活这些过表达基因的蛋白质表达产物。
测量方法在本发明的一些实施方案中,如下所述通过测量来自组织样品的mrna水平来确定900个基因中所选基因的基因表达谱。
在一些实施方案中,基因表达谱可通过测量组织(包括但不限于肿瘤和血液组织)中多肽基因表达产物来更间接地测量。
在一些实施方案中,基因表达通过鉴定表9中所列基因之一编码的一个或更多蛋白质的存在或数量来测量。
本发明还提供检测两个或更多目的标记物(例如来自表2的两个或更多标记物)的系统。例如,当确定了具体标记物的有限集提供相关信息时,即提供检测标记物有限集的检测系统。例如,期望通过通用微阵列检测所有在组织中表达的基因时,使用定义的微阵列或其他技术检测多数(如28、42等)定义生物学状态(如卵巢癌的存在或不存在等)的标记物。
本发明不局限于检测或测量基因表达生物学标记物的方法。在一些实施方案中,在例如活检组织样品的组织样品中检测mrna、cdna或蛋白质。在另外的实施方案中,在例如血清、血浆、尿液或唾液的体液中检测mrna、cdna或蛋白质。本发明优选的实施方案提供本发明方法的离体实施。本发明还提供用于检测这些相关的基因表达生物学标记物的试剂盒。
在一些优选的实施方案中,检测蛋白质或多肽表达产物。蛋白质表达可通过任一适当的方法检测。在一些实施方案中,通过结合对该蛋白质特异的抗体结合检测蛋白质。例如在一些实施方案中,使用适当的技术检测抗体结合,包括(但不限于)放射免疫测定法、酶联免疫吸附测定法(elisa)、“夹层”免疫测定法、免疫放射测定法、凝胶扩散沉淀反应法、免疫扩散测定法、原位免疫测定法(例如使用胶体金、酶或放射性同位素标签),例如western印迹、沉淀反应、凝集测定法(例如凝胶凝集测定法、血凝集测定法等),补体结合测定法、免疫荧光测定法、a蛋白测定法、免疫电泳测定法和蛋白质组测定法,例如使用与质谱分析耦联的凝胶电泳来鉴定一个样品中的多种蛋白质。
在一个实施方案中,通过检测一抗上的标记物检测抗体结合。在另一实施方案中,通过检测二抗或试剂与一抗的结合来检测一抗。在另外的实施方案中,标记二抗。本领域已知许多在免疫测定中检测结合的方法,这些方法属于本发明的范围。
在一些实施方案中,利用自动检测测定法。用于自动免疫测定的方法包括(但不限于)u.s.专利no.5,885,530、4,981,785、6,159,750和5,358,691中所述的那些,此处引用上述各专利作为参考。在一些实施方案中,结果的分析和说明也是自动化的。例如,在一些实施方案中,使用基于一系列对应于标记的蛋白质的存在或不存在产生诊断和/或预测的软件。
在其他实施方案中,使用u.s.专利no.5,599,677和5,672,480所述的免疫测定法,此处引用两专利作为参考。在其他实施方案中,通过免疫组织化学检测蛋白质。还在其他实施方案中,在cdna或rna水平检测标记物。
文中使用术语“基因表达生物学标记物”是指任一可指出特定基因的基因表达率或度的生物学标记物,包括(但不限于)mrna、cdna或特定基因的多肽表达产物。
在本发明的一些实施方案中,使用基于pcr的测定法检测基因表达生物学标记物。而在其他实施方案中,使用反转录酶pcr(rt-pcr)检测rna的表达。在rt-pcr中,使用反转录酶将rna酶转化为cdna。然后使用cdna作为pcr反应的模板。pcr产物可使用任一适当的方法检测,包括(但不限于)凝胶电泳和用dna特异染料染色或与标记的探针杂交。
在一些实施方案中,使用u.s.专利no.5,639,606、5,643,765和5,876,978(此处引用上述各专利作为参考)描述的使用竞争模板的标准混合物的定量rt-pcr的方法。
在本发明优选的实施方案中,使用杂交测定法检测基因表达生物学标记物。在杂交测定法,标记物的存在或不存在根据来自样品的核酸与互补核酸分子(例如寡聚核苷酸探针)的杂交能力来确定。可利用多种杂交测定法。
在一些实施方案中,探针与目的序列的杂交直接通过显影结联合的探针(例如northern或southern测定法)来测定,见例如ausabel等编《current protocols in molecular biology》,john wiley & sons,ny(1991)。在这些测定法中,分离dna(southern)或rna(northern)。然后用一系列限制性酶酶切该dna或rna,所述内切酶在基因组中切点稀少并且不接近测定的任一标记物。然后将dna或rna通过例如琼脂糖凝胶分离并转移至膜上。通过例如掺入放射性的核苷酸来标记的探针被允许在低、中或高严谨度条件下与膜接触。除去未结合的探针,然后通过显影标记的探针来检测结合的存在。
在一些实施方案中,dna芯片测定法为genechip(affymetrix,santaclara,ca),见例如u.s.专利no.6,045,996;5,925,525和5,858,659,此处引用上述各专利作为参考。genechip技术使用附着在“芯片”上的小型化、高密度寡核苷酸探针阵列。探针阵列通过affymetrix光导引的化学合成方法制造,该方法组合固相化学合成与半导体工业中使用的光刻法加工技术。使用一系列的光刻法掩蔽物(mask)定义芯片日暴光位点,随后是特定的化学合成步骤,该方法构建了寡核苷酸的高密度阵列,其中各探针位于阵列中预定义的位置。多探针阵列在巨大的玻璃薄片上同时合成。然后将薄片切为小片,独立的探针阵列包装在注射器型的塑料药筒内,药筒使它们与环境隔离并作为杂交的容器使用。
待分析的核酸被分离,使用pcr扩增并用荧光报道子基团标记物。然后使用射流装置(fluidic station)将标记的dna与阵列孵育。然后将阵列插入扫描仪,以检测杂交模式。杂交数据作为光被收集,光由已经整合入结合在探针阵列上的靶标上的荧光报道子基团发射。与靶标完全匹配的探针与错配的相比通常产生更强的信号。由于各个探针的序列和位置是已知的,通过互补,应用于探针阵列的靶核酸身份可被确定。
在其他实施方案中,使用含有电子捕获探针(nanogen,san diego,ca)的dna微阵列,见例如u.s.专利no.6,017,696、6,068,818和6,051,380,此处引用上述各专利作为参考。通过使用微电子学,nanogen的技术使得带电荷分子能够主动运动并集中至其半导体微阵列上的指定测试点以及从那里主动运动和集中。对给定的基因表达生物学标记物特异的dna捕获探针被电子地置于或“寻址”至微阵列上的特定位点。由于核酸分子带有强负电荷,它们可以被电子地移至正电荷区域。
在另外的实施方案中,使用根据通过表面张力的差异在扁平表面(芯片)上分离流体的阵列技术(protogene,palo alto,ca)。见例如u.s.专利no.6,001,311、5,985,551和5,474,796,此处引用上述各专利作为参考。protogene的技术基于流体可通过化学涂料传递的表面张力差异在扁平表面分离。一旦这样分离,寡核苷酸探针可在芯片上通过试剂的喷墨印刷直接合成。
在其他的实施方案中,还使用“小珠阵列(bead array)”用于检测基因表达生物学标记物(illumina,san diego,ca)。见例如pctpublications wo 99/67641和wo 00/39587,此处引用上述各专利作为参考。illumina使用将光纤束与自发集合为阵列的小珠结合的bead array技术。每个光纤束根据束的直径包含数千到数百万的独立纤维。小珠包被有特异检测给定标记的寡核苷酸。成批的小珠结合在一起形成对阵列特异的库。bead array与制备好的样品接触以进行测定。使用任一适当的方法检测杂交。
在本发明的一些优选的实施方案中,通过对特异结构的酶切来检测杂交,例如invadertm实验、third wave技术。见例如u.s.专利no.5,846,717、6,090、543;6,001,567、5,985,557和5,994,069,此处引用上述各专利作为参考。在一些实施方案中,使用taqman测定法(pe biosystems,foster city,ca)检测联合探针的杂交。见例如u.s.专利no.5,962,233和5,538,848,此处引用上述各专利作为参考。该测定法在pcr反应中实施。taqman测定利用例如amplitaq dna聚合酶的dna聚合酶5’-3’核酸外切酶活性。pcr反应中包括特异于给定标记的探针。探针由具有5’-报道染料(如荧光染料)和3’-猝灭染料的寡核苷酸组成。在pcr中,如果探针与其靶标结合,amplitaq聚合酶的5’-3’溶核活性在报道和猝灭染料之间切割探针。报道和猝灭染料的分离导致荧光的增强。荧光随着每个pcr循环累积并可使用荧光光度计监测。
使用本发明体系和方法产生和使用的其他检测测定法包括(但不限于)酶错配切割方法,例如variagenics(见u.s.专利no.6,110,684、5,958,692和5,851,770,此处引用其整体作为参考);分支杂交方法,例如chiron(见u.s.专利no.5,849,481、5,710,264、5,124,246和5,624,802,此处引用其整体作为参考);滚环复制(见例如u.s.专利no.6,210,884和6,183,960,此处引用其整体作为参考);nasba(见例如u.s.专利no.5,409,818,此处引用其整体作为参考);分子信标技术(见例如u.s.专利no.6,150,097,此处引用其整体作为参考);e-传感器技术(见motorola,u.s.专利no.6,248,229;6,221,583;6,013,170和6,063,573,此处引用其整体作为参考);循环探针技术(见例如u.s.专利no.5,403,711;5,011,769和5,660,988,此处引用其整体作为参考);连接酶链式反应[见barnay,proc.natl.acad.sci.usa,卷88,189-93页(1991)]和夹层杂交方法(见例如u.s.专利no.5,288,609,此处引用其整体作为参考)。
在一些实施方案中,使用质谱法检测基因表达生物学标记物。例如在一些实施方案中,使用massarraytm系统(sequenom,san diego,ca)检测基因表达生物学标记物。见例如u.s.专利no.6,043,031、5,777,324和5,605,798,此处引用上述各专利作为参考。
在一些实施方案中,本发明提供了用于基因表达生物学标记物的鉴定、定性和定量的试剂盒。在一些实施方案中,试剂盒除检测试剂和缓冲液外还包含特异于基因表达生物标记的抗体。在其他实施方案中,试剂盒包含特异用于检测核酸的试剂,例如寡核苷酸探针或引物。在优选的实施方案中,试剂盒包含进行检测测定必须的所有成分,包括所有的对照、实施测定的说明和所有用于分析和说明结果的必须软件。在一些实施方案中,试剂盒含有包括环境保护署(environmental protection agency)或美国食品和药品管理局(fda)要求的用于标注体外诊断测定法和/或药物或食品产品的使用说明的说明书。
将生物的基因表达模式与表9中表示的结果相比较,可以指出是否该生物具有可以指出该生物患有或不患有卵巢癌的基因表达谱。
在另一实施方案中,本发明为筛选测试化合物的方法,所述化合物能够抑制、延缓、逆转或模拟具有卵巢癌特征的基因表达变化。在该实施方案的典型实施例中,首先用测试化合物处理已知患有卵巢癌的测试哺乳动物,然后分析该哺乳动物典型组织中会响应卵巢癌而发生表达变化的基因或序列表达水平。优选地,该组织为来自肿瘤或在优选的实施方案中来自容易取材的组织(如血液或血清)的活组织检查材料。
然后与已知患有卵巢癌但没有被给予测试化合物的对照哺乳动物比较组织分析,因此鉴定出能够修饰基因表达生物学标记物序列在哺乳动物样品中的表达并使得表达朝向未患卵巢癌的模式变化的复合物。
在本发明的另一实施方案中,使用表2公开的基因序列用于模拟未患卵巢癌状态的疗法。通常,设法扩大在卵巢癌中被鉴定为表达不足的基因的基因表达,并减少在卵巢癌中被鉴定为过表达的基因的表达。例如,应设法降低表2中鉴定为提高表达的基因或序列的表达,或提高在卵巢癌中发现减少表达的基因的表达。
提高和降低表达的方法是本领域技术人员已知的。补充表达的实例包括给生物补充额外的基因拷贝。降低表达的优选实例包括rna反义技术或药物干涉。表2公开的基因将是适当的药物研制靶标。可使用本申请的信息用于药物研制,通过使用现有的或研发的能够模拟或抑制表2所列基因或其编码的蛋白质的活性的药物复合物。因此,基因表达生物学标记物或文中公开的基因代表了以在分子水平抑制卵巢癌特有的变化为目的的药物开发和基因治疗或rna反义治疗的靶标。这些基因表达的变化还可对理解作为卵巢癌基础的多种机制起作用。另外,这些基因代表了可用于诊断目的的卵巢癌生物学标记物。
本发明不受表达谱形式的限制。在一些实施方案中,表达谱在计算机软件中获得。在一些实施方案中,表达谱为书写的材料。本发明不受表达谱中提供或显示的标记物数量限制。例如表达谱可包含两个或更多见于表2的指示样品生物学状态的标记物。
本发明还提供了包含表达信息(例如来自一个或多个样品的包含一个或多个表2标记的表达谱)的数据库。在一些实施方案中,发现数据库用于数据分析,包括(但不限于)将标记物与一个或多个公开的或私人的信息数据库(例如omim、genbank、blast、molecular modelingdatabases、medline、基因组数据库等)比较。在一些这样的实施方案中,实施自动方法以自动将来自使用本发明方法得到的数据信息与一个或多个公开的或私人的数据库中的信息联系起来。联系的用途在于例如建立表达与表型(如疾病)之间的相互关系。
可以理解本发明将扩展到表9所列小鼠基因的哺乳动物同系物。本领域技术人员通过鉴定与表9所列基因具有足够高同源性的特定基因可容易的研究其他哺乳动物种中的同系物。“高同源性”是指在核苷酸或氨基酸水平同源性为至少总(在完整基因或蛋白质中)的50%。
缩写列表
实施例1优选方法为了鉴定在卵巢肿瘤发生和发展中相关的基因,我们比较了一系列正常和肿瘤卵巢活检组织基因表达谱。每个样品中产生多于12000个基因的基因表达数据。在我们观察到的在正常和癌症卵巢活检组织中最差异表达的900个探针组中,98%在肿瘤活检组织中下调。使用8个正常和10个肿瘤样品,我们鉴定了可用于将活检组织分类为正常或肿瘤的最小数量的探针组(28个)。该发现在之前经另一实验室分析的第二个活检组织集(4个正常和14个肿瘤)中被验证。建立了可作为参考用于比较其他卵巢活检组织的平均正常卵巢谱。正常和肿瘤卵巢活检组织的最差异表达基因的鉴定可为卵巢肿瘤产生和发展的分子机制提供新的视角。在该项研究中鉴定的一些基因已知与卵巢癌相关,但大部分代表了用于诊断或监控疾病和治疗的药物靶标和分子生物学标记物的新候选者。
材料与方法样品新鲜冷冻的卵巢活检组织取自asterand(detroit,mi),并由10个肿瘤样品和10个临近的正常组织组成。还从ambion(austin,tx)和stratagene(la jolla,ca)购买了4个额外样品的总rna。在验证步骤中使用的样品基因表达谱由gnf之前产生并报道。见welsh等(2001),如上。
大部分分析的肿瘤为恶性表面上皮浆液肿瘤,例如乳头状腺癌(cystcarcinoma)、乳头状囊腺癌或乳头状腺癌;其他的包括粘液囊肿癌、子宫内膜样腺癌和成熟型畸胎瘤。
样品信息概述如下文表1所示。
表1.用于基因表达分析的卵巢样品
注意取自相同病人的成对样品(正常和肿瘤临近组织)装在一起。卵巢癌阶段使用figo分期系统标明。
rna表达谱分型从每个活检组织中提取总rna并如前文所述处理。本领域技术人员熟知rna提取技术。所有样品都使用affymetrix genechiptm系统按照affymetrix(genechip expression analysis technical manual,rev.1,2001七月)推荐的进行表达分型。使用beckman-coulter du 650分光光度计在1∶50稀释样品后于260nm和280nm波长测量样品来评估rna和cdna的浓度和总量(见表2)。本研究使用的阵列类型为human genome u95av2(http//www.affymetrix.com/products/arrays/specific/hgu95.affx)。
分析策略表达谱的分析以下文所述的几个步骤进行。
最高质量的微阵列数据选择我们只使用换算系数低于6的微阵列用于我们的分析,其中超过30%的探针组被affymetrix mas 4.0算法称为“存在”。
选择探针组的子集表达数据直接从数据库中输入gene spring_程序(silicongenetics,redwood city,ca)。排除只在少数样品中表达的基因;在微阵列上12627个探针组中,只使用10%或更多的样品中avgdiff至少为100的探针组用于进一步的分析。进行聚类实验(clustering experiment)以显现正常和肿瘤活检组织中差异的基因表达谱。
进一步的过滤通过排除两组样品(第一组正常活检组织;第二组肿瘤活检组织)中低质量或强度信号非常低的探针组来完成。在两组之一的至少75%的样品不被称为“存在”(p)的探针组用于进一步分析。另外,低于20的avgdiff值全部转换为20的值。
集中最差异表达的基因在两步中完成两组样品中差异表达基因的选择1.使用sas 8.2通过非参数的的单因素anova测试,在两组样品中比较每个探针组的avgdiff。
2.p<0.05的每个探针组avgdiff与样品(正常或肿瘤)相关。然后探针组从最高绝对pcc排列至最低(用microsoft excel计算)。
样品的重新分类我们使用先前被描述过的“留-法”分析策略确定区分正常卵巢组织和卵巢癌的最佳探针组数量。见van′t veer等(2002),如上文。
为了每个样品的清除(left-out),我们测定了每组样品(组1和组2)中每个探针组的平均avgdiff。对分-探针组计算清除样品的表达谱与每组的平均谱之间的pcc。通过根据两个cc中校高的重新将每个样品归类为正常或肿瘤来评估每个探针组区分肿瘤和正常卵巢组织的有效性。
我们测定了使用逐渐增大的基因集(从5开始)时错误分类样品的数量。文中使用“假阴性”定义为肿瘤被错误归类为正常卵巢组织,相反的,“假阳性”定义为正常组织被错误归类为肿瘤。
然后测试了最有效区分肿瘤和正常卵巢组织的探针组对来自gnf(见表1)的不同卵巢组织集(正常和肿瘤)的基因表达谱进行分类的能力。
or的统计学测定使用期望的阈值相关值构建了指出被正确和错误鉴定为正常或肿瘤的活检组织数量的2×2表格。使用sas 8.2版计算具有95%置信区间的or。使用fisher’s精确测试测定统计学显著性,以p值0.05截止。
基因探针组名称和genbank登录号之间的链接由affymetrix提供,并带有简短的基因描述。我们通过ncbi数据库搜索补充并升级了该描述,主要locuslink为(http//www.ncbi.nlm.nih.gov/locuslink/index.html),omim(http//www.ncbi.nlm.nih.gov/omim/searchomim.html)和pubmed(http//www.ncbi.nlm.nih.gov/entrez/query.fcgi).
结果rna表达谱分型20个活检组织中18个产生了多于对样品进一步处理必须的5mg纯化的总rna(见表2)。样品p6175是最小的样品(38mg),从中得到了少于1mg纯化的总rna。通过1%琼脂糖凝胶电泳评估rna的质量。样品p6169和p6180缺失28s和18s核糖体rna条带,指示一些rna发生了降解。如果可能,微阵列杂交使用最多15mg crna,但不能少于12mg。21个样品能够得到足够的crna(见表2)。
质量评估检查来自pg(本研究)中21个微阵列杂交和来自先前gnf的18个杂交的数据质量(见表3)。见welsh等(2001),如上文。除三个(p6169,p6180和p6185)之外的所有都通过了我们换算系数低于6的标准,其中多于30%的探针组被称为“p”(见表3)。剩余36个表达谱被分为两个集合由8个正常和10个肿瘤活检组织的数据组成的在pg产生的18个表达谱测试集,以及先前在gnf产生的来自4个正常和14个肿瘤活检组织的18个表达谱验证集。见welsh等(2001),如上文。
分析聚类分析将测试集中18个样品的表达数据输入genespring_软件。在affymetrix u95a微阵列的12627个探针组中,有2174个在18个样品中的两个或更多中有至少100的avgdiff,将它们用于聚类分析。图1显示了产生的样品和探针组的聚类树。有趣的是,实验的树状图包含两个对应于两组样品(正常(顶部)和肿瘤(底部)活检组)的主要分支。绝大部分(>90%)检量的基因在正常卵巢组织中具有整体较高的表达。探针组的树状图只表现出一小簇在肿瘤组织中具有更高表达的基因(左侧部分)。
选择最差异表达的基因在2174个探针组中,217个被排除在进一步的分析之外,因为它们产生许多“a”或者“边缘”信号(call)(各组中均>75%)。
将剩余1957个探针组的数据输入sas 8.2版中进行正常和肿瘤组之间的非参数的单因素anova测试。总共900个探针组在两组之间有显著的avgdiff值差异(p<0.05)。这些基因在表9中列出。
然后将这900个探针组的avgdiff与两组样品相关联(第一组正常;第二组肿瘤)。绝对pcc(r)值在0.042-0.877间变化,其中694个探针组(77%)具有高于0.5的r值。在附录1中可得到900个探针组由最高绝对pcc排列至最低的avgdiff数据。
留一法和样品的重新分类之前描述的“留一法”分析策略应用于用来表达900个选定的探针组的18个卵巢样品。见上文van’t veer等(2002)。
使用最初5个探针组时错误归类的样品数量为6(2假阳性和4假阴性)。使用逐步增大的基因集。错误归类的数量在2和7之间变化,在使用最初28个探针组时达到最小值(图1)。这最初的28个探针组只产生一个假阳性和一个假阴性。有趣的是,使用最初32个探针组时达到正常活检组织的完美分类(0假阳性)(仍然检测到2假阴性),而肿瘤活检组织的完美归类(0假阴性)则未观察到。
最佳分类组和相关阈值我们测定了平均正常(无肿瘤)活检组织谱以归类探针组,旨在作为分析未知或可疑状态活检组织的参考使用;我们预期肿瘤不均一性可能不允许测定参考肿瘤谱。我们通过将最初28个探针组在18个样品中每一个的表达与使用所有8个正常活检组织谱计算的平均正常谱比较,检查了它们的分类值。然后将样品按照相关值从最高至最低排列,且错误率作为产生阈值相关值的函数被测定。图2显示其结果。错误指定样品的最小数量为2[1假阳性(p6177)和1假阴性(p6168)]。相应的cc值在0.920和0.921之间。or和fisher精确测试基于被正确或错误预测为正常或肿瘤的样品数量实施。观察的和期望的活检组织状态之间的差异是显著的or=63;95%ci3.3-1194.7,p=0.0029。or指出如果测试集的表达谱中28个预测探针组与平均正常谱以cc≤0.920相关(见表4),则该卵巢活检组织大约63倍更可能来自于卵巢肿瘤。在我们的测试集中,100%的cc>0.955的谱对应于正常活检组织且100%的cc<0.870的谱对应于肿瘤活检组织(见图3)。
平均正常谱的验证通过留一法选出的28个探针组允许我们在我们的18个卵巢样品中区分正常和肿瘤卵巢活检组织。然后我们检测是否独立的卵巢活检组织可以通过将它们的表达谱与28个分类探针组的相同平均正常谱比较而被正确地分类。
图3概括了根据与28个探针组的相关性对所有卵巢活检组织的分类。值得注意的是,验证集的正常和肿瘤样品谱彼此之间清楚分开(见图3)。如在该测试集中,100%的cc<0.870的谱对应肿瘤活检组织。有趣的是,正常谱比测试集有更低的cc,且在验证集中分离正常和肿瘤活检组织的最佳阈值相关值位于0.762和0.876之间。
我们在测试集平均正常谱与验证集平均正常谱之间进行了非参数的t检验。类似地,我们比较了两个集合的平均肿瘤谱。由于未观察到统计学差异(分别有p=0.373和p=0.110),我们将两个集合组合以提高28个探针组的分类值。我们将所有样品的表达与使用所有12个正常活检组织谱(8个来自测试组4个来自验证测试)计算的平均正常谱比较。结果证实相关值提供了正常活检组织与肿瘤活检组织谱间的非常显著的分离(见图4和表5)。如前所见,肿瘤样品谱(p6168)与平均正常谱高度相关。
单个基因表达与活检组织状态间的相关性用于卵巢活检组织分类的探针组的选择最初基于18个测试样品谱完成。使用相同探针组的全部36个正常和肿瘤样品(见图4)的良好分离提示用我们方法选择的基因在许多其他的卵巢肿瘤中差异表达。然而,由于肿瘤的不均一性,单个基因表达的差异可能随分析的样品而变化。我们评估了在什么范围内900个探针组在18个测试样品中差异表达,在36个活检组织被分析时也差异表达。
探针组从最高绝对pcc排列至最低,首先使用来自测试集的18个样品,然后是来自测试集和验证集的全部36个样品。在选定的900个探针组中,694个和473个分别在18和36个样品中具有高于0.5的绝对cc;412个探针组在两种情况均有高于0.5的系数。有趣的是,在最初选择用于活检组织分类的28个探针组中,19个位于最高的100个中;另外9个探针组相关值在0.359-0.703之间变化。
正常和肿瘤卵巢活检组织之间差异表达的基因卵巢肿瘤中上调的基因在正常和肿瘤卵巢活检组织间差异表达的基因中,我们检测到少量已知在卵巢肿瘤中会上调的基因,例如编码密蛋白4,拓扑异构酶iiα,激肽释放酶8,骨桥蛋白以及可能的卵巢癌新标记物(见表6)。
密蛋白4(紧密连接的组件)已经显示在卵巢肿瘤中与该跨膜受体家族的另一成员密蛋白3一起被上调。见hough等,cancer res.,卷60,no.22,6281-6287页(2000)。costa和同事们已经报道拓扑异构酶iiα水平与卵巢表面上皮瘤的预后不良相关。激肽释放酶8通过免疫组织化学可在癌中检测到而正常卵巢组织中没有,并被认为是卵巢癌的预测标记物。见underwood等,cancerres.,卷59,no.17,4435-4439页(1999);和magklara等,clin.cancer res.,卷7,no.4,806-811页(2001)。骨桥蛋白先前也被建议用作卵巢癌的诊断生物学标记物。见kim等,jama,卷287,no.13,1671-1679页(2002)。另一个基因c20 orf1显示在肺癌细胞系中表达,但不在正常肺组织中表达。见manda等,genomics,卷61,no.1,5-14页(1999)。其他可能仅在一些活检组织中根据肿瘤类型、疾病阶段或其他肿瘤特性过表达的基因,通过我们的分析方法未检测出。
在卵巢肿瘤中下调的基因我们还检查了大量在卵巢肿瘤活检组织谱中下调的基因。为了分析的目的,我们根据28个探针组和最高的100个下调基因产物的已知或预测功能将其分为8类(见表7和8)。有趣的是,这100个基因中接近30%的功能仍然未知。大部分其他基因在转录调控中(16个基因)、在细胞周期调控、生长分化、细胞死亡或肿瘤抑制中(12个基因)和信号转导中(6个基因)起作用或被预测为与之相关。该列表包括若干可能的肿瘤抑制子编码转化生长因子β受体iii(tgf-βr3)的基因、血小板来源的生长因子受体样基因(pdgfrl)、致肿瘤性抑制(st13)基因、编码含有kazal基序的回复诱导富含半胱氨酸蛋白质(reck)的基因以及父本表达3(peg3)基因。
该观察指出功能仍未鉴定的基因可能与细胞周期调控、生长分化、信号转导或转录调控相关。它们中的一些可能作为肿瘤抑制子起作用。这些基因中只有一个被报道在卵巢肿瘤或细胞系中下调,即在我们的研究中用2个分离的探针组检测到的igfbp5(见表8)。见welsh等(2001),如上文。
只有6个编码细胞外基质蛋白质的基因被注意到包含层粘连蛋白2(lamα2)。yang和同事们已经报道恶化前上皮基底膜瞬间缺失lamα2和随后的dab2失活是与卵巢表面上皮致肿瘤性相关的普遍早期事件。见yang等,cancer,卷94,no.9,2380-2392页(2002)。有趣的是,dab2(探针组479_at)的下调在我们的研究中也以cc值0.49被观察到。
总而言之,这些结果指出大部分在卵巢活检组织中统计学显著降低表达的基因的确与肿瘤发生和发展相关,而不是由于细胞群体或组织结构变化(例如结缔组织和脂肪细胞丢失)而检测到的。
讨论我们使用的过滤和分析方法提供了一系列在正常和肿瘤卵巢样品中差异表达的基因。我们显示了小子集(28-42探针组)足够根据其表达谱精确地将卵巢活检组织区分为正常或肿瘤。该表达标签的验证通过在独立实验室中不同活检组织谱中完成,并证实正常和肿瘤样品间观察到的表达差异反映了生物过程而不是实验室或分析误差。
若干文中没有验证的可能影响差异表达基因检测的因素包括测试集中样品数量和所研究样品的不均一性。的确,预计活检组织尤其是肿瘤活检组织具有高水平的不均一性肿瘤类型、等级、肿瘤细胞百分比、结缔组织和脂肪组织的存在等。我们研究了多种等级的不同类型卵巢肿瘤(见表1),以寻找与肿瘤发生和发展普遍途径相关的基因,而不是象先前报道的在确定类型肿瘤中更特异相关的基因。见ono等(2000),如上文和welsh等(2001),如上文。
我们对活检组织表达谱的聚类分析揭示大部分在正常和肿瘤样品中差异的基因在肿瘤中都被下调。的确,当900个最差异表达的探针根据它们在所有36个活检组织和正常及肿瘤状态间的cc排列时,最高的220个探针(r从0.865-0.644)在肿瘤中下调。我们更紧密地,检验了最高的100个基因的功能,最高的10个基因在肿瘤中过表达(r从0.865-0.644)。在最差异表达的基因中,我们检测了若个已知在卵巢肿瘤中上调的基因,以及可能的卵巢癌新标记物。然而,大部分基因被下调,极可能是因为我们研究了多种类型不同来源、不同等级和不同肿瘤细胞含量的晚期肿瘤。许多这种基因与转录调控、细胞周期调控、生长分化、信号转导、细胞死亡或肿瘤抑制的相关性低于进一步评估它们在卵巢癌中作用的需要。其他功能仍然未知的基因列表指出在肿瘤发生和发展中新的潜在参与者。
修饰rna丰度和活性的方法修饰rna丰度和活性的方法目前有三种类型核酶、反义种类和rna适体。见good等gene ther.,第4卷,no.1,45-54页(1997)。细胞可操控地应用或暴露于这些实体允许可操控地干扰rna丰度。
核酶核酶是能够催化rna切割反应的rna。见cech,science,卷236,1532-1539页(1987);pct international publication wo 90/11364(1990);sarver等,science,卷247,1222-1225页(1990)。可设计“发卡”和“锤头”rna核酶以特异性切割特定靶mrna。已经建立了设计具有核酶活性的短rna分子的原则,具有核酶活性的短rna分子能够以高度序列特异性的方式切割其他rna分子并事实上可以所有种类的rna为靶标。见haseloff等,nature,卷334,585-591页(1988);koizumi等,febs lett.,卷228,228-230页(1988);和koizumi等,febs lett.,卷239,285-288页(1988)。核酶方法涉及将细胞暴露于这样的小rna核酶分子;诱导其在细胞中的表达等。见grassi和marini,annals of med.,卷28,no.6,499-510页(1996);以及gibson,cancer meta.rev.,卷15,287-299页(1996)。
核酶可在体内常规表达足够的数量以有效催化切割mrna,从而修饰细胞中mrna丰度。见cotton等embo j.,卷8,3861-3866页(1989)。特别地,根据先前的规则设计并根据例如标准亚磷酰胺化学合成的编码核酶的dna序列可被连接于编码trna基因的反密码子茎和环的限制性酶切位点上,然后该trna可通过本领域常规方法转化进目的细胞并在其中表达。优选地,诱导启动子(如糖皮质激素或四环素应答元件)也被引入该构建体内使得核酶表达可被选择性地控制。可使用高度组成性活性启动子用于饱和使用。tdna基因即编码trna的基因由于其小尺寸、高效率转录和在不同种类组织中的普遍表达而在该申请中有用。因此,可例行设计核酶以切割事实上任何mrna序列,且细胞可被例行地用编码这样核酶序列的dna转化从而表达可控制的和催化性的有效数量的核酶。因此,可以修饰或干扰细胞中事实上任何种类rna的丰度。
反义分子在另一实施方案中,可通过可控制地应用反义核酸来可控制地抑制靶rna(优选mrna)种类的活性,特别是翻译率。高水平的应用引起饱和抑制。文中使用的“反义”核酸是指由于与编码或非编码区序列互补而能够与特定序列(例如非多聚a、靶rna局部(如其翻译起始区)杂交的核酸。本发明的反义核酸可以是双链或单链、rna或dna的寡核苷酸或其变体或其衍生物,它们能够直接以可控制的方式施用于细胞或通过外源的转录以足够干扰靶rna翻译的可控制的量导入的外源序列,从而在细胞内产生。
优选地,反义核酸为至少六个核苷酸并优选为寡核苷酸,介于6个寡核苷酸至大约200个寡核苷酸的范围。在具体的方面,寡核苷酸为至少10个核苷酸、至少15个核苷酸、至少100个核苷酸或至少200个核苷酸。寡核苷酸可为dna或rna或嵌合体混合物或它们的衍生物或修饰形式、单链或双链。寡核苷酸可在碱基部分、糖部分或磷酸骨架上被修饰。寡核苷酸可包括其他附加部分,例如肽或促跨膜转运试剂[见例如letsinger等,proc.natl.acad.sci.usa,卷86,6553-6556页(1989);lemaitre等,proc.natl.acad.sci.usa,卷84,648-652页(1987);和pct publication no.wo88/09810(1988)]杂交引发的切割剂[见例如krol等,biotechniques,卷6,958-976页(1988)]或嵌入剂[见例如zon,pharm.res.,卷5,no.9,539-549页(1988)]。
在本发明优选的方面,反义寡核苷酸优选以单链dna的形式提供。可以本领域普遍已知的组分在寡核苷酸结构上任一位置对其进行修饰。
反义寡核苷酸可包含至少一个修饰的碱基部分,其选自(但不限于)5-氟尿嘧啶、5-嗅尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧羟甲基)尿嘧啶,5-羧甲基氨基甲基-2-硫尿核苷、5-羧甲基氨基甲基尿嘧啶,二氢尿嘧啶、β-d-半乳糖queosine、肌苷、n6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-甲基肌苷、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、n6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶,5-甲氧氨基甲基-2-硫尿嘧啶、β-d-甘露糖基queosine,5’-甲氧羧甲基尿嘧啶,5-甲氧基尿嘧啶、2-甲硫基-n6-异戊烯腺嘌呤、尿嘧啶-5-羟乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-巯基胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲尿嘧啶、尿嘧啶-5-氧丙酸甲酯、尿嘧啶-5-氧丙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-n-2-羧丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。
在另一个实施方案中,寡核苷酸包含至少一个修饰的糖部分,这些糖部分包括(但不限于)阿拉伯糖、2-荧光阿拉伯糖、木酮糖和己糖。
还在另一实施方案中,寡核苷酸包含至少一个修饰的磷酸骨架,修饰选自硫代磷酸酯、二硫代磷酸酯、硫代磷酸氨基(phosphoramidothioate)、亚磷酰胺、亚磷酰二胺、甲基膦酸酯、烷基磷酸三酯和formacetal或其类似物。
还在另一实施方案中,寡核苷酸为2-α-异头寡核苷酸。α-异头核苷酸与互补的并与通常b-单元相反的rna形成特异的双链杂交物,双链彼此平行排列。见gautier等,nucl.acids res.,卷15,6625-6641页(1987)。
寡核苷酸可缀合另一分子(如多肽、杂交引发的交联剂、运载剂、杂交引发的切割试剂等)。
本发明反义核酸包含至少与靶rna种类部分互补的序列。然而,绝对的互补虽然优选但不要求。本文“至少与rna部分互补的”序列是指有能够与rna杂交形成稳定二聚体的足够互补性的序列;双链反义核酸情况下,可因此测试二聚体dna的单链或测定三聚体形成。杂交能力依赖互补程度和反义核酸的长度。通常,杂交核酸越长,其可能包含与靶rna间的碱基错配就越多并且仍然形成稳定二聚体(或三聚体,根据情况)。本领域技术人员可通过标准方法测定杂交复合物的解链温度来测定错配耐受度。在抑制靶rna翻译中有效的反义核酸的数量可通过标准实验技术确定。
本发明的寡核苷酸可通过本领域已知标准方法例如使用如来自biosearch、applied biosystems的市售自动dna合成仪合成。例如,硫代磷酸寡核苷酸可通过stein等,nucl.acids res.,卷16,3209页(1988)的方法合成、甲基膦酸酯寡核苷酸可使用可控有孔玻璃聚合物支柱等制备。见sarin等,proc.natl.acad.sci.usa,卷85,7448-7451页(1988)。在另一实施方案中,寡核苷酸为2’-0-甲基核糖核苷[见inoue等,nucl.acids res.,卷15,6131-6148页(1987)]或嵌合rna-dna类似物[见inoue等,febslett.,卷215,327-330页(1987)]。
合成的反义寡核苷酸可以受控的或饱和的方式施用给细胞。例如,反义寡核苷酸可以受控的水平被置于细胞的生长环境中,在那里它们可被细胞吸收。可使用本领域熟知的方法协助寡核苷酸的吸收。
细胞内表达的反义分子在可选的实施方案中,本发明的反义核苷酸通过外源序列的转录在细胞内可控制地表达。如果将表达控制在高水平,结果为饱和干扰或修饰。例如,载体可导入体内使得其被细胞吸收,在该细胞中载体或其部分得到转录,产生本发明的反义核酸(rna)。这样的载体将包含编码反义核酸的序列。这样的载体可是游离的或整合进染色体的,只要它可以转录产生期望的反义rna。可通过本领域标准重组dna技术构建这样的载体。载体可是质粒、病毒的或本领域已知的其他用于在哺乳动物细胞中复制并表达的载体。可通过本领域已知任何在目的细胞中发挥作用的启动子来表达编码反义rna的序列。这样的启动子可是诱导型的或组成型的。最优选可通过施用受外源成分制或诱导的启动子,以实现反义寡核苷酸的受控表达。这样的可控启动子包括tet启动子。其他可用于哺乳动物细胞的启动子包括(但不限于)sv40早期启动子区[见bernoist和chambon,nature,卷290,304-310页(1981)]、劳斯肉瘤病毒3’长末端重复包含的启动子[见yamamoto等,cell,卷22,787-797页(1980)]、疱疹胸苷激酶启动子[见wagner等,proc.natl.acad.sci.usa,卷78,1441-1445页(1981)]、金属硫蛋白基因调节序列等[见brinster等,nature,卷296,39-42页(1982)]。
因此,可例行地将反义核酸设计为事实上以任何mrna为靶标,且可例行地用编码该反义序列的核酸转化细胞或将细胞暴露于其中,从而表达有效且可控的或饱和数量的反义核酸。因此,事实上任何rna在细胞中的翻译可被修饰或干扰。
rna适体最后,在另一实施方案中,可向细胞中导入或在细胞中表达rna适体。rna适体为针对蛋白质的特异rna配体,例如针对tat和rev rna[见good等(1997),如上文],其可以特异抑制蛋白质翻译。
修饰蛋白质丰度的方法修饰蛋白质丰度的方法包括(特别是)改变蛋白质降解效率和使用与影响天然靶蛋白质种类活性丰度的蛋白质结合的抗体的那些方法。提高(或降低)蛋白质种类的降解效率减少(或增加)该种类的丰度。本发明可使用本领域所熟知的应答于提高的温度和/或暴露于特定药物而提高靶蛋白质降解效率的方法。例如,一种这样的方法使用热诱导或药物诱导n-末端降解决定子,它是在较高温度(例如37℃)下暴露启动快速蛋白质降解的降解信号,而在较低温度(如23℃下)隐藏以阻止快速降解的n-末端蛋白质片段。见dohmen等,science,卷263,1273-1276页(1994)。这样的标准降解决定子为arg-dhfrts,n-端val被arg取代,66位pro被leu取代的鼠二氢叶酸还原酶变体。根据该方法,通过本领域已知标准基因打靶方法[见lodish等,《molecular biology of the cell》,w.h.freeman和co.,ny,特别是第8章(1995)]用编码融合蛋白质ub-arg-dhfrts-p(“ub”代表泛素)的基因取代例如靶蛋白质p的基因。n-末端泛素在暴露n-末端降解决定子的翻译后被迅速切割。在较低的温度下,arg-dhfrts的内部赖氨酸未被暴露,蛋白质泛素化未发生,降解缓慢且活性靶蛋白质水平高。在较高的温度(无氨甲喋呤)下,arg-dhfrts的内部赖氨酸被暴露,蛋白质泛素化发生,降解迅速且活性靶蛋白质水平低。由于降解的热激活可被暴露氨甲喋呤可控地阻滞,该技术还允许可控地改变降解效率。该方法适用于其他应答其他诱导因子(例如药物和温度变化)的n-末端降解决定子。
用抗体修饰蛋白质活性靶蛋白质活性也可通过(中和)抗体降低。通过供给受控的或饱和的暴露于这种抗体接触,蛋白质丰度/活性可被以可控的或饱和的方式修饰或干扰。例如,针对蛋白质表面合适表位的抗体可减少丰度,从而通过聚集靶蛋白质野生型的活性形式成为与未聚集的野生型形式相比有较少或最小活性的复合物,间接地减少活性。可选地,抗体可通过例如直接与活性位点接触或阻滞底物接触活性位点而直接减少蛋白质活性。相反的,在特定的情况下,(激活)抗体也可与蛋白质及其活性位点接触而增加产生的活性。在任一情况下,可根据特异的蛋白质种类(通过将描述的方法)制备(将要描述的多种类型的)抗体并筛选其效果。抗体的效果可被测定,并选择能够提高或降低靶蛋白质种类浓度和/或活性的合适抗体。这样的测定涉及将抗体导入细胞(见下文)并通过本领域已知标准方法(如免疫测定法)测定野生型浓度、靶蛋白质数量或活性。野生型形式的净活性可通过对靶蛋白质已知活性适合的测定手段测定。
可通过多种方式将抗体导入细胞,包括例如将抗体显微注射进细胞[见morgan等,immunol.today,卷9,84-86页(1988)]或将编码所需抗体的杂交瘤mrna转化入细胞[见burke等,cell,卷36,847-858页(1984)]。在另一技术中,可在多种非淋巴细胞类型中改造和异位地表达重组抗体,以结合靶蛋白质并封闭靶蛋白质活性。见biocca等,trends cell biol.,卷5,248-252页(1995)。优选抗体在可控启动子或组成型活性启动子(用于产生饱和干扰)的控制下表达(例如tet启动子)。第一步选择对靶蛋白质有适当特异性的特定单克隆抗体(见下文)。然后编码所选抗体可变区的序列可被克隆进多种改造的抗体形式中,包括完全抗体、fab片段、fv片段、单链fv(scfv)片段(vh和vl通过肽接头联合)、双抗体(两个相互结合的具有不同特异性的scfv)等等。见hayden等,curr.opin.immunol.,卷9,210-212页(1997)。通过与多种已知细胞内前导序列融合物表达,可将多种形式的细胞内表达抗体靶向细胞区室,例如细胞质、核、线粒体等。见bradbury等,《antibody engineering》borrebaeck编,卷2,295-361页,irl press(1995)。特别地,scfv形式似乎特别适合于细胞质靶向。
抗体类型包括(但不限于)多克隆的、单克隆的、嵌合体的、单链的、fab片段和fab表达文库。可使用本领域已知的多种方法制备靶蛋白质的多克隆抗体。抗体制备时,可通过注射靶蛋白质来免疫多种宿主动物,这样的宿主动物包括(但不限于)兔、小鼠、大鼠等。依赖于宿主种类,可使用多种佐剂来增强免疫应答,包括(但不限于)付氏(完全和不完全)、矿物凝胶(例如氢氧化铝)、表面活性物质(例如溶血卵磷脂、多聚醇、多聚阴离子、肽、油乳化剂、二硝基苯酚)和可能有用的人佐剂,如卡介苗(bcg)和短小棒杆菌(corynebacterium parvum)。
制备针对靶蛋白质的单克隆抗体时,可使用任何通过培养的连续细胞系产生抗体分子的技术。这样的技术包括(但不限于)最初由kohler和milstein,nature,卷256,495-497页(1975)发展的杂交瘤技术、三源杂交瘤技术、人类b-细胞杂交瘤技术[见kozbor等,immunol.today,卷4,72页(1983)]和产生人类单克隆抗体的ebv杂交瘤技术[见cole等,《monoclonal antibodies and cancer therapy》,alan r.liss,inc.,77-96页(1985)]。在本发明的附加实施方案中,单克隆抗体可利用新近的技术在无菌动物中制造单克隆抗体。见pct/us90/02545。根据本发明,可使用人抗体并可通过使用人杂交瘤获得人抗体[见cote等,proc.natl.acad.sci.usa,卷80,2026-2030页(1983)],或通过用ebv病毒体外转化人类b细胞而获得[见cole等(1985),如上文]。事实上,根据本发明,可使用发展来产生“嵌合体抗体”的技术[见morrison等,proc.natl.acad.sci. usa,卷81,6851-6855页(1984);neuberger等,nature,卷312,604-608页(1984);takeda等,nature,卷314,452-454页(1985)],所述技术将来自对靶蛋白质特异的小鼠抗体分子的基因与具有适当生物活性的来自人抗体分子的基因拼接而制备“嵌合体抗体”;这样的抗体包含在本发明范围内。
另外,当单克隆抗体有利时,也可使用噬菌体展示技术从大的抗体文库中选择单克隆抗体。见marks等,j.biol.chem.,卷267,16007-16010页(1992)。使用该技术在fd丝状噬菌体表面表达大于1012个不同的抗体,产生能够选择单克隆抗体的体外“single pot”抗体免疫系统。见griffiths等,embo j.,卷13,3245-3260页(1994)。从这样的文库中选择抗体可通过本领域已知技术完成,包括将噬菌体与固定的靶蛋白质接触、选择并克隆结合在靶上的噬菌体和将编码抗体可变区的序列亚克隆进表达所需抗体形式的适当载体。
根据本发明,描述的用于制备单链抗体的技术(见u.s.专利no.4,946,778)可适合于制备靶蛋白质特异的单链抗体。本发明附加实施方案利用描述用于构建fab表达文库的技术[见huse等,science,卷246,1275-1281页(1989)]以允许快速并容易地鉴定具有所需靶蛋白质特异性的单克隆fab片段。
可通过本领域已知技术产生含有靶蛋白质独特型的抗体片段。例如这样的片段包括(但不限于)可通过胃蛋白酶消化抗体分子产生的f(ab’)2片段;可通过还原f(ab’)2片段二硫键产生的fab’片段;可通过用番木瓜酶和还原剂以及fv片段处理抗体分子产生的fab片段。
在制备抗体时,可通过本领域已知技术(例如elisa)完成目的抗体的筛选。为了筛选靶蛋白质特异的抗体,应针对结合靶蛋白质的抗体测定产生的杂交瘤或噬菌体展示抗体文库。
修饰蛋白质活性的方法直接修饰蛋白质活性的方法包括(尤其是)显性失活突变、特异药物或化学部分以及如前所述的抗体的使用。
显性负相突变是内源基因的突变或在细胞中的表达会破坏靶蛋白质种类活性的外源基因的突变。根据靶蛋白质的结构和活性,存在指导选择用于构建破坏该靶标活性的显性负相突变的合适策略的普遍规律。见hershkowitz,nature,卷329,219-222页(1987)。活性单体形式的情况下,非活性形式的过表达可引起对天然底物或配体的竞争,足以引起靶蛋白质净活性的显著降低。这样的过表达可通过例如将提高活性的启动子(优选可控或可诱导启动子,也可以是组成型表达启动子)与突变基因联合而完成。可选地,可制造活性位点残基的变化,使得发生与靶配体事实上不可逆的结合。这可使用一定的酪氨酸激酶小心地取代活性位点的丝氨酸残基来完成。见perlmutter等,curr.opin.immunol.,卷8,285-290页(1996)。
关于活性多聚体形式,若干策略可指导显性负相突变的选择。可以受控的或饱和的方式,通过表达编码结合多聚体联合结构域并阻止多聚体形成的外源蛋白质片段的基因来降低多聚体活性。可选地,特定类型的非活性蛋白质单位的可控或饱和过表达可束缚非活性多聚体中野生型活性单位,并因此降低多聚体活性。见nocka等,embo j.,卷9,1805-1813页(1990)。例如,关于二聚体dna结合蛋白质,dna结合结构域可从dna结合单位上被删除,或将激活结构域从激活单位上删除。在这种情况下,dna结合结构域单位还可在没有引起与激活单位联合的结构域的情况下表达。因此,dna结合位点由于没有任何可能的表达激活而被束缚。在激活时通常经受构象变化的特定类型单位中,刚性单位的表达可使产生的复合物失活。在另一实例中,涉及细胞机制如细胞活力、有丝分裂过程、细胞结构等的蛋白质通常由许多少量类型的亚基联合组成。这种结构通常对包含有结构缺陷的单体单元引起的破坏高度敏感。这样的突变单体破坏相关蛋白质活性并可在细胞中以可控的或饱和的方式表达。
除显性负相突变外,对温度(或其他外源因子)敏感的突变靶蛋白质可通过本领域熟知的诱变和筛选方法找到。
本领域技术人员还将理解,可使用结合并抑制靶蛋白质的抗体表达作为另一各显性负相策略。
使用小分子药物修饰蛋白质最后,可通过暴露于外源药物或配体,以可控的或饱和的形式修饰或干扰某些靶蛋白质的活性。由于本发明的方法常用于测试或证实多种癌症治疗药物的有效性,药物暴露是一个修饰/干扰细胞组分(mrnas和表达的蛋白质)的重要方法。在优选的实施方案中,通过药物暴露或基因操作(例如基因删除或敲除)干扰输入细胞的组分;并且通过基因表达技术(例如与基因转录物阵列杂交)来测量系统应答(如下文所述)。
在优选的情况下,已知药物只与细胞中一个靶蛋白质相互作用并只改变该靶蛋白质活性(增加或减少活性)。将细胞分级暴露于不同数量该种药物从而引起具有该靶蛋白质作为输入(input)的网状模型的分级干扰。饱和暴露引起饱和修饰/干扰。例如,环孢素a是非常特异的神经钙蛋白调节子,通过带有亲环蛋白的复合物作用。因此滴定系列的环孢素a可用于产生任何所需数量的神经钙蛋白抑制。可选地,饱和暴露于环孢素a将最大化抑制神经钙蛋白。
测量方法本发明的实验方法依赖细胞组分的测量。测量的细胞组分可来自于细胞生物状态的任何方面。它们可来自测量rna丰度的转录状态、测量蛋白质丰度的翻译状态、测量蛋白质活性的活性状态。细胞特性也可来自混合的方面,例如其中一个或多个蛋白质的活性和其他细胞组分的rna丰度(基因表达)一起被测量。本部分描述了用于测量药物或途径应答中细胞组分的代表性方法。本发明适用该测量的其他方法。
在本发明中优选测量其他细胞组分的转录状况。可通过下面描述的与核酸阵列或核酸模拟探针杂交的技术或通过后面描述的其他基因表达技术来测量转录状况。无论如何测量,结果为包含反映dna表达比值的代表mrna丰度的数值和/或比值(不存在rna降解率差异时)的数据。
在多种本发明可选的实施方案中,可测量转录状态之外的其它方面的生物学状态,如翻译状态、活性状态或综合方面。
在所有的实施方案中,应通过相对独立于进行测量的时间的方式测量细胞组分。
测量转录状态优选地,通过与下部分描述的转录物阵列杂交测量转录状态。其他的一些转录状态测量方法在该部分稍后描述。
通常的转录物阵列在本发明优选的实施方案中使用“转录物阵列”,此处也称为“微阵列”。可使用转录物阵列分析细胞中的转录状态,尤其是测量癌细胞的转录状态。
在一个实施方案中,通过杂交代表细胞中存在的mrna转录物的可检测标记物的多核苷酸产生转录物阵列。例如将从总细胞mrna合成的荧光标记的cdna与微阵列杂交。微阵列是带有细胞或生物基因组中许多基因,优选大部分或几乎全部基因产物结合(例如杂交)位点的有序阵列的表面。可通过许多途径制造微阵列,其中一些下文有所描述。无论如何制造,微阵列具有一些共有的特性。阵列是可重现的,这使得可以生产并容易地互相比较给定阵列的多个拷贝。优选小的微阵列,通常小于5cm2且它们由在结合(例如核酸杂交)条件下稳定的材料制成。微阵列上的给定结合位点或结合位点的独特集合会特异结合细胞中单个基因的产物。尽管每个特异的mrna可能有多于一个物理结合位点(下文称“位点”),为了清晰起见,下文的讨论会假定有单个位点。在特定的实施方案中,使用在每个位置包含附着的已知序列核酸的可设定位置的阵列。
要理解当与细胞rna互补的cdna被产生并与微阵列在适当的杂交条件下杂交时,与阵列上对应任何特定基因的位点的杂交水平会反映细胞中转录自该基因的mrna的优势。例如,当被(例如荧光)可检测标记后,与总细胞mrna互补的cdna与微阵列杂交,阵列上在细胞中未转录的基因对应的位点(即能够特异结合基因产物)会有很少或没有例如荧光的信号,编码优势mrna的基因对应的位点会有较强的信号。
微阵列的制备本领域已知微阵列由序列对应基因产物例如cdna、mrna、crnas和多肽及其片段的探针可以在已知位置特异杂交或结合的表面组成。在一个实施方案中,微阵列是其中每个位置代表由基因编码的产物例如蛋白质或rna的不连续的结合位点且其中存在大部分或几乎全部生物基因组中基因的结合位点的阵列(即矩阵)。在优选的实施方案中,“结合位点”(下文中的“位点”)是指特定的同源cdna可与之特异杂交的核酸或核酸类似物。结合位点的核酸或类似物可为例如合成的低聚物、全长cdna、小于全长的cdna或基因片段。
尽管在优选的实施方案中,微阵列包含所有或几乎所有靶生物基因组基因产物的结合位点,这样的全面不是必须要求的。通常,微阵列会有对应于基因组至少大约50%基因的结合位点,经常至少大约75%、更经常至少大约85%、更经常多于大约90%且最经常至少大约99%。优选地,微阵列具有与检测和确定目的生物学网络模型相关基因的结合位点。“基因”被定义为优选至少50、75或99个氨基酸的开放读码框(orf),生物(例如单细胞)或多细胞生物中一些细胞中的mrna从之转录而来。基因组中基因数可根据生物表达的mrna数量或通过基因组熟知其特性的部分外推来估计。目的生物基因组被测序后,可确定orf的数量并通过分析dna序列鉴定mrna编码区。例如,酿酒酵母(saccharomyces cerevisiae)基因组已被完整测序且报道它具有大约6,275个长于99个氨基酸的orf。这些orf的分析指出存在5,885个可能指定蛋白质产物的orf。见goffeau等,science,卷274,546-567页(1996),此处引用其整体作为参考。相比而言,人类基因组估计含有大约105个基因。
制备用于微阵列的核酸如上文所注解的,与特定同源cdna特异杂交的“结合位点”通常为附着在该结合位点的核酸或核酸类似物。在一个实施方案中,微阵列的结合位点为对应生物基因组每个基因至少一部分的dna多核苷酸。这些dna可通过例如从基因组dna、cdna的基因片段中通过如rt-pcr而pcr扩增得到,或为克隆序列。在基因或cdna已知序列基础上选择造成唯一片段(即与微阵列上任何其他片段共享不超过10个碱基的连续相同序列)的扩增的pcr引物。计算机程序对设计具有要求特异性和最佳扩增性质的引物是有用的。见例如oligo pl 5.0版,national biosciences。在对应超长基因的结合位点情况下,有时期望扩增基因近3’末端片段,使得当寡聚dt预处理的cdna探针与微阵列杂交时,小于全长的探针可有效结合。一般微阵列上每个基因片段长度会在大约50bp到大约2000bp之间,更通常在大约100bp到大约1000bp之间,且常常在300bp到800bp之间。pcr方法是熟知的并在例如innis等编《pcr protocolsa guide to methods andapplications》,academic press inc.,san diego,ca(1990)中描述,此处为全部目的引用其整体作为参考。显然计算机控制的机器人系统在分离并扩增核酸时是有用的。
产生用于微阵列核酸的其他方法是例如使用n-磷酸酯或亚磷酰胺化学合成多核苷酸或寡核苷酸。见froehler等,nucleic acid res.,卷14,5399-5407页(1986)和mcbride等,tetrahedron lett.,卷24,245-248页(1983)。合成的序列长度在大约15个碱基和大约500个碱基之间,更通常在大约20个碱基和大约50个碱基之间。在一些实施方案中,合成的核酸包含非天然碱基(例如肌苷)。如上文所注解的,核酸类似物可作为杂交结合位点使用。合适的核酸类似物实例为肽核酸。见例如egholm等,nature,卷365,566-568页(1993);以及u.s.专利no.5,539,083。
在另一实施方案中,结合(杂交)位点由基因、cdna(例如表达的序列标签)的质粒或噬菌体克隆或其中的插入物产生。见nguyen等,genomics,卷29,207-209页(1995)。在另一实施方案中,结合位点的多核苷酸是rna。
将核酸附着在固体表面将核酸或类似物附着在可由玻璃、塑料(例如聚丙烯和尼龙、聚丙烯酰胺、硝基纤维)或其他材料制成的固体载体上。将核酸附着在表面的优选方法为印在玻璃板上,如schena等,science,卷270,467-470页(1995)中普遍描述的那样。该方法在制备cdna微阵列时尤其有用。见derisi等,nat.genet.,卷14,457-460页(1996);shalon等,genome res.,卷6,639-645页(1996);和schena等.,proc.natl.acad.sci.usa,卷93,10539-11286页(1995)。为了所有目的此处引用前述每篇文章整体作为参考。
另一个优选的制造微阵列的方法是通过制造高密度寡核苷酸阵列。使用用于原位合成的光刻法技术产生[见fodor等,science,卷251,767-773页(1991);pease等,proc.natl.acad.sci.usa,卷91,no.11,5022-5026页(1994);lockhart等,nat.biotechnol.,卷14,1675页(1996);和u.s.专利no.5,578,832;5,556,752和5,510,270,为了所有目的此处引用其中每个整体作为参考]或其他确定寡核苷酸的快速合成及沉积[见blanchard等,biosens.bioelectron.,卷11,687-690页(1996)],在表面上确定的位置包含数千与确定序列互补的寡核苷酸阵列的技术是已知的。使用这些方法时,已知序列的寡核苷酸(例如20mer)直接在表面(如衍生的载玻片)上合成。通常,产生的阵列对每个rna多余若干个寡核苷酸分子。可选择寡核苷酸探针以另外检测剪接的mrna。
也可使用其他制造微阵列的方法,例如通过掩蔽(masking)。见maskos和southern,nucleic acids res.,卷20,1679-1684页(1992)。通常,虽然本领域技术人员会公认由于杂交体积会较小而优选超小的阵列,可使用任意类型的阵列,例如尼龙杂交膜上的斑点印迹[见sambrook等,《molecularcloning-a laboratory manual》,第二版,卷1-3,cold spring harborlaboratory,cold spring harbor,ny(1989),为了所有的目的此处引用其整体作为参考]。
制备标记的探针制备总rna和多聚(a) rna的方法是众所周知的,并一般性描述于sambrook等(1989),如上文。在一个实施方案中,rna从多种类型本发明目的细胞中使用硫氰酸胍裂解和随后的氯化铯离心法提取。chirgwin等,biochemistry,卷18,5294-5299页(1979)。多聚(a) rna通过使用寡聚dt纤维素选择法来选择。见sambrook等(1989),如上文。目的细胞包括野生型细胞、暴露于药物中的野生型细胞、具有修饰/干扰的细胞组分的细胞和暴露于药物中具有修饰/干扰的细胞组分的细胞。
标记的cdna通过寡聚dt引物或随机引物从mrna反转录制备,两种方法都是本领域熟知的。见例如klug和berger,methods enzymol.,卷152,316-325页(1987)。反转录可在与可检测标签结合的dntp,最优选荧光标记的dntp存在时进行。另外,分离的mrna可转化为标记的反义rna,其通过在标记dntp存在时的双链cdna体外转录合成。见lockhart等(1996),如上文,此处为了所有的目的引用其整体作为参考。在另选的实施方案中,cdna或rna探针可在无可检测标记物存在时合成并可随后被标记,例如通过掺入生物素化的dntp或rntp,或一些类似的手段,例如将生物素的补骨脂素衍生物与rna光交联,然后加入标记的链霉抗生物素,例如藻红蛋白缀合的链霉抗生物素或等价物。
使用荧光标记探针时,已知许多合适的荧光基团,包括荧光素、丽丝胺、藻红蛋白、罗丹明(perkin elmer cetus)、cy2、cy3、cy3.5、cy5、cy5.5、cy7、fluorx(amersham)见例如kricka,《nonisotopic dna probetechniques》,academic press,san diego,ca(1992)。会理解选择具有不同发射光谱的成对荧光团以容易地区分它们。
在另一实施方案中,使用除荧光标记外的标记。例如可使用放射性标记物或一对具有不同发射光谱的放射性标记物。见zhao等,gene,卷156,207页(1995);和pietu等,genome res.,卷6,492页(1996)。然而,由于放射性粒子的散射以及因此对大空间结合位点的要求,使放射性同位素的使用成为次优选的实施方案。
在一个实施方案中,标记的cdna通过将包含0.5mm dgtp,datp和dctp加上0.1mm dttp加上荧光脱氧核糖核酸(例如0.1mm罗丹明110utp(perken elmer cetus)或0.1mm cy3 dutp(amersham))和反转录酶(例如superscript.tm.ii,lti inc.)的混合物在42℃孵育60分钟合成。
与微阵列杂交选择核酸杂交和洗涤条件使得探针与特异的阵列位点“特异结合”或“特异杂交”,即探针与有互补的核酸序列的序列阵列位点杂交、形成二聚体或结合,但是不与具非互补核酸序列的位点杂交。如在文中使用的,当较短的多核苷酸≤25碱基,使用标准碱基配对规则没有错误配对时,或较短的多核苷酸长于25碱基,错误配对不超过5%时,认为一个多核苷酸序列与另一个互补。优选多核苷酸完全互补(没有错配)。很容易证明,通过实施包含负对照的测定,特异的杂交条件引起特异杂交。见例如上文shalon等(1996)和上文chee等。
最佳杂交条件依赖于标记探针和固定的多核苷酸或寡核苷酸的长度(例如寡聚物和>200碱基的多核苷酸)和类型例如rna、dna和pna。通常用于核酸特异(即严紧)杂交条件的参数描述于sambrook等(1996),如上文,和ausubel等,《current protocols in molecular biology》,greenepublishing and wiley-interscience,ny(1987),此处引用其整体作为参考。使用schena等的cdna微阵列时,通常的杂交条件为在有0.2%sds的5×ssc中于65℃杂交4小时,然后在低严紧度洗涤缓冲液(1×ssc加0.2%sds)中于25℃洗涤,然后在高严紧度洗涤缓冲液(0.1×ssc加0.2%sds)中在25℃10分钟。见shena等,proc.natl.acad.sci.usa,卷93,10614页(1996)。还提供了有用的杂交条件。见例如tijessen,《hybridizationwith nucleic acid probes》,elsevier science publishers b.v.(1993)和kricka(1992),如上文。
信号检测和数据分析使用荧光标记探针时,转录物阵列上每个位点的荧光发射可优选的通过共聚焦激光显微镜扫描检测。在一个实施方案中,使用适当的激发光线可对两个荧光团中的每一个进行单独扫描。另外,可使用允许样品同时受到两个荧光团特异波长的光照的激光,并且可同时分析来自两个荧光团的发射。见shalon等(1996),如上文,此处为所有目的引用其整体作为参考。在优选的实施方案中,使用具有计算机控制x-y级别和显微镜物镜的激光荧光扫描仪扫描阵列。随后的两个荧光团激发使用多谱线(multi-lme)、混合气体激光实现,并且根据波长分离发射光并使用两个光电倍增管检测。荧光激光扫描设备描述于上文的schena等(1996)和文中引用的其他参考。另外,可使用ferguson等,nat.biotechnol.,卷14,1681-1684页(1996)所描述的光导纤维束同时监测许多位点的mrnas丰度水平。
记录信号,在优选的实施方案中,通过计算机分析,例如使用12字节模拟-数字转换板(analog to digita board)。在一个实施方案中,使用制图程序(例如hijaak graphics suite)将扫描的图像去斑点,然后使用创建每个位点每个波长平均杂交的表格程序的图像网格程序分析。如果必要,可进行两个荧光团通道之间的相互干扰(或重叠)的由实验确定的校正。对于转录物阵列上任何具体的杂交位点,优选计算出两个荧光基团的发射比例。该比例不依赖于同源基因的绝对表达水平,但是对于表达受药物给予、基因删除或其他测试事件显著调控的基因则是有用的。
优选地,除鉴定干扰是正或负之外,确定干扰强度是有利的。这可通过本领域技术人员会容易明白的方法进行。
其他测量转录状态的方法细胞的转录状态可使用其他本领域已知的基因表达技术测量。一些这样的技术产生有限复杂性的限制片段库用于电泳分析,例如将双限制性内切酶消化产物与phasing引物结合的方法[见例如ep 0 534858 a1 (1992),zabeau等],或选择其位点与确定的mrna末端最接近的限制片段的方法[见例如prashar等,proc.natl.acad.sci.usa,卷93,659-663页(1996)]。其他的方法从cdna库中统计地取样,例如通过测序多个cdna中每个cdna足够多的碱基(如20-50个碱基)以鉴定每个cdna,或通过测序在已知与确定mrna末端途径类型相关的位置产生的短标签(如9-10个碱基),见例如velculescu,science,卷270,484-487页(1995)。
其他方面的测量在本发明的多个实施方案中,为了得到药物和途径应答,可测量除转录状态之外的其它方面的生物学状态方面,例如翻译状态、活性状态或综合的方面。这些实施方案的细节描述于本部分。
翻译状态测量可根据若干方法实施翻译状态的测量。例如,监测蛋白质的全基因组,即“蛋白质组”[见上文goffeau等(1996)],可通过构建微阵列来实现,其中结合位点包括固定的,优选单克隆的对细胞基因组编码的多种蛋白质种类特异的抗体。优选地,抗体基于编码的蛋白质主要级分而存在,或至少基于与测试和证实目的网络模型相关的那些蛋白质。生产单克隆抗体的方法是众所周知的。见例如harlow和lane,《antibodiesa laboratorymanual》,cold spring harbor,ny(1988),此处为了所有的目的引用其整体作为参考。在优选的实施方案中,单克隆抗体针对根据细胞基因组序列设计合成的肽片段制造。使用这样的抗体阵列,来自细胞的蛋白质与阵列接触,并使用本领域已知的测定法测定它们的结合。
另外,可通过双向凝胶电泳系统分离蛋白质。双向凝胶电泳为本领域所熟知并通常涉及沿着第一个方向的等电聚焦和随后沿着第二个方向的sds-page电泳。见例如hames等,gel electrophoresis of proteinsapractical approach,irl press,ny(1990);shevchenko等,proc.natl.acad.sci.usa,卷93,1440-1445页(1996);sagliocco等,yeast,卷12,1519-1533页(1996);lander,science,卷274,536-539页(1996)。可通过许多技术分析产生的电泳图谱,这些技术包括质谱技术、western印迹和使用多克隆和单克隆抗体的免疫印迹,以及内部和n端微量测序。使用这些技术可能鉴定在给定生理条件下产生全部蛋白质的主要级分,包括在细胞(例如暴露于药物的酵母中)或例如删除或过表达特异基因而修饰的细胞中表达的蛋白质。
根据生物学状态其他方面的实施方案尽管监测除mrna丰度外的细胞组分目前存在在检测mrna时未遇到的某些技术性困难,对本领域技术人员显而易见的是使用本发明的方法可测量与细胞功能特征相关的蛋白质的活性,本发明的实施方案可基于这些测量。可通过任何适于待表征的具体活性的功能、生化或物理途径实施活性测量。当活性涉及化学转化时,可将细胞内蛋白质与天然底物接触并测量转化率。当活性涉及多聚单元结合,例如激活的dna结合复合物与dna结合时,可测量例如转录的mrna数量。另外,当只知道功能活性(例如控制细胞周期)时,可观察该功能的表现。不管是如何了解和测量的,蛋白质活性的变化构成了本发明上述方法分析的应答数据。
在另选的非限制性实施方案中,应答数据可由细胞生物学状态的多个方面形成。应答数据可由例如一定的mrna丰度变化、一定的蛋白质丰度变化和一定的蛋白质活性变化组成。
计算机运行在优选的实施方案中,为了提供用于形成并检验生物体系模型的有力的和方便的设备,在计算机系统或一个或多个联网的计算机系统上实施先前方法的计算步骤。计算机系统可是包括内部元件并连接在外部元件上的单个硬件平台。该计算机系统的内部元件包括与主存储器互联的处理元件。例如计算机系统可是基于intel pentium的200mhz或更大时钟频率的处理器加上32mb或更多主内存。
外部元件包括大量数据存储器。该大容量存储器可是通常与处理器和内存成套的一个或多个硬盘。通常,这样的硬盘提供至少1gb存储空间。其他的外部元件包括可为显示器和键盘的用户界面设备以及可为“鼠标”或其他图形输入设备的指示设备。通常计算机系统还连接在其他本地计算机系统、远程计算机系统或广域通信网络(例如因特网)上。这样的网络连接允许计算机系统与其他计算机系统分享数据和处理任务。
该系统运行时,一些本领域标准且本发明特异的软件元件被下载至内存。这些软件元件共同引起计算机系统根据本发明的方法运行。这些软件元件通常存储于大容量存储器。另外,软件元件可存储于可移动媒体例如软盘或cd-rom(无图片)。该软件元件代表了负责管理计算机系统及其网络互联的操作系统。该操作系统可以是例如microsoft windows家族,例如windows 95、windows 98或windows nt或unix操作系统,例如sun solaris。软件包括方便存在于该系统的常用语言和功能以帮助编制完成本发明特异方法的程序。可用于编制本发明分析方法程序的语言包括c、c 或次优选的java。最优选本发明的方法使用数学软件包编程,其允许等式的符号输入和高水平处理规格(包括使用的算法)从而将使用者从程序上的为单个等式或算法编程中解放出来。这样的软件包包括例如来自mathworks的matlab(natick,mass.)、来自wolfram researc的mathematica(champaign,il)和来自mathsoft的mathcad(cambridge,ma)。
在优选的实施方案中,分析软件组间事实上包含互相作用的独立软件组件。分析软件代表包含所有系统运行必需数据的数据库。这样的数据通常包括(但不必须限制于)先前实验的结果、基因组数据、实验过程和费用以及本领域技术人员显而易见的其他信息。分析软件包括含有一个或多个执行本发明分析方法程序的数据归纳和计算组件。
分析软件还包括用户界面,其给计算机系统用户提供测试网络模型的控制和输入,以及任选的实验数据。用户界面可包括详细说明系统假设的拖曳界面(drag-and-drop interface)。用户界面可还包括从大容量存储器组件(例如硬盘驱动器)、从可移动媒体(例如软盘或cd-rom),或从在网络(如本地网络或广域交流网络,如因特网)上用即时系统交流的不同计算机系统上下载实验数据的方法。
实现本发明分析方法的其他系统和方法将为本领域技术人员显而易见,并旨在包含于附带的权利要求书中。具体而言,附带的权利要求书旨在包含另外的用于实现本发明方法并为本领域技术人员容易明白的备选程序结构。
table 2.纯化的总rna和rna的定量
table 3.实验qc概述
table 4.使用28个探针组表达谱的18个卵巢测验样品的预测与观察到的状态比较
注意显示每组样品的观测数量与随机联合时的期望值(括号内)。
″r″=活检组织样品28个探针组谱与平均正常谱的pcc值。or=63(95%cl3.3-1194.7),p=0.0029表5.比较36个卵巢样品使用28个、32个或42个探针组预测的和观察到的状态。
表6.在卵巢癌中上调的基因列表显示只在18个测试样品中(r1)或在全部36个样品中(r2)分析的表达水平绝对cc值。
表7.卵巢癌中最差异表达基因的功能分类
*对于5个基因(gprk5、igfbp5、irs1、itpr1和rbpms)使用两个不同探针组得到类似的结果。
表8.在卵巢癌中下调的基因功能种类列表
注意粗体基因符号表示基因用两个独立探针组探测。显示在全部36个样品中(r1)和只在18个测试样品中(r2)分析的表达水平绝对cc值。在每个功能类型中,探针组按照降低的r1值排列。
*表示来自28个分类组的基因未排在100个最高r1值中。
table 9.在卵巢癌中差异影响的900个基因全集。
表10.前100探针组基于pcc值的排序。
注意显示在全部36个样品中(r1)和只在18个测试样品中(r2)分析的表达水平绝对cc值。
ccs≥0.5用斜体和下划线标记。
引用的参考文献所有在此引用的参考文献以其整体引入作为参考,并且为了所有的目的以相同的程度引入作为参考,就如同每一出版物、专利或专利申请为了所有目的被明确和单独地以其整体引入作为参考一样。本文对参考文献的讨论旨在仅概括其作者的主张,并不认为任何参考文献构成现有技术。申请人保留置疑所引用的参考文献的精确性和适当性的权利。
另外,文中引用所有的genbank登录号、unigene cluster号和蛋白质登录号以其整体引入文中作为参考,并且为了所有的目的以相同的程度引入作为参考,就如同每一号码为了所有目的被明确和单独地以其整体引入作为参考一样。
本发明不局限于本申请描述的具体实施方案的术语,具体实施方案被认为是本发明个别方面的单一解释。本领域技术人员会明白,可产生本发明的许多修饰和变更而不脱离其主旨和范围。根据先前的描述和附图,本领域技术人员会明白本发明范围内的功能上等价的方法和设备,以及文中列举的那些。这样的修饰和变更旨在包含于附加的权利要求书范围内。本发明仅受附加的权利要求书术语与该权利要求书授权的全部范围等价物的限制。
权利要求
1.测定病人是否经受卵巢癌的方法,包括a)获得来自所述病人的样品;b)测定两个或更多表9中所列基因在来自病人样品中的基因表达水平;c)比较b)中测定的两个或更多基因的基因表达水平与表1中所列相同基因的水平;d)测定c)中测定的两个或更多基因的基因表达水平之间的相似度(dos);以及e)从两个或更多基因的基因表达水平之间的dos测定样品显示病人中存在卵巢癌的证据的可能性。
2.权利要求1的方法,其中基因表达水平由包含表9中1-28号基因的表中所列基因的子集测定。
3.权利要求1或2的方法,其中样品包含取自病人的细胞。
4.权利要求1到3中任一项的方法,其中样品包含从所述病人的实体瘤中取出的细胞。
5.权利要求1到4中任一项的方法,其中样品包含取自所述病人的血细胞和血清。
6.权利要求1到5中任一项的方法,其中样品包含取自病人的体液。
7.权利要求1到6中任一项的方法,其中测定基因表达水平的方法包括测量来自病人的样品中蛋白质表达产物的水平。
8.权利要求7的方法,其中使用与蛋白质特异结合的试剂检测蛋白质表达产物的存在和水平。
9.权利要求7或8的方法,其中试剂选自抗体、抗体衍生物和抗体片段。
10.权利要求1到6中任一项的方法,其中通过测量表9中两个或更多基因转录的多核苷酸在样品中的水平评估样品中的表达水平。
11.权利要求10的方法,其中转录的多核苷酸为mrna。
12.权利要求10或11的方法,其中转录的多核苷酸为cdna。
13.权利要求10到12中任一项的方法,其中检测步骤还包括扩增转录的多核苷酸。
14.权利要求1到13中任一项的方法,其中该方法离体实施。
15.治疗经受卵巢癌被试者的方法,该方法包括向被试者细胞提供与一个或多个表6所示在卵巢癌中表达被上调的基因互补的反义寡核苷酸。
16.在有发生卵巢癌危险的被试者中抑制卵巢癌的方法,该方法包括抑制一个或多个表6所示在卵巢癌中被上调的基因的表达。
17.用于决定针对怀疑具有卵巢癌的病人的治疗策略的试剂盒,包含a)能够识别并结合两个或更多表9所列基因多肽表达产物的两个或更多抗体;b)适合盛放所述抗体和来自所述个体体液样品的容器,其中如果存在两个或更多表9所示基因表达的多肽,抗体可与之接触;c)检测所述抗体与两个或更多表9所示基因表达的多肽结合的手段;以及d)使用和试剂盒结果解释的说明书。
18.用于确定病人中存在或不存在卵巢癌的试剂盒,包括a)能够识别并结合两个或更多表9所示基因的mrna表达产物的两个或更多多肽;b)适合盛放所述多核苷酸和来自所述个体体液样品的容器,其中如果有mrna,所述多核苷酸可与之接触;c)探测所述多核苷酸与来自两个或更多表9所示基因的mrna结合水平的手段;以及d)使用和试剂盒结果解释的说明书。
全文摘要
本发明涉及对组织或血液样品进行基因组分析以检测卵巢癌在患者中的存在的用途,还涉及实施该测定的试剂盒。此外,本发明涉及治疗卵巢癌患者的方法。
文档编号c12q1/68gk1845999sq200480025033
公开日2006年10月11日 申请日期2004年7月1日 优先权日2003年7月2日
发明者c·n·拉韦丹 申请人:诺瓦提斯公司