TCGA癌症临床数据资料资源全面介绍---癌症研究领域的全谱!

2021-11-08 08:31 来源:赤峰妇科医院

2006年,前列腺癌原核生物由此可知谱(The Cancer Genome Atlas, TCGA)开发计划以多形性质母细胞会结节(GBM)、肺点状细胞会乳癌(LUSC)和卵巢上皮细胞性囊腺乳癌(OV)开始为期3年的示范项目,2009年~2015年年初展开。到项目上半年,TCGA网络研究者工则有者已描绘了33种前列腺癌多种类型10,000余则有高血压的小分子有所不同之处,并假设了很多小分子亚型。TCGA包含的医学关键有所不同之处代列于泛化的原始数据整理。为确保正确用作这些具原核生物有所不同之处的巨量医学原始数据,最近TCGA完成一批重大成果,发列于在CellPress旗下的Journal。

本文对4年初5日发列于Cell上的一文顺利进行载入。篇文章阐述以OS(总活过期)、PFI(无成果时除此以外延迟)、DFI(无病时除此以外延迟)和DSS(哮喘相关活过)为四个主要医学结果起点的TCGA泛前列腺癌医学原始数据森林资源(TCGA-CDR)新简化原始元数据,并所述了每种前列腺癌多种类型的起点用作同意。TCGA医学原始数据可从原核生物原始数据共享三维空除此以外(GDC)门户网站App,所有的小分子原始数据在App。医学原始数据和小分子原始数据用作同样的明信片结构,便于高血压的医学数据和抽样小分子原始数据拆分。

TCGA泛乳癌原始元数据字段有所不同之处

由此可知1A为医学原始数据拆分和归纳作法及4个主要医学起点新创和归纳的流程由此可知,对33份初始提出申请和97份早先原始数据文件,共33种前列腺癌多种类型111,60则有前列腺癌高血压的数据顺利进行了处理。列于1为每个TCGA字段的基本有所不同之处。按原发抽样根据小分子有所不同之处选入每个字段,黏膜黑色素结节(SKCM)的原发和转到南村两种多种类型都有,其它极少数的原发与转到多种类型也有研究者。

由此可知1. 医学原始数据拆分和归纳作法及4个主要医学起点新创和归纳流程由此可知

列于1. TCGA 泛乳癌字段有所不同之处

医学结果起点OS、PFI、DFI和DSS

总活过期(OS)很不可或缺,优点是假设OS惨案时模糊性最低。但用作OS则有起点可能会削弱医学研究者,因为非乳癌死因不一定能反映出生命体学、来袭性或对用药缓解。用作OS或才可更长的随访等待时除此以外;很多医学试验之前,通常采用相对来说较随访等待时除此以外较短的DFI或PFI。针对现有TCGA医学原始数据,要察觉到短时医学随访时除此以外延迟在来袭性前列腺癌多种类型结果的不可或缺性,因为可能会几年内就辨别到医学惨案,在死亡前已用到病情罹患或成果。对来袭性较弱的前列腺癌多种类型,高血压在数十乃至几十年后罹患,随访长年可能会无法辨别更多惨案以支亦然精准结果可供判断。该归纳的目的是验证TCGA泛乳癌医学检测的相对来说较优势和不足,指导更促使的归纳和避免随访时除此以外延迟等待时除此以外不足等缺陷。

归纳全部TCGA医学原始数据后,论点如下:在原始数据可授予时,OS、PFI及DFI相对来说较精准,但多数情况情况估计DSS。由此可知1B为33种有所不同前列腺癌多种类型的OS K-M斜率。尽管活过归纳不是TCGA主要最大限度,多数前列腺癌多种类型活过斜率与无论如何归纳大致相同活过起点的实质上研究者基本大致相同,GBM、OV(2008, 2011)和低等级质结节(LGG)(2015)的TCGA结果就是比较好相对来说较。PFI、DFI和DSS的K-M斜率见由此可知1C–1E。

由此可知1 B-E医学的验证

基于每种前列腺癌多种类型4个起点的辨别等待时除此以外计算少于随访等待时除此以外及惨案或验证的之前位等待时除此以外(列于2)。所有的之前位随访等待时除此以外为22.1个年初,但有所不同多种类型前列腺癌该等待时除此以外共同点极大;GBM和急性髓系前列腺癌(LAML)最短约12个年初,而肾嫌色细胞会乳癌(KICH)最多约48个年初。

列于2 总体之前位随访等待时除此以外及4个起点的惨案与辨别之前位等待时除此以外

引荐用作的医学结果起点

医学结果起点同样不同研究者最大限度、惨案量、字段较小和结果原始数据质量。将这些作法和开发的其它作法则有为对单个哮喘原始元数据的验证和补足验证,所述在每种哮喘多种类型之前用作每个结果起点的同意及原因(列于3)。每种前列腺癌多种类型的活过起点才可要最少通过一个主要验证和补足验证才被接受。33种乳癌之前的13种用作全部4个起点:膀胱尿路上皮乳癌(BLCA)、结膜点状细胞会乳癌(CESC)、结肠乳癌(COAD)、食管乳癌(ESCA)、头颈部点状细胞会乳癌(HNSC)、肾状细胞会乳癌(KIRP)、肺腺乳癌(LUAD)、LUSC、OV、胰腺乳癌(PAAD)、肉结节(SARC)、肠胃腺乳癌(STAD)和子宫内膜乳癌(UCEC)。相反,无法一个起点的有嗜铬细胞会结节和副神经节结节(PCPG)。黏膜散发大B细胞会黏膜结节(DLBC)、LAML和胸腺结节(THYM)非常少一个起点;剩余前列腺癌多种类型2或3个起点,但其之前一些亦然意见分歧。最精准的是PFI,可无保留地引荐给除LAML(无原始数据)、DLBC和KICH(慎重用作)和PCPG(不引荐)外的4种。

列于3 起点OS,PFI,DFI及DSS的归纳与引荐用作

验证TCGA-CDR及案则有应用

在帕金森氏症研究者之前,甲状腺素ER复数高血压医学活过期结节病比ER+高血压差。分别用OS、PFI、DFI和DSS比较这两类高血压的活过期(由此可知3A–3D;斜率上半年于10年随访等待时除此以外,但用作整个原始元数据顺利进行归纳)。单各种因素归纳显示,用作PFI(p= 0.005)和DFI(p = 0.001)则有为医学起点,TCGA之前ER+帕金森氏症高血压比ER-高血压有更佳的活过期,但用作OS时两类高血压除此以外不实际上共同点(p = 0.097) 。此外,两类高血压的DSS(p = 0.009)有突出共同点,指出DSS的潜在商业价值。以上见到列于明了PFI和DFI是特定多种类型帕金森氏症小分子研究者的合适起点。

由此可知3 验证和应用实则有

此外还验证了来袭性GBM活过结果起点。TCGA之前GBM之前位OS为12.6个年初,介于此前美联社的新标准用药的12.1个年初和新标准用药协同替莫唑胺的14.6个年初中除此以外。之前位PFI是6.1个年初,介于此前美联社的新标准用药5个年初和新标准用药协同替莫唑胺的6.9个年初中除此以外。显然,TCGA原始元数据OS和PFI惨案等待时除此以外与古籍相反。再一印证OS和PFI则有为GBM小分子研究者的医学起点效度。

用Cox比则有危险性回归数学模型已确定高期(III、IV期)相对来说较低期(I、II期)前列腺癌高血压的危险性比(HR),验证4个起点的TCGA-CDR原始数据。由于DFI假设与其它结果的假设不相反,对引荐用作OS、PFI和DSS的14种多种类型前列腺癌比较logHR(列于3)。随后非常少对意味着Cox比则有危险性论点的哮喘顺利进行总和(由此可知3E–3G)。结果指出,14种多种类型前列腺癌之前,除除此以外皮结节(MESO)、PAAD和葡萄膜黑色素结节(UVM)外,高期对比低期HR在3个引荐起点OS、PFI及DSS上显著偏高。采用配对抽样的Wilcoxon秩和验证,当用作PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有突出共同点,显示哮喘成果和活过起点在HR上实际上系统差值;OS与DSS中除此以外无法突出共同点(p = 0.106)。对2个logHR值的新标准误顺利进行变加权少于已确定Pearson相关系数, 由logHR估计的3种结果有极突出正相关:PFI和OS相关系数0.96(95%置信区除此以外[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区除此以外:0.76–0.99),OS和DSS为0.90(95%置信区除此以外:0.61–0.98)。这些相关性潜在支亦然医学早期用PFI,后期用OS和DSS做起点。

除了拆分小分子原始数据,还尝试归纳首次用药后无病高血压与非无病高血压是否用到有所不同的新惨案。TCGA-CDR之前29类前列腺癌文档用于解决该缺陷,划定高血压从诊断到完成首治并达到无病状态最少活过3个年初。以LUSC为则有,有289则有无病高血压和41则有长年非无病高血压,NTE率分别为21.8%和68.2%。用Cox比则有危险性回归数学模型,见到在非无病高血压之前NTE危险性突出高于无病高血压(HR = 6.68,95% CI = 4.25–10.51,FDR优化q值<0.05)。在另外21种前列腺癌多种类型之前也有相似结果(列于4)。余下7种之前无法辨别到这些共同点。我们也在归纳是否每个数学模型都意味着比则有危险性论点,其之前有两个不符合,才可要研究者等待时除此以外依赖及多变量数学模型来寻找原因。

列于4 非无病与无病高血压NTE发展对比

TCGA从亚缘故地区数百个条线路整理病则有,为解决医学原始数据有所不同条线路除此以外的可比性,才可考虑原始数据完整性、和高血压有所不同之处等。对每种哮喘而言,我们对比了前两名提可供病则有数最多的有组织来源条线路(TSS)与所有其它TSS的同种哮喘及4个结果起点(列于5)。

列于5 对来自前两位TSS的每个前列腺癌多种类型研究者结果顺利进行比较

对于GBM等极具来袭性的,前两位TSS(#1和#2)的发病许多人与其它TSS相对来说相似的有OS、PFI和DSS,因惨案缘故少难以归纳不引荐DFI做起点。BRCA等较低来袭性,强力引荐用作PFI和DFI,但同意慎重用OS或DSS归纳。TSS #1的医学原始数据转化成不缘故好的OS和DSS,但无法辨别到PFI共同点;另外,列于层上TSS#1有更佳的DFI结果,非常少用到3则有 DFI惨案。这种列于里不一的反常指出该条线路的结果原始数据才可促使归纳。另一特别,TSS #2的4个起点结果与其它地方相反。

这个简单的结果比较指出,当从特定结果归纳整体TCGA的医学原始数据时,才可要考虑TSS的具体内容文档。由于年龄、分期/分级及用药等各种因素影响有所不同TSS患许多人的起点结果,TSS可以则有为这些和不完全医学注解等其它未测量共同点的替代。

潜在的相异各种因素、竞争者结果的

危险性及数学模型论点

对医学活过起点归纳来说,同意用作所处理的全部医学原始数据。但相对来说小分子/原核生物原始数据的拆分归纳,要注意两个特别。首先,引荐意见基于基线活过数学模型,以小分子亚型则有预报特异性划分抽样集,有可能会损害结果总和的突出性共同点。因此,从互相共同点的TCGA小分子原始数据或亚型TCGA-CDR结果原始数据之前得出的论点才可在实质上的原始元数据之前促使列于明。

第二,我们同意非常少用作原发的小分子原始数据,因为高血压初诊时,不可或缺等待时除此以外文档等最简单的医学原始数据已整理相对来说较完整。黏膜黑色素结节(SKCM)在TCGA多种类型之前非常特殊,470则有之前非常少103则有原发,其余296则有为原发局部肺部转到,68则有近端转到。这与极少整理到转到结节的其它TCGA前列腺癌多种类型形成鲜明对比。SKCM转到结节极少很强最简单的原发,而其它TCGA前列腺癌多种类型尽管极少有转到结节,但都很强最简单的原发抽样。因此,对于SKCM结果的相关性,同意只用作有限量的原发病则有,尽管SCKM肺部转到的III期病则有可则有为实质上组群顺利进行研究者。

在用作新拆分的TCGA-CDR原始元数据时,还才可要注意:潜在误用各种因素、竞争者结果的危险性及数学模型论点。

相异各种因素

相异各种因素实际上但被排除在数学模型均时,差值可能会高估或归因于真实。如在帕金森氏症的种族共同点研究者之前,有色人种与黑人高血压中除此以外实际上不可或缺的基因列于达共同点,然而根据小分子亚型顺利进行优化后,这种共同点突出提高甚至消失。治果也是潜在的相异各种因素,当文档可获取时应适当考虑优化。用药未知时,年龄、诊治该医院及诊断日期等新标准用药则有为替代文档能提高部分最小值。对这特别的对政府建模,努力用作标志物结节病研究者同意统计数据(REMARK)。

竞争者结果的危险性

测定DSS、DFI和PFI起点时,要对无法境遇不可或缺惨案且无病的死亡高血压顺利进行审查。在这种情况,如果论点高血压无法其它死因,那她/他最终仍可能会死于前列腺癌指征。然而,在估计用药等预报特异性对诱发前列腺癌或心血管哮喘等非指数前列腺癌死亡危险性的预报能够时,该论点并不可取。

数学模型论点

应用Cox比则有危险性(PH)数学模型须要验证PH论点。尚有案则有外,大多数数学模型都意味着Cox PH论点,但才可促使探索这些个案以找出违背论点的原因,从而对HR显然更准确的估计。尽管已经为修整原始数据和解决缺陷付出了巨大奋斗,但仍实际上不可或缺的用作受限制,访问TCGA医学原始数据都须要了解这些受限制。

首先,TCGA主要是为小分子研究者所设计,最初病则有同样来自多个机构很强合适库存有组织的未用药原发病则有,因此这些病则有不构成连续性。此外,对于每种有所不同多种类型/研究者,随访原始数据无法统一整理。同时,医学原始数据整理的一些游戏规则在无论如何不得不随着等待时除此以外的推移而改变。TCGA - CDR不包含前列腺癌用药历史学者,并非所有病则有都被注解。因此,归纳特定多种类型或亚型的用药文化背景要强概况性泛乳癌归纳。当高血压顺利进行具体内容用药时,给与可用DFI和PFI起点有效归纳。

其次,TCGA抽样医学随访根据当地门诊的等待时除此以外列于,可能会为哮喘或特定肺脏的罹患和病人不可或缺生命状态的历史纪录,因此无法TCGA指定的医学随访开发计划,非常少所述项目主要强调的小分子有所不同之处。

最后,近乎所有TCGA授予的抽样和原核生物及小分子原始数据来自新诊高血压原发的单个切片,由此转化成的原核生物和小分子原始数据不能在三维空除此以外或等待时除此以外任何特别确实捕捉代列于另一高血压结果变量的异质性。该缺陷不是TCGA独有的,任何静态诱发研究者都实际上。

展望

这项工则有是有历史学者以来第一次年初核心内容处理TCGA泛乳癌医学数据。由此转化成的TCGA-CDR的结果起点与实质上非TCGA研究者结果相反,详述该森林资源在空前规模的医学连续性上提可供了生命体观测新视角。也要察觉到TCGA-CDR的内在用作局限性及值得注意指导和引荐意见。已经非常明晰,人类哮喘未来大规模的小分子研究者须要核心内容整理医学病理、用药和原于惨案原始数据,以坚亦然最高新标准的医学研究者。尽管有其局限性,TCGA-CDR提可供了新简化原始元数据,以及模糊的4个医学结果起点导出,并解决了质量缺陷,从而在泛乳癌和个体水平上顺利进行转化研究者。未来原始数据研究者的融合将提高结果中除此以外的可比性,更佳地解释和支亦然重复。

参考数据

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
李青短评:静脉输注鲜榨果汁 还有比这位大妈更为奇葩的养生术吗?
据《潇湘晨报》媒体报道,51岁的曾夫婿幼时岳阳桂阳县,原本是一个身心健康、性格云彩的人,进入早产之后,特别景仰畜夙之道。各种偏方制作方法...[详细]
2022-05-05
我是不是快要生了?别急,分娩先兆一文说清
什么是产妇前兆?就是时时刻刻准小女孩们,糖果就要祖父母啦!如果你是第一次怀生子,对临产或许不太探究。那么这篇文章似乎都会对你有设法哦!...[详细]
2022-05-04
怎么化疗结核性胸膜炎 有什么方法
结核性腹膜炎是现在诊疗上很常见的一种肺外癌症了,主要是由于转化杆菌属以及其细胞内产物重回了处于敏感状态的腹膜腔而导致的一种腹膜炎症。患...[详细]
2022-05-03
欧洲药监机构就替格瑞洛临床试验情况向阿斯利康进行询问
欧洲药剂税务政府机构现在写给阿斯利康,要求阿斯利康给予格外多有关大英帝国追查其心脏病化学合成替格瑞洛的个人信息。阿斯利康正依靠替格瑞洛...[详细]
2022-05-02
炎的有害有哪些?
胆是新娘牵涉到的胆症,这种胆症显然就会经常出现腹痛、排泄物等副作用,这种胆如果不需要得不到及早的外科手术的话就显然导致患儿的很多非常严...[详细]
2022-05-02
女人月经第一天,为什么会痛经大多数人可能还从未搞清楚
今日很多好朋友都时会受到这样一个后遗症,其实好朋友在妊娠初潮之后,每个月初都是时会来妊娠的,但是有的好朋友却不想让大姨妈来,这是因为他...[详细]
2022-04-28
例假总是不准时是怎么回事?10大原因似乎是“罪魁祸首”!
一个人如果仅有了高血压的体魄、焦虑和历史文化,是值得非常自豪的坏事。四肢的思想的和 历史文化的高血压,为我的成长道路铺就了一条阳光灿烂的...[详细]
2022-04-27
月经不调的滋补方法 吃这些能调理生理期
随着生活节奏的赞快,很多男同性恋朋友的阻碍也以后赞大,阻碍大的危害很多,比如很非常容易引发男同性恋月经不调,月经不调不应怎么办呢?那时候...[详细]
2022-04-26
妇女节科普:女性不妨在月经期间偷懒四件事。子宫会感谢你的。
一年一度的女神节降临,有人送钱,有人送花,今天胡侃医生还在送健康!月经作为女性健康的晴雨表,一直受到公众的关注。然而,月经的特殊点是,...[详细]
2022-04-25
  • 地区医院
  • 医院联盟