Abstract
不同癌症亚型组织病理学图像中核的局部空间排列已被证明具有预后价值。
为了捕捉局部核架构信息,提出了基于局部细胞群集图的测量方法。
然而,传统的细胞图构建方式仅利用核空间接近性,在构建图时不区分不同的细胞类型。
在本文中,我们提出了一种新方法:特征驱动的局部细胞群集图(FLocK),通过同时考虑个体核(如形状、大小、纹理)的空间接近性和属性来构建局部细胞图。
此外,我们设计了一套从 FLocKs 中提取的定量衍生度量指标,以捕捉相邻位置聚类核之间的相互作用。
我们评估了从 H&E 染色组织图像中提取出来的 FLocK 特征在两个临床应用中的有效性:对早期非小细胞肺癌(ES-NSCLC)患者进行短期与长期生存分类,并预测口咽鳞状细胞性癌(OP-SCCs)人乳头瘤病毒(HPV)状态。在 ES-NSCLC 患者长期与短期生存分类方面(训练队列,n = 434),通过最小冗余和最大相关性(MRMR)选择,在 10 次 10 折交叉验证的 100 次运行中确定了与 FLocK 大小变化和相交 FLocK 距离有关的前 10 个具有区分能力的 FLocK 特征,并结合线性判别分类器在训练队列中预测生存率时得到平均 AUC 为 0.68。这比其他先进的组织形态计量学和深度学习分类器更好(细胞群集图(AUC = 0.62),全局细胞图(AUC = 0.56),核形状(AUC = 0.54),核定向性(AUC = 0.61),AlexNet (AUC=0.55),ResNet ( AUC=0.56))。基于 FLocK 的分类器在一个独立测试队列(n=150)中获得了 AUC 为 0.70。在测试队列中,“高风险”患者整体生存较差,危险比(95%置信区间)为 2.24(1 .24-4 .05), p=O.Oll44)。在 OP-SCC HPV 状态分类方面,利用与相交 FLocKs 部分相关联的三个顶级 FLocK 特征构建了一个分类器,在训练队列(n=50)中获得了 AUC 为 0 .80, 在一个独立测试队列(n=35)中获得了准确率为 0.78。FLocK 测量与细胞群集图、核定向性和核形状的组合将训练 AUC 分别提高到 0 .87, 0 .91 和 0 .85。在这个应用中,深度学习方法的表现略好于基于 FLocK 的分类器,在测试队列中 AlexNet 的 AUC 为 0.78,ResNet 的 AUC 为 0.81,基于 FLocK 的分类器的 AUC 为 0.76。然而,两种手工特征:FLocK 和核定向性结合起来表现更好(AUC = 0.84)。
Intro
- 分布、外观、大小、形态和组织学原始物质(如细胞核和腺体)的排列变化已被证明可以预测癌症的侵袭性(Bera 等,2019 年;Gurcan 等,2009 年)。例如,在肺癌的背景下,众所周知肺癌致死率可以通过核形状、形态和排列的差异来表征。对于许多不同类型的癌症而言,疾病存在的标志是癌细胞与属于同一家族(如淋巴细胞)的其他原始物质之间结构连贯性的紊乱。相反,更具侵袭性的肿瘤倾向于在同类原始物质之间展示相对较低程度的结构和组织。
- 最近人们对开发基于计算图方法来表征组织学图像中核排列空间特征以预测患者结果产生了兴趣(Ali 等,2013a, 2013b; Bilgin 等, 2007; Lewis 等, 2014; Shin 等, 2015)。其中许多方法都基于捕捉与组织学原始物质空间架构相关的测量值。例如全局图形如 Voronoi 和 Delaunay 三角剖分策略已被用于连接个体细胞核(代表图形顶点或节点),然后提取与边长和节点密度相关的统计数据以预测疾病结果。Lewis 等人(2014 年)提出了细胞群集图(CCG),其中节点定义为核团/聚类,而不是单个细胞核,因为越来越多的人认识到肿瘤侵袭性可能更多地受到相邻核之间空间相互作用的驱动,而不是远离位置的全局相互作用。尽管这些方法显示与近距离核排列有关的属性具有预测意义(Ali 等, 2013a, 2013b; Bilgin 等, 2007; Lewis 等, 2014; Shin 等, 2015),但图形连接并未区分不同的细胞种群,例如近距离细胞是否都是癌细胞或属于其他家族如免疫细胞。早期非小细胞性肺癌(ESNSCLC)通常采用完全手术切除后进行辅助化疗治疗,如果需要。然而,在系统治疗后仍有 30%至 55%的患者往往会出现局部或远处复发。目前还没有临床使用准确可复制的生物标志物,可以识别出高风险复发患者,他们可能需要早期治疗强化,而低风险患者可能只需手术治疗。最近的研究表明与免疫细胞密度相关的计算机测量值(Saltz 等, 2018 年)以及免疫细胞与癌细胞之间的相互作用能够对这些患者进行风险分层(Corredor 等, 2019 年)。人乳头瘤病毒(HPV)阳性咽喉鳞状细胞癌(OP-SCC)占北美和欧洲所有 OPSCC 的 70%至 80%(Chaturvedi 等,2011)。 HPV 状态对分期、治疗和预后至关重要。目前确定 HPV 状态的标准依赖于组织上 p16 蛋白的免疫组化染色。然而,一些研究表明可以通过传统 H&E 染色图像来确定 HPV 状态(Kather 等,2019)。
- 在这项工作中,我们试图超越传统方法构建仅关注细胞邻近性的细胞图。我们结合固有核形态特征与空间距离来构建局部且形态不同的细胞聚类群体。我们引入了一种称为特征驱动局部细胞聚类图(FLocK)的新型构建局部细胞图方式,并提出了相应的新型定量组织形态学特征集合。
- 已经确立了细胞多样性与形态异质性密切相关,并且增加的形态异质性与许多不同类型癌症预后恶化强相关(Almendro 等,2013; Aum 等,2014; Mroz 和 Rocco,2016; Yuan 等,2012)。事实上,细胞多样性在许多癌症分级方案中起着关键作用,例如布鲁姆-理查森乳腺癌分级方案(Genestie 等,1998),其中核异形性(主要集中在对核形态、大小和外观的视觉评估)是主要标准。同样地,病理学家经常观察到各种癌症类型中癌细胞和肿瘤浸润淋巴细胞(TILs)排列的空间差异(Nawaz 等,2015)。
- 然而,与定量细胞密度相关的任务相比,定量空间结构更具挑战性。FLoCK 允许对 WSI 中与细胞外貌、形态和结构多样性有关的测量进行定量化。然后将 FLoCK 特征与机器学习分类器结合使用以预测早期非小细胞肺癌(ES-NSCLC)患者的生存率,并分类咽喉部癌症的 HPV 状态。
Feature-driven local cell graph
(a) nuclei segmentation (b) FLocK construction (c) and (d) FLocK feature computation without or with pre-defined cluster type number, respectively.
Nuclei segmentation and morphologic feature extraction
为了有效地分割细胞核,采用了多次通道自适应投票方法来检测细胞,随后使用基于分析这些细胞的形状和所占面积的局部最优阈值方法来分割细胞核。然后,基于这些预先分割的细胞核,计算了 11 种描述核形状和纹理的细胞核形态学特征。这些核特征将用于下游核形态特征空间分析,用于构建 FLocK。
FLocK construction in nuclear morphologic feature space
在这一步骤中,使用了细胞核的空间和形态特征进行特征空间分析以构建 FLocK。应用均值漂移聚类方法来执行子图构造的特征空间分析。这通过首先估计核形态特征底层密度函数的模式(即核形态特征密度的静止点)来实现。然后,根据相应的模式将核分组到不同的子图中。