英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
使用卷积神经网络的巴氏染色图像分类
摘要:本文介绍了基于深度学习的计算机辅助诊断技术,使用巴氏染色图像对子宫颈分类的综合研究的结果。所有的实验都是在一个真实的图像库上执行的,该数据包含有两个诊断中心生成的1611张图像。该方法的重点是构建一个有效的特征向量,该特征向量可以执行隐藏在巴氏涂片图像中的特征的多级表示。为此,使用深度卷积神经网络,然后使用无监督技术进行特征选择,以最大信息压缩索引为相似度度量。最后,对两个分类器(最小二乘支持向量机(LSSVM)和 SoftMax回归)的性能进行了监测,并根据五种测量方法进行了分类器选择以及五次交叉验证技术。生成结果的类别反映了建立的Bethesda分类系统,用于鉴定宫颈癌前期和癌变的病变。所提出的系统也与两个现有的常规系统进行比较,并且在公开的数据库上进行测试。实验结果和比较结果表明,提出的系统在巴氏染色分类中有效地执行。
关键字:巴氏涂片图像;深度学习;最小二乘支持向量机;SoftMax
- 介绍
计算机辅助诊断(CAD)是一种旨在减少观察性疏忽的技术,从而降低了医师解读医学图像的假阴性率的一种技术[3]。
CAD系统在医疗领域应用的最新进展是通过消除观察者间不同点并为临床决策提供定量支持来提高决策的执行能力[6]。特征提取,特征选择和分类是设计任何这样的CAD系统的三个主要阶段。任何自动化系统的效率由上述技术完全确定。近年来,深度学习技术对CAD系统的医学图像处理和开发产生了很大的影响[1] [6]。特殊卷积神经网络(CNN)已经成为许多计算机视觉工程的热门。但是,对于细胞学图像进行应用而言存在限制,因为培养深层网络需要大量的数据。但是如Genctav等人所提到的,[8]数据的收集是医学成像领域的一大挑战。
作者已经尝试通过FCM [4],遗传算法[17],联合优化技术[19]和流域变换[22,21]等分割技术研究巴氏涂片图像的特征。首先尝试分割感兴趣区域(细胞核或细胞质),并尝试从感兴趣的区域提取形态学或结构特征。在提取特征后,使用不同的分类器对巴氏染色图像进行分类[2,4,12]。这种定量图像分析技术的限制因素是没有一个鲁棒和理想的分割算法来区分感兴趣的对象[5]。在从不同来源收集的图像的分割中,一种分割技术也可能不一致。为了克服这些缺点,我们使用CNN提取的深度特征。深度学习方法是机器学习中的一组算法,它尝试自动学习有助于理解数据的图像的多级表示和抽象[24]。
在这项工作中,已经尝试将巴氏染色单细胞图像分类以检测宫颈发育不良。所有实验在包含1611个不同类别的图像的生成数据上进行,即,对于上皮内损伤或恶性(NILM),低度鳞状上皮内病变(LSIL)和高度鳞状上皮内病变或HSIL(包括鳞状细胞癌)的阴性。这些类别反映了建立的Bethesda分类系统,用于鉴定癌症和癌前癌症宫颈癌。系统也在一个在线的Herlev数据库上进行测试,其中包含917张公开的图像。特征提取使用Deep CNN进行。对于特征选择,基于相似性测度的无监督方法,以便我们可以消除冗余特征以提高系统的准确性。最后,对两个分类器,即最小二乘支持向量机(LSSVM)和SoftMax回归的性能进行监测,然后根据精度,精度,回归,特异性和F分数等5个度量进行分类器选择。使用交叉验证作为评估目的。输出类别将反映图像中存在的发育不良程度。该系统还与巴氏图像分类的两种现有常规方法进行比较。广泛的实验证明,提出的系统胜过现有技术。
本文的主要贡献可概括如下:
- 数据库生成:生成一个新的巴氏染色图像数据库,以执行从两个诊断中心收集图像的所有实验。Genctav等人[8]提到难以收集实际真实样本用于实验目的。 为了避免这类研究中涉及的伦理问题,研究人员对公开的数据进行了研究。 但是,基于这些数据开发的系统可能不会在基于区域的实际样本中显示一致的结果。
- 深入分析CNN的深部特征:虽然文献丰富了研究深入学习在各个领域的应用,但几乎没有任何报告用于深入学习在巴氏染色分类中的研究。 这促使目前的工作在宫颈发育不良检测中使用深层特征。
- 方法
方法所提出的工作框图如图1所示。它涉及4个阶段。 第一阶段用于数据库生成,第二阶段用于使用深层CNN进行特征提取,第三阶段是使用无监督技术进行特征选择,最后阶段用于分类,其中输出类别反映了已建立的病理分类系统。
图 1工作流程框图
2.1数据库生成
从Ayursundra Healthcare Pvt有限公司和Dr.B Borooah癌症研究所,Guwahati,阿萨姆邦收集了1611个真正的巴氏染色图像。通过认证病理学家在各自的中心进行染色和准备幻灯片。然后,我们使用Leica ICC50高清显微镜在400倍分辨率和24位色深度捕获图像。
图像根据从诊断中心收集的报告进行标记。最后,在相应诊断中心的两名医生的帮助下准备了一个图像数据库。 Gray [9]的书中很好地解释了NILM,LSIL和HSIL的特征。数据库的图像样本显示在图2中。为了检查系统的一致性,在Herlev University 巴氏染色数据库中进行了相同的一组实验,该数据库是公开的。数据库的详细信息可以在表1中找到。由于在Herlev数据库中,图像分为7类,我们将它们分为3类到贝塞斯达标准,其中正常中等,正常浅表和正常柱被包括在NILM类别中。轻度发育不良症包括在LSIL中,其他2类包括在HSIL类中。所以最后的课程如下 - 第1类:NILM,2级:LSIL和3级:HSIL包括鳞状细胞癌。
图 2不同类别的样本图像
2.2使用CNN进行特征提取
图像检索系统的性能固有地取决于表示图像内容的特征向量的有效性。最近的结果表明,从CNN提取的通用描述符在对象识别中非常有效,目前在计算机视觉论坛[14] [18]中的热门讨论。 CNN包括一个深入网络的前馈系列,其中中间层接收由上一层生成的特征作为输入,并将其输出传递到随后的层。这个网络的优势在于学习层次化的概念表示,对应于不同的抽象层次。对于图像数据,较低级别的抽象可能会描述图像中不同的定向边缘;中间层可能会描述对象的部分,而高层则指较大的对象部分甚至对象本身。
深度学习方法在应用于大型训练集时最为有效[16]。在医学影像研究中,很难得到这样大的数据集[8]。
在使用深层结构方法的医学领域中可以找到很少的研究[1,23]。在[1]中,Imagenet非医疗训练模型已被用于医学图像的分类。使用相同的直觉,我们使用Berkeley Caffe参考模型imagenet-caffe-alex [13]进行巴氏染色图像特征提取机制。 AlexNet有五个卷积层,三个池层,连接层约有6000万个自由参数[25]。对于我们的工作,我们选择了这个网络,因为AlexNet最初是为256 x 256 x3像素的固定图像尺寸设计的[15]。当感兴趣的对象比较小时这个模式也是很好的表现 [25]。在我们的情况下,识别核边界对于学习成功的分类模型是一个更大的挑战。图3显示了AlexNet模型的框图。
图 3 Alexnet模型框图
对于本文,我们从头开始训练和测试了该模型,并且没有使用预先训练的模型用于此目的。系统经过单独培训和测试,用于生成单个单元格和Herlev数据库。在此过程中,将医疗数据库的图像重新调整为Mtimes;M。这些调整大小的图像用于构建图像代表特征向量。 CNN包括一个深入网络的前馈系列,其中层间接收由上一层生成的特征作为输入,并将它们的输出传递给后续层。这个网络的优势在于学习层次化的概念表示,对应于不同的抽象层次。我们选择“fc7”层的输出作为特征向量。我们选择这个层对其他层是因为fc7是最后输出层(输出类得分的层)之间的最后一层,并且应包含更多具体的图像细节。最后,每个图像都被表示与4096维度特征向量。
2.3特征选择
选择更小的特征子集,保留数据的最佳特征,不仅减少了计算时间和复杂性,而且导致了紧凑的高效模型的产生。 在本文中,我们试图使用Mitra等[20]提出的无监督特征选择技术。 它是基于使用特征向量中的最大信息压缩索引(MICI)测量相似度。 它是快速的,因为它不需要任何搜索,特征子集不像主成分分析(PCA)转变。 涉及将特征集划分成较小的子集或集群,其中集群内的特征非常相似但集群间相似性非常低。然后选择来自每个这样的集群的单个特征以构成所得到的缩减子集。详细的算法在[20]中可用。
2.4分类
在本文中,监测两个分类器的性能,即LSSVM和SoftMax回归,并且基于表2中所示的5个度量执行分类器选择。
- 结果与讨论
3.1 实验设备
作者使用2.20GHz的Intel CORE i5处理器和4GB RAM的计算机在MATLAB R2016a中进行了实验。首先创建了一个图像库,其中所有的图像都存储在3个不同的目录中,代表3个不同的类。根据收集患者的报告和病理学家的适当咨询安排图像。为了评估技术,采取了5项措施。这些措施列于表2。
通过计算正确识别的类示例(真正的积极性)的数量,不属于类(真正的否定)的正确识别的样本的数量以及未正确分配给类的示例(假阳性)来评估分类的准确性)或者不被认为是阶级例子(假阴性)[26]。准确性是检查案件总数中真实结果(真阳性和真阴性)的比例。准确度越高,真正分类课程的比例越高。回忆的价值反映了错误分类率,即召回的价值越高,错误分类率就越低。另一方面,精确度反映了误报率;误报率越低,精度越高。 F度量是回归和精度的谐波平均值。只有当召回和精确度都很高时,即只有当错误分类率以及误报率都很低时,F值的值才会很高。
3.2特征选择技术评价
由于使用CNN提取的特征向量具有高维度(大小为4096),因此执行特征选择以检查冗余特征的存在并去除它们以提高系统的效率。该方法中使用的特征选择技术涉及两个步骤。首先,将原始特征集划分为使用MICI作为相似性度量的kNN原理的一些簇[20]。其次,从每个这样的集群中选择一个代表性的特征。在这种方法中,缩小特征的大小完全由参数k确定。为了从原始特征尺寸D执行实验并选择有效的缩小特征尺寸R,进行小的实验。在这样做时,k值选择为R = 100,200,300,...,4000.对于每个缩减的特征子集,使用LSSVM分类器来监视精度值。从1611图像收集70%的图像被认为是训练集,其他30%被认为是测试集。选择最大精度的R值作为最终R并用于进一步处理。图4显示了具有不同R值的精度与降低特征集合,其中R = 100,200,...,4000.从图4可以看出,对于R = 100,精度是最大的,因此考虑最终的减小的特征集大小从图4还可以看出,尺寸为4096的较高尺寸特征给出了生成数据库的84-87%的精度。它表示特征向量中存在冗余特征。所以在应用特征选择精度提高到90-95%之后,也将尺寸降至100,这表明使用这种技术的重要性。它还可以减少系统的计算时间。
图 4减少特征维数结果
3.3分类技术评估
评价分两个阶段进行。功能选择之后,功能选择之后,功能选择完成后,可以尽可能准确地监控性能。对于评估目的,表2中列出的5种措施是准确度,精度,回归,特异性和F分值。对生成的数据库以及Herlev数据库进行了实验。分级为二级-2级和3级。在2级分类中,输出类是正常和异常类,其中NILM包含在正常类中,LSIL与HSIL包括在异常类中,异常类也包括鳞状细胞癌。
另一方面,在3级分类中,输出类别为NILM,LSIL和HSIL(包括鳞状细胞癌)。对于2级分类,SoftMax回归不适用,因为它可以应用于多类问题,因此使用逻辑回归代替2类问题的SoftMax回归。图5显示了特征选择之前提出的工作的不同度量,图6显示了特征选择后系统的结果。
图 5 使用两个数据库进行特征选择之前的分类结果
可以看出,特征选择后系统的结果非常令人满意。执行5次交叉验证以实现对系统的良好评估。K折叠交叉验证是训练和测试给定模块以提高系统对已经可用数据的性能的最佳技术之一。在这种情况下,数据集被分为k个子集,该方法重复k次。
每次k个子集中的一个被用作测试集,并且其他k-1个子集被认为是训练集。该技术的优点是该技术不受数据集分割的影响。它可以很好地代表给定的数据集。使用这种技术,开发人员独立于根据所使用的K倍数选择火车和测试仪的大小。为了获得这种技术的优点,还要记住,由于重复执行,不应该将计算时间增加到一定程度,我们选择k = 5作为计算目的。
从图6的结果可以看出,在3级分类的情况下,SoftMax回归表现优于LSSVM。为深入研究深入研究下一组实验,以检查采用SoftMax回归的采用模型是否符合数据。为此,遵循统计方法,使用Pearson卡方分析计算拟合优度。随着模型拟合信息被仔细观察以检查其意义。 dF和p的观察值显示在表3中。当p lt;0.01时,p值“表示1%的显着性水平”,当p lt;0.05时,表示5%的显着性水平。另一方面,更高效率的dF值越高。从表3获得的数值证明,该模型非常适合数据,SoftMax回归可以在3级分类中有效地使用。
图 6使用两个数据库进行特征选择后的分类结果
3.4比较两
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[27686],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。