捷克儿童癌症信息系统的开发:数据分析和交互式可视化外文翻译资料

 2023-04-12 08:04

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


捷克儿童癌症信息系统的开发:数据分析和交互式可视化

摘 要

背景:了解人群的癌症负担、时间趋势以及国际对比的可能性是癌症项目的重要起点。直到如今,捷克还没有描述儿童和青少年癌症的可靠的交互工具。

目标:本次研究的目标是开发一个名为捷克儿童癌症信息系统(CCCIS)的新网站,该网站将提供有关捷克儿童癌症的信息。

方法:儿童癌症的数据来自捷克癌症登记处。这些数据使用儿童癌症患者的临床数据库进行验证,随后与住院患者登记处和死亡证明的数据相结合,然后使用这些数据来确定1994年至2016年期间诊断出的0至19岁儿童癌症患者的发病率和存活率(N=9435)。死亡证明中的数据用于检测死亡率的趋势。该技术方案基于强大的PHP开发 Symfony框架,以PostgreSQL系统为数据基础。

结果:自2019年11月以来,任何人都可以使用该门户网站,为专家提供有关儿童癌症各个诊断组的基本信息(即分析和出版物)。它涉及用于分析报告的交互式工具,它以图表或表格的形式提供有关一下基本主题的信息:发病率、死亡率和总生存率。使用以下方法获得反馈并验证在CCCIS门户上发布的输出的准确性:理论背景的验证和用户测试。

结论:我们开发了能够处理来自多个来源的数据的软件,该软件可供所有用户免费使用,即使没有数学背景的用户也可以进行自动分析;需要用户对要分析的主题进行简单的选择。

关键字:癌症;儿童;数据可视化;软件开发

引言

儿童和青少年癌症(或简称儿童癌症)被归类为罕见疾病,因为其发病率比成人癌症发病率低几个数量级。捷克每年诊断出大约400例新的儿童癌症病例。尽管就数量而言,儿童癌症很少见,但它们是儿童死亡的第二大原因(仅次于受伤)。

门户网站SVOD(肿瘤数据可视化系统)提供了捷克癌症的代表性流行病学数据。然而,它并不适用儿童癌症。主要问题是儿童癌症的不同分类系统,它考虑了儿童癌症和成人癌症之间的差异;与基于原发肿瘤部位的成人癌症分类系统不同,认同癌症的分类系统主要基于形态学。

为此,捷克卫生信息和统计研究所(IHIS CR)与马萨里克大学医学院(IBA FM MU)的生物统计和分析研究所决定开发一个名为捷克儿童癌症信息系统的新的门户网站。

CCCIS门户的主要目标是提供有关捷克儿童癌症发病率的流行病学数据以及与儿童和青少年癌症相关的死亡率和生存率数据的全面概述。CCCIS门户网站还旨在向国际社会提供有关捷克儿童癌症的相关信息;这就是为什么门户网站不仅有捷克语而且还有英语的原因。本文的作者提出了一下探索性问题,这些问题在讨论部分得到了回答:如何有条不紊地设计并实施详细的分析观点,这些观点涵盖了发病率、死亡率和生存率;是否有可能根据可用的代表性数据确定选定癌症诊断的流行病学趋势;捷克儿童癌症患者目前的存活率是多少?

方法

数据源

门户网站上使用的儿童癌症数据来自捷克国家癌症登记处(CNCR),该登记处由IHIS CR管理。这些数据使用儿童癌症患者的临床数据进行验证并结合来自住院患者登记处的数据以及死亡证明,然后使用这些经过验证的数据来确定在此期间被诊断出的0至19岁儿童癌症患者的发病率和存活率。

1994年至2016年,死亡证明数据用于监测长期死亡率趋势。人口统计数据是从捷克统计局获得的。此外还使用了国际数据:来自国际儿童癌症发病率数据和来自欧洲癌症信息系统的死亡率数据以及来自国际比较研究CONCORD-3的存活率数据。

分类

根据国际儿童癌症分类第三版(ICCC-3),癌症分为12个主要小组。行为3(原发性恶性肿瘤)的所有诊断加上来自组III(中枢神经系统【CNS】和其他颅内和椎管内肿瘤)和Xa(颅内和椎管内生殖细胞肿瘤)的诊断,行为0/1(良性肿瘤或不确定、未知的肿瘤)被认为是恶性肿瘤。关于死亡率数据,根据国际疾病统计分类第十次修订版(ICD-10),儿童癌症死亡的最常见原因,即以下诊断列表:所有恶性肿瘤(COO-C97);骨头和关节软骨的恶性肿瘤(C40-C41);结缔组织和软组织恶性肿瘤(C47、C49);脑、脊髓和中枢神经系统其他部位的恶性肿瘤(C70-C72);非霍奇金淋巴瘤(C82-C86)和白血病(C91-C95)。

流行病学数据分析

在统计分析方面,门户网站CCCIS关注三个流行病学指标:发病率、死亡率和存活率。发病率是在特定时期内特定人群中诊断出的新病例数。CCCIS门户可以以多种不同的方式表达发生率。首先,绝对数字显示了特定疾病人群的总体负担。其次,粗发病率是特定人群中每100万儿童中出现的新病例数。如果感染的人群仅仅包括给定年龄区间(例如,10-14岁)的人,我们谈论的事特定年龄的发病率。第三,年龄标准化发病率是给定人口如果具有标准年龄结构的理论发病率。该门户网站可以计算欧洲年龄标准化发病率(ASR-E)和世界年龄标准化发病率(ASR-W)。死亡率是在给定人口的一定时期内发生的诊断导致的死亡人数(所谓的特定原因死亡率)。与发病率情况一样,CCCIS门户网站上的死亡率也可以用绝对数字、每100万儿童的比率、特定年龄的比率以及欧洲或世界人口的标准年龄化比率来表示。总生存率用于评估患者的生存率,与监测的总生存率相对应,无论死因如何。使用生命表方法计算1年、2年、3年、4年和5年的总体生存率,间隔为1年,其中任何原因的死亡是感兴趣的事件。

设计和开发

CCCIS是一个配备在线数据浏览器的门户网站,它是实践证明的Symfony PHP框架在3.4版本中开发的。使用这个框架来系统地设计、开发和实现Web应用程序可以加速各个阶段,并且通常有利于应用程序的管理和可拓展性。因此,可以相对快速地对用户的需求和要求做出反应,以适应当前功能或添加新功能。Twig模板引擎已用于创建页面模板,Dcotrine Object Relational Mapper已用于映射对象一一两者都已与Symfony框架一起发布。数据存储库建立在开源的面向对象系统PostgreSQL上,PostgreSQL目前通常用于组织更复杂的数据结构。PostgreSQL的主要优势包括开发者社区的支持,高级性能优化的可能性,以及高质量的技术文档,使得管理整个数据库系统和单个数据库没有问题成为可能。

导入数据库本身是由自动脚本执行的,这些脚本上传新的数据库内容。保持数据模型的一致性以及数据纯度和质量(由分析师和开发人员彻底验证)是成功导入的基本要求。对第三方库的依赖由Yarn(前端)和Composer(后端)处理。门户的很大一部分被设计为响应式(即,显示的内容根据用户的设备—台式机、平板电脑、手机)自动调整。但是,包含数据浏览器的几个部分的响应能力并不完整;在这种情况下不完全支持移动版本,因为用户界面太复杂(图形、过滤器、分析设置)。响应式前端是使用Zurb Foundation框架和jQuery库开发的。Webpack工具已用于编译最终的样式和JavaScript库的扩展组件提供;特别是d3.js、NVD3和database已被用于交互式数据可视化。过去,我们已经将类似的方法应用于web应用程序的开发,即在专注于捷克医疗保健中几个问题的交互式数据浏览器中。

数据和应用安全

该项目的基本要求之一是保护整个应用程序,包括数据层。该应用程序旨在抵御潜在的第三方攻击并灵活响应。客户端和服务器之间的通信通过HTTPS协议以安全的方式进行。

这种加密传输现在被用作标准,并且以这种方式保护数据流是一种常见的做法。应用程序本身构建在Symfony框架上,还内置了其他安全机制。遵守标准的实施方法可确保暴露于基本攻击,例如跨站点脚本、跨站点请求,避免伪造或各种类型的注入,尤其是SQL注入。

服务器端保护主要由网络防火墙提供。检测可能的第三方攻击的另一种有效方法是设置配置良好的资源和流量监控,记录来自外部网络环境的错误和访问,并提醒管理员注意非标准事件。

保护数据本身是另一个需要满足的必要要求。门户用于呈现可视化的基础数据已清除了有关患者及其住院时间的所有个人和敏感信息。因此,不可能将记录直接连接到特定患者。数据安全地存储在一个数据库中,该数据库只能从预定义的位置(这些位置始终是内部网络的一部分)和有限的一组用户访问,这些用户的权限仅限于某些数据操作。根据最终可视化的需要,数据始终以聚合形式发送到客户端。在发送之前执行聚合操作很重要,这样数据就不会在客户端分解为单独的行。同时,对于潜在的少量记录,不发送分析结果,并且将这一事实通知用户。因此,有效地防止了对特定人员的识别。

验证和用户测试

使用一下方法获得了反馈并验证了CCCIS门户上发布的输出的准确性,这些方法通常适用于识别潜在的缺陷,不仅在内容方面,而且在用户界面和控制元素的设计方面。

描述基本术语,癌症分类方法和静态分析报告的理论背景验证在内部进行(即与分析团队和一群拥有多年儿童癌症分类方法的癌症专家)。同时,对交互式数据浏览器的所有三个部分都进行了彻底检查;根据用户设置对发病率、死亡率和存活率的复杂分析视图进行了广泛测试。

用户测试包括通过门户各个部分的简单说明,并提供关于整体视觉风格、控制元素和用户友好性的主观反馈。

作者团队对两次评估的结果进行了广泛讨论,随后实施了符合门户整体概念的选定建议。

结果

CCCIS门户的基本描述

门户网站CCCIS是一个独立的在线演示文稿,自2019年11月起在互联网上免费提供,无需用户身份验证。门户可以被编入索引,因此可以被标准搜索引擎找到。用户可以通过web浏览器,并且所有通信都通过HTTPS协议进行(即以安全和加密的方式)。CCCIS门户分为几个部分:

  • 简介部分提供有关门户目标和内容的基本信息。介绍了参与机构和作者团队。本节还介绍了用于统计和交互式数据视图的数据源。与捷克共和国儿童癌症相关的新闻也有涉及。
  • 方法部分描述了如何根据国际分类系统对儿童癌症进行分类。
  • 统计部分包含有关数据集提供的视图的信息和描述性属性的概述。该部分分为发病率、死亡率和存活率。静态分析也可供下载;但是,此功能仅在捷克语中使用。
  • 交互式数据图部分提供图形输出,使用户可以以交互方式浏览可用数据集。所有数据集都会根据来自CNCR的数据和来自临床数据库的数据定期更新。与统计部分一样,交互式数据视图部分也分为发生率、死亡率和存活率子部分。本白皮书的下一部分将更详细地介绍门户的这一部分。
  • 出版物部分提供在研究期刊上发表的文章列表和会议论文列表。

CCCIS浏览器介绍

交互式浏览器是门户的主要组成部分,包含预定义的分析工具,使用户可以从不同的角度以图形和表格表示形式查看流行病学数据。从用户的角度来看,这就是交互式浏览器的使用方式:

  • 主要模块的选择(发病率、死亡率、存活率)
  • 分析类型的选择
  • 选择分析的患者组、设置分析输出

选择主模块是开始如何分析的第一步。主要的流行病学分析,即所谓的模块,涵盖以下主题:发病率、死亡率和存活率。选择主模块后,用户需要选择所需的分析类型,即按诊断年份、按性别、按癌症类型、按年龄和癌症类型进行分析(此选项仅在发病率和死亡率模块中可用),或通过国际比较。可以在屏幕的上部选择个别类型的分析。选择所需的分析类型后,会显示一个分析窗口,显示带有基本设置的结果。这些设置可以在两个级别上进一步调整。

分析患者组的选择

可以使用以下过滤器为分析的患者组选择选项:

  • 诊断(或癌症类型):通过ICCC-3(在发病率和生存模块中)或通过ICD-10(在死亡率模块中)选择诊断
  • 性别:所有儿童,仅男孩或仅女孩
  • 年龄:选择年龄类别0至19岁、0至14岁、小于1年、1至4年、5至9年、10至14年或15至19年(在发病率和死亡率模块中),或0至19年、0至14年或15至19年(在生存模块中)
  • 时期/年:可在发病率和死亡率模块中使用滚动条来选择个别年份或跨年(目前在1994年至2016年之间)生存模块只能选择1999-2004、2005-2010、2011-2016预定义的时间段。

这些过滤器可以组合在一起,这样就可以获得所选主题的详细视图。所选分析上下文中不合适或不合逻辑的变量处于非活动状态(灰色)。重置过滤器按钮可用于恢复原始分析设置。

分析输出的详细设置

根据选择的分析,软件提供合适的计算方法,例如绝对数;年度数字;百分比;每100万儿童的比率;ASR-E;ASR-W和1年、2年、3年、4年或5年总生存率。在发病率和死亡率模块中,可以可视化单个年份(关闭位置)或组合在一起的年份(开启位置)的数据。在国际对比分析中,这个拨动开关始终处于开启状态,从而可以将捷克的数据与其他欧洲国家的数据进行比较。

交互工具的主要输出是显示在工作窗口中央的图形,包括应用过滤器和数据源的描述。除了这种图形输出,结果还可以以数据表的形式显示。图形输出可以作为图形下载,而表格输出可以作为*.csv或*.xlsx文件复制

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[589624],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。