阳光肺科

 找回密码
 立即注册

微信扫码登录

搜索
查看: 7|回复: 0

肿瘤大数据与真实世界研究中国专家共识(2022版)

[复制链接]

1253

主题

543

回帖

1万

积分

V4

积分
10405
Tom 发表于 2023-5-31 09:43:17 | 显示全部楼层 |阅读模式
中国抗癌协会肿瘤大数据与真实世界研究专业委员会. 肿瘤大数据与真实世界研究中国专家共识(2022版) [J] . 中华肿瘤杂志, 2022, 44(12) : 1330-1343. DOI: 10.3760/cma.j.cn112152-20220628-00458.


ab6d4ba7e847d219dc5badc5b49cf739.png </p>

4.研究对象的选择标准

(1)筛选目标患者:基于数据库筛选研究对象,不仅需要明确符合诊断指标,如疾病分类编码,还要综合考虑金标准的检查结果、其他就诊情况及处方药品等多种信息。
(2)选择首次用药患者:建议选择新诊断的患者作为首次用药患者。而对于长时间停药后再次用药的患者也可定义为"首次用药患者",但需根据所研究药物的半衰期和研究目的,对再次用药与前次用药的间隔时间进行详细定义,控制选择偏倚。
(3)定义暴露相关时间点:与研究对象和暴露有关的时间点包括起始用药时间、末次用药时间、暴露期、非暴露期、诱导期、风险期、干预宽限期和洗脱期。
(4)尽量减少失访:失访率过高不仅会影响研究结果的真实性,还可能导致研究无法按计划完成。
(5)明确病例纳入研究次数:明确在此研究中,每个病例是仅纳入1次,还是根据不同时期的具体暴露情况多次纳入研究。与之对应的是,选择对照人群时,应考虑是否采取多次重复匹配。
5.暴露定义与偏倚控制

观察性研究存在诸多混杂因素,应事先参考数据库已有变量来定义暴露,最大程度避免错分偏倚。要确定是否给予研究药物,定义药物暴露时间,评估是否存在停药、交替给药和合并用药等情况。控制错分偏倚、提高组间基线可比性的常用方法有:(1)限定暴露组与对照组的主要特征;(2)基于暴露人群的基线特征,从数据库中筛选可匹配的对照。
6.研究结局评价

开展观察性研究时要尽量选择客观存在的终点指标,如患者死亡等。目标结局的发生时间与干预实施之间的间隔时间要足够长,如果间隔时间过短,则结局可能与干预无关。还应注意甄别目标结局是疾病本身进展所致还是干预所致。
7.伦理学考量

研究设计要充分考虑伦理学要求,医学伦理一方面要明确研究设计是否能解决科学问题,另一方面还需确保数据收集范围合理,避免出现超出研究目的的数据采集。
(1)知情同意:研究实施前均应获取患者的知情同意。在知情同意书中,应对研究内容做出完整通俗的解释,并确保患者是自愿参与,应明确解释如何使用研究产生的数据,向患者充分解释可能的风险,清晰说明是否为患者购买了医疗保险,患者的知情权是否得到充分保障。由于回顾性研究是基于已有数据,不涉及对患者的干预,该类研究可向伦理委员会申请豁免患者知情同意,但研究方案仍需经伦理审查机构审查并获得书面批准。
(2)研究者利益冲突:伦理审查应关注研究者的利益冲突,确保研究者和临床医师不能通过开展研究获取不合理的收入,同时申办方不能通过实施研究间接推广产品。
(3)研究注册与发表:观察性研究是以自愿为原则,没有研究注册的强制要求,但仍建议开展研究前进行注册。此外,为了保证患者权益,无论最终研究结果如何,研究结束后均应如实公开和发表。
五、真实世界研究质量控制标准

建立质量控制标准可以保障真实世界研究所有相关活动在符合质量要求的前提下实施技术和活动。质量控制需要建立完善的真实世界研究质量管理体系、标准操作流程和标准评价模式,以规范真实世界研究的实施流程,严格评价研究的合规性,充分保护患者安全及权益,并在实际工作中持续优化、完善。真实世界研究质量包括真实世界数据质量、研究设计和实施质量及实施的合规性。
(一)数据质量控制

1.基本原则

(1)准确性:数据源核查确认是保证研究数据真实完整的必要措施之一,真实世界研究涉及到大规模的数据,可充分利用系统实时自动逻辑核查来加强质控,降低人工质控成本。对于关键字段,可进行100%原始数据核查,其他字段可根据实际情况降低核查率。
(2)代表性:尽管真实世界研究的样本更接近医疗实践,但并不意味其具有良好的样本代表性。应在采集数据前制定详细的研究设计方案,选择适合的人群和抽样框架,确认关键字段可获取。
(3)一致性:对于数据的采集、提取、转化和录入,应建立标准的流程和模式,如结构化、编码化等,用以确保产生真实世界证据的数据与源数据的一致性。
(4)完整性:真实世界研究数据存在不同程度的缺失,对于缺失的内容应详尽描述。为保障其完整性,应制定完善的数据质量管理计划来判断该数据是否可产生真实世界证据。
(5)标准性:数据的标准化是保障数据质量的基础和关键环节,能够更快的将非结构化数据整合为高质量结构化数据,实现数据的互通共享和交流。数据标准化需基于标准化设计与实施、科学的分类体系,如数据或信息的交换可参照临床数据交换标准协会标准、HL7标准等,医学术语及代码标准可参照国际疾病分类编码、MedDRA标准术语集等。
(6)可溯源性:从第1次数据录入起,每次更改、删除或增加都必须保留在临床研究数据库系统中。稽查轨迹应设立计算机保护,不允许任何人为修改和编辑。采集的真实世界数据转化为计算机系统或信息技术处理的标准化数据,保证能够对真实数据源进行溯源核查。
2.数据质量控制要点

数据安全保护范围应涵盖数据收集、数据提取、数据传输、数据存储、数据交换、数据销毁等全生命周期[2,22]。建立完善的人员管理制度,同时需建立从数据收集到数据递交各环节的风险管理流程。从真实世界数据的创建、存储、传输、应用等多个方面探究可能存在的质量风险点,是真实世界数据质控的关键节点。
(1)源数据:源数据的使用应符合伦理审查法规要求及相关数据安全与隐私保护要求。保证源数据质量,关键问题在于数据随机缺失的程度,随机缺失会减低准确性,而非随机缺失会导致结果偏倚。临床病历作为最常见的数据源,不仅要符合病历书写规范、医院质控要求等,还应提高病历质控标准以满足科研需要,减少数据源本身的缺失和偏差。影响源数据质量的因素包括数据的收集方式、调查员培训程度及能力、外部因素(如对数据完整性的重视程度)、数据审核周期等。
(2)数据清洗:数据清洗应在保证数据真实的情况下进行,真实世界研究的数据大多来自于多个数据集,分析前需将不同数据集通过标准模型和统一结构式进行关联及整合,去除重复数据与不相关数据,对异常、缺失数据进行删除或补充,最后基于实际情况按照标准进行逻辑核查。
(3)数据转化:数据经过链接、提取和转化,最终纳入数据仓库。将数据转化为适用的标准数据时可能会遇到挑战,包括术语和概念不一致、编码错误、研究期间数据收集或编码规范改变,信息缺失(如所需信息并非医疗业务流程的必要采集项)等。应通过制定标准的数据格式、规范术语、制定标准的编码及适合的统计方法来控制数据转化的质量。
(4)数据递交:经过数据标准转换后递交数据,应在安全网络环境中进行,并有相应的计算机加密模式,同时建立递交的标准操作流程,从申请到实施应由专人负责审批及监督。
(5)数据分析:对原始数据库及转化后数据库进行数据分析,将真实世界数据转化为真实世界证据,大多需要倚仗多因素分析方法的深度支持。回归分析模型是真实世界研究的常用工具,如探讨肿瘤预后的影响因素,评价某种治疗方式的临床疗效,控制研究的混杂因素,构建分类、预测预后及疗效的模型等。
(二)设计和实施的质量控制

真实世界研究中存在诸多混杂因素,控制混杂因素的干扰是真实世界研究设计中的核心问题之一。在偏倚的控制上主要涉及选择人群,获知暴露与结局,以及控制混杂。同时,应设计科学规范的研究方案、实施流程和统计分析方法。
1.偏倚的控制

(1)选择偏倚的控制:在人群的选择、框架的制定和研究实施过程中,往往容易出现选择偏倚。真实世界研究中常见的选择偏倚包括奈曼偏倚、伯克森偏倚、病程长度偏倚、竞争风险和非死亡时间偏倚[23]。不同真实世界研究易出现的偏倚类型也不尽相同,如肿瘤早期患者生存期较长,而晚期患者生存期较短,一同分析将出现病程长度偏倚,应在研究中具体规定,将不同分期的肿瘤予以区分;涉及入院率时,应尽可能将不同地域、医院级别、医保类型等数据纳入进来。可绘制研究流程图来减少潜在选择偏倚,包括纳入人群的选择、样本量计算、数据来源、标准化样本量、结构化的入排标准、最终纳入分析的样本量。
(2)信息偏倚的控制:数据收集过程中产生的系统误差都可能导致信息偏倚,如回忆偏倚、报告偏倚、诱导偏倚等。真实世界研究常见的信息偏倚包括药物暴露错分和结局错分[23]。真实世界研究中药物的暴露信息多是通过电子数据库识别提取,信息错误或信息可及性限制将导致信息偏倚的发生。肿瘤真实世界研究会涉及客观缓解率等作为研究结局,在研究设计方面应对暴露和结局有严格、客观、规范的定义,力求指标定量化。还可对人群分类,采用标准诊断编码,联合多种方式整合资源提高暴露识别的准确性。此外,为避免医师诊断水平、调查对象的记忆程度、调查员的业务能力等原因导致的信息偏倚,可采用重复提问、严格培训、定期检查等方式,使用统计学方法评估测量误差并校正。对于异常值,可预先制定敏感性分析方案。
(3)混杂因素的控制:控制混杂因素可以从研究设计和统计分析上着手,如采用群随机设计可有效控制组间沾染,采用协变量模型和分层分析方法可在事后进行混杂的调整。对于复杂的研究,在采集疾病、结局相关数据时,注意选择更高级、更适配的统计分析方法。
2.研究实施中人员的控制

人是医疗信息采集、分析、处理、存储过程中最活跃的因素。为保障真实世界研究合理开展,应制定质控分级要求、质控管理计划、质量评价程序和质控培训规范,妥善配置人员,满足真实世界研究质量管理规范相关要求,明确自身职责。与真实世界研究质量控制相关的人员包括申办者、研究者、监查员、临床协调员、数据管理员以及合同研究组织等[24]。研究者是真实世界研究质量的直接责任人,与研究者的专业性和医疗水平密不可分。相比于传统的随机对照研究,真实世界研究中数据管理员的角色更加重要,应熟悉真实世界数据相关法规、精通数据管理系统的使用、配有完整的技术解决方案以支持不同数据源的采集,按照研究项目的要求参与设计病例报告表、建立数据库、对数据进行标准化管理、建立和测试逻辑检验程序。应对真实世界研究相关人员进行智能化、平台化、专业化、精细化管理。
(三)法规制度

美国FDA先后发布了《使用真实世界证据支持医疗器械的监管决策》、《真实世界证据计划的框架》和《使用真实世界数据和真实世界证据向FDA递交药品和生物制品资料的行业指南》等法规政策或行业指南,为真实世界数据在药械研发中的实际应用提供指引,并结合实践操作中发现的问题不断更新,适应发展[25]。美国发布的《健康保险隐私及责任法案》以及欧盟颁布的《通用数据保护条例》等法律法规,适用于真实世界数据在应用过程中涉及的数据安全及个人隐私保护[26]。
我国国家药品监督管理局先后发布了《真实世界证据支持药物研发与审评的指导原则(试行)》、《真实世界数据用于医疗器械临床评价技术指导原则(试行)》及《用于产生真实世界证据的真实世界数据指导原则(试行)》等相关指导原则,为业界和监管部门利用真实世界数据提供了参考意见[27]。同时,应当遵循涉及药品、人类遗传、人口信息等的相关法律法规来保障数据安全及个人隐私。
六、真实世界研究证据级别

1.证据级别来源:

循证医学是基于客观临床证据进行医疗决策的科学,提倡医师结合临床实践经验与当前推荐的客观临床证据,综合考虑患者的意愿和医疗环境,做出最优的诊疗决策。为了区分不同临床证据的科学性和可靠性,相关医疗组织和机构尝试对医学证据进行分级,目前使用较广泛的是国际统一的证据质量分级和推荐强度标准GRADE标准[28]以及金字塔证据分级,即系统评价和Meta分析、RCT为最高级别的临床证据,而队列研究、病例对照研究、病例报告等则作为次一等的临床证据。过去几十年,RCT一直被认为是在药物及医疗器械研发过程中评价安全性和有效性的金标准,但也存在RCT研究结论在真实临床实践环境中的外推难以达到预期、实施难度高、成本高昂等问题。
2.真实世界证据质量:

2016年,美国国会通过了《21世纪治愈法案》,将真实世界证据定义为"从RCT以外的其他来源获取的关于用药方式、药物潜在获益或者安全性方面的数据",并明确规定真实世界证据在药物评审中的两个用途,即用来支持已获批的药物进行扩大其适应症的批准,和用来支持或满足已获批的临床试验的相关需求[29]。也就是说,真实世界证据在药物评审中可作为传统临床试验的证据补充,传统临床试验和相关的试验证据用于新药的研发和评审,真实世界研究则用于新药上市后的有效性和安全性研究。同年,美国FDA在《新英格兰医学杂志》上指出,真实世界证据与临床试验证据的根本区别在于获取数据的场景不一样,二者间的区别不应该建立在是否存在有计划的干预实验以及是否采用了随机化试验设计这两种情况之上[30]。目前已发布的相关政策、指南、指导原则等文件也表明,目前国内外对于真实世界证据在药物研发和医疗器械评价中的作用均持认可态度。
3.真实世界证据分级:

考虑到真实世界证据与传统临床试验的不同侧重点和设计方式,及其在药械审批中对传统临床试验的支持和补充,把真实世界证据的证据级别简单划分在金字塔证据分级中的某个或某几个级别并不适合。因此,对真实世界证据的分级应当采用适合其设计特点的全新评估系统,依据研究设计与研究问题的相关性、研究质量控制程度及研究数据的可靠性进行评价。借鉴金字塔证据分级模式,结合真实世界研究的不同设计,将常见的真实世界研究类型按照证据等级的高低进行排序(图1)。同时,仅靠研究设计对证据等级进行比较是不全面的,对证据质量的评估应建立在对研究数据、研究设计和证据提取方式的相关性和可靠性的考量之上(表2)。

831ab3c43ac27f169e298a6282f027db.png


89e91ae3f58fce186a122868e3feb09f.png

七、真实世界研究的数据安全与隐私标准

真实世界研究范围广泛,时间跨度大,数据多源,涉及个人基本信息、人口健康信息、健康医疗大数据、人类遗传资源信息等不同属性的数据。在数据的收集、存储、使用、加工、传输、提供、公开等过程中,数据安全与隐私保护是确保研究顺利进行的重要环节。
(一)数据安全

数据安全是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。
目前,《数据安全法》、《网络安全法》、《个人信息保护法》、《人口健康信息管理办法(试行)》、《信息安全技术数据出境安全评估指南(征求意见稿)》、《国家健康医疗大数据标准、安全和服务管理办法(试行)》等多部法律法规及管理办法已对真实世界数据中的个人信息保护、人口健康管理、健康医疗大数据等方面提出监管办法。
《数据安全法》自2021年9月1日起施行,是我国首部有关数据安全的法律,其制定目的在于规范数据处理活动,保障数据安全,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益。《数据安全法》推进数据开发利用技术和数据安全标准体系建设,建立数据分类分级保护制度,建立集中统一、高效权威的数据安全风险评估、报告、信息共享、监测预警机制,建立数据安全应急处置机制及数据安全审查制度。《数据安全法》提示收集真实世界数据前,应明确待收集数据的分级分类标准,根据不同的分级分类结果采取不同的管理措施及安全审查制度。
应根据《网络安全法》及《网络数据安全管理条例(征求意见稿)》建立数据分类分级保护制度,按照数据对国家安全、公共利益及个人、组织合法权益的影响和重要程度,将数据分为一般数据、重要数据、核心数据,不同级别的数据采取不同的保护措施。其中,医疗保健机构记录的个人电子病历、健康档案、各类诊疗数据,在药品不良反应报告和监测过程中获取的个人隐私、患者和报告者信息,涉及国家战略安全的药品在药品审批过程中提交的药品实验数据等均属于重要的真实世界数据。建立完善的数据安全管理制度和技术保护机制,要求数据处理者对数据安全负责,履行数据安全保护义务,接受政府和社会监督,承担社会责任。
(二)隐私标准

1.医院信息系统数据:

患者基本特征、临床病理特征、诊断、治疗方案及疗效评价、实验室检查、影像学检查、安全性和临床结局等数据多为既往临床诊疗中积累的门诊、住院信息,在采集之初对于其研究应用目的尚不明确[31],研究者必须经过编码去标识化处理,如匿名算法、访问权限模型、隐私分离算法等,才能提供给第三方使用[32]。患者随访数据存储于医院随访数据系统,真实世界研究使用相关数据应遵循医疗行业的伦理规范和信息安全等级保护规范,提取研究所需最小数据集[15,33]。
2.网络数据:

应加密处理临床科研信息共享系统及其数据运行系统,确保网络安全。尽可能分设不同物理阶段,提高数据安全性级别,对采集系统、基本数据库和运算系统等进行分段隔离,分别基于不同的服务器运行。对患者的隐私信息,尤其是与诊疗行为无直接关系的隐私信息,应进行加密存储,在数据传输及应用中进行隐藏,避免追溯到个人[33]。
3.知情同意:

数据收集和使用须通过伦理委员会的审查批准,严格执行知情同意原则,符合数据安全保护、个人隐私保护、人类遗传资源管理相关法律法规的要求,充分保护患者合法权益。
参与本共识制定的专家(按姓氏汉语拼音字母排序) 陈锦飞(温州医科大学附属第一医院肿瘤中心)、陈萌(国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院肿瘤大数据中心)、杜春霞(国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院内科)、杜君(国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院院办公室)、惠周光(国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院特需医疗部)、冀寿健(解放军联勤保障部队九六〇医院消化科)、李健(北京大学肿瘤医院消化肿瘤内科)、李琦(上海交通大学医学院附属第一人民医院肿瘤科)、兰世杰(吉林大学第一医院肿瘤中心)、刘天舒(复旦大学附属中山医院肿瘤内科)、李文庆(北京大学肿瘤医院流行病学研究室)、卢瑗瑗(空军军医大学西京医院消化内科)、李智(中国医科大学附属第一医院肿瘤内科)、孟睿(华中科技大学同济医学院附属协和医院肿瘤中心)、马悦(哈尔滨医科大学附属肿瘤医院消化内科)、任贺(青岛大学附属医院消化肿瘤诊治中心)、任伟(南京大学医学院附属鼓楼医院肿瘤中心)、孙安龙(重庆大学附属肿瘤医院)、陕飞(北京大学肿瘤医院胃肠肿瘤中心一病区)、尚磊(空军军医大学卫生统计学教研室)、孙颖(中山大学肿瘤防治中心放疗科)、王栋(南方医科大学基础医学院)、王贵玉(哈尔滨医科大学附属第二医院肿瘤中心结直肠肿瘤外科)、王嘉倍(中国科学技术大学附属第一医院肝胆外科)、王健仰(国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院放疗科)、吴开春(空军军医大学第一附属医院消化内科)、吴丽花[树兰(杭州)医院肝胆胰外科]、吴文广(上海交通大学医学院附属仁济医院胆胰外科)、徐建明(解放军总医院第五医学中心消化肿瘤科)、许剑民(复旦大学附属中山医院普通外科)、薛增福(厦门大学附属第一医院消化内科)、张纯慧(哈尔滨医科大学附属肿瘤医院消化内科)、赵海涛(北京协和医院肝脏外科)、张俊(上海交通大学医学院附属瑞金医院肿瘤内科)、张建中(无锡慧方科技有限公司生物统计和大数据业务部)、郑少江(海南医学院第一附属医院肿瘤研究所)、张涛(重庆医科大学附属第一医院肿瘤科)、郑桐森(哈尔滨医科大学附属肿瘤医院消化内科)、周洋(哈尔滨医科大学附属肿瘤医院影像中心)、张艳桥(哈尔滨医科大学附属肿瘤医院消化内科)
执笔人(按姓氏汉语拼音字母排序) 陈萌(国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院肿瘤大数据中心)、惠周光(国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院特需医疗部)、马悦(哈尔滨医科大学附属肿瘤医院消化内科)、孙颖(中山大学肿瘤防治中心放疗科)、徐建明(解放军总医院第五医学中心消化肿瘤科)、张纯慧(哈尔滨医科大学附属肿瘤医院消化内科)、郑桐森(哈尔滨医科大学附属肿瘤医院消化内科)、张艳桥(哈尔滨医科大学附属肿瘤医院消化内科)

回复

使用道具 举报

给我们建议|手机版|PIME|阳光肺科 ( 粤ICP备2020077405号-1 )

GMT+8, 2024-9-20 07:24

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表