Healthbox报告:利用人工智能进行医疗大数据变革(3)
这触及了人类领域经验与人工智能交叉的根源,以及人类大脑处理的“大影响”,而机器正在检测的小影响因素可能会忽略这些“大影响”。
2 匿名性与特异性不一致
从理论上讲,利用大数据力量的过程中,应该允许通过匿名化个人数据点来源,来保护个人身份和健康信息的安全。现实世界中的大数据的价值在于,它可以被分析,从而为指导个体患者的个性化精准医疗决策提供洞见。大数据的广度包含了元数据元素,这些元数据元素有潜力实现个人身份的去匿名化。
最终,在开放共享大数据所产生的价值与重新识别数据源的有限风险(可能侵犯患者隐私)之间,存在一种平衡。人们必须采取适当的预防措施进行结构分析,以避免对患者身份进行反向工程(Reverse Engineering或Back Engineering)。
然而,值得注意的是,共享开放数据的好处超过了对个人不利因素的重新识别。社会将不得不在共享和开放获取数据的好处,以及通过对分割的数据进行反向工程来重新识别个人的有限但真实的可能性之间,进行道德权衡。解决这些问题需要的是人类的智慧,而不是人工智能。
3 创建可证明性
我们有理由假设,对患者及其病情进行更有力的高维描述,将有助于更好地理解驱动特定疾病过程的环境。然而,以这些数据和分析为指导的有效干预措施能否降低成本、提高满意度并改善消费者体验,还有待证明。
因此,我们必须将数据、人工智能获取的知识和知情的临床决策集成到临床流程和工作流中,并将其紧密地交织在一起,以推动患者护理的潜在效益。我们还需要进行适当的结构化临床试验,以证明数据驱动的护理过程带来的增量效益足以证明这些决策所产生的任何成本都是合理的。
4 相关性并不意味着因果关系
定义因果关系对于开始将数据中观察到的模式转换为知情干预至关重要,在知情干预中,假定的因果变量可以被改变,以实现拟议的结果。在这个过程中,最重要的是确保被分析的数据不会遗漏可能与测量结果有因果关系的混杂因素。领域专家和人类直觉总是需要与人工智能协同工作,以确认没有隐藏的混杂因素。
另一方面,高维数据提供了识别盲点的机会,而这些盲点是人类大脑没有考虑到的,它们可能与人类领域专业知识中固有的偏见,以及启发式假设导致的结果有因果关系。机器的使用可以帮助人类揭示这些未发现或未预料到的变量。
在智能软件能够处理大数据集并被编程成像人类一样思考之前,构造良好的随机对照试验,在过去和现在都被当做用来避免隐藏混杂因素的重要方法。然而,现实世界中的大数据并不总是被划分为干预组和对照组,而且往往存在巨大的差距。随机对照试验或队列研究并不总能解决谜题中缺失的那一块。
人工智能和机器学习现在可以提供统计工具来确定测量值,以填补数据空白,并综合构建“控件”,以便与真实世界的经验进行比较。这些工具提供了一条前进的道路,以便在没有干预的情况下,将来自给定干预的观察结果与预期结果进行比较,这样我们就可以模拟允许关于确定性和因果关系的假设的测试范式。
应用程序:大数据的现实应用
人工智能在研究中的潜在应用
GNS Healthcare的董事长、首席执行官兼联合创始人Colin Hill设想了一个因果机器学习过程,该过程首先通过检查高维数据中的关系,推断出潜在的因果机制。使用这些信息,“反向工程”就可以在模拟场景环境中测试可能的因果关系。这被称为“正向模拟”,它能使研究人员检验因果假设的有效性,而这些假设在现实世界中是不容易检验的。
在药物发现方面, Relay Therapeutics的首席科学官兼联合创始人Mark Murcko博士提出了一种理论,即如何利用药物到靶点相互作用的正向模拟来进行潜在药物的内硅筛选,以获得针对生物验证靶点的有效性。该模拟基于数据驱动的对药物使用时蛋白质运动和功能变化的理解。
这些理解因果关系的方法结合了人类领域的专业知识和应用于大量数据集的人工智能,以预测筛选的化合物与疾病过程的生物靶点之间的治疗相互作用。
大数据的现实应用