R 和 SAS 如何在临床研究报告中共存

在本博客中,我们将讨论生物统计专业人员在创建临床研究报告时如何使用 SAS 和 R。

数十年来,SAS 一直是分析和报告临床试验数据的可靠标准,也是监管机构青睐的工具,被广泛应用于申报工作流程的方方面面。然而,R 的日益普及为高级建模、自动化和数据可视化带来了新的可能性。

企业现在面临着一个复杂的问题:R 和 SAS 如何共存,同时又不影响合规性或运营效率?这不是一个简单的 "非此即彼 "的决定。这需要建立一种混合模式,既能利用 SAS 坚如磐石的合规性和 R 的灵活性,又能避免对既定流程造成不必要的干扰。

临床研究报告为何需要 SAS 和 R

临床研究报告 (CSR) 是提交监管申请的核心。它是分析、记录和向 FDA、EMA 和加拿大卫生部等机构传达试验结果的方式。从历史上看,SAS 因其可靠性、稳定性和与监管机构期望的高度一致而占据主导地位。

但是,随着临床数据的复杂性不断增加,团队开始转向 R 语言:

  • 先进的统计建模和机器学习能力、
  • 丰富的可视化软件包(如 ggplot2 和 Shiny),以及
  • 通过开源灵活性实现成本效益

然而,挑战不仅仅在于选择最好的工具。如何将 R 集成到几乎完全围绕 SAS 构建的工作流程中,同时又不影响可重复性、可追溯性或合规性,这才是挑战所在。事关重大,生物统计团队该如何找出最佳的前进道路?

两个世界,两个起点

并非每个组织都以同样的方式面临这一转变。走向平衡的多语言分析环境在很大程度上取决于传统的基础设施、员工的专业知识和监管历史。

类型 1:成熟的、重 SAS 的组织

大型制药公司和 CRO 通常拥有数十年的 SAS 资产、全局库、治疗领域模板、宏和 SOP,这些都与机构的期望紧密契合。他们的生物统计团队对 SAS 非常精通,从数据集创建到输出验证的每个流程都围绕着 SAS 进行。

对于这些组织而言,引入 R 需要慎重考虑。目标不是完全取代,而是逐步共存,允许 R 在能增加价值的地方使用(如探索性建模或可视化),同时保留 SAS 作为可提交输出结果的权威系统。

类型 2:更新、更敏捷的组织

新兴生物技术公司或早期开发人员在开始时往往受到较少的限制。由于历史 SAS 库或传统工作流程有限,他们可以更自由地采用 R。这种灵活性使他们能够快速创新,但也意味着他们必须设计新的流程,以保持与仍然依赖 SAS 的监管机构和外部合作伙伴的互操作性。

在这两种情况下,面临的挑战都是平衡:既要发挥 R 的创造力,又要保持 SAS 提供的信任和合规基础。

SAS 与 R 集成的实用途径

从单一语言环境过渡到多语言环境并非放之四海而皆准。在本文中,我们概述了几种实用方法,每种方法都有自己的利弊权衡:

  1. 用 R 完全取代 SAS- 雄心勃勃,但风险很大。这涉及到重写库、重新培训员工以及从头开始验证每个流程。很少有机构认为这是可行的第一步。
  2. 在研究层面实现语言共存--保留 SAS 作为全球和治疗标准,同时在研究中使用 R 进行高级分析和可视化。
  3. 有选择地使用 R 来完成专门任务--保留 SAS 来处理核心数据和报告,但在需要独特功能时,允许 R 对其进行补充。
  4. 各层次完全共存--每种语言各司其职:SAS 用于大规模数据处理,R 语言用于复杂建模、图形和创新。

大多数组织从方案 2 或 3 开始,在低风险领域引入 R,并随着信心的增强而逐步扩大。

基础设施势在必行:现代 SCE

一个成功的共存模式取决于一个现代化的统计计算环境(SCE),一个能无缝支持多种语言的环境。

有效的能力培养计划必须提供

  • 统一的数据访问和共享控制
  • 程序和产出的端到端可追溯性
  • 版本控制和依赖性管理
  • 自动执行和资源分配
  • 所有语言的可重复性和审计就绪性

简而言之,它必须允许 SAS、R、Python 和未来的工具并肩运行,而不会出现支离破碎或冗余的验证周期。这意味着一致的用户体验、共享的安全协议和集中管理。

如果没有现代化的 SCE,混合编程环境很快就会变得低效或不合规,从而失去采用 R 的初衷。如果您想更新您的 SCE,请联系我们。

人为因素:培训、文化与合作

仅靠技术无法实现转型。最大的障碍往往在于人。许多生物统计和编程团队的整个职业生涯都在掌握 SAS。由于 R 的开源生态系统、不同的语法和软件包管理,它的引入可能会引发抵触情绪。为了克服这一问题,领导层必须在培训、指导和逐步采用方面进行投资。与每个组织一样,有效的变革管理可以改变团队在变革中的困境。

实用的方法可能包括

  • 内部研讨会和同行学习计划、
  • 跨职能编码会议,比较 R 和 SAS 的输出结果、
  • 鼓励创新项目,展示 R 在可视化或自动化方面的价值。

通过强调共存而非竞争,团队可以将 R 视为一种增强而非替代。

管理合规性和可重复性

无论使用哪种编程语言,监管机构都希望得到一致、可追溯和可重现的输出结果。采用 R 语言的关键问题之一是确保每项分析、数据集和图形都是完全可审计的。

为此,各组织必须

  • 为代码验证和审查建立透明的管理机制
  • 使用 R 的受控软件包库
  • 记录脚本、输入和输出的每个版本
  • 确保 R 生成的结果可酌情与 SAS 进行验证

EMA 的《临床试验计算机化系统和电子数据指南》(2023 年)强调的正是这些原则:可重复性、可追溯性和系统控制。任何混合方法都应符合这些期望,以保持监管机构的信心。

为什么混合动力是合理的

R 和 SAS 为临床研究报告带来了各自独特的优势。SAS 提供可靠性、标准化流程和成熟的合规性框架。R 提供灵活性、尖端统计技术和成本节约。

混合模式兼顾两者,使组织能够

  • 加快分析时间表
  • 通过自动化提高可重复性
  • 在不违反合规性的前提下扩展统计功能
  • 通过面向未来的分析基础设施增强复原力

过渡并不一定是破坏性的。通过小规模起步、选择合适的 SCE 和培养学习文化,企业可以创建一个融合两种工具优势的一流环境。

结论

数十年来,SAS 一直为生命科学行业最关键的提交工作提供支持。然而,R 正在重新定义临床分析的可能性。问题不在于哪种语言会胜出,而在于企业如何利用这两种语言建立更具创新性、灵活性和合规性的分析生态系统。

临床研究报告的未来不在于替代而在于团队之间、系统之间和语言之间的协作。成功的公司将是那些有目标、有远见、有适当技术基础的公司。如果您对 SAS 和 R 如何在贵公司共存感到好奇,请联系我们。

别忘了在 LinkedIn 上关注我们

参考资料

Instem 团队

Instem 是一家领先的 SaaS 平台供应商,产品涵盖发现、研究管理、监管提交和临床试验分析。Instem 应用程序被全球客户广泛使用,满足了生命科学和医疗保健机构对数据驱动决策的快速增长需求,从而生产出更安全、更有效的产品。

分享本文

了解最新信息

将专家提示、行业新闻和新鲜内容发送到您的收件箱。

立即申请演示

不确定选择哪种产品?从表格中选择 "其他",并在信息栏中告诉我们您的研究目的,我们的专家将为您推荐解决方案。