数十年来,SAS 一直是分析和报告临床试验数据的可靠标准,也是监管机构青睐的工具,被广泛应用于申报工作流程的方方面面。然而,R 的日益普及为高级建模、自动化和数据可视化带来了新的可能性。
企业现在面临着一个复杂的问题:R 和 SAS 如何共存,同时又不影响合规性或运营效率?这不是一个简单的 "非此即彼 "的决定。这需要建立一种混合模式,既能利用 SAS 坚如磐石的合规性和 R 的灵活性,又能避免对既定流程造成不必要的干扰。
临床研究报告为何需要 SAS 和 R
临床研究报告 (CSR) 是提交监管申请的核心。它是分析、记录和向 FDA、EMA 和加拿大卫生部等机构传达试验结果的方式。从历史上看,SAS 因其可靠性、稳定性和与监管机构期望的高度一致而占据主导地位。
但是,随着临床数据的复杂性不断增加,团队开始转向 R 语言:
- 先进的统计建模和机器学习能力、
- 丰富的可视化软件包(如 ggplot2 和 Shiny),以及
- 通过开源灵活性实现成本效益。
然而,挑战不仅仅在于选择最好的工具。如何将 R 集成到几乎完全围绕 SAS 构建的工作流程中,同时又不影响可重复性、可追溯性或合规性,这才是挑战所在。事关重大,生物统计团队该如何找出最佳的前进道路?
两个世界,两个起点
并非每个组织都以同样的方式面临这一转变。走向平衡的多语言分析环境在很大程度上取决于传统的基础设施、员工的专业知识和监管历史。
类型 1:成熟的、重 SAS 的组织
大型制药公司和 CRO 通常拥有数十年的 SAS 资产、全局库、治疗领域模板、宏和 SOP,这些都与机构的期望紧密契合。他们的生物统计团队对 SAS 非常精通,从数据集创建到输出验证的每个流程都围绕着 SAS 进行。
对于这些组织而言,引入 R 需要慎重考虑。目标不是完全取代,而是逐步共存,允许 R 在能增加价值的地方使用(如探索性建模或可视化),同时保留 SAS 作为可提交输出结果的权威系统。
类型 2:更新、更敏捷的组织
新兴生物技术公司或早期开发人员在开始时往往受到较少的限制。由于历史 SAS 库或传统工作流程有限,他们可以更自由地采用 R。这种灵活性使他们能够快速创新,但也意味着他们必须设计新的流程,以保持与仍然依赖 SAS 的监管机构和外部合作伙伴的互操作性。
在这两种情况下,面临的挑战都是平衡:既要发挥 R 的创造力,又要保持 SAS 提供的信任和合规基础。
SAS 与 R 集成的实用途径
从单一语言环境过渡到多语言环境并非放之四海而皆准。在本文中,我们概述了几种实用方法,每种方法都有自己的利弊权衡:
- 用 R 完全取代 SAS- 雄心勃勃,但风险很大。这涉及到重写库、重新培训员工以及从头开始验证每个流程。很少有机构认为这是可行的第一步。
- 在研究层面实现语言共存--保留 SAS 作为全球和治疗标准,同时在研究中使用 R 进行高级分析和可视化。
- 有选择地使用 R 来完成专门任务--保留 SAS 来处理核心数据和报告,但在需要独特功能时,允许 R 对其进行补充。
- 各层次完全共存--每种语言各司其职:SAS 用于大规模数据处理,R 语言用于复杂建模、图形和创新。
大多数组织从方案 2 或 3 开始,在低风险领域引入 R,并随着信心的增强而逐步扩大。
基础设施势在必行:现代 SCE
一个成功的共存模式取决于一个现代化的统计计算环境(SCE),一个能无缝支持多种语言的环境。
有效的能力培养计划必须提供
- 统一的数据访问和共享控制
- 程序和产出的端到端可追溯性
- 版本控制和依赖性管理
- 自动执行和资源分配
- 所有语言的可重复性和审计就绪性
简而言之,它必须允许 SAS、R、Python 和未来的工具并肩运行,而不会出现支离破碎或冗余的验证周期。这意味着一致的用户体验、共享的安全协议和集中管理。
如果没有现代化的 SCE,混合编程环境很快就会变得低效或不合规,从而失去采用 R 的初衷。如果您想更新您的 SCE,请联系我们。
人为因素:培训、文化与合作
仅靠技术无法实现转型。最大的障碍往往在于人。许多生物统计和编程团队的整个职业生涯都在掌握 SAS。由于 R 的开源生态系统、不同的语法和软件包管理,它的引入可能会引发抵触情绪。为了克服这一问题,领导层必须在培训、指导和逐步采用方面进行投资。与每个组织一样,有效的变革管理可以改变团队在变革中的困境。
实用的方法可能包括
- 内部研讨会和同行学习计划、
- 跨职能编码会议,比较 R 和 SAS 的输出结果、
- 鼓励创新项目,展示 R 在可视化或自动化方面的价值。
通过强调共存而非竞争,团队可以将 R 视为一种增强而非替代。
管理合规性和可重复性
无论使用哪种编程语言,监管机构都希望得到一致、可追溯和可重现的输出结果。采用 R 语言的关键问题之一是确保每项分析、数据集和图形都是完全可审计的。
为此,各组织必须
- 为代码验证和审查建立透明的管理机制
- 使用 R 的受控软件包库
- 记录脚本、输入和输出的每个版本
- 确保 R 生成的结果可酌情与 SAS 进行验证
EMA 的《临床试验计算机化系统和电子数据指南》(2023 年)强调的正是这些原则:可重复性、可追溯性和系统控制。任何混合方法都应符合这些期望,以保持监管机构的信心。
为什么混合动力是合理的
R 和 SAS 为临床研究报告带来了各自独特的优势。SAS 提供可靠性、标准化流程和成熟的合规性框架。R 提供灵活性、尖端统计技术和成本节约。
混合模式兼顾两者,使组织能够
- 加快分析时间表
- 通过自动化提高可重复性
- 在不违反合规性的前提下扩展统计功能
- 通过面向未来的分析基础设施增强复原力
过渡并不一定是破坏性的。通过小规模起步、选择合适的 SCE 和培养学习文化,企业可以创建一个融合两种工具优势的一流环境。
结论
数十年来,SAS 一直为生命科学行业最关键的提交工作提供支持。然而,R 正在重新定义临床分析的可能性。问题不在于哪种语言会胜出,而在于企业如何利用这两种语言建立更具创新性、灵活性和合规性的分析生态系统。
临床研究报告的未来不在于替代, 而在于团队之间、系统之间和语言之间的协作。成功的公司将是那些有目标、有远见、有适当技术基础的公司。如果您对 SAS 和 R 如何在贵公司共存感到好奇,请联系我们。
别忘了在 LinkedIn 上关注我们!
参考资料
- 欧洲药品管理局。临床试验计算机化系统和电子数据指南》。EMA, 2023,https://www.ema.europa.eu/en/documents/regulatory-procedural-guideline/guideline-computerised-systems-electronic-data-clinical-trials_en.pdf
- 美国食品和药物管理局。生产和质量系统软件的计算机软件保证:工业和食品药品管理局工作人员指南草案》。FDA, 2022,https://www.fda.gov/regulatory-information/search-fda-guidance-documents/computer-software-assurance-production-and-quality-system-software

