专注于数字技术的商业观察者
登录×
公司
2025-03-27

AI+医药,新药研发如何跑出加速度?

时间: 2025-03-27 编辑:

自春节以来,DeepSeek 这一生成式 AI 工具成为了许多行业关注的焦点,不少企业纷纷表态要全面拥抱这一新...

自春节以来,DeepSeek 这一生成式 AI 工具成为了许多行业关注的焦点,不少企业纷纷表态要全面拥抱这一新技术。对于医药行业来说,DeepSeek 是否能够融入日常工作,甚至帮助解决国内创新药研发的困境,成为了业内人士热议的话题。

“医药领域需要训练和学习化学、生物语言,并掌握医药行业特有的模态数据。只有专门针对医药行业训练的垂类大模型,才能真正适用于这一领域。”望石智慧创始人&CEO 周杰龙强调,仅依靠文本生成的大模型无法深入理解医药语言,难以解决行业深层次问题。

望石智慧成立于 2018 年,是一家使用人工智能技术驱动新药研发的科技公司,旨在用技术与创新力为医药行业带来新视角,打造世界领先的小分子创新药研发平台。过去六年,公司在北京、上海、沈阳和旧金山建立了团队,已成功推进多个 First-in-Class(FIC)和 Best-in-Class(BIC)管线进入试验阶段,其中一个自研 BIC 研发管线近期更是获得中美 IND 批件。然而,AI 赋能新药研发并非易事,行业仍面临诸多挑战。

首先是技术复杂性与研发效率的平衡。传统药物研发周期长(通常 10 年以上)、成本高(单个药物开发成本超10 亿美元),且临床失败率高(超过 90%)。其次,跨学科协作和资源整合也是难题。新药研发涉及计算生物学、化学、临床医学等多个学科,而传统制药企业与科技公司的合作壁垒尚未完全打破。此外,安全合规问题也是药企在全球市场拓展的核心考量。

周杰龙形象地将医药行业的挑战比喻为“水面之上”和“水面之下”:水面之上是研发挑战的问题,创新难度大,怎么突破创新的过程,避免专利撞车;水面之下,医药行业作为数据密集型产业,很多药企有非常多数据,但今天这些数据沉积在很多数剧仓里,没有实现数据价值最大化。

在周杰龙看来,相对于其他行业,医药领域在数字化层面可能更偏落后。不仅是因为业务每个环节的数据记录可能未必规范,很多的数据之间没有打通,或由于保密性原因无法办法共享,导致数据浪费,知识无法沉淀。对于工具层面,虽然目前已经有非常多的工具,但这些工具就好像散布在系统里面的一个个点,没有形成从设计目标出发,构建一条系统化的工具链。

在这一趋势下,望石智慧提出了 Model+X 的策略,通过Model+X可以把沉积的数据和认知充分使用起来,用户可以基于望石智慧的模型进行分子的设计;也可以通过检索增强、微调方式利用历史项目数据对这个模型进行再次的训练,最终通过三层合理性的评估,给出符合药化人员预期的分子,最终这些交互产生的认知和信息可以再回到新的模型上,形成完整迭代的循环。

“过去药企使用的计算化学工具较为零散,更像是一个工具箱,用户需要随时挑选合适的工具,而不是在系统化的平台上进行有序研究。所以我们还希望通过 Model+X 的方式,结合自身开发的工具,以及药企内部积累的资源和第三方合作伙伴的技术,共同打造完整的研发工具链。”

周杰龙认为,这样两个维度可以构建从下而上的基础平台,包括从云基础设施出发到数据的治理、模型的训练、工业的SaaS,以分子生成为核心构造整个工具链,同时也可以结合药企特定的需求,做些不同的定制化垂类模型,把企业封存的数据充分使用起来,通过+X工具化、平台化的过程,提供协同的效率,再通过+X的数字化,把已有的数据充分使用起来,真正打造行业认知的护城河,提高竞争力。

值得一提的是,望石智慧与亚马逊云科技的合作,进一步推动了这一模式的落地。基于亚马逊云科技的数据存储与云算力服务,望石智慧搭建了能够精准的生成与靶点口袋结构契合的分子/分子骨架的核心平台——多模态3D分子生成大模型。该模型以 GPT/Transformer 框架为基础,融合了几何深度学习等算法。依托该模型,多个医药项目已收获显著成果,其中部分项目更是进入了临床阶段。模型还可作为基座模型,合作伙伴能够在此基础上,充分整合自身拥有的数据、认知以及模型等要素,进行定制化迭代。

例如,作为交互式无服务器查询服务,Amazon Athena使用标准 SQL 语言分析Amazon Simple Storage Service (Amazon S3) 中的数据,使得望石智慧无需准备运行环境和移动数据,即可在数秒内获取分析结果。同时,无服务器数据集成服务Amazon Glue能够帮助望石智慧发现、准备和集成所有任意规模的数据,实现数据治理的关键一步。

另外,望石智慧通过使用易于管理的关系数据库服务Amazon Relational Database Service (Amazon RDS),能够在几分钟内创建新数据库,并灵活地自定义数据库以满足自身业务需求。此外,望石智慧借助Amazon DynamoDB可以开发任何规模的现代应用程序,且在任何规模下均具有个位数毫秒级的性能。作为无服务器的NoSQL 数据库服务,Amazon DynamoDB具有 99.999% 的可用性 SLA 和更高的弹性,望石智慧仅需按Amazon DynamoDB使用量进行付费,有效降低了成本支出。

与此同时,望石智慧将内部体系化研发平台和 StoneMIND® 分子设计平台等多个核心业务部署至亚马逊云科技,在降低开发成本的同时,提升了新药研发流程的效率与成功率。结合Amazon Elastic Compute Cloud(Amazon EC2)预留、按需和Spot实例,可充分支持望石智慧在药物筛选与新药研发过程中的密集的计算需求,并在最高可节省成本达90%的同时获得海量算力。

在安全性方面,望石智慧采用了包括 Amazon WAF 在内的一系列安全服务,并与亚马逊云科技合作伙伴安恒、光环有云一起构建了VPN、堡垒机、主机防护、数据库审计等多方位的安全防护机制,实现了全球业务发展的合规要求;在合规性方面,亚马逊云科技还拥有国内外很多合规认证与法规声明,并能提供部署的白皮书、最佳实践指导等。

亚马逊云科技不仅为望石智慧提供了丰富的产品服务和完备的技术文档,还派驻专业的合作伙伴与技术团队为望石智慧提供相关的技术支持。望石智慧仅用了3个月,就基于Amazon Batch服务快速建立了一套灵活的任务投递机制,应用于不同规模的小分子高通量筛选,实现云原生的业务部署。“接下来基于与亚马逊云科技的合作,我们会完成从分子生成模型到多模态检索增强(RAG)的突破,到Model+X整合整个工具链构造平台,再往前推进Agent化,以及Multi-agents,最终实现整个流程更智能化。”周杰龙表示。

在这个变革的时代,我们正在见证人工智能如何助力人类攻克疾病难题,让医学创新走得更快、更远。而望石智慧与亚马逊云科技的合作,正是这一趋势下的生动缩影,展现了AI如何从概念走向实际应用,真正推动医药行业迈向智能化的未来。

标签:
版权声明:本文版权归数字商业时代所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。