AI制药的数据之困,何解?
发布时间:2024-12-06 02:19 浏览量:7
随着AI技术的蓬勃发展,AI+制药被视为下一个黄金赛道。在日前三部门联合印发的《卫生健康行业人工智能应用场景参考指引》中,就明确指出AI可以赋能药物研发的全流程,包括智能药物研发、智能药物临床试验辅助、智能药品临床综合评价辅助。
海通国际指出,AI制药技术的应用有望缩短药物研发周期,降低成本,提高研发成功率。AI技术使得从药物设计到临床试验的全流程更加高效,为传统药物研发带来创新变革,并展现出在药物研发领域的广阔前景和巨大潜力。
而在推动AI制药发展的过程中,数据是讨论多年的核心问题。“如果我是AI,你希望我对你有更大的帮助,你就要给我创造更多的标准化的数据。”晶泰科技联合创始人、CEO马健近日在一场论坛中表示,在未来5到10年内,希望更多的行业能够投入更多精力在数据生成方面。
标准化数据的重要性也有一组数据可以佐证,根据中商产业研究院发布的《2024-2029中国AI制药市场现状研究分析与发展前景预测报告》,全球700多家AI制药公司主要布局了6大环节:包括早期药物开发(392家)、数据处理(235家)、临床开发(149家)、端到端药物开发(83家)、临床前发展(57家)及药物再利用(26家)。
但数据的处理并非易事。多位业内专业人士均向21世纪经济报道记者指出,数据是目前制约AI制药发展的一大因素。
打造数字资产
在AI时代,企业将自身业务流程数字化是拥抱AI技术的关键一步,也是发展AI制药的重要基础。
百济神州高级副总裁、全球统计与数据科学部负责人郭翔表示,数字化不仅仅是电子化,两者之间存在巨大的差异。将业务流程迁移到云端的过程中,数据布点是一项极具挑战性的工作,需要对业务流程有深刻的理解,才能尽可能地复刻业务流程。一旦实现了数字化,整个业务将得到赋能。
对企业而言,AI的应用和自动化努力需要对数据进行整合,而这一过程非常痛苦。制药行业的一个特点是分工非常细密,即使是身处行业内部的人,也可能对不同部门之间的业务逻辑理解不深。
郭翔认为,许多大型企业,比如诺华,大约十年前曾提出要转型为数字公司,但他们的努力并没有达到预期效果。至少目前看来,由于分工过于细密,导致咨询公司和数字化专业公司在尝试对药企进行数字化转型时,对业务逻辑的理解非常困难。
另一方面,由于分工特别细,企业基本上使用单点系统,例如EDC和CTMS等,所有系统之间都是独立的。系统会自己产生数据,包括运营数据、管理数据,而现在企业需要形成自己的数据湖、数据仓库,需要将所有数据进行整合。在整合过程中,便会发现大量信息存在问题。
“一个项目的ID在不同系统中可能不同,员工完全根据自己的理解使用不同的标准,而且存在重复录入的情况,这对数据治理工作带来了很大的挑战。”郭翔举例道。
因此,企业需要具备自己的工程化能力。郭翔指出,我们不能再依赖外部公司来帮助我们建设数字化,而是要基于自己的业务理解来实现数字化。
以往企业静态地在小样本上进行分类、预测,今天企业需要拥抱工程化,例如药物供应方面,能否根据药物研发、招募的病人和其他国家的突发事件进行及时预测和调整,这种能力非常重要,而这就需要企业具备工程能力,需要对算法、工具进行及时调整。
其实不仅国内药企欠缺此方面的能力,跨国公司同样也很欠缺。以往各大企业都喜欢从市场上找一家公司做一个产品,使自身业务不得不适应该产品,便不能用工具很好地促进业务发展。
在数字化的过程中,所有的业务最终都会变成数据流。郭翔认为,在新药研发中,企业产生的都是数字,而且是广义的数字,不仅包括采集病人的数据,还包括数据管理部门制作的各种临床文件。目前看来,这些都有机会成为广义数字资产。
充分利用数据资源
当前,人类在病魔面前虽然开发了大量药物,但仍有70%的病症缺乏对症药物和治疗方案。根据美国FDA统计,在已知的约10000种疾病中,只有3000种有至少一种治疗药物,而剩下的7000余种疾病并无有效的治疗方案。
随着技术的发展,在制药领域,国外以Alphafold、AlphaProteo为代表的大模型正逐步赋能药物研发;国内以ADMETlab、inClinico为代表的大模型也已被应用于药物研发。
相较于传统药物研发,AI技术能将药物发现、临床前研究的时间缩短近40%,将临床新药研发的成功率从12%提高到约14%。
对于AI技术来说,数据、算法、算力是三大核心要素。其中,数据是训练模型的基础,高质量的数据能够提升模型的准确性。
据英矽智能大湾区负责人潘颖介绍,在数据方面,英矽智能更是通过双CEO的配备,使得团队之间合作更为紧密。其对数据的重视程度可见一斑。
“在制药领域,AI的应用是一个机会。与国外相比,过去我们在很多方面非常欠缺,本来就是一穷二白,所幸没有太多历史包袱,这给了我们机会,在同一赛道上进行起跑。我们药企中并不缺少数据科学家,无论是做模型、预测,还是分类,都不是问题。”郭翔说。
潘颖指出,中国有一个很好的优势,我们有很多优秀的科学家,有很多做实验尤其是临床之前的实验效率非常高,我们可以获取大量的数据。所以我相信结合全球领先的算法,再加上非常有效的数据,我们可以把这个行业做得更好。
需要指出的是,有业内人士向21世纪经济报道记者表示,数据的使用强调合规性。AI需要输入很多数据,无论是企业自建AI还是外部的AI,如何合法使用这些数据是需要解决的问题,同时也要避免敏感数据的泄露。
目前,全球已有多款AI研发药物进入临床,且最高进展已到临床三期,与此同时,有很多利用AI技术研发的药物进入临床后失败。尚无AI研发的药物成功上市。
俄罗斯工程院外籍院士、南方科技大学化学系讲席教授张绪穆指出,AI在起步阶段,一定能够帮助人类在科学发现上发挥巨大的作用,这是毋庸置疑的。但是人工智能还要和人的智能结合在一起,在制药领域,与长期训练的药化专家结合是最好的选择。许多传统的药厂要警惕,不能总是走老路,要早点拥抱AI,早点利用中国的AI模型,这将对未来的发展有所帮助。