Статья анализирует ключевые вызовы, связанные с использованием данных реальной клинической практики (RWD), такие как разрозненность, несовместимость и предвзятость, а также операционные задержки, вызванные ручной постфактум-обработкой. Обосновывается необходимость проактивной, основанной на открытых стандартах (CDISC, FHIR) стратегии гармонизации данных в реальном времени. Показано, что создание унифицированной инфраструктуры данных является критическим условием для реализации прорывных сценариев ИИ — от предиктивного моделирования и синтетических контрольных групп до адаптивных дизайнов исследований — что способно сократить сроки и стоимость разработки терапии, трансформируя клинические испытания из узкого места в двигатель инноваций. Введение: парадокс данных в эпоху ИИИзвестный принцип «мусор на входе — мусор на выходе» (GIGO) сохраняет свою актуальность в цифровую эпоху, особенно в контексте больших языковых моделей и аналитики на основе ИИ. Несмотря на признанный трансформационный потенциал ИИ для ускорения и оптимизации клинических испытаний, его реализация сдерживается фундаментальной проблемой — отсутствием чистых, высококачественных и интегрированных данных в реальном времени. Фармацевтическая индустрия продолжает сталкиваться с проблемами фрагментированных экосистем данных, где бремя ручного согласования разрозненных источников ложится на операционные команды, подрывая саму цель внедрения инноваций. Для раскрытия полного потенциала ИИ необходима стратегия переосмысления управления данными, начиная с фундаментальных основ. Рост объёмов и многообразия данных: возможности и вызовыЗа последнее десятилетие объём и разнообразие данных в клинических разработках резко возросли. Если в 2012 году испытание III фазы генерировало около 1 миллиона точек данных, то к 2025 году этот показатель вырос почти до 6 миллионов. Традиционные данные отчётов о случаях (CRF) из рандомизированных контролируемых исследований теперь дополняются — а в некоторых случаях и заменяются — разнообразными источниками данных реальной клинической практики (RWD): электронными медицинскими картами (ЭМК), страховыми claims, данными носимых устройств и регистров пациентов. Эти данные предлагают более целостное представление об эффективности терапии и исходах для пациентов, однако их интеграция сопряжена со значительными сложностями. В отличие от структурированных CRF, RWD часто неполны, нестандартизированы и могут содержать систематические ошибки (bias), связанные с неслучайным отбором пациентов, что ставит под вопрос их репрезентативность и пригодность для регуляторных решений. Ключевые барьеры на пути интеграции RWD
Стандартизация и гармонизация данных как основа для ИИЦель заключается не в простом накоплении больших объёмов данных (big data), а в создании данных высокого качества (smart data). Ключевым шагом является проактивная гармонизация RWD с данными традиционных клинических испытаний на основе единых стандартов. Внедрение стандартов CDISC и FHIR на этапе проектирования исследования обеспечивает согласованный поток информации на всём его жизненном цикле. Такой подход позволяет:
Практическое влияние на бизнес-результаты: данные с конференции DPHARM 2025Внедрение унифицированной стратегии данных демонстрирует измеримое влияние на ключевые бизнес-показатели. На примере ведущего фармацевтического спонсора, представленном на DPHARM 2025, были достигнуты следующие результаты:
Заключение: от операционного узкого места к драйверу прорываБудущее клинических разработок заключается не просто в более быстрых, но в более интеллектуальных исследованиях. Однако эта перспектива достижима только при условии решения фундаментальной проблемы качества данных. Искусственный интеллект не может компенсировать некачественные исходные данные. Трансформация клинических испытаний требует, в первую очередь, трансформации подхода к управлению данными: проектирования экосистем с приоритетом открытых стандартов, проактивной гармонизации в реальном времени и создания единого источника достоверной информации. Только на этом фундаменте ИИ сможет реализовать свой потенциал по сокращению 10-15-летнего цикла разработки лекарств, значительно снижению затрат и открытию новой эры персонализированной, data-driven медицины. |
||






















