Preview

Реальная клиническая практика: данные и доказательства

Расширенный поиск

Качество данных в разработке лекарств: недостающий фундамент для реализации потенциала ИИ в клинических испытаниях

Трансформационный потенциал искусственного интеллекта (ИИ) в клинических исследованиях упирается в фундаментальную и часто игнорируемую проблему — качество и гармонизацию данных. В эпоху персонализированной медицины и взрывного роста объёмов информации (от носимых устройств до электронных медицинских карт) фрагментированные экосистемы данных становятся основным операционным барьером.

Статья анализирует ключевые вызовы, связанные с использованием данных реальной клинической практики (RWD), такие как разрозненность, несовместимость и предвзятость, а также операционные задержки, вызванные ручной постфактум-обработкой. Обосновывается необходимость проактивной, основанной на открытых стандартах (CDISC, FHIR) стратегии гармонизации данных в реальном времени. Показано, что создание унифицированной инфраструктуры данных является критическим условием для реализации прорывных сценариев ИИ — от предиктивного моделирования и синтетических контрольных групп до адаптивных дизайнов исследований — что способно сократить сроки и стоимость разработки терапии, трансформируя клинические испытания из узкого места в двигатель инноваций.

Введение: парадокс данных в эпоху ИИ

Известный принцип «мусор на входе — мусор на выходе» (GIGO) сохраняет свою актуальность в цифровую эпоху, особенно в контексте больших языковых моделей и аналитики на основе ИИ. Несмотря на признанный трансформационный потенциал ИИ для ускорения и оптимизации клинических испытаний, его реализация сдерживается фундаментальной проблемой — отсутствием чистых, высококачественных и интегрированных данных в реальном времени. Фармацевтическая индустрия продолжает сталкиваться с проблемами фрагментированных экосистем данных, где бремя ручного согласования разрозненных источников ложится на операционные команды, подрывая саму цель внедрения инноваций. Для раскрытия полного потенциала ИИ необходима стратегия переосмысления управления данными, начиная с фундаментальных основ.

Рост объёмов и многообразия данных: возможности и вызовы

За последнее десятилетие объём и разнообразие данных в клинических разработках резко возросли. Если в 2012 году испытание III фазы генерировало около 1 миллиона точек данных, то к 2025 году этот показатель вырос почти до 6 миллионов. Традиционные данные отчётов о случаях (CRF) из рандомизированных контролируемых исследований теперь дополняются — а в некоторых случаях и заменяются — разнообразными источниками данных реальной клинической практики (RWD): электронными медицинскими картами (ЭМК), страховыми claims, данными носимых устройств и регистров пациентов.

Эти данные предлагают более целостное представление об эффективности терапии и исходах для пациентов, однако их интеграция сопряжена со значительными сложностями. В отличие от структурированных CRF, RWD часто неполны, нестандартизированы и могут содержать систематические ошибки (bias), связанные с неслучайным отбором пациентов, что ставит под вопрос их репрезентативность и пригодность для регуляторных решений.

Ключевые барьеры на пути интеграции RWD

  1. Разрозненность и несовместимость: данные из клинических испытаний, ЭМК, лабораторных информационных систем и других источников существуют в несогласованных форматах с различными словарями и стандартами кодирования.

  2. Проблемы качества и предвзятости: пропущенные значения, неполные записи и смещения выборки ограничивают использование RWD в качестве надёжных доказательств и увеличивают риск ложных выводов.

  3. Операционные задержки: преобладающая практика постфактум ручной очистки и сводки данных из параллельных потоков создаёт циклы «остановки-запуска», замедляя получение insights.

  4. Фрагментарное внедрение стандартов: несмотря на существование глобальных стандартов, таких как CDISC (для клинических исследований) и FHIR (для обмена медицинской информацией), их повсеместное применение остаётся неполным, делая интеграцию дорогостоящей и подверженной ошибкам.

  5. Регуляторные и правовые сложности: обеспечение конфиденциальности (в соответствии с GDPR, HIPAA), отслеживание происхождения данных (provenance) и соблюдение требований локализации данных в глобальных исследованиях остаются серьёзными препятствиями.

Стандартизация и гармонизация данных как основа для ИИ

Цель заключается не в простом накоплении больших объёмов данных (big data), а в создании данных высокого качества (smart data). Ключевым шагом является проактивная гармонизация RWD с данными традиционных клинических испытаний на основе единых стандартов. Внедрение стандартов CDISC и FHIR на этапе проектирования исследования обеспечивает согласованный поток информации на всём его жизненном цикле.

Такой подход позволяет:

  • Ликвидировать дорогостоящие и подверженные ошибкам процессы постфактум-сверки.

  • Обеспечить аналитику в реальном времени и готовность данных для регуляторной подачи.

  • Создать надёжный фундамент для применения алгоритмов ИИ и машинного обучения.

Практическое влияние на бизнес-результаты: данные с конференции DPHARM 2025

Внедрение унифицированной стратегии данных демонстрирует измеримое влияние на ключевые бизнес-показатели. На примере ведущего фармацевтического спонсора, представленном на DPHARM 2025, были достигнуты следующие результаты:

  • Ускорение подачи в регуляторные органы: благодаря данным, заранее гармонизированным по стандартам CDISC, процессы сборки анализационных наборов (SDTM/ADaM) и подготовки электронных подач (eCTD) стали непрерывными.

  • Операционная аналитика в реальном времени: переход от пакетной обработки к двунаправленным потокам данных предоставил спонсору немедленную видимость операционной эффективности и возможность научного анализа по запросу.

  • Расширение базы для фармаконадзора и HEOR: интеграция данных испытаний с ЭМК и регистрами усилила мониторинг безопасности и исследования результатов в реальной практике.

  • Ускорение запуска исследований: использование библиотек стандартизированных протоколов и eCRF, интегрированных с FHIR, сократило сроки активации исследовательских центров.

  • Создание фундамента для ИИ: наличие объяснимой и воспроизводимой базы данных позволило безопасно внедрять сложные сценарии ИИ без повторной настройки инфраструктуры для каждого проекта.

Заключение: от операционного узкого места к драйверу прорыва

Будущее клинических разработок заключается не просто в более быстрых, но в более интеллектуальных исследованиях. Однако эта перспектива достижима только при условии решения фундаментальной проблемы качества данных. Искусственный интеллект не может компенсировать некачественные исходные данные. Трансформация клинических испытаний требует, в первую очередь, трансформации подхода к управлению данными: проектирования экосистем с приоритетом открытых стандартов, проактивной гармонизации в реальном времени и создания единого источника достоверной информации. Только на этом фундаменте ИИ сможет реализовать свой потенциал по сокращению 10-15-летнего цикла разработки лекарств, значительно снижению затрат и открытию новой эры персонализированной, data-driven медицины.