Близнец, о котором вы не знали, что он у вас есть

Лекарство, которое вы приняли сегодня утром, прошло долгий путь от лаборатории до упаковки с таблетками. Сначала - обширные лабораторные исследования. Затем - испытания на животных. Но прежде чем лекарство будет одобрено к применению, его необходимо испытать на людях - в ходе дорогостоящего и сложного процесса, известного как клинические испытания.

Основы

В своей простейшей форме клиническое испытание выглядит следующим образом: Исследователи набирают пациентов, страдающих заболеванием, на которое направлено действие экспериментального препарата. Добровольцев случайным образом делят на две группы. Одна группа получает экспериментальный препарат, другая, называемая контрольной группой, получает плацебо (лекарство, которое кажется идентичным испытуемому препарату, но не оказывает никакого эффекта). Если пациенты, получающие активный препарат, демонстрируют большее улучшение, чем те, кто получает плацебо, это свидетельствует о том, что препарат эффективен.

Одна из самых сложных частей разработки испытания - найти достаточное количество добровольцев, которые отвечают точным критериям исследования. Врачи могут не знать об испытаниях, которые могут подойти их пациентам, а пациенты, готовые принять участие в исследовании, могут не обладать характеристиками, необходимыми для данного испытания. Но искусственный интеллект может значительно облегчить эту работу.

Познакомьтесь со своим близнецом

Цифровые двойники - это компьютерные модели, имитирующие реальные объекты или системы. Статистически они ведут себя практически так же, как и их физические аналоги. НАСА использовало цифрового двойника космического корабля "Аполлон-13", чтобы помочь провести ремонт после того, как взорвался кислородный баллон, в результате чего инженеры на Земле были вынуждены прибегнуть к ремонту, находясь на расстоянии 200 000 миль.

При наличии достаточного количества данных ученые могут создавать цифровых двойников людей, используя машинное обучение - вид искусственного интеллекта, при котором программы обучаются на основе большого количества данных, а не специально программируются для выполнения поставленной задачи. Цифровые двойники пациентов, проходящих клинические испытания, создаются путем обучения моделей машинного обучения на данных о пациентах, полученных в ходе предыдущих клинических испытаний и из индивидуальных историй болезни. Модель предсказывает, как будет развиваться здоровье пациента в ходе испытания, если ему дать плацебо, по сути, создавая имитацию контрольной группы для конкретного пациента.

Вот как это будет работать: Человек, назовем его Салли, включается в группу, получающую активный препарат. Цифровой двойник Салли (компьютерная модель) находится в контрольной группе. Она предсказывает, что произойдет, если Салли не будет получать лечение. Разница между реакцией Салли на препарат и предсказанной моделью реакцией Салли, если бы она принимала плацебо, является оценкой того, насколько эффективным будет лечение для Салли.

Цифровые двойники также создаются для пациентов из контрольной группы. Сравнивая предсказания того, что произойдет с цифровыми двойниками, получающими плацебо, с людьми, которые действительно получили плацебо, исследователи могут выявить любые проблемы в модели и сделать ее более точной.

Замена или дополнение контрольных групп цифровыми двойниками может помочь как пациентам-добровольцам, так и исследователям. Большинство людей, участвующих в испытаниях, надеются получить новое лекарство, которое может помочь им, когда уже одобренные препараты не помогают. Но существует вероятность 50/50, что они попадут в контрольную группу и не получат экспериментального лечения. Замена контрольных групп цифровыми двойниками может означать, что больше людей получат доступ к экспериментальным препаратам.

Неожиданное

Технология может быть многообещающей, но она еще не получила широкого распространения - возможно, по уважительной причине. Дэниел Нилл, доктор философии, является экспертом в области машинного обучения, включая его применение в здравоохранении, в Нью-Йоркском университете. Он отмечает, что модели машинного обучения зависят от наличия большого количества данных, а получить высококачественные данные об отдельных людях бывает непросто. Информация о таких вещах, как диета и физические упражнения, часто сообщается самостоятельно, а люди не всегда честны. Они склонны переоценивать количество физических упражнений и недооценивать количество нездоровой пищи, которую они едят, говорит он.

Учет редких побочных явлений также может стать проблемой, добавляет он. "Скорее всего, это те события, которые вы не предусмотрели в контрольной группе". Например, у кого-то может возникнуть неожиданная негативная реакция на лекарство.

Но больше всего Нилла беспокоит то, что прогностическая модель отражает то, что он называет "обычным делом". Скажем, крупное неожиданное событие - такое, как пандемия COVID-19, например, - меняет модели поведения каждого, и люди заболевают. "Это то, что эти модели контроля не учитывают", - говорит он. Эти непредвиденные события, не учтенные в контрольной группе, могут исказить результаты испытания".

Эрик Топол, основатель и директор трансляционного института Scripps Research и эксперт по использованию цифровых технологий в здравоохранении, считает, что идея замечательная, но еще не готова к прайм-тайму. "Я не думаю, что клинические испытания изменятся в ближайшей перспективе, потому что это требует множества уровней данных, помимо медицинских карт, таких как последовательность генома, микробиом кишечника, данные об окружающей среде и так далее и тому подобное". Он прогнозирует, что пройдут годы, прежде чем можно будет проводить крупномасштабные испытания с использованием ИИ, особенно для нескольких заболеваний. (Тополь также является главным редактором Medscape, родственного сайта журнала "Доктор").

Сбор достаточного количества качественных данных является сложной задачей, говорит Чарльз Фишер, доктор философии, основатель и генеральный директор компании Unlearn.AI, которая является пионером в области цифровых двойников для клинических испытаний. Но, по его словам, решение этой проблемы является частью долгосрочных целей компании.

Две из наиболее часто упоминаемых проблем, связанных с моделями машинного обучения - конфиденциальность и предвзятость - уже учтены, говорит Фишер. "С конфиденциальностью все просто. Мы работаем только с теми данными, которые уже анонимизированы".

Когда речь идет о предвзятости, проблема не решена, но она не имеет значения - по крайней мере, для исхода испытания, по словам Фишера. Хорошо задокументированная проблема инструментов машинного обучения заключается в том, что они могут быть обучены на предвзятых наборах данных - например, на тех, в которых недопредставлена определенная группа. Но, говорит Фишер, поскольку испытания являются рандомизированными, результаты нечувствительны к предвзятости данных. В ходе испытания оценивается, как испытуемый препарат влияет на людей, участвующих в испытании, на основе сравнения с контрольными группами, и корректируется модель, чтобы более точно соответствовать реальным контрольным группам. Таким образом, по словам Фишера, даже если выбор испытуемых для испытания необъективен, а исходный набор данных необъективен, "мы можем разработать испытания таким образом, чтобы они были нечувствительны к этой необъективности".

Нилл не считает это убедительным. Вы можете устранить предвзятость в рандомизированном исследовании в узком смысле, скорректировав свою модель, чтобы правильно оценить эффект лечения для исследуемой популяции, но вы просто вернете эти предвзятости, когда попытаетесь обобщить результаты за пределами исследования. Unlearn.AI "не сравнивает людей, прошедших лечение, с контрольной группой", - говорит Нилл. "Он сравнивает людей, прошедших лечение, с основанными на моделях оценками того, каким был бы исход для данного человека, если бы он был в контрольной группе. Любые ошибки в этих моделях или события, которые они не смогли предугадать, могут привести к систематическим ошибкам - то есть к завышенным или заниженным оценкам эффекта лечения".

Но unlearn.AI продвигается вперед. Она уже работает с фармацевтическими компаниями над разработкой испытаний для неврологических заболеваний, таких как болезнь Альцгеймера, Паркинсона и рассеянный склероз. По этим заболеваниям имеется больше данных, чем по многим другим, поэтому они являются хорошим местом для начала работы. Фишер говорит, что в конечном итоге этот подход может быть применен к каждому заболеванию, что значительно сократит время, необходимое для вывода на рынок новых лекарств.

Если технология окажется полезной, эти невидимые братья и сестры могут принести пользу как пациентам, так и исследователям.

Hot