Звучит больной голос? Новая технология искусственного интеллекта может определить, что это КОВИД
Билл Стиг
19 сентября 2022 г. - Представьте себе следующее: Вы думаете, что у вас может быть COVID. Вы говорите пару фраз в телефон. Затем приложение выдает вам достоверные результаты менее чем за минуту.
"Похоже, ты болен" - вот что мы, люди, можем сказать другу. Искусственный интеллект, или ИИ, может выйти на новые рубежи, анализируя ваш голос для выявления инфекции COVID.
Недорогое и простое приложение можно использовать в странах с низким уровнем дохода или для проверки толпы на концертах и других крупных мероприятиях, говорят исследователи.
Это лишь последний пример растущей тенденции использования голоса в качестве диагностического инструмента для выявления или прогнозирования заболеваний.
За последнее десятилетие было показано, что анализ речи с помощью ИИ помогает выявить болезнь Паркинсона, посттравматическое стрессовое расстройство, слабоумие и сердечные заболевания. Исследования были настолько многообещающими, что Национальные институты здравоохранения недавно запустили новую инициативу по разработке ИИ для использования голоса для диагностики широкого спектра заболеваний. Они варьируются от таких респираторных заболеваний, как пневмония и ХОБЛ, до рака гортани и даже инсульта, ALS и психических расстройств, таких как депрессия и шизофрения. Программное обеспечение может обнаружить нюансы, которые не может уловить человеческое ухо, говорят исследователи.
По крайней мере, полдюжины исследований использовали этот подход к обнаружению COVID. В самом последнем исследовании ученые из Университета Маастрихта в Нидерландах сообщают, что их модель ИИ была точной в 89% случаев, по сравнению со средним показателем в 56% для различных тестов бокового потока. Голосовой тест также был более точным при выявлении инфекции у людей без симптомов.
Одна загвоздка: Тесты бокового потока дают ложноположительные результаты менее чем в 1% случаев, по сравнению с 17% для голосового теста. Тем не менее, поскольку тест является "практически бесплатным", было бы практично просто заставить тех, у кого положительный результат, пройти дальнейшие тесты, сказал исследователь Вафаа Альджбави, который представил предварительные результаты на Международном конгрессе Европейского респираторного общества в Барселоне, Испания.
"Лично я в восторге от возможных медицинских последствий", - говорит Висара Урови, доктор философии, исследователь проекта и доцент Института науки о данных Маастрихтского университета. "Если мы лучше поймем, как меняется голос при различных заболеваниях, то потенциально сможем знать, когда мы вот-вот заболеем или когда нужно пройти дополнительные тесты и/или лечение".
Разработка ИИ
Инфекция COVID может изменить ваш голос. Она поражает дыхательные пути, "что приводит к недостатку энергии речи и потере голоса из-за одышки и закупорки верхних дыхательных путей", - говорится в препринте статьи, которая еще не прошла рецензирование. Типичный для пациентов с COVID сухой кашель также вызывает изменения в голосовых связках. А предыдущие исследования показали, что дисфункция легких и гортани при COVID изменяет акустические характеристики голоса.
Отчасти последнее исследование примечательно размером набора данных. Исследователи использовали базу данных Кембриджского университета, содержащую 893 звуковых образца от 4 352 человек, из которых у 308 был выявлен COVID.
Вы можете внести свой вклад в эту базу данных - все анонимно - с помощью кембриджского приложения COVID-19 Sounds App, которое просит вас три раза кашлянуть, три-пять раз глубоко вдохнуть через рот и три раза прочитать короткое предложение.
В своем исследовании ученые Маастрихтского университета "сосредоточились только на произнесенных предложениях", - объясняет Урови. По ее словам, "параметры сигнала" аудиозаписи "дают определенную информацию об энергии речи". "Именно эти цифры используются в алгоритме для принятия решения".
Аудиофилам может показаться интересным, что исследователи использовали анализ спектрограммы мела для определения характеристик звуковой волны (или тембра). Любители искусственного интеллекта обратят внимание на то, что в ходе исследования было установлено, что лучше всего работает модель ИИ с долговременной кратковременной памятью (LSTM). Она основана на нейронных сетях, имитирующих человеческий мозг, и особенно хороша при моделировании сигналов, собранных в течение длительного времени.
Для неспециалистов достаточно знать, что прогресс в этой области может привести к созданию "надежных, эффективных, доступных, удобных и простых в использовании" технологий для обнаружения и прогнозирования заболеваний, говорится в статье.
Что дальше?
По словам Урови, для превращения этих исследований в полноценное приложение потребуется успешный этап проверки. Такая "внешняя валидация" - проверка работы модели с другим набором данных звуков - может быть медленным процессом.
"Этап валидации может занять годы, прежде чем приложение станет доступно широкой публике", - говорит Урови.
Урови подчеркивает, что даже с большим набором данных Кембриджа "трудно предсказать, насколько хорошо эта модель может работать в общей популяции". Если будет доказано, что речевое тестирование работает лучше, чем экспресс-тест на антигены, "люди могут предпочесть дешевый неинвазивный вариант".
"Но необходимо провести дополнительные исследования, чтобы выяснить, какие особенности голоса наиболее полезны для выявления случаев COVID, и убедиться, что модели могут отличить COVID от других респираторных заболеваний", - говорится в статье.
Так есть ли в нашем будущем тесты приложений перед концертом? Это будет зависеть от анализа затрат и выгод и многих других соображений, говорит Урови.
Тем не менее, "тест может принести пользу, если он будет использоваться в поддержку или в дополнение к другим хорошо зарекомендовавшим себя инструментам скрининга, таким как ПЦР-тест".