Российские программисты обучили нейронную сеть анализировать мнения пользователей соцсетей о действии лекарств.

Как в четверг пишут "Известия", искусственный интеллект теперь может излагать пользовательский текст в медицинских терминах. Собранные в соцсетях данные помогут проанализировать побочные эффекты от препаратов на большой выборке.

"Не могу заснуть всю ночь", "слегка кружится голова" — эти и другие жалобы пользователей соцсетей теперь можно перевести на формальный медицинский язык — к примеру, "бессонница" и "головокружение" соответственно. Задача сопоставления упомянутого пользователем заболевания с конкретным медицинским термином называется нормализацией медицинских концептов.

Чтобы решить проблему сопоставления, программисты использовали обучение особого типа нейросетей (так называемых рекуррентныx нейронныx сетей) и семантическое векторное представление слов. В исследовании принимали участие ученые Казанского федерального университета, НИЦ "Курчатовский институт", Первого МГМУ им. И.М. Сеченова, Санкт-Петербургского отделения Математического института им. В.А. Стеклова РАН (ПОМИ РАН) и МФТИ. Исследования проводились на базах данных для английского языка. В ближайшие годы группа планирует перенести технологию на русский язык. Работа была поддержана грантом Российского научного фонда.

Для того чтобы осуществить корректное сопоставление, в программу загрузили медицинские тексты, после чего на их основе был сформирован специальный словарь. Работает это так: программа принимает большое количество текстов в качестве входных данных и сопоставляет каждому слову вектор.

По мнению авторов работы, непрерывное развитие и улучшение точности интеллектуального анализа текстов сообщений пациентов в социальных сетях окажет значительное влияние на понимание того, как те или иные лекарства воздействуют на организм. Также будет проанализирована информация о повторном назначении лекарств и понимании лекарственных эффектов в контексте других факторов, таких как одновременный прием разных препаратов, диеты и образ жизни.