МЕТОДЫ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ О ЗАБОЛЕВАНИЯХ
ИЗ КОЛЛЕКЦИЙ БИОМЕДИЦИНСКИХ ТЕКСТОВ

Е.В. Тутубалина (КФУ)

В число активно развивающихся направлений обработки неструктурированной текстовой информации входят задачи медицинской науки, в частности, задачи фармакологии и персонализированной медицины. Предметом доклада являются задачи выделения сущностей, связанные с заболеваниями, и установления соответствия между выделенными сущностями и медицинскими понятиями в онтологии (системе классификации болезней). Рассматривается ряд конструкций современных рекуррентных нейронных сетей, включая комбинированную модель LSTM (Long Short-Term Memory) c CRF (Conditional Random Fields) и модель архитектуры “кодировщик-декодировщик” (Encoder-Decoder) для приведения фраз из записей врачей на английском языке к медицинскому коду по системе международной классификации болезней (МКБ-10, ICD-10), показавшая наилучшие результаты в открытых соревнованиях алгоритмов CLEF eHealth 2017 Task 1.

ПРЕЗЕНТАЦИЯ

ВИДЕО ДОКЛАДА: