ИЗВЛЕЧЕНИЕ ЦЕЛЕВЫХ ОБЪЕКТОВ И ИНДИКАТИВНОЙ ЛЕКСИКИ О ПРОБЛЕМАХ, СВЯЗАННЫХ С ПРОДУКТАМИ, НА ОСНОВАНИИ ОТЗЫВОВ ПОЛЬЗОВАТЕЛЕЙ
Е.В. Тутубалина
Казанский (Приволжский) федеральный университет

Рассматривается задача автоматического извлечения информации о существовании различных проблем c товарами и услугами из отзывов пользователей. Отзыв пользователя содержит проблему, если продукт не работает желаемым образом и необходимо устранить неполадки. Дается классификация фраз пользователей, отражающих существование проблемы. Предлагаются методы: извлечения фраз, основанный на словарях; выделения целевых аспектов на основе синтаксических связей в предложении; организации целевых объектов и лексического контекста в категории на основе модификации модели латентного размещения Дирихле (latent Dirichet allocation, LDA). Сэмплирование Гиббса (Gibbs sampling) выбрано для оптимизации параметров модификации LDA. Приводятся результаты оценки качества работы предложенных методов на корпусах текстов, содержащих пользовательские отзывы различных тематик.

ПРЕЗЕНТАЦИЯ

ВИДЕО ДОКЛАДА: