Исследователи из России разработали подход, позволяющий применять искусственный интеллект для автоматического анализа литературных произведений. Система может определить тип персонажей по репликам и описанию, а также раскрыть характер их взаимоотношений. Метод можно использовать для обучения цифровых помощников и решения других задач, сообщила пресс-служба Института искусственного интеллекта AIRI.
«Содержащийся в исследовании набор шагов можно использовать для извлечения именованных сущностей и их взаимосвязей из других текстов. С помощью описанных методов можно выполнять ряд практических задач. Например, проводить анализ нормативной документации и суммаризацию юридических текстов, чтобы переписывать сложные документы простым и понятным обычному человеку языком», — говорится в сообщении.
Группа исследователей под руководством старшего научного сотрудника Института искусственного интеллекта AIRI (Москва) Ильи Макарова приспособила уже существующие нейросетевые алгоритмы для литературного анализа текстов, а также распознавания персонажей и определения характера их взаимоотношений. Для этого ученые применили теорию графов и так называемые NER-алгоритмы, одну из форм компьютерной обработки естественного языка.
Исследователи проверили работу подхода на «Властелине колец» и других произведениях Джона Рональда Руэла Толкина. После обучения система ИИ успешно распознала то, в каких отношениях находились свыше 880 наименованных сущностей в книгах британского писателя, а также научилась узнавать их по репликам.
Аналогичным образом, как отмечают Макаров и его коллеги, можно анализировать любые другие сложные и объемные литературные произведения, а также другие типы текстов, в том числе имеющие важное историческое или юридическое значение. Это позволит использовать системы ИИ для подготовки кратких и удобочитаемых изложений подобных документов, а также глубокого анализа правовых норм, подытожили ученые.
comments powered by HyperComments