Rambler's Top100
Все новости Новости компаний

В Центре компетенций НТИ разработано решение для интеллектуального анализа больших массивов текстов

15 апреля 2020

Решение может анализировать и обрабатывать любой тип информации, представленной в текстовом виде на русском, английском, белорусском, казахском и татарском и языках. Преимуществом системы является возможность кросс-языковой аналитики текстов.  

В Центре компетенций НТИ на базе МГУ по направлению «Технологии хранения и анализа больших данных» совместно с Институтом проблем искусственного интеллекта ФИЦ «Информатика и управление» РАН и ООО «Технологии системного анализа» разработана платформа текстовой аналитики на основе интеллектуальных систем сбора и обработки текстов.


Разработанное решение может анализировать и обрабатывать любой тип информации, представленной в текстовом виде на русском, английском, белорусском, казахском и татарском и языках. Преимуществом проекта является возможность кросс-языковой аналитики текстов: не требуется повторный поиск одних и тех же сведений, представленных в документах на разных языках и описанных терминами из разных языков. Внедрение решения существенно упростит работу специалистов, работающих с анализом больших объемов текстов, и значительно повысит эффективность патентного и исследовательского поиска.

 

Решение позволяет проводить анализ больших объемов научно-технической информации, анализ социальных сетей на предмет выявления материалов нежелательной тематики, девиантного поведения, анализ психологического состояния пользователей и социальной напряженности слоев общества. Кроме того, решение может выполнять задачи по извлечению информации, анализу медицинских документов, технической информации по закупкам для перевода больших полуструктурированных массивов текстов в форму структурированной информации.

 

В дальнейшем потребителями разработки могут стать аналитические центры, научные и научно-образовательные организации, предприятия, оказывающие услуги защиты интеллектуальной собственности, государственные корпорации. Также потенциальными потребителями могут стать нормативно-правовые справочные системы и консалтинговые бюро.

 

«Симбиоз нескольких научных подходов, предложенный президентом Российской академии социальных наук, доктором философских наук, профессором Г.В. Осиповым, позволяет описывать тематику документов через словосочетания и анализировать смысл, отдельных высказываний в форме неоднородных семантических сетей. В совокупности с современными методами компьютерной лингвистики, дистрибутивной семантики и машинного обучения созданное решение позволяет достигать большей точности и полноты в задачах текстовой аналитики», - комментирует разработку руководитель проекта Илья Соченков, научный сотрудник Центра компетенций НТИ на базе МГУ по большим данным.

 

Решение уже прошло стадию пилотных внедрений в таких организациях, как: ИНФРА-М, НЦР Руконт, НТИМИ, Дирекция научно-технических программ, Минобрнауки РФ, что позволило собрать базу технологических запросов заказчиков в области текстовой аналитики.

 

Стоимость разработки и внедрения готового решения варьируется от 5 до 25 млн рублей в каждом конкретном случае в зависимости от потребности заказчика в услугах по интеграции, кастомизации и глубокой настройке программного обеспечения.

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Оставить свой комментарий:

Для комментирования необходимо авторизоваться!

Комментарии по материалу

Данный материал еще не комментировался.