В ТюмГУ на основе интернет-текстов составляют информационный портрет
Cотрудница кафедры программного обеспечения ТюмГУ Анна Глазкова разрабатывает программу, которая будет извлекать биографические факты из интернет-текстов и автоматически строить информационные портреты.
"Сегодня информационный поиск в электронных ресурсах связан с рядом сложностей. Так, исследователь не всегда может четко сформулировать поисковый запрос. Кроме того, ряд биографических фактов находится в тексте в неявном виде, - объяснила она. – Это вынуждает просматривать большие объемы текстовой информации в поисках значимых для исследования фактов. В том числе в разных по структуре материалах. И если извлечение фактов из резюме легко поддается автоматизации, то обработка текстов, не имеющих регламентированной структуры, требует дополнительной работы".
В описании проекта разработчик будет использовать понятие информационного портрета личности. По мнению Глазковой, программа будет полезна ученым, которые занимаются биографическими исследованиями и другим пользователям в связи с увеличением объема информации в хранилищах электронных документах. Проект тюменки "Автоматизированное извлечение биографических фактов из текстов на естественном языке" поддержан грантом Российского фонда фундаментальных исследований, сообщает управление стратегических коммуникаций ТюмГУ.