Рубрика: Общество

Тюменские программисты создали модели оценки принадлежности постов к слухам

Сотрудники ТюмГУ протестировали метод определения наличия слухов в средствах массовой информации для русского языка, сообщает управление стратегических коммуникаций вуза.

Метод позволяет вести поиск слухов среди сообщений пользователей в социальных сетях. В своем исследовании тюменцы использовали различные семантический и лингвистический способы анализа текста, а также анализ распространения записей относительно временных отрезков. Они проанализировали популярные инструменты для получения данных из социальных сетей, а также вручную составили и промаркировали выборку для обучения нейронной сети.

Данные измерения подаются на нейронную сеть и она дает определенный процент того, является ли данное сообщение слухом. В итоге из собранных данных удалось получить модель с предсказательной способностью в почти 93% на тестовой выборке данных.

"Обществу нужно бороться с распространением ложной информации. Переход от традиционных средств массовой информации к современным методам получения новостей породил множество проблем с проверкой доверия к ним. Журналисты вынуждены конкурировать с огромным потоком данных обычных пользователей, из-за чего основным фактором качества становится время, за которое был опубликован материал. В результате все большее число традиционных источников новостей сообщают о необоснованной информации из-за спешки быть первыми", - сообщил инженер-исследователь ТюмГУ Александр Черняев.

В качестве инструмента решения задачи использовалась нейронная сеть, в основе которой лежит многослойный персептрон. На вход поступал набор из 15 измерений, которые оценивали все стороны сообщения, а в качестве выхода - вероятность наличия слуха. Проверка выполнялась при помощи различных измерений, которые показали высокие результаты для построенной модели нейронной сети. По данным вуза, модель способна выдерживать проверки на высоком уровне. Исследователи ТюмГУ продолжают искать решение, которое позволит автоматически выполнять поиск сообщений-слухов.

"Количество сообщений в социальных сетях достигает таких количеств, что приходится полагаться на алгоритмы поиска, - говорит Александр Черняев. - Наша работа является своеобразной компиляцией - с дополнениями и изменениями - имеющихся алгоритмов в этой области".

Для более точного поиска слухов программисты планируют собирать больше данных.