Бот может обнаружить депрессивных пользователей Twitter в 9 из 10 случаев

Новый алгоритм может определить депрессию у пользователей Twitter с точностью 88,39%. Разработанный исследователями из Университета Брунеля в Лондоне и Университета Лестера, алгоритм определяет психическое состояние человека путем извлечения и анализа 38 данных из его публичного профиля в Twitter, включая содержание сообщений, время их публикации и других пользователей из его социального круга.

По мнению исследовательской группы, подобные системы могут найти применение в будущем на нескольких платформах, например, в ранней диагностике депрессии, проверке при приеме на работу или полицейском расследовании.

«Мы протестировали алгоритм на двух больших базах данных и сравнили наши результаты с другими методами обнаружения депрессии. — делится профессор Абдул Садка, директор Института цифрового будущего Брунеля. — Во всех случаях мы смогли превзойти существующие методы по точности классификации».

Алгоритм был обучен на двух базах данных, содержащих истории тысяч пользователей Twitter, а также дополнительную информацию о психическом здоровье этих пользователей. Восемьдесят процентов информации из каждой базы данных было использовано для обучения бота, а оставшиеся 20%  — для проверки его точности.

Бот работает, сначала исключая всех пользователей с менее чем пятью твитами и прогоняя оставшиеся профили через программы естественного языка для исправления орфографических ошибок и сокращений.

Затем он рассматривает 38 различных факторов, таких как использование пользователем положительных и отрицательных слов, количество друзей и подписчиков, использование смайликов, и определяет психическое и эмоциональное состояние пользователя.

Используя набор данных Twitter Tsinghua по депрессии, команда смогла получить 88,39% точности, в то время как 70,69% точности было достигнуто при использовании набора данных CLPsych Университета Джона Хопкинса 2015 года.

«Все, что выше 90%, считается превосходным в машинном обучении. Так что 88% для одной из двух баз данных — это фантастика. — рассказывает профессор Садка. — Это не 100% точность, но я не думаю, что какое-либо решение в области машинного обучения может достичь 100% надежности на таком уровне. Однако чем ближе к цифре 90%, тем лучше».

Команда говорит, что такая система потенциально может выявить депрессию пользователя до того, как он опубликует что-то в открытом доступе, прокладывая путь к тому, чтобы платформы активно отмечали проблемы психического здоровья у пользователей.

Однако бота можно использовать и после того, как сообщение стало достоянием общественности, что потенциально позволит работодателям и другим компаниям оценивать психическое здоровье пользователя на основе его сообщений в социальных сетях. По словам исследователей, бот может быть использован по ряду причин, включая анализ настроений, уголовные расследования или проверку при приеме на работу.

Исследование опубликовано в IEEE Transactions on Affective Computing.

Поделиться:

Подписывайтесь на краткие, но содержательные новости со всего мира
глазами молодого поколения в Телеграм и ВКонтакте.

Почитайте также

Попугаи предпочитают живое общение в режиме реального времени, а не видеозаписи

6 Предоставление доступа к видеочатам может значительно облегчить жизнь домашним попугаям. Исследование, проведенное специалистами по …