Лингвистический анализ приспособили для деанонимизации

На конференции 29C3 в Берлине аспиранты из американского Университета Дрекселя представили способ установки автора анонимной публикации с помощью лингвистического анализа материалов, которые опубликованы в интернет сети. Как сообщает SC Magazine Australia, исследователи предложили провести анализ материалов – электронных писем, «твитов», сообщений из мессенджеров, а также постов из форумов. В них будут выявлены закономерности и общие черты с точки зрения статистической стилистики. Главный ориентир, позволяющий вычислить человека — служебные слова в переписке. По мнению разработчика Садии Афроз, служебные слова используются прежде всего для выражения отношений между членами предложения.

Однако затруднить поиск может так называемый «альтернативный алфавит», отличный от английского. Новый инструментарий для установки авторства называется JStylo. Программа способна успешно выявить автора при соблюдении ряда условий. Круг «подозреваемых» ограничен 50-ю людьми или меньшим числом и на каждого обязательно должен быть собран языковой материал не менее 6500 слов. Кроме того, длина текста, авторство которого устанавливается, должна быть выше 500 слов. В настоящее время разработка программы JStylo ещё не завершена. По словам исследователей, новый инструмент можно использоваться для выявления хакеров, создателей вирусов и операторов ботнетов.

Loading

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *