ИИ научился определять личные данные по рекламной ленте

Даже без доступа к истории браузера алгоритмы могут восстановить уровень образования, возраст и политические взгляды человека — просто анализируя ту рекламу, которую он видит.

Исследование Центра ARC по автоматизированному принятию решений (Университет Нового Южного Уэльса) совместно с Квинслендским технологическим университетом показало: современные большие языковые модели (LLM) способны извлекать персональные характеристики пользователя из рекламной ленты, не требуя явных сигналов вроде истории кликов или поисковых запросов.

Раньше алгоритмы строили профили на основе заранее размеченных признаков. Теперь ИИ анализирует скрытые корреляции в разнородном контенте — и делает это непрозрачно, без объяснения использованных критериев.

Реклама как цифровой след

Учёные изучили более 435 тысяч контекстных объявлений и данные 891 пользователя (проект «Australian Ad Observatory»). Выяснилось, что даже без доступа к браузеру или личной информации ИИ способен с высокой точностью определить:
— политические и идеологические предпочтения;
— уровень образования;
— статус занятости;
— пол, возраст, расу;
— социально-экономическое положение.

При этом длительное наблюдение не требуется — достаточно коротких сессий просмотра рекламы.

В 200 раз дешевле человека

LLM-модели работают точнее и стабильнее людей в аналогичной задаче, а также в 50 раз быстрее и более чем в 200 раз дешевле.

«Наши результаты демонстрируют, что готовые LLM-модели могут точно восстанавливать сложные частные атрибуты пользователей», — отмечают авторы доклада (ACM Web Conference 2026).

«Создание профилированных данных возможно даже в течение коротких периодов наблюдения. Длительное отслеживание не является необходимым условием для успешного извлечения таких данных».

Не гипотеза, а системная уязвимость

Ведущий автор Байю Чен подчёркивает:

«Реклама, которую видит человек, не случайна. Её общая картина несёт сигналы о поле, возрасте, образовании, занятости и политических взглядах. ИИ анализирует эти закономерности».

Авторы выделяют риск браузерных расширений, которые получают доступ к содержимому страниц:

«Мы определили расширения, злоупотребляющие законными привилегиями, как потенциальный основной вектор этой атаки».

Почему это нельзя игнорировать

Потоки рекламы фактически работают как цифровой отпечаток пользователя, который можно анализировать вне платформы. Решить проблему только техническими средствами не получится — риск заложен в самой экосистеме онлайн-рекламы. Нужны и технические, и регуляторные меры.

Ранее на OOH Mag: OpenAI целит в $100 млрд рекламы к 2030 году.

Тэги

Big Data digital исследование маркетинг регулирование реклама технология