Мы предложили агентству отказаться от поверхностного поиска точных совпадений и перейти к смысловому анализу медиа. Для этого разработали AI-систему, которая находит и интерпретирует все формы републикации контента: от дословных копий до рерайтов и материалов с адаптированными заголовками.
Решение строится на нескольких ключевых модулях:- Для поиска используются сразу несколько поисковых систем (Google, Bing, Yahoo, DuckDuckGo), а также парсеры новостных агрегаторов. Это позволяет охватить разные сегменты медиа — от крупных площадок до нишевых региональных источников.
- Вместо поиска по ключевым словам применяется семантический анализ. Система работает на базе NLP-моделей, которые распознают смысловую близость текстов. Даже если материал опубликован в другом формате, с новым заголовком или частичным сокращением, система фиксирует его как релевантную републикацию.
- Модели настраиваются под конкретную кампанию с учётом ключевых сообщений, тематики, брендовых особенностей и требований клиента.
Итоговая картина — это не просто список упоминаний, а целостная визуализация медиаприсутствия: опубликовано материалов, на каких площадках они вышли, как распространялась информация и какие фрагменты получили наибольшее количество цитирований.
РеализацияРаботу начали с анализа типичных кейсов: изучили, как выглядят публикации, как они распространяются и какие изменения в них встречаются чаще всего. На основе этого подготовили стандартные шаблоны — заголовки, ключевые сообщения, цитаты и смысловые блоки для отслеживания.
Затем загрузили в систему исходные материалы кампании: пресс-релизы, статьи, цитаты спикеров. Это послужило отправной точкой для дальнейшего поиска. После этого мы настроили семантическое ядро. С помощью языковых моделей создали смысловое представление каждого материала. Это позволяет системе находить даже сильно изменённые версии публикаций, включая переводы, адаптации и сокращённые варианты. Контент из источников парсится и сравнивается с исходными шаблонами по смыслу, а не по набору слов. Все найденные публикации собираются в общей базе с аннотациями и данными о достигнутом охвате.
Система работает как ассистент: автоматически предлагает найденные републикации, связывает их с оригиналом, рассчитывает охват и формирует итоговый отчёт. Её не нужно настраивать заново для каждой кампании: достаточно обновить исходные материалы, чтобы адаптировать базовую логику под новые задачи.