Технологии в маркетинге: цифровое рабочее место и машинное обучение

В ноябре, пока редакция Журнала активно готовилась к Национальному Рекламному Форуму, наши коллеги из АДВ Лаб, Николай Симон и Михаил Горкунов, успели выступить ещё на двух весьма интересных мероприятиях, посвященных технологиям в маркетинге. Что такое цифровое рабочее место сотрудника? Как именно машинное обучение используется в рекламе? Ответы на эти и другие вопросы – в нашем новом материале.

Создание цифрового рабочего места сотрудника агентства

Технический директор АДВ Лаб Николай Симон выступил на IDC Digital Workplace Forum 2018, который был посвящен цифровизации рабочего пространства. Николай рассказал о том, как меняются современные рекламные агентства, в чем состоят особенности их digital-трансформации и насколько в принципе необходимы подобные преобразования в реалиях рынка.

Стив Джобс говорил, что вся «магия» компьютерных вычислений состоит лишь в способности компьютера проводить их невероятно быстро – это может быть простое сложение двух чисел, но за секунду компьютер совершит миллион подобных операций. Однако действительно ли агентский бизнес нуждается в подобной автоматизации?

Очевидно, что ответ на этот вопрос положительный – увеличение количества медиаканалов и возможностей для измерения эффективности рекламного сообщения с каждым годом создают всё больший спрос на построение четких взаимосвязей между рекламой и продажами, что, в свою очередь, требует серьезной аналитической обработки.

Однако простая истина, которую нужно осознавать в любом бизнесе, заключается в том, что создание технологического решения, способного ускорить существующие процессы, само по себе не решит проблему эффективности. Поворотный момент всегда происходит на этапе внедрения – и необходимо четко понимать, что данный этап влечет за собой не только дополнительные финансовые расходы, но и больше временных затрат для сотрудников, которым придется обучиться работать с новым инструментом.

Для успешного прохождения цифровой трансформации владельцы бизнеса должны уметь видеть перспективу, ведь технологии – это всегда игра в долгую. Чтобы подготовить компанию к переменам, нужно не только самому верить в эти перемены, но и уметь ретранслировать это сообщение по всей вертикали, от руководящего состава до самых младших сотрудников, выделять время и людей на их обучение. Диджитализацию нельзя предотвратить, но можно возглавить – необходимо лишь создать симбиоз между профессиональной экспертизой сотрудника и технологическими возможностями современности.

Машинное обучение в рекламе: продвинутые методики идентификации пользователей на ТВ и в Интернете

В тот же самый день, 13 ноября, руководитель отдела Data Scinece АДВ Лаб Михаил Горкунов выступил на Martech Expo Russia – форуме, посвященном практическому использованию IT-технологий в рекламном бизнесе.

Вы наверняка не раз сталкивались со словосочетанием «машинное обучение» в самом разном контексте — в том числе и тогда, когда речь заходит о работе нашей платформы Aizek. Однако что скрывается за этим модным научным понятием применительно к миру рекламы и какие задачи решаются с помощью ML? Именно этому вопросу был посвящен доклад Михаила.

Прежде всего, машинное обучение лежит в основе модуля Aizek.Persona и отвечает за идентификацию пользователей и формирование реальных потребительских сегментов на основе имеющейся информации о медиапотреблении и образе жизни. Разберемся по порядку, как это происходит.

Начнем с медиапотребления. Для того, чтобы эффективно планировать размещение сразу в двух ключевых медиа (ТВ+Интернет) и определять необходимую долю каждого из них в рекламной кампании, нужно объединить информацию из двух источников – Mediascope TV Index (данные о телесмотрении) и Web Index (данные об интернет-пользовании). Для начала мы используем небольшую выборку, в которой нам уже известны характерные черты поведения одних и тех же пользователей как на ТВ, так и в Интернете, и на её основе обучим алгоритм находить похожих пользователей в нужных нам источниках – здесь используется довольно популярный алгоритм kNN или k-ближайших соседей. Отбор происходит на основе внушительного количества признаков – 32 признака на ТВ и 88 признаков в Интернете.

По результатам проделанной работы мы получим новую, более обширную базу данных с респондентами, однако телезрители в ней по-прежнему будут существовать отдельно от Интернет-пользователей. Как же найти одного и того же человека на ТВ и в Интернете?

Здесь в дело вступает Венгерский алгоритм — он будет формировать пары в новой выборке на основе данных из нашей исходной, небольшой выборки. Как вы могли заметить на рисунке выше, математически каждый пользователь представляет собой вектор (думаю, все мы помним, что такое вектор из общего курса математики), а значит, теоретически мы можем вычислить расстояние от «вектора телезрителя» до «вектора интернет-пользователя» на основе уже имеющихся данных. Задача алгоритма – подобрать наиболее выгодное расстояние от одного пользователя до другого, и чем оно будет меньше, тем больше вероятность, что мы нашли одного и того же человека в двух источниках. Наглядно это выглядит так:

Конечно же, вся система не строится на школьной математической программе – в ней задействованы гораздо более серьезные вычисления, для осуществления которых АДВ Лаб сотрудничает с ведущими специалистами Факультета вычислительной математики и кибернетики МГУ (ребята разрабатывали алгоритмы AI для таких гигантов, как Boeing и Hitachi). Благодаря этому сотрудничеству удалось добиться почти фантастической точности распознавания потребителя в 95%.

С медиапотреблением разобрались, а как быть с покупками и образом жизни? Здесь всё работает схожим образом: благодаря обширным данным наших партнеров, мы можем получить сегмент потребителей, в котором нам уже известны совершаемые ими покупки и детальное интернет-поведение (clickstream). Исходя из гипотезы о том, что пользователи со схожим поведением в Сети будут интересоваться схожими товарами, мы можем расширить существующий сегмент, обучив алгоритм определять вероятность того, что случайный пользователь принадлежит выбранному сегменту на основе его интернет-поведения. Кроме того, мы можем проверить полученные результаты, сравнив соц.-дем. профиль исходного и нового сегментов:

Но что мы получаем в итоге? Для чего нам необходимы все эти сложные математические вычисления? Что ж, прежде всего, они позволяют нам понять, где именно следует искать наших потребителей – не мужчин в возрасте от 25 до 45 лет или женщин с детьми, а людей, которых действительно интересуют те категории товаров, которые мы рекламируем. Ну и как вы уже можете догадаться, конечной целью внедрения подобных алгоритмов является построение полноценных моделей атрибуции – проще говоря, это возможность привязать каждый конкретный рекламный контакт к продажам. Благодаря данным X5 Retail Group Aizek уже сейчас измеряет конверсию в бизнес-результат по всем digital-кампаниям категории FMCG.

Так что машинное обучение – это не просто полезный инструмент в арсенале современного рекламного бизнеса. Это его будущее!