Основная задача в разработке приложений персонификации – создание точных и полных профилей пользователей на основе собранных данных.
Процесс формирования профиля состоит из двух этапов: выявления правила и его проверка.
Рисунок 1 – Упрощенное представление процесса построения профиля
Полный профиль пользователя состоит из двух частей: фактической и поведенческой. Фактическая часть содержит такую информацию, как имя, пол, дата рождения, которую система персонификации получает из фактических данных посетителя.
Поведенческий профиль моделирует действия пользователя; как правило, он строится на основе данных о транзакциях. Поведение конкретного пользователя описывается с помощью правил различных типов, в том числе правил связывания и классификации.
Методы выявления правил применяются по отдельности к данным каждого пользователя. Поскольку методы добычи данных позволяют получать правила для каждого пользователя по отдельности, эти методы прекрасно работают в случае приложений, содержащих большое число транзакций для каждого пользователя, таких как приложения обработки кредитных карт и покупки товаров.
Важным моментом при решении задачи проверки правил является масштабируемость. В приложениях персонификации число пользователей может оказаться крайне велико. Проверка правил, в отличие от их выявления, выполняется не для каждого пользователя, а для всех вместе. Эксперт обычно анализирует множество похожих или даже идентичных правил, установленных для различных пользователей. После проверки система помещает принятые правила в профиль соответствующего пользователя.