Данные метки портрета, используемые при выборе круга правил, рассчитываются в автономном режиме. Большая часть подробной информации удаляется в процессе расчета, и сохраняется только наиболее важное содержимое портрета, то есть значение метки пользователя в определенный день. Хотя портретные данные представляют собой сжатые и упорядоченные основные данные, во многих сценариях выбора толпы они основаны на подробных данных о поведении. Например, операторы хотят узнать период с 10:00:00 2022-08-15 по 12:00 2022-08-15: Пользователи, которым понравилась статья через мобильный клиент между 00 и 00. В настоящее время для поиска пользователей, соответствующих условиям, можно использовать только подробные данные о поведении. Подробные поведенческие данные в основном содержат пять основных элементов:
Взяв эти пять элементов в качестве примера, вы можете построить таблицу подробных данных о поведении, как показано на рисунке 5-24, в которой user_id соответствует КТО, action_time соответствует КОГДА, Operation_page соответствует ГДЕ, action_type соответствует КАК, а action_content соответствует ЧТО. Среди них action_type и action_content просто записывают тип поведения и связанный с ним идентификатор статьи. Они также могут хранить более важную информацию через строки JSON, такую как тип сети, операционная система, версия приложения во время работы, классификация статьи, автор статьи, публикация статьи. время и т. д.
Упомянутые выше эксплуатационные требования можно решить на основе таблицы подробных данных о поведении на рисунке 5-24, а ее оператор SQL выглядит следующим образом. Среди них action_time строго ограничивает время возникновения такого поведения, а Operation_page ограничивает работу клиента.
SELECT
DISTINCT user_id
FROM
userprofile_demo.userprofile_action_detail_table_ch
WHERE
p_date = '2022-08-15'
AND action_time >= 1660528800000
AND action_time <= 1660536000000
AND (
operation_page = 'APP_NEWS'
OR operation_page = 'APP_PROFILE'
)
AND action_type = 'LIKE'
AND action_content = '101'
Подробные данные о поведении в приведенном выше примере хранятся в таблице ClickHouse, и существует два основных способа получения данных. Первый использует таблицу Hive для импорта. Сначала вам нужно найти подробные данные о поведении в автономном режиме, а затем организовать данные и записать их в ClickHouse. Второй напрямую потребляет данные о поведении в реальном времени и записывает их в ClickHouse. и результаты выбора круга также более своевременны. В предыдущей главе было описано, как записывать данные в ClickHouse, и здесь мы не будем вдаваться в подробности. В процессе потребления данных в реальном времени данные необходимо систематизировать. Если другие атрибуты (например, типы статей) необходимо связать с бизнес-требованиями, их необходимо дополнить и улучшить перед размещением заказа в ClickHouse. На рис. 5-25 показан основной процесс создания подробных данных о поведении на основе двух методов.
Подробные данные о поведении содержат атрибуты времени, и на основе этой последовательности можно рассчитать последовательность поведения каждого пользователя. Например, вы можете обвести пользователей, которым понравилась статья, а затем поделились ею, или пользователей, которые нашли любимый товар и наконец купили его. Его можно использовать в сочетании с данными тега портрета при выборе деталей поведения. Например, если вы найдете пользователей мужского пола в Пекине, которым понравилась статья через мобильный клиент в течение определенного периода времени, вы можете напрямую связать ее с широкой таблицей портретов. для расчета.
Эта статья взята из книги «Портреты пользователей: построение платформ и бизнес-практика». При перепечатке указывайте источник.