Как создать толпу на портретной платформе — детальная подборка поведения
Как создать толпу на портретной платформе — детальная подборка поведения

Данные метки портрета, используемые при выборе круга правил, рассчитываются в автономном режиме. Большая часть подробной информации удаляется в процессе расчета, и сохраняется только наиболее важное содержимое портрета, то есть значение метки пользователя в определенный день. Хотя портретные данные представляют собой сжатые и упорядоченные основные данные, во многих сценариях выбора толпы они основаны на подробных данных о поведении. Например, операторы хотят узнать период с 10:00:00 2022-08-15 по 12:00 2022-08-15: Пользователи, которым понравилась статья через мобильный клиент между 00 и 00. В настоящее время для поиска пользователей, соответствующих условиям, можно использовать только подробные данные о поведении. Подробные поведенческие данные в основном содержат пять основных элементов:

  • КТО: пользователь, участвующий в поведении, например UserId или DeviceId.
  • КОГДА: время, когда произошло поведение, обычно сохраняется миллисекундная отметка.
  • ГДЕ: конкретная страница и функциональный модуль, где происходит данное поведение.
  • КАК: способ возникновения поведения, например нажатие, обмен информацией, комментирование и т. д., а также операционная система и тип сети, использовавшиеся в тот момент.
  • ЧТО: Контент, связанный с поведением, например идентификатор статьи, которая понравилась, идентификатор видео, которое было прокомментировано, идентификатор прямой трансляции, которой поделились, и т. д.

Взяв эти пять элементов в качестве примера, вы можете построить таблицу подробных данных о поведении, как показано на рисунке 5-24, в которой user_id соответствует КТО, action_time соответствует КОГДА, Operation_page соответствует ГДЕ, action_type соответствует КАК, а action_content соответствует ЧТО. Среди них action_type и action_content просто записывают тип поведения и связанный с ним идентификатор статьи. Они также могут хранить более важную информацию через строки JSON, такую ​​как тип сети, операционная система, версия приложения во время работы, классификация статьи, автор статьи, публикация статьи. время и т. д.

Рисунок 5-24 Структура таблицы данных с подробностями поведения и примеры данных
Рисунок 5-24 Структура таблицы данных с подробностями поведения и примеры данных

Упомянутые выше эксплуатационные требования можно решить на основе таблицы подробных данных о поведении на рисунке 5-24, а ее оператор SQL выглядит следующим образом. Среди них action_time строго ограничивает время возникновения такого поведения, а Operation_page ограничивает работу клиента.

Язык кода:javascript
копировать
SELECT
DISTINCT user_id
FROM
userprofile_demo.userprofile_action_detail_table_ch
WHERE
p_date = '2022-08-15'
AND action_time >= 1660528800000
AND action_time <= 1660536000000
AND (
operation_page = 'APP_NEWS'
OR operation_page = 'APP_PROFILE'
)
AND action_type = 'LIKE'
AND action_content = '101'

Подробные данные о поведении в приведенном выше примере хранятся в таблице ClickHouse, и существует два основных способа получения данных. Первый использует таблицу Hive для импорта. Сначала вам нужно найти подробные данные о поведении в автономном режиме, а затем организовать данные и записать их в ClickHouse. Второй напрямую потребляет данные о поведении в реальном времени и записывает их в ClickHouse. и результаты выбора круга также более своевременны. В предыдущей главе было описано, как записывать данные в ClickHouse, и здесь мы не будем вдаваться в подробности. В процессе потребления данных в реальном времени данные необходимо систематизировать. Если другие атрибуты (например, типы статей) необходимо связать с бизнес-требованиями, их необходимо дополнить и улучшить перед размещением заказа в ClickHouse. На рис. 5-25 показан основной процесс создания подробных данных о поведении на основе двух методов.

Рисунок 5-25 Два способа создания подробных данных о поведении
Рисунок 5-25 Два способа создания подробных данных о поведении

Подробные данные о поведении содержат атрибуты времени, и на основе этой последовательности можно рассчитать последовательность поведения каждого пользователя. Например, вы можете обвести пользователей, которым понравилась статья, а затем поделились ею, или пользователей, которые нашли любимый товар и наконец купили его. Его можно использовать в сочетании с данными тега портрета при выборе деталей поведения. Например, если вы найдете пользователей мужского пола в Пекине, которым понравилась статья через мобильный клиент в течение определенного периода времени, вы можете напрямую связать ее с широкой таблицей портретов. для расчета.


Эта статья взята из книги «Портреты пользователей: построение платформ и бизнес-практика». При перепечатке указывайте источник.

boy illustration
Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Прочитайте нейросетевую модель Трансформера в одной статье
boy illustration
.ART Теплые зимние предложения уже открыты
boy illustration
Сравнительная таблица описания кодов ошибок Amap
boy illustration
Уведомление о последних правилах Points Mall в декабре 2022 года.
boy illustration
Даже новички могут быстро приступить к работе с легким сервером приложений.
boy illustration
Взгляд на RSAC 2024|Защита конфиденциальности в эпоху больших моделей
boy illustration
Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.
boy illustration
Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)
boy illustration
Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов
boy illustration
[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста
boy illustration
Обзор Cloud-init и этапы создания в рамках PVE
boy illustration
Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)
boy illustration
Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.
boy illustration
Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!
boy illustration
[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !
boy illustration
[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз
boy illustration
Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.
boy illustration
Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?
boy illustration
Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента
boy illustration
Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.
boy illustration
Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)
boy illustration
[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши
boy illustration
Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)
boy illustration
Кодирование Base64 в MultipartFile
boy illustration
5 точек расширения SpringBoot, супер практично!
boy illustration
Глубокое понимание сопоставления индексов Elasticsearch.
boy illustration
15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.
boy illustration
Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.