Анализ данных, основной сценарий применения больших данных, отслеживает рабочее состояние предприятий с помощью показателей анализа данных и своевременно корректирует стратегии операций и продуктов. Подавляющее большинство вычислений больших данных, выполняемых на платформах больших данных, связаны с анализом данных. Для различных статистических данных, корреляционного анализа и сводных отчетов требуется платформа больших данных.
Эти показатели операционных данных, руководитель должен полностью и быстро понять эти показатели, чтобы обнаружить операционные проблемы компании.
С точки зрения компании, операционные данные являются основой управления деятельностью и развитием компании. С помощью операционных данных можно не только понимать текущий статус развития компании, но и управлять компанией, корректируя эти показатели, то есть операции, основанные на данных.
Получение оперативных данных требует большого количества точек сбора данных в приложении, сбора данных из баз данных, журналов и других третьих сторон, очистки, преобразования и хранения данных, а также использования SQL для выполнения статистики данных, обобщения и анализа, чтобы в конечном итоге получить необходимые данные оперативных отчетов. Все это требует поддержки платформы больших данных.
Различные интернет-отрасли фокусируются на разных операционных данных. Однако некоторые показатели широко используются и в основном отражают основное состояние операций.
1. Количество новых пользователей
Ключевым показателем роста веб-сайта является количество новых пользователей, которые посещают веб-сайт (или количество новых пользователей, которые загружают приложение). Для веб-сайта в период взрывного роста количество новых пользователей удвоится за короткий период. В течение короткого периода времени, который является периодом стратегических возможностей для веб-сайта, многие крупные веб-сайты пережили одну или несколько стадий быстрого роста числа пользователей.
Количество новых пользователей включает в себя несколько статистических методов, таких как количество новых пользователей в день, количество новых пользователей в неделю и количество новых пользователей в месяц.
2. Уровень удержания пользователей
Новые пользователи не всегда довольны веб-сайтом. Если они чувствуют неудовлетворенность после использования веб-сайта, они могут закрыть свои учетные записи (удалить приложение), и эти с трудом заработанные пользователи будут потеряны. Веб-сайты относятся к пользователям, которые не были потеряны по истечении определенного периода времени, как к сохраненным пользователям. Отношение количества сохраненных пользователей к количеству новых пользователей в текущем периоде является коэффициентом удержания пользователей.
Коэффициент удержания пользователей = Количество удержанных пользователей / текущий период Количество новых пользователей
Существует временное окно для расчета ретенции, то есть по сравнению с текущими данными удержание новых пользователей 3-дневной давности называется 3-дневным ретеншеном, соответственно есть 5-дневное ретеншен, 7-дневное ретеншен и т.д. Новых пользователей можно привлечь с помощью рекламы, рекламных акций, вирусного маркетинга и других средств, но для того, чтобы пользователи оставались, продукт должен иметь реальную ценность. Уровень удержания пользователей — важный показатель, отражающий пользовательский опыт и ценность продукта. Вообще говоря, показатель удержания пользователей за 3 дня, превышающий 40 %, считается хорошим. Коэффициенту удержания пользователей соответствует показатель оттока пользователей.
Отток пользователей = 1 - Коэффициент удержания пользователей
3. Количество активных пользователей
Пользователи скачивают и регистрируются, но редко открывают продукт, что указывает на отсутствие привлекательности и привлекательности продукта. Количество активных пользователей представляет собой количество пользователей, которые открыли и использовали продукт. В зависимости от статистического уровня различают количество активных пользователей в день, количество активных пользователей в месяц и т. д. Повышение активности является важной целью работы веб-сайта. Различные приложения часто отправляют пользователям сообщения о скидках и рекламных акциях, чтобы побудить пользователей открыть продукты.
4. PV
Даже если продукт активен при его открытии, частота его использования после открытия измеряется индикатором PV. Каждый раз, когда пользователь щелкает мышью и переходит на каждую страницу, это называется PV (просмотр страницы). PV — важный показатель статистики посещений веб-страниц. В мобильных приложениях для подсчета необходимо внести некоторые изменения.
5. GMV
GMV — это валовой объем товаров, который является показателем статистического оборота (потока) веб-сайта электронной коммерции и отражает возможности получения дохода от веб-сайта. Также включены объем заказа (общее количество заказов, размещенных пользователем), цена за единицу (средняя цена одного заказа) и т. д.
6. Коэффициент конверсии
Соотношение пользователей, совершающих покупки, к числу пользователей, посещающих сайт электронной коммерции.
коэффициент конверсии = Количество пользователей с покупательским поведением / Общее количество посещенных пользователей
От входа на веб-сайт до совершения окончательной покупки пользователю, возможно, придется пройти сложный путь доступа и он может уйти по каждой ссылке: зайдя на домашнюю страницу, думая, что покупать нечего, а затем уйти, просматривая результаты поиска; и не желая покупать, то уходите; заходя на страницу сведений о товаре, смотрите отзывы, фотографии, цены, а затем уходите, положив его в корзину, думаете о себе; собственный кошелек, а затем уходите; при оплате вы обнаруживаете, что ваш любимый способ оплаты не поддерживается, и уходите... От входа на сайт до оплаты пользователь совершает реальный расход, будет высокая вероятность потери в В середине сайт должен делать все возможное. Различные методы: персональные рекомендации, скидки и акции, бесплатная доставка, красные конверты и рассрочка платежа, чтобы удержать пользователей и повысить конверсию.
В частности, разные веб-сайты будут иметь свои собственные показатели, основанные на их собственных характеристиках. Например, Baidu может сосредоточиться на таких показателях, как «рейтинг кликов по рекламе», а игры — на «количестве платящих игроков». Для каждого продукта следует искать показатели данных, которые смогут отражать его собственные условия эксплуатации, исходя из его собственных характеристик.
Для облегчения анализа и принятия решений эти показатели обычно отображаются в виде диаграмм, то есть визуализации данных.
Данные отображаются в виде диаграмм, которые позволяют более интуитивно отображать и обнаруживать закономерности данных. К наиболее часто используемым визуальным диаграммам для операций в Интернете относятся следующие.
1. Линейный график
Горизонтальная ось — время, показывающая закономерность изменения данных во временном измерении.
2. График рассеяния
Он может эффективно помочь аналитикам быстро обнаружить закономерности и тенденции в распределении данных и может быть описан как алгоритм кластеризации, открывающийся невооруженным глазом.
3. Тепловая карта
Анализируйте популярные области страниц веб-сайта, посещаемые пользователями, чтобы лучше реализовать макет страницы и визуальное отображение.
Тепловая карта, отображаемая на карте, отражает состояние загруженности и агрегированности района, что облегчает планирование поездок пользователей.
4. Воронкообразная диаграмма
Представляет коэффициент конверсии на каждом этапе всего пути доступа пользователя. Когда важные показатели дохода (GMV, прибыль, объем заказов) выходят за пределы нормы, необходимо проанализировать всю диаграмму воронки, чтобы определить, есть ли проблема с входным трафиком сайта или проблема с конверсией на определенном этапе в середине; Независимо от того, является ли это проблемой контента или системной проблемой, необходимо анализировать и исследовать одну за другой. Помимо выявления ключевых моментов и методов повышения эффективности работы веб-сайта, одной из задач анализа данных также является анализ и обнаружение коренных причин аномальных проблем.
Визуальная графика может помочь аналитикам прогнозировать тенденции и более точно и быстро выявлять проблемы во время анализа данных. Использование диаграмм при составлении отчетов становится более убедительным и позволяет принимать более обоснованные и уверенные решения.
Вышеуказанные графики взяты изECharts,Компонент визуальных диаграмм Baidu с открытым исходным кодом,Всего несколько строк кода,Вы можете классно визуально отображать оперативные данные.
Окончательное внедрение технологии больших данных должно принести реальную пользу предприятию, а анализ данных является одним из наиболее важных сценариев применения. Результаты анализа — это окончательное отображение результатов. Перед этим сбор данных, очистка, преобразование, хранение, расчет и анализ требуют большой работы. Теперь, когда проделана такая большая работа, как оформить окончательные результаты работы в более интуитивном и технологическом смысле? Технический персонал должен думать с точки зрения пользователей и нетехнических точек зрения, чтобы стремиться к более широкому признанию своей работы? и осознал большую ценность.
Монитор с большим экраном:
Если начальник хочет сделать оперативный системы мониторинга, необходимо предварительно согласовать с начальником несколько моментов: 1. Пользователь. Для кого посмотреть. Это только для руководства, начальников, сотрудников среднего звена, рядовых сотрудников или даже внешних пользователей. Это касается прав доступа к данным и разрешений функций. 2. Основные показатели. Разные предприятия имеют разные основные показатели. После определения необходимых основных показателей легко уточнить калибр, уровень отображения информации и конкретный метод отображения. 3. Временная точка онлайн. Начальная часть системы мониторинга имеет источник данных системы индикаторов, а нижняя часть — анализ данных и оперативные действия. Как только момент времени станет ясен, ее можно легко демонтировать и внедрить. Только после этого мы переходим к конкретным планам продукта, архитектуре системы, выбору технологий, а также планированию и отслеживанию разработки. PS в системе мониторинга данных неизбежны логарифмы. После выхода в интернет данные все равно нужно проверять каждый день. Если начальство первым обнаружит проблему, все будет кончено.