Какие информационные продукты необходимы для цифровой трансформации? (Прилагается схема архитектуры продукта данных)
Какие информационные продукты необходимы для цифровой трансформации? (Прилагается схема архитектуры продукта данных)

Цифровая трансформация в основном включает в себя несколько этапов: оцифровка бизнеса, капитализация данных, бизнесизация активов и бизнес-аналитика. Какие информационные продукты необходимы на разных этапах? Сегодня я проанализирую их один за другим. Я надеюсь, что это может стать справочной информацией для всех руководителей при планировании их продуктов в процессе цифровой трансформации. В основном основное внимание уделяется планированию модулей. Подробные функции и логика реализации продуктов почти. все по одному описано в предыдущих статьях.

1. Продукты, связанные со сбором данных

Оцифровка имеет два значения. Одно из них — онлайн, что означает оптимизацию оффлайновых и ручных неэффективных бизнес-процессов в прошлом, чтобы повысить эффективность работы человека и создать основу для сбора данных. Второй — это оцифровка, которая собирает данные онлайн-бизнес-процессов, чтобы предоставить базовые источники данных для последующего бизнеса и аналитики. Таким образом, в среде сбора данных основные задействованные продукты данных включают в себя:

1. Объем сбора данных и стандартное определение (обязательно)

В конце концов, в интернет-индустрии известен термин «скрытые точки», и скрытые точки также являются «болью» для многих компаний. Зарытые точки не стандартизированы, а данные полны слез. Сначала загрязнение, а затем очистка неизбежно приведет к пустой трате ресурсов на последующую очистку приложений данных. Поэтому, чтобы избежать ошибок, необходимо заранее установить спецификации сбора данных для различных источников и типов данных. Для таких продуктов, как приложения и мини-программы, необходимо установить унифицированные спецификации отслеживания и планы сбора данных. Другое интеллектуальное оборудование, датчики. Необходимо установить оборудование или сторонние источники данных. Требования определяют форматы передачи данных из разных источников.

2. Система управления точками захоронения (опция)

Интегрируйте спецификации захоронения точек в серверную часть управления данными, чтобы весь процесс захоронения точек проходил в режиме онлайн, улучшайте стандартизацию работы по захоронению точек и уменьшайте количество пропущенных и ошибочных захоронений. Даже если некоторые системы анализа поведения пользователей не поддерживают скрытых точек или визуальных скрытых точек, существуют модули управления данными скрытых точек, которые предоставляют возможности определения индикаторов на основе интерфейса. Вначале правила захоронения точек в основном передавались из поколения в поколение через Excel.

3. Система синхронизации или интеграции данных (обязательно)

Этот модуль может существовать отдельно или в сочетании с платформой разработки больших данных. Его основная функция — обеспечить функцию сквозной синхронизации данных, то есть выбрать источник данных и цель, с которой данные должны быть синхронизированы. и для установки различных источников и целей достаточно параметров, частоты планирования задач и стратегии. Одно из самых модных слов в наши дни — озеро для ввода данных с помощью одной клавиши. Автоматизация одним щелчком мыши передает неструктурированные (аудио, видео и т. д.) и структурированные данные в центральное озеро данных для последующей обработки и потребления. Возвращаясь к упомянутому ранее примеру с кулинарией шеф-повара, инструменты интеграции данных подобны автоматизированным инструментам сбора урожая. В прошлом из-за ручного труда количество и тип ингредиентов были ограничены. После механизированного производства богатство продуктов значительно улучшилось.

2. Обработка и инструменты обработки данных

1. Офлайн-платформа разработки (обязательно)

Данные, собранные в озере, необходимо обрабатывать, чтобы проявить свою ценность, особенно для интегрированной архитектуры озера и хранилища, которая предполагает разработку модулей хранилища данных для структурированных данных. Выполняйте ETL-обработку данных в соответствии с логикой бизнес-требований и выводите модели данных одну за другой. К основным функциям платформы офлайн-разработки следует отнести:

хранилище&Вычислительный уровень:Автоматизированное распределение ресурсов(В основном планирование ресурсов кластера),Основная специализация «Разработка данных» — «Бизнес-логика».,Нет необходимости всем иметь набор Hadoop

Уровень разработки задач:IDEВизуальная разработка задач,В дополнение к основной логике обработки данных, требующей реализации кода,Другие настройки параметров могут быть настроены,Платформа должна поддерживать общие типы задач разработки и анализа данных, такие как Hive, Shell и Python.

Планирование задач:Данные имеют строгие восходящие и нисходящие отношения.,Только после успешного выполнения задачи восходящего потока данных и завершения обработки данных.,Данные ниже по течению точны,Таким образом, общие задачи не существуют сами по себе.,Необходимо установить зависимости,также,Периодические данные нельзя щелкать вручную каждый день.,Еще нужно время, чтобы составить расписание,Установите, следует ли выполнять каждую минуту, час или день и месяц в соответствии с вашими потребностями.,В какое время выполнять и т.д.

Задача эксплуатации и обслуживания:Изменить логику、Ошибка в восходящем потоке、Нестабильные ресурсы кластера часто требуют обратного отслеживания данных.、Перезапуск задач и другие операции выполняются в пакетном режиме.、Автоматизированные операции могут сэкономить много времени на эксплуатацию и техническое обслуживание.

2. Платформа разработки в реальном времени (обязательно)

Данные в реальном времени в основном отвечают потребностям мониторинга данных в реальном времени, поиска в реальном времени, рекомендаций или сценарного маркетинга в реальном времени на стороне продукта. Основное различие между разработкой в ​​реальном времени и автономной разработкой заключается в технических компонентах. Функциональные модули продукта аналогичны и также могут быть интегрированы для формирования единого интегрированного пакетного потока. Платформа для разработки и обслуживания больших данных.

3. Инструменты построения хранилища данных (необязательно)

В основном он интегрирует спецификации и процессы разработки модели данных в систему. Это идея с низким кодом, которая сокращает разработку кода разработки моделирования хранилища данных и улучшает стандартизацию и возможность повторного использования модели. Например, Datapin от Alibaba имеет преимущество. систематизация Удобно управлять процессом моделирования заранее, вместо того, чтобы сначала загрязнять, а потом лечить. Недостаток в том, что он может быть не таким гибким, как разработка и написание собственного кода, поэтому его можно использовать как дополнительный модуль.

3. Продукты для управления и контроля данных

1. Карта данных (обязательно)

Вино также боится глубоких переулков. Как только модель данных будет разработана, ее можно будет найти и использовать для улучшения возможности повторного использования. Карта данных обеспечивает возможность просмотра и поиска данных посредством совместного использования каталога активов и мощных возможностей поиска данных. В то же время это требует глубоких знаний. Информация метаданных модели позволяет потребителям данных быстро определить, нужны ли им данные и как их использовать.

2. Мониторинг качества данных (обязательно)

Можно сказать, что неточные данные являются одной из самых неприятных проблем для бизнеса и групп данных. Бизнес боится использовать данные после их получения. Давайте сначала спросим, ​​точны ли данные после прочтения. задачи и глядя на код, все должно быть в порядке. Мониторинг качества данных создает богатую и гибкую конфигурацию правил качества данных и автоматические возможности раннего предупреждения, основанные на таких аспектах, как согласованность, своевременность, полнота и точность, что делает разработчиков данных более уверенными. Пока мониторинг не вызывает тревогу, они могут похлопать себя по груди. скажите, да какие изменения произошли в бизнесе?

3. Происхождение данных (обязательно)

В основном решает проблему отслеживания источника данных,Например, аномалии данных,Необходимо уведомить перерабатывающий бизнес,Необходимо перейти в автономный режим или удалить во время управления данными.,Кто-нибудь ниже по течению использует его?,Если у вас нет кровных уз, вы не осмелитесь управлять.,данные&Услуги только увеличиваются, а не уменьшаются。

4. Оптимизация стоимости данных (обязательно)

Хотя все по умолчанию считают отдел данных центром затрат, в эту холодную зиму мы должны затянуть пояса. Хотя мы не можем открыть исходный код, мы должны сократить расходы. Данные, которые не использовались в течение длительного времени, могут быть заархивированы или удалены. и какие задачи имеют крайне низкую производительность SQL. Задача выполняется более 10 часов и потребляет много ресурсов процессора и графического процессора? Основная цель оптимизации затрат на данные — создать систему оценки состояния данных, автоматически определить цели управления и обеспечить автоматизированные действия по управлению, такие как архивирование и удаление, тем самым высвобождая ресурсы сервера и выполняя вычитание на регулярной основе.

5. Унифицировать права доступа к данным (обязательно)

Проблемы безопасности данных связаны с жизнью и смертью предприятия, а также с «денежным путем» группы данных. Унификация разрешений в основном устанавливает соответствующий процесс для подачи заявок на получение разрешений на активы данных, авторизации и аудита, чтобы гарантировать, что данные являются и тем, и другим. общий и безопасный.

4. Принятие решений на основе данных и интеллектуальные приложения

1. Анализ визуализации данных (обязательно)

В основном это относится к отчетам по тематическому анализу данных, которые можно кастомизировать или настроить на основе инструментов BI самообслуживания. Его основная цель — предоставить возможности визуального анализа для основной системы показателей бизнес-операций и управления. Вы не можете позволить своему начальнику каждый день использовать функцию перетаскивания BI самообслуживания. Например, некоторые панели управления кабины управления или большие визуальные экраны.

2. Современный BI-анализ самообслуживания (обязательно)

После того, как компания Tableau была приобретена отделом продаж за 15,7 миллиардов долларов США, в конце 21 года она объявила об уходе с китайского рынка. Как создатель инструментов BI, ее функции очень полны и мощны. Почему она так популярна? Основная причина заключается в том, что его целевыми пользователями являются аналитики данных. Сложность функций приводит к высоким затратам на обучение и понимание. Эпоха цифровой трансформации требует демократии данных и инклюзивности. Поэтому по сравнению с Tableau в настоящее время. Внутренний рынок Некоторые поставщики облачных технологий (QuickBI, Volcano Engine и т. д.) и продуктов BI (Guanyuan Data) могут лучше удовлетворять потребности непосредственного бизнес-персонала в использовании данных. Благодаря современному бизнес-аналитике сотрудники, работающие с данными, сосредотачиваются на разработке моделей и инфраструктуры данных, в то время как бизнес-персонал перетаскивает анализ и настраивает свои собственные визуальные информационные панели. Они больше не полагаются исключительно на временный поиск SQL или разработку настраиваемых визуальных страниц.

3. Система анализа поведения пользователей (опционально)

В 2015 году, когда были популярны теории роста пользователей и взлома роста, многие малые и средние интернет-компании приобрели системы анализа поведения пользователей, такие как Shence и GrowingIO. Его преимущество состоит в том, что он может предоставить возможность собирать данные о поведении пользователей посредством анализа самообслуживания, но уровень данных больше ориентирован на данные о трафике и имеет относительно слабую поддержку других данных бизнес-системы. Современный BI самообслуживания может включать модельные данные о поведении пользователей, что делает его более инклюзивным.

4. CDP или DMP цифрового маркетинга (обязательно)

Основываясь на технологиях обработки больших данных и интеллектуального анализа данных, мы создаем систему маркировки портретов пользователей, отбираем пользователей, уточняем стратификацию, осуществляем дифференцированные операции и маркетинговые контакты, а также повышаем операционную рентабельность инвестиций. На основе платформы студенты-бизнесмены могут реализовать замкнутый цикл от выбора толпы, построения сцены, доставки охвата и восстановления эффекта. В то же время на основе тегов интеллектуального анализа алгоритмов и рекомендованных моделью комбинаций толпы, от операций, основанных на человеческом опыте, до рекомендуемые операции на основе алгоритмов больших данных. Интеллектуальная работа. Как правило, операции с трафиком частного домена внутри предприятий называются CDP (платформа управления клиентскими данными), а компании, которые монетизируют трафик, называются DMP (платформа управления данными), например Tencent Guangdiantong и Alibaba Damopan.

5. Алгоритмическая платформа (опционально)

Высокий уровень цифровой трансформации — это интеллект. Если вы хотите, чтобы разработка услуг искусственного интеллекта была более эффективной, даже продукты и операции могут быть настроены с помощью интерфейса службы рекомендаций. В настоящее время могут пригодиться платформы машинного обучения или алгоритмов. Для разработки алгоритмов он в основном предоставляет рабочую среду для всего процесса, начиная от планирования ресурсов (ЦП, графического процессора и т. д.), автономного сбора данных, разработки функций, обучения модели и служб вывода, тем самым улучшая возможность вывода алгоритма. на тайваньский манер, да еще через Сервис безкодового алгоритма, реализуемый путем перетаскивания узлов модели, находится в сети.

6. Управление службами данных (опционально)

Некоторые люди также называют центр обработки данных DAAS, что означает «данные как услуга». Как можно быстро экспортировать данные в бизнес-конец, чтобы расширить возможности инноваций в продуктах. Службы API управляются унифицированным образом, обеспечивая полную взаимосвязь приложений, предоставляя возможности создания конфигурации для общих интерфейсов и снижая зависимость от разработки Java. Согласно идее промежуточной платформы данных, вывод API службы данных является основной формой вывода приложения. С одной стороны, платформа управления службами данных должна иметь возможность самостоятельной настройки и вывода активов данных, то есть. Хранилище данных очистило модель данных, разработку данных или бизнес-персонал. Интерфейс API можно создать посредством визуальной конфигурации входных и выходных параметров без необходимости вмешательства в разработку интерфейса. В то же время также необходимо управлять активами API и обеспечивать отслеживаемость и мониторинг документов интерфейса API и вызовов приложений.

5. Резюме

Определение продуктов широких данных заключается в том, что любые сопутствующие продукты, которые могут повысить эффективность всего процесса сбора, хранения, управления, расчета и использования данных, а также способствовать получению ценности данных, могут быть отнесены к соответствующим продуктам данных. В процессе цифровой трансформации есть большие и маленькие модели, но общая матрица продуктов аналогична. И теперь почти в каждом сегменте существуют зрелые версии коммерческих продуктов для обработки данных. В процессе фактической цифровой трансформации предприятия могут всесторонне оценить, какие из них выбрать для аутсорсинга, исходя из ресурсов НИОКР, инвестиционного времени и финансовых затрат, безопасности данных и других аспектов. разрабатываются независимо.

boy illustration
Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Прочитайте нейросетевую модель Трансформера в одной статье
boy illustration
.ART Теплые зимние предложения уже открыты
boy illustration
Сравнительная таблица описания кодов ошибок Amap
boy illustration
Уведомление о последних правилах Points Mall в декабре 2022 года.
boy illustration
Даже новички могут быстро приступить к работе с легким сервером приложений.
boy illustration
Взгляд на RSAC 2024|Защита конфиденциальности в эпоху больших моделей
boy illustration
Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.
boy illustration
Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)
boy illustration
Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов
boy illustration
[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста
boy illustration
Обзор Cloud-init и этапы создания в рамках PVE
boy illustration
Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)
boy illustration
Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.
boy illustration
Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!
boy illustration
[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !
boy illustration
[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз
boy illustration
Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.
boy illustration
Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?
boy illustration
Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента
boy illustration
Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.
boy illustration
Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)
boy illustration
[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши
boy illustration
Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)
boy illustration
Кодирование Base64 в MultipartFile
boy illustration
5 точек расширения SpringBoot, супер практично!
boy illustration
Глубокое понимание сопоставления индексов Elasticsearch.
boy illustration
15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.
boy illustration
Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.