A. Передовые технологии обработки больших данных (5%)
Вопросы с несколькими вариантами ответов:
1. Следующие __ не являются ключевыми технологиями больших данных.
А. Технологии обработки данных
B. Технологии безопасности больших данных и технологии качества больших данных
C. Технология виртуализации и технология платформы облачных вычислений
D. Технология массового хранения данных
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
2. Spark более эффективен, чем расчет MR в Hadoop. К основным причинам не относятся следующие__.
А. Spark поддерживает DAG.
Б. Промежуточные данные Spark не хранятся на диске и кэшируются.
C. Spark использует архитектуру MPP и параллельную обработку.
D. Высоко абстрактный API
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
3. Какое из следующих заблуждений относительно потоковых вычислений является ___
А. Потоковые вычисления соответствуют эффективным сценариям реального времени
Б. Вычисления в реальном времени обеспечивают более быстрые пакетные вычисления и более быструю доставку данных.
C. Потоковые вычисления должны сначала отправить задание потокового вычисления и дождаться потока данных, чтобы запустить операцию.
D. Потоковые вычисления выполняют непрерывные вычисления, а данные после вычислений отбрасываются.
Ответ: Б
Официальный аккаунт@Изучите большие данные за пять минут
4. Фильтр Блума (BF) — это структура случайных данных с высокой эффективностью использования пространства. Следующее описание неверно __.
А. Это вероятностный алгоритм определения существования элемента в наборе.
Б. Суждение о том, что если его нет в наборе, то его точно нет. Если он есть в наборе, существует определенная вероятность ошибки.
C. Поддерживает удаление элемента из коллекции.
D. Выбор хэш-функции повлияет на эффект алгоритма.
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
Вопросы с несколькими вариантами ответов:
5. Вопрос. К методам оптимизации производительности механизмов больших данных относятся следующие ____
А. При планировании задач вычислительной машины постарайтесь локализовать вычисления и уменьшить выходную мощность сети передачи данных.
Б. Данные передаются на разных этапах в потоковом режиме, что позволяет сократить материализацию на диск.
C. Принять столбчатое хранилище данных, включая облегченные сжатые данные, отложенную декомпрессию и технологию механизма векторизации.
D. Архитектура MPP использует детальную отказоустойчивость, чтобы предотвратить влияние обратных узлов на всю производительность запроса.
Ответ: АВС
Эта статья взята из Официальный аккаунт@Изучите большие данные за пять минут
B. Обзор методологии проектирования архитектуры больших данных (3%)
Вопросы с несколькими вариантами ответов:
6. Система генерации идентификаторов распределенных систем не включает __
А. Сгенерированный идентификатор должен учитывать разницу хоста
Б. Идентификатор должен быть глобально уникальным и не допускать дублирования.
C. Идентификатор нерегулярен и необходим по соображениям информационной безопасности.
D. Высокое количество запросов в секунду, высокая производительность, доставка с низкой задержкой.
Ответ: А
Эта статья взята из Официальный аккаунт@Изучите большие данные за пять минут
7. Неправильное понимание теории CAP – это ___
А. В основе CAP лежит сценарий создания нескольких копий одних и тех же данных.
Б. В сценариях с большими данными требования к A/P выше, но требования к C ниже.
C. AP подходит как для баз данных NoSQL, так и для реляционных баз данных.
D. Реляционная база данных жертвует C ради обеспечения P и A.
Ответ: Д
Эта статья взята из Официальный аккаунт@Изучите большие данные за пять минут
Вопросы с несколькими вариантами ответов:
8. На что следует обратить внимание при обработке данных о поведении пользователей: ___
О. Скрытые данные должны соответствовать информационному потоку бизнес-данных, чтобы обеспечить целостность обработки данных и доступность данных.
Б. Поведенческие данные должны быть последовательно связаны с другими источниками данных, чтобы обеспечить согласованность и актуальность данных.
C. Метаданные поведенческих данных должны быть помещены и сохранены в файлах данных из источника, насколько это возможно.
D. Скрытые данные могут быть визуальными и невизуальными скрытыми точками.
Ответ: АВСD
Эта статья взята из Официальный аккаунт@Изучите большие данные за пять минут
C. Проектирование архитектуры в распространенных сценариях больших данных (составляет 5%)
Вопросы с несколькими вариантами ответов:
9. Неверное архитектурное описание модели разрешений RBAC___
А. Используется для определения ролей, требующих проверки разрешений.
Б. Модель разрешений Hive для механизма больших данных опирается на RBAC.
C. Между ролями могут существовать отношения наследования.
D. RBAC основан на принципе разделения ответственности и принципе абстракции данных.
Ответ: Б
Официальный аккаунт@Изучите большие данные за пять минут
10. Платформа мониторинга больших данных не включает ___
A. Системный мониторинг обслуживания SLA
B. Мониторинг состояния онлайн-функций
C. Отслеживание цепочки вызовов службы и обнаружение проблем
D. Предоставление базовых высокопроизводительных услуг RPC.
Ответ: Д
Официальный аккаунт@Изучите большие данные за пять минут
11. Что из перечисленного не относится к трем элементам высокопроизводительной архитектуры__
A. Промежуточное программное обеспечение сообщений
Б. Высокая доступность услуг
C. Управление конфигурацией
D. Компонентизация услуг
Ответ: Б
Официальный аккаунт@Изучите большие данные за пять минут
12. Что не является частью архитектуры масштабируемости услуг, так это ___
О. Службы можно добавлять через сервер, чтобы справиться с растущим давлением одновременного доступа.
Б. Серверы кластера не могут хранить данные и имеют одноранговую архитектуру.
C. Степень связи между различными продуктами и бизнесом очень мала, и изменения в одном продукте или бизнесе не повлияют на другие.
D. Восходящий поток может использовать подходящее оборудование для балансировки нагрузки для обнаружения новых или закрытых сервисов.
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
Вопросы с несколькими вариантами ответов:
13. Обычно используемые методы сортировки при обработке больших данных включают:
А. Быстрая сортировка
Б. Сортировка кучей
С. сортировка слиянием
Д. сортировка ведром
Ответ: АВСD
Официальный аккаунт@Изучите большие данные за пять минут
D. Хранение больших данных и параллельная обработка (2%)
Вопросы с несколькими вариантами ответов:
14. Что из перечисленного не относится к интегрированной системе управления базами данных для хранения и вычислений больших данных?
A. ClickHouse
B. PrestoDB
C. Hive
D. InfluxDB
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
15. Каких функций нет в базе данных NewSQL?
А. Автоматическое сегментирование данных решает проблемы масштабируемости и прозрачно для пользователей.
B. Аварийное восстановление раздела данных и автоматическое переключение при сбое
C. Поддержка распределенных транзакций
D. NewSQL ограничен емкостью локального диска, поэтому необходимо учитывать вопросы расширения.
Ответ: Д
Эта статья взята из Официальный аккаунт@Изучите большие данные за пять минут
E. Ресурсы больших данных и управление безопасностью (2%)
16. Yarn — это платформа планирования ресурсов, которая отвечает за предоставление серверных вычислительных ресурсов для вычислительных программ. Верно следующее утверждение:
А. Yarn понимает механизм работы пользовательских программ.
Б. Архитектурный дизайн Yarn — Master и StandBy.
С. Вычислительные платформы, такие как Spark и Storm, можно интегрировать и запускать на Yarn.
Д. Yarn не полностью связан с работающим приложением, и приложение необходимо подключить согласно спецификации.
Ответ: С
Эта статья взята из Официальный аккаунт@Изучите большие данные за пять минут
17. Что не подпадает под категорию снижения чувствительности к конфиденциальности данных?
А. Либо делайте все, либо не делайте вообще.
Б. Десенсибилизация путем сокрытия конкретного адреса и номера дома из данных
C. Номер мобильного телефона пользователя сопоставлен с уникальным значением хеша.
D. Десенсибилизация данных требует изменения данных, тогда как шифрование данных не изменяет исходные данные.
Ответ: А
Официальный аккаунт@Изучите большие данные за пять минут
F. Настройка производительности обработки больших данных, оптимизация кластера, вычисления в реальном времени и т. д. (3%)
18. Методы, принятые для обработки распределенных транзакций больших данных, не включают в себя следующее ___
A. Raft
B. Paxos
C. MVCC
D. JDBC
Ответ: Д
Официальный аккаунт@Изучите большие данные за пять минут
19. Настройка кластера не включает в себя следующее ___
А. Правильно настройте параллелизм задания на этапе Stage.
B. Уменьшите ресурсы предварительного приложения и функцию предварительного чтения хранилища.
C. Предотвращение искажения данных
D. Сократите широкое использование операторов перемешивания
Ответ: Б
Официальный аккаунт@Изучите большие данные за пять минут
Вопросы с несколькими вариантами ответов:
20. Функции потоковых вычислений в реальном времени включают в себя:
А. Никаких границ, источник данных обеспечивает непрерывные данные
Б. Низкая задержка
С. Механизм запуска включает запуск потока данных и планирование запланированных задач.
Д. Автономная коррекция больших данных с приоритетом вычислений в реальном времени
Ответ: АВС
Официальный аккаунт@Изучите большие данные за пять минут
G. Обзор управления данными, типы больших данных (2%)
21. Следующее не входит в сферу управления большими данными:
О. Система управления данными хорошо отлажена и позволяет быстро идентифицировать данные.
Б. Обеспечить систему мониторинга и быстрого выявления проблем.
C. Архитектурное проектирование для высокой эффективности бизнеса, высокой пропускной способности и высокой доступности.
D. Система приложений данных, которая может обмениваться данными и эффективно использовать их.
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
22. К функциям базы данных временных рядов не относятся: __
A. Производительность базового хранилища LSM Tree лучше, чем BTree.
B. Акцент на функции случайного чтения
C. В базе данных временных рядов используются методы сегментирования, включая сегментирование хэша, последовательное хеширование и разделение диапазона.
D. Выбираемые столбцы поддержки можно установить как атрибуты тега.
Ответ: Б
Официальный аккаунт@Изучите большие данные за пять минут
H. Управление метаданными, стандарты данных (3%)
Вопросы с несколькими вариантами ответов:
23. Описание метаданных неверно:
А. Метаданные могут напрямую повысить производительность запросов к данным.
Б. Метаданные — основа управления большими данными
C. Метаданные поддерживают управление информационными активами на уровне предприятия.
D. Метаданные могут помочь понять ситуацию с данными в компании и быстро обнаружить проблемы с данными.
Ответ: А
Официальный аккаунт@Изучите большие данные за пять минут
24. Управление качеством данных не включает ___
А. Целостность данных
Б. Точность доставки данных
C. Стандартизация именования данных
D. Оптимизация производительности вычислений данных
Ответ: Д
Официальный аккаунт@Изучите большие данные за пять минут
Вопросы с несколькими вариантами ответов:
25. Аспекты, охватываемые стандартами управления большими данными, включают:
А. управление большими данными
Б. хранилище больших данных
С. Качество больших данных
Д. Обмен данными и открытость
Ответ: АВСD
Официальный аккаунт@Изучите большие данные за пять минут
I. Конфиденциальность, безопасность больших данных и знание законодательства (3%)
Вопросы с несколькими вариантами ответов:
26. 1. Конфиденциальность больших данных не включает следующее __
A. Информация о бизнес-данных
B. Информация об IP, к которой имеют доступ пользователи
С. Хранилище данных использует хранилище столбцов для доставки данных по требованию.
Д. История просмотра поведения пользователя, действия пребывания и отправки
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
27. Технические проблемы и проблемы, с которыми не сталкивается безопасность больших данных: __
A. Проблемы и проблемы безопасности платформы больших данных
Б. Платформа больших данных обслуживает большое количество пользователей и разнообразные сценарии, и производительность традиционных механизмов безопасности не может быть удовлетворена.
C. Крупномасштабная распределенная модель хранения и вычислений платформы больших данных усложняет настройку безопасности.
D. Автономный расчет данных сопряжен с длительным циклом и высокой стоимостью обратного отслеживания.
Ответ: Д
Официальный аккаунт@Изучите большие данные за пять минут
Вопросы с несколькими вариантами ответов:
28. Общий закон ЕС о защите данных охватывает:
А. Полное забывание данных
Б. Защита конфиденциальности по умолчанию
C. И лицензируйте данные
D. Внесение псевдонимизированных данных в персональные данные
Ответ: АВСD
Официальный аккаунт@Изучите большие данные за пять минут
J. Управление качеством данных (3%)
Вопросы с несколькими вариантами ответов:
29. Что не так с проверкой качества данных?
А. Увеличьте объем памяти в случайном порядке, чтобы ускорить вычисления.
B. На основе общего пакетного сравнения данных проверьте, нет ли в данных каких-либо упущений.
C. Агрегация на основе некоторых частей данных, чтобы увидеть, есть ли какие-либо отклонения в общих данных.
D. Можно ли сравнить подробные данные выборки со всей колонкой?
Ответ: А
Официальный аккаунт@Изучите большие данные за пять минут
30. Что из перечисленного не может быть включено в систему качества обслуживания?
А. Время ответа на запросы механизма больших данных
Б. Доля выборки грязных данных в данных
С. Метаданные разрабатываются сверху
Д. Доступность хранилища данных
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
Вопросы с несколькими вариантами ответов:
31. К числу тех, которые могут способствовать повышению качества данных, относятся:
А. Унификация инструментов Data ETL
Б. Избыточность данных требует согласованности данных
С. Уточнение требований к данным на практике и целевое использование данных
Д. Предоставьте систему со спецификациями и процессами для облегчения унификации и сотрудничества.
Ответ: АВСD
Официальный аккаунт@Изучите большие данные за пять минут
K. Управление жизненным циклом данных (2%)
32. Популярные приложения для работы с большими данными не включают
А. Дифференцированное хранение данных точек доступа для повышения эффективности
Б. Данные точек доступа могут целенаправленно кэшироваться для повышения пропускной способности.
С. Горячие данные облегчают управление качеством данных
Д. Горячие данные облегчают анализ аналитического поведения пользователей
Ответ: С
Официальный аккаунт@Изучите большие данные за пять минут
33. Сервисные действия в отношении просроченных данных не включают в себя:
А. Архивирование и упаковка исторических данных
Б. Вычисление данных отчета, на которые никто не обращает внимания, можно остановить.
С. Разделы, к данным которых нет доступа, можно рассмотреть для удаления.
Д. Данные с истекшим сроком хранения хранятся как активы данных в течение длительного времени.
Ответ: Д
Официальный аккаунт@Изучите большие данные за пять минут
L. Услуги передачи данных (2%)
34. Предоставьте специальный шлюз для запроса данных, не задействованное содержимое:
А. Проверка качества доставки данных
Б. Проверка разрешения
С. Записывайте исторические запросы и поставки для облегчения аудита.
Д. Обеспечивает автоматическую маршрутизацию запросов к движку, выбирая лучший движок для выполнения.
Ответ: А
Официальный аккаунт@Изучите большие данные за пять минут
35. Группа обработки данных предоставляет данные за пределы организации. Исключенный контент включает:
А. Значение метаданных
Б. Параметры настройки производительности больших данных
С. Логика расчета формирования данных
Д. Цикл генерации данных
Ответ: Б
Официальный аккаунт@Изучите большие данные за пять минут