[Третья годовщина ES] Заметки новичка о начале работы с Elasticsearch
[Третья годовщина ES] Заметки новичка о начале работы с Elasticsearch

до этого,Я действительно не понимаюElasticsearch,Я тоже случайно наткнулся на это, читая статью.Elasticsearchслово,Но не вникал в это,Просто зная, что такое существует,Его можно использовать для поиска,Давайте выясним это сегодня на мероприятии, посвященном третьей годовщине ES.

Кто такой Elasticsearch?

Если вы ничего не знаете об Elasticsearch, первый шаг — зайти в Baidu!

результат:

Tencent Cloud Elasticsearch Service (ES) — это высокодоступный, масштабируемый, полностью управляемый облачный сервис Elasticsearch, основанный на поисковой системе с открытым исходным кодом Elasticsearch. Он включает в себя Kibana и распространенные плагины, а также интегрирует расширенные функции, такие как безопасность, SQL и машинное обучение. , сигнализации и мониторинг (X-Pack).

Но результат был неудовлетворительный. Если я это сказал, то я этого не сказал, или я не знал, что я сказал! Ты так же сбит с толку, как и я, ха-ха! Что такое высокая доступность? Что такое масштабируемый? трава

Когда я сталкиваюсь с чем-то слишком официальным, я обычно продолжаю искать, есть ли какой-нибудь народный текст. Если его нет, я проверяю понимание других друзей, а затем сам суммирую его.

ВотВысокая доступностьФактически речь идет оElasticsearch ServiceПредоставили нам несколько вариантов развертывания,Он может защитить от сбоев, вызванных какими-либо факторами, без остановки службы.,COS Стратегия резервного копирования данных позволяет регулярно создавать резервные копии данных, чтобы обеспечить быстрое восстановление в случае потери данных из-за непредвиденных обстоятельств. Кроме того, существуют такие стратегии, как оптимизация ядра для обеспечения стабильности кластера, которая может всесторонне обеспечить безопасность данных и стабильность обслуживания.

иМасштабируемыйотносится кElasticsearch ServiceПредоставляет различные типы спецификаций узлов.иносители данных,Мы можем выбрать в соответствии с бизнес-потребностями компании.,По мере развития бизнеса,Можно динамически настраивать конфигурацию кластера для расширения или сжатия.,Обеспечение потребностей развития бизнеса в режиме реального времени,и эффективно контролировать расходы.

Подводя итог примерно:

Elaticsearch,сокращенно ES,ES — распределенная полнотекстовая поисковая система.,Он может не только хранить данные в режиме реального времени,Данные также можно получить,Его масштабируемость очень хорошая,Это то, что было упомянуто ранееМасштабируемый,Может быть расширен до сотен серверов,Обработка петабайт данных. ES также разработан на Java и использует Lucene в качестве ядра для реализации всех функций индексирования.,на самом делеElaticsearchНижний слой по-прежнемуLucene,Грубо говоряElaticsearchПросто тамLuceneТам оболочка снаружи,Давайте избежим некоторых утомительных операций,Это облегчает начало работы.

Рейтинг Elasticsearch в поисковых системах очень высок. Вы можете нажать на ссылку ниже, чтобы просмотреть его.

Пожалуйста, нажмите: рейтинг в поисковых системах

Происхождение — Лусене

Luceneоснован наjavaязык развитпоисковая Класс библиотеки системы, созданный в 1999 году, в 2005 году стал Apache. Лучшие проекты с открытым исходным кодом,

Lucene обладает преимуществами высокой производительности и простоты расширения.,Но есть ограничения,Например: его можно разработать только на основе языка Java, кривая изучения интерфейса библиотеки классов крутая, а нативная версия не поддерживает горизонтальное расширение.,В это времяElasticsearchрождение Понятно。

рождение

Elasticsearch — это распределенная поисковая система с открытым исходным кодом, созданная на основе Lucene. В 2004 году Шей Бэнон разработал Compass на основе Lucene. В 2010 году Шав Банон переписал Compass и назвал его Elasticsearch, который поддерживает распространение и может расширяться по горизонтали.

Сокращает время обучения полнотекстовому поиску и может вызываться на любом языке программирования. Преимущество Elasticsearch в конкуренции с основной библиотекой Lucene заключается в том, что она идеально инкапсулирует основную библиотеку Lucene и создает дружественный Restful-API. Разработчикам не нужно уделять слишком много внимания базовому механизму, и они могут использовать его прямо из коробки. . Механизмы сегментирования и копирования напрямую решают проблемы производительности и высокой доступности в кластере.

Никакого сравнения, никакого вреда: Elaticsearch VS Solr

Solr является первым, основанным на Lucene Продукты для поисковых систем с полными базовыми библиотечными функциями появились гораздо раньше, чем Эластичный поиск. Если вы просто ищете существующие данные, Solr работает быстрее.

Elaticsearch и solr Всеоснован наLucene,Все они являются инкапсуляцией Lucene. Elaticsearch и solr также являются очень хорошими инструментами.,Просто для разных сценариев,Иметь разные преимущества. Просто выберите хорошее дерево для жизни!

контраст:

  • Elasticsearch работает лучше, чем Solr, в поисковых приложениях в реальном времени, но значительно более эффективен, чем Elasticsearch, при обработке общих поисковых приложений.
  • Elasticsearch поддерживает только формат файлов json, а Solr поддерживает больше форматов данных, таких как JSON, XML и CSV.
  • По мере увеличения объема данных эффективность поиска Solr будет снижаться, в то время как Elasticsearch не имеет явных изменений.

Каковы сценарии использования?

  • поиск

Поиск также очень распространен в повседневной жизни. Службы поиска на месте, основанные на больших объемах данных, такие как поиск продуктов в торговых центрах, магазинах программного обеспечения и поиск внутри предприятий, являются необходимыми способами эффективного получения информации. Elasticsearch Service Он имеет функцию полнотекстового поиска, хорошую поддержку как структурированных, так и неструктурированных данных, а также обеспечивает простой и удобный в использовании RESTful API Клиенты на разных языках помогают пользователям быстро создавать стабильные сервисы поиска и интегрировать их в существующие бизнес-структуры. Одним словом: Используйте везде, где есть поиск!

Большое количество компаний в Китае сейчас используют Elasticsearch, например Didi, Toutiao, Ele.me, 360 Security и другие известные компании. Помимо поиска, его можно комбинировать с Kibana, Logstash, Beats и Elastic Stack для использования в платформе анализа больших данных в реальном времени для анализа некоторых журналов, мониторинга индикаторов и других полей.

  • Управление журналами и анализ

Серверы веб-сайтов, мобильные устройства, Интернет вещей Журналы, созданные датчиками и другим оборудованием, имеют такие проблемы, как рассредоточенность узлов, разнообразие типов и большие масштабы. Это создает большие проблемы для работы, такие как ненормальное обнаружение проблем и бизнес-анализ с помощью журналов. Тенсент Облако Elasticsearch Service поставлять Понятно Эластичный и масштабируемый、Централизованное решение для хранения данных, работающее в квазиреальном времени,и функция полнотекстового поиска,Удобное унифицированное управление и запрос логов,Помогите пользователям быстро обнаружить и обнаружить проблемы,Повышайте эффективность решения проблем.

ES широко используется. Например, Wikipedia, Github, Sina и т. д. используют ES для реализации поиска.

Начать установку

Перейдите прямо на официальный сайт, чтобы скачатьES:https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.4.2.zip

После распаковки вы получите следующий каталог:

имя каталога

главная роль

bin

Каталог bin содержит некоторые команды запуска, то есть сценарии. Какие команды используются в Windows, а какие — в Linux?

config

config хранит файл конфигурации ES-сервера.

lib

Пакет jar файла библиотеки хранится

modules

Вот несколько расширенных модулей

plugins

Плагины по ES можно разместить здесь

После завершения распаковки найдите файл Elasticsearch в каталоге bin и дважды щелкните его. Когда вы увидите, что запуск успешно запущен, порт по умолчанию — 9200;

Некоторые концепции в ES

  • индекс индекс

Индекс — это набор документов с одинаковыми атрибутами. Его также можно рассматривать как набор типов,мыпоиск,При обновлении и удалении,Это имя необходимо использовать. в кластере,Вы можете определить столько координат, сколько захотите.

  • тип тип

В индексе можно определить один или несколько типов. Тип — это логическая классификация/разделение вашего индекса. Семантика полностью зависит от вас. Обычно тип определяется для документов, имеющих общий набор полей. По аналогии с базой данных это эквивалентно таблице

  • полеполе

Оно эквивалентно полю в таблице данных, классифицируя и идентифицируя данные документа по различным атрибутам.

  • документдокумент

Документ представлен в формате JSON, который эквивалентен фрагменту данных в таблице в базе данных.

  • картографирование

Сопоставление — это способ обработки данных, и правила имеют некоторые ограничения.,Например, тип данных поля, значение по умолчанию, анализатор, индексировано ли оно и т. д.,Их можно установить в картографировании.,Для базы данные — это определение структуры таблицы.

  • кластеркластер

Кластер организован одним или несколькими узлами.,Вместе они владеют всеми данными,И вместе обеспечить функцию индексации ипоиска. Кластер идентифицируется уникальным именем.,Имя по умолчанию — «elasticsearch». имя важно,Поскольку узел может указать только имя кластера,Присоединяйтесь к этому кластеру.

boy illustration
Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Прочитайте нейросетевую модель Трансформера в одной статье
boy illustration
.ART Теплые зимние предложения уже открыты
boy illustration
Сравнительная таблица описания кодов ошибок Amap
boy illustration
Уведомление о последних правилах Points Mall в декабре 2022 года.
boy illustration
Даже новички могут быстро приступить к работе с легким сервером приложений.
boy illustration
Взгляд на RSAC 2024|Защита конфиденциальности в эпоху больших моделей
boy illustration
Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.
boy illustration
Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)
boy illustration
Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов
boy illustration
[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста
boy illustration
Обзор Cloud-init и этапы создания в рамках PVE
boy illustration
Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)
boy illustration
Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.
boy illustration
Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!
boy illustration
[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !
boy illustration
[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз
boy illustration
Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.
boy illustration
Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?
boy illustration
Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента
boy illustration
Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.
boy illustration
Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)
boy illustration
[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши
boy illustration
Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)
boy illustration
Кодирование Base64 в MultipartFile
boy illustration
5 точек расширения SpringBoot, супер практично!
boy illustration
Глубокое понимание сопоставления индексов Elasticsearch.
boy illustration
15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.
boy illustration
Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.