Новое поколение искусственного интеллекта: освойте векторную базу данных и глубоко объедините ее с большими моделями

Shortcuts

Calendar Appointments

Invoice App Manage Accounts

User App Manage Users

Role Management Permission

Dashboard Analytics

Setting Account Settings

FAQs FAQs & Articles

Modals Useful Popups
- Notification
  8 New
- - Congratulation Lettie 🎉
    Won the monthly best seller gold badge
    
    1h ago
  - CF
    
    Charles Franklin
    Accepted your connection
    
    12hr ago
  - New Message ✉️
    You have new message from Natalie
    
    1h ago
  - Whoo! You have new order 🛒
    ACME Inc. made new order $1,154
    
    1 day ago
  - Application has been approved 🚀
    Your ABC project application has been approved.
    
    2 days ago
  - Monthly report is generated
    July monthly financial report is generated
    
    3 days ago
  - Send connection request
    Peter sent you connection request
    
    4 days ago
  - New message from Jane
    Your have new message from Jane
    
    5 days ago
  - CPU is running high
    CPU Utilization Percent is currently at 88.63%,
    
    5 days ago
- View all notifications

Новое поколение искусственного интеллекта: освойте векторную базу данных и глубоко объедините ее с большими моделями

【Идеи выбора темы】

Поскольку масштаб моделей искусственного интеллекта продолжает расширяться, важным вопросом становится то, как заставить эти «большие модели» более эффективно обслуживать пользователей. База данных векторов — это база данных, которая возникла на этом фоне. Она использует векторы для эффективного хранения и извлечения данных модели, что значительно повышает эффективность запросов.

【Написание плана】

1.Что такое векторная база данных

2.Как работают векторные базы данных

3.Классификация векторной базы данных

4.Сравнительный анализ

5.Применение векторной базы данных в больших моделях

6.Оптимизация векторного индекса

7. Области применения

8.Зачем нам нужна векторная база данных для создания интеллектуальных отраслевых приложений на основе больших языковых моделей?

9. Будущее и перспективы

10 Резюме

Tencent Cloud VectorDB — это полностью управляемая, самостоятельно разработанная служба распределенных баз данных корпоративного уровня. Один индекс поддерживает масштаб векторов в 1 миллиард, а также миллионы запросов в секунду и задержку запросов на уровне миллисекунд. Он не только может повысить точность ответов на большие модели, но также может широко использоваться в рекомендательных системах, обработке естественного языка и других областях.

Что такое векторная база данных

Раньше за организацию данных отвечали традиционные реляционные базы данных. Но он больше подходит для работы со структурированными данными. Большие модели и нейронные сети чаще сталкиваются с массивными неструктурированными данными, такими как текст, аудио, видео, отношения и т. д. У них есть специальный метод обработки: «векторизация». Если вы хотите организовать данные по такой «мозговой схеме», вам понадобится специальная база данных — векторная база данных. Объединяйте сложные неструктурированные данные в значения координат в многомерном пространстве посредством векторизации (встраивания) и быстро находите наиболее подходящее приближение, вычисляя сходство или расстояние между векторами.

Vector Database — это новый тип нереляционной базы данных, которая использует технологию математической линейной алгебры для хранения и обработки структурированных и неструктурированных данных.

Базы данных векторов отображают объекты данных в векторы фиксированной размерности и сохраняют эти векторы в памяти или на диске в эффективном и плотном формате. В отличие от традиционных реляционных баз данных, она не требует предварительного определения фиксированной схемы базы данных, и можно легко добавлять новые поля.

Как работают векторные базы данных

Проще говоря, рабочий процесс векторной базы данных выглядит следующим образом:

На этапе предварительной обработки данных неструктурированные данные преобразуются в числовое векторное представление;

На этапе векторного представления обработанное векторное представление фиксируется в векторе фиксированной размерности;

На этапе векторного хранения векторное представление сохраняется и управляется в эффективном формате (например, TF-IDF, LSH и т. д.);

На этапе поиска векторов вычисление расстояния между векторами (например, косинусного сходства) используется для быстрого поиска векторов результатов, похожих на вектор запроса.

Взяв в качестве примера TF-IDF, он отображает документ в плотное векторное представление, подсчитывая частоту каждого слова в отдельном документе и во всем корпусе, и использует косинусное сходство для сопоставления документов.

Классификация векторной базы данных

В соответствии с различными форматами хранения и алгоритмами поиска основные векторные базы данных в основном включают:

База данных векторов инвертированного индекса. Используйте таблицу инвертированного индекса для преобразования слов в список идентификаторов документов, аналогично Elasticsearch.

База данных векторов TF-IDF: используйте значения TF-IDF для представления документов в виде плотных векторов, аналогично базе данных антропных векторов.

База данных векторов дерева лучей: используйте структуру дерева лучей для повышения эффективности многомерного запроса векторного расстояния, аналогично Faiss.

Локально ориентированная база данных хэш-векторов: использует алгоритм LSH для приблизительного запроса ближайшего соседа, аналогично Nephrite.

Представительская работа: милвус

Milvus — это векторная база данных с открытым исходным кодом, предназначенная для поддержки встроенных приложений поиска по сходству и искусственного интеллекта. Milvus делает поиск неструктурированных данных более доступным, обеспечивая единообразный пользовательский опыт независимо от среды развертывания.

Milvus 2.0 — это облачная векторная база данных, хранилище и вычисления которой разделены в зависимости от конструкции. Все компоненты в этой обновленной версии Milvus не имеют состояния для повышения отказоустойчивости и гибкости.

Сравнительный анализ

Традиционные слова, такие как NoSQL и SQL.

Классифицировать базы данных на основе выразительности данных

База данных реляционных выражений: выражает структурированные данные в реляционном графе таблиц, представленном реляционной базой данных.

База данных неструктурированных выражений: использует ключ-значение, документ и другие простые методы для непосредственного выражения неструктурированных данных, представленных базой данных «ключ-значение» и базой данных документов.

База данных векторных выражений: использует технологию линейной алгебры для выражения неструктурированных данных в виде цифровых векторов фиксированной длины, представленных в виде баз данных векторов.

Основные различия заключаются в нескольких основных направлениях.

Подход к моделированию данных

Традиционные базы данных обычно используют табличные и реляционные модели для моделирования данных, сохраняя данные в виде структурированных строк и столбцов. База данных векторов представляет #данные в виде векторов.

Метод запроса данных

Традиционные базы данных используют язык SQL для запроса и получения необходимых данных путем указания условий и отношений. База данных векторов выполняет запросы, вычисляя сходство между векторами.

Возможности обработки данных

Векторные базы данных обладают превосходной производительностью и эффективностью при обработке многомерных векторов и крупномасштабных данных. Он использует высокооптимизированные алгоритмы индексации векторов и запросов для быстрого поиска и извлечения похожих векторов в больших объемах данных. Традиционные базы данных часто неэффективны при работе со сложными связями данных и запросами к нескольким таблицам.

База данных SQL с векторной поддержкой

PostgreSQL от Tencent, Clickhouse

По сравнению с реляционными базами данных преимуществами векторных баз данных являются:

Никакую структуру данных не нужно определять заранее, что упрощает расширение;

Основанный на вычислении векторного расстояния, он поддерживает нечеткое сопоставление, а не точный запрос;

Эффективно храните и извлекайте большие объемы векторных данных в сжатом и плотном формате.

По сравнению с неструктурированными базами данных документов:

Замените документы о заболеваниях числовыми представлениями для поддержки более сложных операций запроса;

Базовый алгоритм оптимизирован, а эффективность поиска выше;

Интегрируйте возможности глубокого обучения и поддерживайте функции динамического обучения.

В сценариях применения больших моделей векторные базы данных демонстрируют более заметные преимущества. В следующем разделе мы представим типичные случаи применения в этом отношении.

Применение векторной базы данных в больших моделях

Служба рассуждений Сиюань: использует граф знаний векторной модели управления базой данных для поддержки более быстрого поиска вопросов, ответов и утверждений.

Антропный помощник: используйте векторные базы данных для улучшения моделей диалога на естественном языке и получения более контекстуальных и семантических ответов.

Служба машинного перевода: использует векторные базы данных для ускорения сопоставления семантических графов знаний и обеспечения справочной информационной поддержки для машинного перевода.

Система анализа настроений: в сочетании с векторной базой данных для управления корпусом эмоциональных знаний она может эффективно определять эмоциональные тенденции потребностей пользователей.

Поддержка принятия медицинских решений: используйте базы данных векторов для управления медицинскими знаниями и случаями, чтобы помочь диагностировать сложные клинические проблемы.

Применение векторной базы данных

распознавание лиц

векторная база Данные могут хранить большой объем векторных данных о лицах и обеспечивать быстрое распознавание с помощью технологии векторного индексирования. лица и сравните.

Поиск изображений

векторная база data могут хранить большие объемы векторных данных изображений и обеспечивать быстрый поиск с помощью технологии векторного индексирования. изображения и сопоставление сходства.

распознавание звука

векторная база data может хранить большие объемы аудиовекторных данных и обеспечивать быстрое распознавание с помощью технологии векторного индексирования. звук и совпадение.

обработка естественного языка

Базы данных векторов могут хранить большие объемы текстовых векторных данных и обеспечивать быстрый текстовый поиск и сопоставление по сходству с помощью технологии векторного индексирования.

Система рекомендаций

База данных векторов может хранить большой объем пользовательских векторных данных и векторных данных элементов, а также обеспечивать быстрое сопоставление рекомендаций и сходства с помощью технологии векторного индексирования.

интеллектуальный анализ данных

векторная база Данные могут хранить большие объемы векторных данных и обеспечивать быструю интеллектуальную работу с помощью технологии векторного индексирования. анализ данныхи анализ。

Поисковая оптимизация, инкрементальный вектор TF-IDF для хранения инвертированных таблиц для улучшения расчета релевантности.

Оптимизация векторного индекса

Векторное индексирование — ключ к повышению эффективности поиска. Общие алгоритмы оптимизации включают в себя:

NMSLIB: поддерживает структурную оптимизацию, такую как KMeans, для ускорения запросов к ближайшему соседу.

HNSW: используйте несбалансированный многоуровневый индекс для уменьшения сложности запросов.

FAISS: поиск сходства в реальном времени с использованием методов оптимизации, таких как квантование продукта.

РАЗДРАЖЕНИЕ: предоставление рекомендаций в режиме реального времени с помощью поиска соседей по индексу дерева дорог.

Поиск информации, кластеризация документов и т. д. позволяют достичь соответствия на семантическом уровне посредством векторного представления.

Идентификация домена, извлечение именованных объектов и классификация с помощью обучения с подкреплением векторного представления.

Рекомендации системы строят портреты пользователей и дают персонализированные рекомендации за счет векторного сходства.

Биоинформатика для быстрого анализа выравнивания с помощью векторизованных последовательностей/структур.

Благодаря эффективному управлению векторными базами данных эти службы больших моделей могут обеспечить более эффективный поиск знаний, тем самым предоставляя пользователям персонализированный опыт обслуживания.

Зачем нам нужна векторная база данных для создания интеллектуальных отраслевых приложений на основе больших языковых моделей?

База данных векторов может эффективно управлять отраслевыми знаниями и предоставлять структурированный интерфейс запросов к модели. Большие языковые модели больше не полагаются на внутренние знания для достижения истинного внешнего интеллекта.

Унифицированное представление структурированных и неструктурированных данных в виде векторов обеспечивает единый интерфейс данных для модели. Крупным моделям полезно изучить отраслевые профессиональные термины и связанные с ними модели.

Поддерживает запросы приблизительного сопоставления на основе расстояния для удовлетворения требований модели к доступу в реальном времени к знаниям о семантическом сходстве.

Через интерфейс оптимизации обучения модель можно объединить с векторной базой данных для онлайн-обновления и быстрого усвоения новых бизнес-знаний.

Если взять в качестве примера робота для медицинских консультаций, то если для управления медицинскими знаниями используется векторная база данных, она включает в себя:

Таблица векторов соответствия симптом-болезнь

Таблица векторов соответствия пунктов проверки заболеваний

Таблица векторов соответствия заболевания-рецепта

При ответе на вопросы пациентов большая языковая модель может выполнять следующие эффективные операции на основании описанных пользователем симптомов:

Используйте косинусное сходство, чтобы найти возможные соответствующие заболевания в таблице симптомов.

Найдите соответствующую информацию об этих заболеваниях в других таблицах, например, в предметах обследования и назначениях, и дайте предложения по выбору наиболее вероятных.

Если предложение неуместно, используйте график знаний, чтобы исправить его и представить заново.

При этом процесс взаимодействия записывается для онлайн-обучения модели и непрерывной оптимизации возможностей обработки.

Таким образом, граф отраслевых знаний, основанный на управлении векторными базами данных, может эффективно помочь большим языковым моделям достичь перехода от «общего» к «профессиональному» и обеспечить более эффективные интеллектуальные услуги. Именно здесь векторные базы данных играют важную роль в построении отраслевой аналитики.

Посмотрите, продолжает ли семантический поиск становиться «лучшей практикой искусственного интеллекта» во всех отраслях. В будущем, включая построение и оптимизацию графов знаний, область применения технологии векторных баз данных станет более широкой. Это поможет большим языковым моделям стать важной частью отраслевой интеллектуальной системы.

В будущем, с развитием искусственного интеллекта, большие модели и векторные базы данных неизбежно будут интегрированы на более глубоком уровне для совместного создания интеллектуальной системы обработки и обслуживания знаний. Это будет способствовать дальнейшему продвижению искусственного интеллекта в промышленных целях.

Справочные ссылки:

https://cloud.tencent.com/developer/techpedia/1953

https://github.com/milvus-io/milvus

https://aws.amazon.com/cn/campaigns/what-is-a-vector-database/

Рекомендация

Категории

ИИ живопись векторная база данных Поиграйте с большой моделью Tencent Hunyuan Конкурс эссе по передовому опыту работы с векторными базами данных

Новые посты

Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет

Код js веб-страницы, фон частицы, код спецэффектов

【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.

🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.

[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!

Как реализовать переход по странице в HTML (html переходит на указанную страницу)

Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?

Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа

Серия uni-app: uni.navigateЧтобы передать скачок значения

Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.

JS-время конвертации

Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены

Поле комментария, щелчок мышью, специальные эффекты, js-код

Объект массива перемещения объекта JS

Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей

Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!

Получить текущее время в js_Как динамически отображать дату и время в js

Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.

У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.

Copilot облачной разработки — упрощение разработки

Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов

CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA

Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация

vLLM: мощный инструмент для ускорения вывода ИИ

CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.

Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%

Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.

Congratulation Lettie 🎉

Charles Franklin

New Message ✉️

Whoo! You have new order 🛒

Application has been approved 🚀

Monthly report is generated

Send connection request

New message from Jane

CPU is running high

Новое поколение искусственного интеллекта: освойте векторную базу данных и глубоко объедините ее с большими моделями

【Идеи выбора темы】

【Написание плана】

Что такое векторная база данных

Как работают векторные базы данных

Классификация векторной базы данных

Представительская работа: милвус

Сравнительный анализ

Подход к моделированию данных

Метод запроса данных

Возможности обработки данных

База данных SQL с векторной поддержкой

Применение векторной базы данных в больших моделях

Применение векторной базы данных

Оптимизация векторного индекса

Зачем нам нужна векторная база данных для создания интеллектуальных отраслевых приложений на основе больших языковых моделей?

Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет

Код js веб-страницы, фон частицы, код спецэффектов

【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.

🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.

[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!

Как реализовать переход по странице в HTML (html переходит на указанную страницу)

Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?

Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа

Серия uni-app: uni.navigateЧтобы передать скачок значения

Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.

JS-время конвертации

Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены

Поле комментария, щелчок мышью, специальные эффекты, js-код

Объект массива перемещения объекта JS

Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей

Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!

Получить текущее время в js_Как динамически отображать дату и время в js

Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.

У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.

Copilot облачной разработки — упрощение разработки

Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов

CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA

Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация

vLLM: мощный инструмент для ускорения вывода ИИ

CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.

Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%

LM Studio для создания локальных больших моделей

Как определить количество слоев и нейронов скрытых слоев нейронной сети?

[Отслеживание целей] Подробное объяснение ByteTrack и детали кода