Новое поколение искусственного интеллекта: освойте векторную базу данных и глубоко объедините ее с большими моделями
Новое поколение искусственного интеллекта: освойте векторную базу данных и глубоко объедините ее с большими моделями

【Идеи выбора темы】

Поскольку масштаб моделей искусственного интеллекта продолжает расширяться, важным вопросом становится то, как заставить эти «большие модели» более эффективно обслуживать пользователей. База данных векторов — это база данных, которая возникла на этом фоне. Она использует векторы для эффективного хранения и извлечения данных модели, что значительно повышает эффективность запросов.

【Написание плана】

1.Что такое векторная база данных

2.Как работают векторные базы данных

3.Классификация векторной базы данных

4.Сравнительный анализ

5.Применение векторной базы данных в больших моделях

6.Оптимизация векторного индекса

7. Области применения

8.Зачем нам нужна векторная база данных для создания интеллектуальных отраслевых приложений на основе больших языковых моделей?

9. Будущее и перспективы

10 Резюме

Tencent Cloud VectorDB — это полностью управляемая, самостоятельно разработанная служба распределенных баз данных корпоративного уровня. Один индекс поддерживает масштаб векторов в 1 миллиард, а также миллионы запросов в секунду и задержку запросов на уровне миллисекунд. Он не только может повысить точность ответов на большие модели, но также может широко использоваться в рекомендательных системах, обработке естественного языка и других областях.

Что такое векторная база данных

Раньше за организацию данных отвечали традиционные реляционные базы данных. Но он больше подходит для работы со структурированными данными. Большие модели и нейронные сети чаще сталкиваются с массивными неструктурированными данными, такими как текст, аудио, видео, отношения и т. д. У них есть специальный метод обработки: «векторизация». Если вы хотите организовать данные по такой «мозговой схеме», вам понадобится специальная база данных — векторная база данных. Объединяйте сложные неструктурированные данные в значения координат в многомерном пространстве посредством векторизации (встраивания) и быстро находите наиболее подходящее приближение, вычисляя сходство или расстояние между векторами.

Vector Database — это новый тип нереляционной базы данных, которая использует технологию математической линейной алгебры для хранения и обработки структурированных и неструктурированных данных.

Базы данных векторов отображают объекты данных в векторы фиксированной размерности и сохраняют эти векторы в памяти или на диске в эффективном и плотном формате. В отличие от традиционных реляционных баз данных, она не требует предварительного определения фиксированной схемы базы данных, и можно легко добавлять новые поля.

Как работают векторные базы данных

Проще говоря, рабочий процесс векторной базы данных выглядит следующим образом:

На этапе предварительной обработки данных неструктурированные данные преобразуются в числовое векторное представление;

На этапе векторного представления обработанное векторное представление фиксируется в векторе фиксированной размерности;

На этапе векторного хранения векторное представление сохраняется и управляется в эффективном формате (например, TF-IDF, LSH и т. д.);

На этапе поиска векторов вычисление расстояния между векторами (например, косинусного сходства) используется для быстрого поиска векторов результатов, похожих на вектор запроса.

Взяв в качестве примера TF-IDF, он отображает документ в плотное векторное представление, подсчитывая частоту каждого слова в отдельном документе и во всем корпусе, и использует косинусное сходство для сопоставления документов.

Классификация векторной базы данных

В соответствии с различными форматами хранения и алгоритмами поиска основные векторные базы данных в основном включают:

База данных векторов инвертированного индекса. Используйте таблицу инвертированного индекса для преобразования слов в список идентификаторов документов, аналогично Elasticsearch.

База данных векторов TF-IDF: используйте значения TF-IDF для представления документов в виде плотных векторов, аналогично базе данных антропных векторов.

База данных векторов дерева лучей: используйте структуру дерева лучей для повышения эффективности многомерного запроса векторного расстояния, аналогично Faiss.

Локально ориентированная база данных хэш-векторов: использует алгоритм LSH для приблизительного запроса ближайшего соседа, аналогично Nephrite.

Представительская работа: милвус

Milvus — это векторная база данных с открытым исходным кодом, предназначенная для поддержки встроенных приложений поиска по сходству и искусственного интеллекта. Milvus делает поиск неструктурированных данных более доступным, обеспечивая единообразный пользовательский опыт независимо от среды развертывания.

Milvus 2.0 — это облачная векторная база данных, хранилище и вычисления которой разделены в зависимости от конструкции. Все компоненты в этой обновленной версии Milvus не имеют состояния для повышения отказоустойчивости и гибкости.

Сравнительный анализ

Традиционные слова, такие как NoSQL и SQL.

Классифицировать базы данных на основе выразительности данных

База данных реляционных выражений: выражает структурированные данные в реляционном графе таблиц, представленном реляционной базой данных.

База данных неструктурированных выражений: использует ключ-значение, документ и другие простые методы для непосредственного выражения неструктурированных данных, представленных базой данных «ключ-значение» и базой данных документов.

База данных векторных выражений: использует технологию линейной алгебры для выражения неструктурированных данных в виде цифровых векторов фиксированной длины, представленных в виде баз данных векторов.

Основные различия заключаются в нескольких основных направлениях.

Подход к моделированию данных

Традиционные базы данных обычно используют табличные и реляционные модели для моделирования данных, сохраняя данные в виде структурированных строк и столбцов. База данных векторов представляет #данные в виде векторов.

Метод запроса данных

Традиционные базы данных используют язык SQL для запроса и получения необходимых данных путем указания условий и отношений. База данных векторов выполняет запросы, вычисляя сходство между векторами.

Возможности обработки данных

Векторные базы данных обладают превосходной производительностью и эффективностью при обработке многомерных векторов и крупномасштабных данных. Он использует высокооптимизированные алгоритмы индексации векторов и запросов для быстрого поиска и извлечения похожих векторов в больших объемах данных. Традиционные базы данных часто неэффективны при работе со сложными связями данных и запросами к нескольким таблицам.

База данных SQL с векторной поддержкой

PostgreSQL от Tencent, Clickhouse

По сравнению с реляционными базами данных преимуществами векторных баз данных являются:

Никакую структуру данных не нужно определять заранее, что упрощает расширение;

Основанный на вычислении векторного расстояния, он поддерживает нечеткое сопоставление, а не точный запрос;

Эффективно храните и извлекайте большие объемы векторных данных в сжатом и плотном формате.

По сравнению с неструктурированными базами данных документов:

Замените документы о заболеваниях числовыми представлениями для поддержки более сложных операций запроса;

Базовый алгоритм оптимизирован, а эффективность поиска выше;

Интегрируйте возможности глубокого обучения и поддерживайте функции динамического обучения.

В сценариях применения больших моделей векторные базы данных демонстрируют более заметные преимущества. В следующем разделе мы представим типичные случаи применения в этом отношении.

Применение векторной базы данных в больших моделях

Служба рассуждений Сиюань: использует граф знаний векторной модели управления базой данных для поддержки более быстрого поиска вопросов, ответов и утверждений.

Антропный помощник: используйте векторные базы данных для улучшения моделей диалога на естественном языке и получения более контекстуальных и семантических ответов.

Служба машинного перевода: использует векторные базы данных для ускорения сопоставления семантических графов знаний и обеспечения справочной информационной поддержки для машинного перевода.

Система анализа настроений: в сочетании с векторной базой данных для управления корпусом эмоциональных знаний она может эффективно определять эмоциональные тенденции потребностей пользователей.

Поддержка принятия медицинских решений: используйте базы данных векторов для управления медицинскими знаниями и случаями, чтобы помочь диагностировать сложные клинические проблемы.

Применение векторной базы данных

распознавание лиц

векторная база Данные могут хранить большой объем векторных данных о лицах и обеспечивать быстрое распознавание с помощью технологии векторного индексирования. лица и сравните.

Поиск изображений

векторная база data могут хранить большие объемы векторных данных изображений и обеспечивать быстрый поиск с помощью технологии векторного индексирования. изображения и сопоставление сходства.

распознавание звука

векторная база data может хранить большие объемы аудиовекторных данных и обеспечивать быстрое распознавание с помощью технологии векторного индексирования. звук и совпадение.

обработка естественного языка

Базы данных векторов могут хранить большие объемы текстовых векторных данных и обеспечивать быстрый текстовый поиск и сопоставление по сходству с помощью технологии векторного индексирования.

Система рекомендаций

База данных векторов может хранить большой объем пользовательских векторных данных и векторных данных элементов, а также обеспечивать быстрое сопоставление рекомендаций и сходства с помощью технологии векторного индексирования.

интеллектуальный анализ данных

векторная база Данные могут хранить большие объемы векторных данных и обеспечивать быструю интеллектуальную работу с помощью технологии векторного индексирования. анализ данныхи анализ。

Поисковая оптимизация, инкрементальный вектор TF-IDF для хранения инвертированных таблиц для улучшения расчета релевантности.

Оптимизация векторного индекса

Векторное индексирование — ключ к повышению эффективности поиска. Общие алгоритмы оптимизации включают в себя:

NMSLIB: поддерживает структурную оптимизацию, такую ​​как KMeans, для ускорения запросов к ближайшему соседу.

HNSW: используйте несбалансированный многоуровневый индекс для уменьшения сложности запросов.

FAISS: поиск сходства в реальном времени с использованием методов оптимизации, таких как квантование продукта.

РАЗДРАЖЕНИЕ: предоставление рекомендаций в режиме реального времени с помощью поиска соседей по индексу дерева дорог.

Поиск информации, кластеризация документов и т. д. позволяют достичь соответствия на семантическом уровне посредством векторного представления.

Идентификация домена, извлечение именованных объектов и классификация с помощью обучения с подкреплением векторного представления.

Рекомендации системы строят портреты пользователей и дают персонализированные рекомендации за счет векторного сходства.

Биоинформатика для быстрого анализа выравнивания с помощью векторизованных последовательностей/структур.

Благодаря эффективному управлению векторными базами данных эти службы больших моделей могут обеспечить более эффективный поиск знаний, тем самым предоставляя пользователям персонализированный опыт обслуживания.

Зачем нам нужна векторная база данных для создания интеллектуальных отраслевых приложений на основе больших языковых моделей?

База данных векторов может эффективно управлять отраслевыми знаниями и предоставлять структурированный интерфейс запросов к модели. Большие языковые модели больше не полагаются на внутренние знания для достижения истинного внешнего интеллекта.

Унифицированное представление структурированных и неструктурированных данных в виде векторов обеспечивает единый интерфейс данных для модели. Крупным моделям полезно изучить отраслевые профессиональные термины и связанные с ними модели.

Поддерживает запросы приблизительного сопоставления на основе расстояния для удовлетворения требований модели к доступу в реальном времени к знаниям о семантическом сходстве.

Через интерфейс оптимизации обучения модель можно объединить с векторной базой данных для онлайн-обновления и быстрого усвоения новых бизнес-знаний.

Если взять в качестве примера робота для медицинских консультаций, то если для управления медицинскими знаниями используется векторная база данных, она включает в себя:

Таблица векторов соответствия симптом-болезнь

Таблица векторов соответствия пунктов проверки заболеваний

Таблица векторов соответствия заболевания-рецепта

При ответе на вопросы пациентов большая языковая модель может выполнять следующие эффективные операции на основании описанных пользователем симптомов:

Используйте косинусное сходство, чтобы найти возможные соответствующие заболевания в таблице симптомов.

Найдите соответствующую информацию об этих заболеваниях в других таблицах, например, в предметах обследования и назначениях, и дайте предложения по выбору наиболее вероятных.

Если предложение неуместно, используйте график знаний, чтобы исправить его и представить заново.

При этом процесс взаимодействия записывается для онлайн-обучения модели и непрерывной оптимизации возможностей обработки.

Таким образом, граф отраслевых знаний, основанный на управлении векторными базами данных, может эффективно помочь большим языковым моделям достичь перехода от «общего» к «профессиональному» и обеспечить более эффективные интеллектуальные услуги. Именно здесь векторные базы данных играют важную роль в построении отраслевой аналитики.

Посмотрите, продолжает ли семантический поиск становиться «лучшей практикой искусственного интеллекта» во всех отраслях. В будущем, включая построение и оптимизацию графов знаний, область применения технологии векторных баз данных станет более широкой. Это поможет большим языковым моделям стать важной частью отраслевой интеллектуальной системы.

В будущем, с развитием искусственного интеллекта, большие модели и векторные базы данных неизбежно будут интегрированы на более глубоком уровне для совместного создания интеллектуальной системы обработки и обслуживания знаний. Это будет способствовать дальнейшему продвижению искусственного интеллекта в промышленных целях.

Справочные ссылки:

https://cloud.tencent.com/developer/techpedia/1953

https://github.com/milvus-io/milvus

https://aws.amazon.com/cn/campaigns/what-is-a-vector-database/

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода