Ноутбук NotebookLM с искусственным интеллектом производства Google, персонализированный продукт искусственного интеллекта на основе RAG
Ноутбук NotebookLM с искусственным интеллектом производства Google, персонализированный продукт искусственного интеллекта на основе RAG

Google запустил экспериментальный продукт NotebookLM — персонализированный продукт-помощник с искусственным интеллектом на основе RAG. На основе достоверной информации, предоставленной пользователями через RAG, он помогает пользователям получить представление о справочном контенте и изучить его, а затем использует искусственный интеллект для организации заметок и их преобразования. в то, что в конечном итоге нужно пользователям. Конечная цель вашего плана, блога, бизнес-плана и т. д.

В предыдущем блоге,упомянутый в то время:"Границы поисковых продуктов ИИ ни в коем случае не ограничиваются поиском. Сверху вниз, как лучше понять реальные потребности пользователей, и вплоть до того, как решать сложные проблемы с помощью комбинации агентов, чтобы предоставить пользователям сквозную информацию. заканчивать персонализированными решениями."。googleВот этотNotebookLM Это также больше соответствует этой идее. Он предоставляет персонализированный помощник по ведению заметок на основе информации, предоставленной пользователем, в сочетании с технологией поиска. Однако в целом он сдержан и подчеркивает надежность, то есть следует за информацией. предоставляется пользователем и не объединяет его с преимуществами поиска Google.

Теперь приступим к делу. Давайте познакомимся с функциями NotebookLM и попробуем.

Официальное введение

NoteboolLM
NoteboolLM

Официальное введениеда,NotebookLM да一个基于Информация о доверии пользователя(也就да用户自己提供из文档)изперсонализация(私人из)ИИпомощник。

В настоящее время NotebookLM предоставляет услуги только в США, и для этого требуется волшебство.

Функции

  • виртуальный научный сотрудник: Пользователи могут загружать документы, связанные с проектом NotebookLM. 会立即成为这些信息из专家。说人话就да,NotebookLMРазберу документ,Разделить на куски,Это понимает содержание документа.
виртуальный научный сотрудник
виртуальный научный сотрудник
  • Помогите пользователям получить представление об информации (Go from information to insight) NotebookLM Предлагая новый мощный интерфейс, который позволяет пользователям легко переходить от чтения к вопросам и написанию, AI Помощники всегда готовы помочь на каждом этапе пути. Загрузить документыназад,Пользователи могут задавать вопросы в поле вопросов.,NotebookLMпроходитьRAGспособность отвечать,И можете просмотреть содержимое справочного документа.
Помогите пользователям получить представление об информации
Помогите пользователям получить представление об информации

Если контент, на который отвечает машина, одобрен пользователем,Пользователи могут отвечать наСохранить в заметки,Итак, представьте себе совместную модель,То есть пользователь сначала загружает справочный документ для изучения.,然назадТолько то, на что вы обращаете внимание(其实就да整理大纲)Задать вопрос,Наконец, сохраните эти ответы в заметках.

Сохранить в заметки
Сохранить в заметки

Задав все волнующие вас вопросы, вы получите много полезных и ценных заметок. На основе этих фрагментов вы можете:

  • Быстрый проектсодержание,Выберите упорядоченные заметки (сохраненные выше).,NotebookLM Это может помочь пользователям быстро преобразовать его в схемы, сообщения в блогах, бизнес-планы и т. д.
Быстро составляйте контент
Быстро составляйте контент

Заявление о конфиденциальности

Google подчеркивает, что личные данные пользователей не будут использоваться для обучения NotebookLM, поэтому любая личная или конфиденциальная информация останется конфиденциальной, если только пользователь не решит поделиться ресурсами с соавторами.

Оценка отрасли

  • Тьяго Форте (автор книги «Создание второго мозга») называет NotebookLM «лучшим программным обеспечением, когда-либо созданным для использования искусственного интеллекта в творческой работе».

Опыт работы с ноутбукомLM

После просмотра Официального введения давайте начнем с него.

Создать новый блокнот

Сначала создайте новый блокнот и измените имя на «Искусственный интеллект и поисковая система».

Создать новый блокнот
Создать новый блокнот

Загрузить справочные документы

Здесь мы загружаем PDF-файл Ван Шусена «Технологии поисковых систем» в качестве справочного документа.

Вы можете напрямую загружать PDF-файлы или текстовые файлы, выбирать их из Google Cloud Drive или напрямую копировать текст.

Загрузить документы
Загрузить документы

Знакомство с документацией

Давайте начнем задавать вопросы. Нам нужно разобраться в поисковых системах и искусственном интеллекте. Давайте начнем задавать вопросы:

Вопрос: Каков принцип работы поисковой системы?

поисковая системаиз原理
поисковая системаиз原理

Видно, что NotebookLM относительно хорошо реагирует на ссылки поисковых систем, включая такую ​​информацию, как трехуровневые воронки.

Нажмите на цитату, чтобы просмотреть исходный текст.

Цитата Посмотреть исходный текст
Цитата Посмотреть исходный текст

Теперь, когда мы понимаем основные связи, давайте посмотрим, какую технологию использует каждая деталь.

Вопрос: Конкретные методы обработки запросов в поисковых системах.

поисковая системасерединаQuery Обработка специфическими методами обработки
поисковая системасерединаQuery Обработка специфическими методами обработки

Ответы нестабильны, отвечайте только на английском, но контент по-прежнему надежен.

Далее поинтересуемся техническим решением отзыва.

Вопрос: Какие решения для поиска обычно используются в поисковых системах и какие технологии искусственного интеллекта? Пожалуйста, ответьте на китайском языке.

Попробуйте здесь и добавьте инструкции по ответу на китайском языке.

поисковая Отзыв системы (Поисковая) часть
поисковая Отзыв системы (Поисковая) часть

Ответ был довольно хороший, и он предложил три решения отзыва и использованные технологии. Мы сохранили их и продолжили задавать вопросы.

Вопрос: Подробное введение в трехуровневую воронку ранжирования в поисковых системах и принятую модельную схему. Ответ на китайском языке.

Сортировка поиска
Сортировка поиска

Трехуровневую воронку представили, но ответ на типовое решение был так себе.

Быстрый проектсодержание

Презентация вопросов и ответов подошла к концу, и мы приступили к систематизации заметок, сохраненных после приведенных выше вопросов. Обратите внимание, что вы можете добавлять сюда заметки самостоятельно и записывать свои мысли в любое время.

С помощью приведенных выше вопросов мы сохранили 4 заметки и выбрали:

Выбрать заметку
Выбрать заметку

можно увидеть,Система даетПодвести итогСоздайте схемуОбъединить в заметкии другие функции,Давайте попробуемСоздать учебное пособие

учебное пособие
учебное пособие

Система формирует учебное пособие, включающее в себя контроль качества, отзыв, сортировку и т. д.

Давайте попробуем другие и выберем эти четыре:

Вопрос: Создайте блог на основе этого содержимого, выведите его в уценке и ответьте на китайском языке.

Смотрите готовый продукт ниже

Язык кода:javascript
копировать
## поисковая Как работает система

Пользователь вводит запрос в поле поиска, поисковая система возвращает несколько документов и представляет их пользователю по порядку. С момента нажатия пользователем кнопки поиска до просмотра окончательных результатов поиска проходит около сотен миллисекунд. В этот период поисковая система выполнила множество вычислений, и мы называем эту серию шагов расчета «поисковая». системасвязь”。поисковая Системная связь обычно имеет трехуровневую структуру воронки: прослушивание отзыва, грубый отбор и точный отбор.

**поисковая Системная ссылка в основном состоит из трех основных этапов: **

1. **Обработка текста запроса (Query Processing)**
    
    - **Сегментация слов.** Разделите слово запроса на несколько слов, например разделите слова «рекомендация по зимней толстовке» на слова «зима», «толстовка» и «рекомендуется». Методы глубокого обучения, такие как BERT, показали хорошие результаты в задачах сегментации слов.
    - **Вес слова:** вычисление важности каждого слова в слове запроса, используемом для стратегии потери слов при вызове текста. Вес слов можно определить с помощью аннотации вручную или с помощью машинного обучения. Модель.
    - **Переписывание слова запроса.** Создавайте другие выражения с тем же семантическим значением, что и исходное слово запроса, например переписывая «побочные эффекты» на «побочные реакции». Переписывание слов запроса может быть основано на правилах, списках синонимов, списках гипонимии или может быть создано с использованием модели глубокого обучения.
    - **Идентификация намерения.** Определите цель запроса пользователя, например, хочет ли пользователь найти близлежащие рестораны или узнать об определенном новостном событии. Сюда входит чувствительность ко времени, которая проверяет, предпочитает ли пользователь новый контент (например, «последние новости»), и региональное намерение, которое учитывает местоположение пользователя и географическую значимость документа (например, «рестораны рядом со мной»).
2. **Извлечение**
    
    - **Воспоминание текста:** Это самый основной и важный канал воспоминания. При вызове текста в основном используется инвертированный индекс, структура данных, которая записывает «слово → список документов, содержащих это слово». Учитывая термин запроса, система сначала сегментирует его на слова, а затем использует инвертированный индекс для поиска документов, содержащих эти слова. Чтобы улучшить скорость запоминания, производится расширение синонимов, например, «зима» расширяется до «зима». Кроме того, при вызове текста также необходимо учитывать расстояние между словами, а также вес слов, чтобы исключить нерелевантные документы.
    - **Векторный отзыв:** Это важная схема отзыва, появившаяся в последние годы. Она преодолевает ограничения отзыва текста и может вызывать документы, которые семантически связаны, но не соответствуют тексту. Суть векторного вызова заключается в представлении слов запроса и документов в виде векторов соответственно, а затем вычислении сходства между векторами. Система предварительно вычисляет векторные представления всех документов и использует технологию индексации приближенного ближайшего соседа (ANN) для ускорения процесса поиска. Векторное запоминание можно разделить на корреляционное запоминание и персонализированное запоминание. Разница между ними заключается в разных целях обучения. Модель. Первое соответствует показателю корреляции, а второе — поведению пользователя.
    - **Отзыв офлайн:** Это решение использует простаивающие вычислительные ресурсы для получения высококачественного индекса «слова запроса → список документов» в автономном режиме для онлайн-воспоминания. Существует множество методов офлайн-запоминания, таких как: анализ журналов воздействия, использование документов с высоким рейтингом и высоким рейтингом кликов на страницах результатов онлайн-поиска для создания индексов, выполнение поисковых ссылок в автономном режиме, вызов и сортировка большого количества терминов запроса; и сортировка. Результаты сохраняются в виде индексов; используйте модель NLP, например doc2query, для поиска терминов запроса, тесно связанных с документом в автономном режиме, и создания индекса.
3. **Сортировать (Ranking)**
    
    - **Вспомнить прослушивание:** Быстро извлекайте десятки тысяч документов из сотен миллионов библиотек документов, используйте простые правила и правила для оценки документов и выбирайте тысячи документов с наивысшими оценками для перехода на следующий уровень сортировки. Чтобы контролировать объем вычислений, при напоминании о релевантности прослушиваний обычно используются башни-близнецы для сопоставления слов запроса и документов с векторным пространством соответственно и расчета векторного сходства. Модель рейтинга кликов также использует структуру с двумя башнями, которая использует характеристики пользователя, характеристики слова запроса и характеристики документа для оценки вероятности клика пользователя. Прослушивание припоминаний может проводиться с использованием правил или простого линейного слияния оценок корреляции и других характеристик или без модели слияния.
    - **Грубый ряд:** Выберите сотни документов из тысяч документов, полученных в ходе повторного прослушивания, в качестве набора кандидатов для получения высокого рейтинга. При грубом скрининге используется немного больший размер модели, чтобы более точно оценить релевантность документа условиям запроса и оценить вероятность клика пользователя, чем при повторном прослушивании. На грубом этапе ранжирования можно использовать глубокую нейронную сеть (DNN) или модель BERT для расчета показателя релевантности, а также модель DNN для оценки рейтинга кликов. Модель Fusion обычно использует модель GBDT для объединения релевантности, рейтинга кликов и других функций для получения окончательного балла.
    - **Тонкий ряд:** Fine Ranking использует глубокие нейронные сети для оценки сотен документов, сортировки их по степени слияния и, наконец, отображения на странице результатов поиска. Модель, используемая для точного ранжирования, является самой крупной. Вы можете использовать модель BERT для расчета корреляции и модель DNN для оценки рейтинга кликов. Модель Fusion обычно использует модель GBDT, которая объединяет несколько показателей, таких как релевантность, рейтинг кликов, качество контента, своевременность, региональность, персонализация и т. д., чтобы в конечном итоге определить рейтинг документов.

**Технология искусственного интеллекта находится в поиске Применение в программе отзыва системы: **

- **Причастие:** Разделите слово запроса на несколько слов, например разделите «рекомендация по зимней толстовке» на «зима», «толстовка» и «рекомендуется». Методы глубокого обучения, такие как BERT, показали хорошие результаты в задачах сегментации слов.
- **Вес слова:** Рассчитайте важность каждого слова в запросе для использования в стратегии удаления слов при вызове текста. Вес слов можно определить с помощью аннотации вручную или с помощью машинного обучения. Модель.
- **Слово запроса переписано:** Создайте другие выражения, имеющие ту же семантику, что и исходный термин запроса, например, замените «побочные эффекты» на «побочные реакции». Переписывание слов запроса может быть основано на правилах, списках синонимов, списках гипонимии или может быть создано с использованием модели глубокого обучения.
- **Модель семантического соответствия:** При вызове векторов слова запроса и документы встраиваются в векторное пространство и вычисляется сходство векторов. Обычно используемые модели включают модель башен-близнецов, BERT и т. д.
- **Приблизительный поиск ближайшего соседа (ANN):** Он используется для вызова векторов, чтобы быстро найти документы, наиболее похожие на представление вектора слова запроса в крупномасштабных библиотеках документов.

Совместное использование решений множественного отзыва и технологии ИИ может улучшить поисковую Отзыв системы Ставка,Представляйте пользователям более актуальные документы.

Следует отметить, что,Предоставленная информация не детализирует конкретный Модельный план для каждого этапа трехуровневой воронки.,Например, используемая структура модели BERT, количество слоев и функций активации модели DNN, количество и глубина деревьев модели GBDT и другая информация. Если вам нужно знать эти детали,Возможно, потребуется обратиться к другим источникам. Готовый продукт:

Обзоры ноутбуковLM

преимущество:

  • Хорошее дизайнерское решение продукта,Может записывать спорадические мысли фрагментами.,Организуйте и усовершенствуйте контент для спорадических мыслей с помощью RAG.,Наконец, обобщите содержание спорадического мышления и выведите его.,Помогите пользователям достичьКомплексное приложение

Оптимизированные направления:

  • Если посмотреть на этот фрагмент, то можно увидеть, что он по-прежнему фрагментирован в соответствии с длиной текста, и никакой семантически структурированной фрагментации не происходит.
  • Поддерживает импорт веб-страниц и заметок.
  • Добавьте переключатель веб-поиска, чтобы установить область поиска, например Википедию.
  • поддержание языка
  • Сгенерированный контент пока не поддерживает модификацию.
  • Представляем больше многорежимных возможностей,Входной разъем поддерживает многорежимный вход,Выход поддерживает многорежимный вывод персонализации.

Подвести итог

NotebookLM 给了我们一个很好изLLM时代изpersonalized AI Пример продукта: хороший посадочный продукт RAG. Во многих случаях способность остается способностью благодаря интерактивным инновациям. best software ever created for leveraging AI in your creative work"。

boy illustration
Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).
boy illustration
[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).
boy illustration
Прочитайте нейросетевую модель Трансформера в одной статье
boy illustration
.ART Теплые зимние предложения уже открыты
boy illustration
Сравнительная таблица описания кодов ошибок Amap
boy illustration
Уведомление о последних правилах Points Mall в декабре 2022 года.
boy illustration
Даже новички могут быстро приступить к работе с легким сервером приложений.
boy illustration
Взгляд на RSAC 2024|Защита конфиденциальности в эпоху больших моделей
boy illustration
Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.
boy illustration
Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)
boy illustration
Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов
boy illustration
[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста
boy illustration
Обзор Cloud-init и этапы создания в рамках PVE
boy illustration
Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)
boy illustration
Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.
boy illustration
Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!
boy illustration
[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !
boy illustration
[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз
boy illustration
Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.
boy illustration
Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?
boy illustration
Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента
boy illustration
Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.
boy illustration
Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)
boy illustration
[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши
boy illustration
Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)
boy illustration
Кодирование Base64 в MultipartFile
boy illustration
5 точек расширения SpringBoot, супер практично!
boy illustration
Глубокое понимание сопоставления индексов Elasticsearch.
boy illustration
15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.
boy illustration
Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.