Google запустил экспериментальный продукт NotebookLM — персонализированный продукт-помощник с искусственным интеллектом на основе RAG. На основе достоверной информации, предоставленной пользователями через RAG, он помогает пользователям получить представление о справочном контенте и изучить его, а затем использует искусственный интеллект для организации заметок и их преобразования. в то, что в конечном итоге нужно пользователям. Конечная цель вашего плана, блога, бизнес-плана и т. д.
В предыдущем блоге,упомянутый в то время:"Границы поисковых продуктов ИИ ни в коем случае не ограничиваются поиском. Сверху вниз, как лучше понять реальные потребности пользователей, и вплоть до того, как решать сложные проблемы с помощью комбинации агентов, чтобы предоставить пользователям сквозную информацию. заканчивать персонализированными решениями."。google
Вот этотNotebookLM
Это также больше соответствует этой идее. Он предоставляет персонализированный помощник по ведению заметок на основе информации, предоставленной пользователем, в сочетании с технологией поиска. Однако в целом он сдержан и подчеркивает надежность, то есть следует за информацией. предоставляется пользователем и не объединяет его с преимуществами поиска Google.
Теперь приступим к делу. Давайте познакомимся с функциями NotebookLM и попробуем.
Официальное введениеда,NotebookLM да一个基于Информация о доверии пользователя(也就да用户自己提供из文档)изперсонализация(私人из)ИИпомощник。
В настоящее время NotebookLM предоставляет услуги только в США, и для этого требуется волшебство.
RAG
способность отвечать,И можете просмотреть содержимое справочного документа.Если контент, на который отвечает машина, одобрен пользователем,Пользователи могут отвечать наСохранить в заметки
,Итак, представьте себе совместную модель,То есть пользователь сначала загружает справочный документ для изучения.,然назадТолько то, на что вы обращаете внимание(其实就да整理大纲)Задать вопрос,Наконец, сохраните эти ответы в заметках.
Задав все волнующие вас вопросы, вы получите много полезных и ценных заметок. На основе этих фрагментов вы можете:
Google подчеркивает, что личные данные пользователей не будут использоваться для обучения NotebookLM, поэтому любая личная или конфиденциальная информация останется конфиденциальной, если только пользователь не решит поделиться ресурсами с соавторами.
После просмотра Официального введения давайте начнем с него.
Сначала создайте новый блокнот и измените имя на «Искусственный интеллект и поисковая система».
Здесь мы загружаем PDF-файл Ван Шусена «Технологии поисковых систем» в качестве справочного документа.
Вы можете напрямую загружать PDF-файлы или текстовые файлы, выбирать их из Google Cloud Drive или напрямую копировать текст.
Давайте начнем задавать вопросы. Нам нужно разобраться в поисковых системах и искусственном интеллекте. Давайте начнем задавать вопросы:
Вопрос: Каков принцип работы поисковой системы?
Видно, что NotebookLM относительно хорошо реагирует на ссылки поисковых систем, включая такую информацию, как трехуровневые воронки.
Нажмите на цитату, чтобы просмотреть исходный текст.
Теперь, когда мы понимаем основные связи, давайте посмотрим, какую технологию использует каждая деталь.
Вопрос: Конкретные методы обработки запросов в поисковых системах.
Ответы нестабильны, отвечайте только на английском, но контент по-прежнему надежен.
Далее поинтересуемся техническим решением отзыва.
Вопрос: Какие решения для поиска обычно используются в поисковых системах и какие технологии искусственного интеллекта? Пожалуйста, ответьте на китайском языке.
Попробуйте здесь и добавьте инструкции по ответу на китайском языке.
Ответ был довольно хороший, и он предложил три решения отзыва и использованные технологии. Мы сохранили их и продолжили задавать вопросы.
Вопрос: Подробное введение в трехуровневую воронку ранжирования в поисковых системах и принятую модельную схему. Ответ на китайском языке.
Трехуровневую воронку представили, но ответ на типовое решение был так себе.
Презентация вопросов и ответов подошла к концу, и мы приступили к систематизации заметок, сохраненных после приведенных выше вопросов. Обратите внимание, что вы можете добавлять сюда заметки самостоятельно и записывать свои мысли в любое время.
С помощью приведенных выше вопросов мы сохранили 4 заметки и выбрали:
можно увидеть,Система даетПодвести итог
、Создайте схему
、Объединить в заметки
и другие функции,Давайте попробуемСоздать учебное пособие
:
Система формирует учебное пособие, включающее в себя контроль качества, отзыв, сортировку и т. д.
Давайте попробуем другие и выберем эти четыре:
Вопрос: Создайте блог на основе этого содержимого, выведите его в уценке и ответьте на китайском языке.
Смотрите готовый продукт ниже
## поисковая Как работает система
Пользователь вводит запрос в поле поиска, поисковая система возвращает несколько документов и представляет их пользователю по порядку. С момента нажатия пользователем кнопки поиска до просмотра окончательных результатов поиска проходит около сотен миллисекунд. В этот период поисковая система выполнила множество вычислений, и мы называем эту серию шагов расчета «поисковая». системасвязь”。поисковая Системная связь обычно имеет трехуровневую структуру воронки: прослушивание отзыва, грубый отбор и точный отбор.
**поисковая Системная ссылка в основном состоит из трех основных этапов: **
1. **Обработка текста запроса (Query Processing)**
- **Сегментация слов.** Разделите слово запроса на несколько слов, например разделите слова «рекомендация по зимней толстовке» на слова «зима», «толстовка» и «рекомендуется». Методы глубокого обучения, такие как BERT, показали хорошие результаты в задачах сегментации слов.
- **Вес слова:** вычисление важности каждого слова в слове запроса, используемом для стратегии потери слов при вызове текста. Вес слов можно определить с помощью аннотации вручную или с помощью машинного обучения. Модель.
- **Переписывание слова запроса.** Создавайте другие выражения с тем же семантическим значением, что и исходное слово запроса, например переписывая «побочные эффекты» на «побочные реакции». Переписывание слов запроса может быть основано на правилах, списках синонимов, списках гипонимии или может быть создано с использованием модели глубокого обучения.
- **Идентификация намерения.** Определите цель запроса пользователя, например, хочет ли пользователь найти близлежащие рестораны или узнать об определенном новостном событии. Сюда входит чувствительность ко времени, которая проверяет, предпочитает ли пользователь новый контент (например, «последние новости»), и региональное намерение, которое учитывает местоположение пользователя и географическую значимость документа (например, «рестораны рядом со мной»).
2. **Извлечение**
- **Воспоминание текста:** Это самый основной и важный канал воспоминания. При вызове текста в основном используется инвертированный индекс, структура данных, которая записывает «слово → список документов, содержащих это слово». Учитывая термин запроса, система сначала сегментирует его на слова, а затем использует инвертированный индекс для поиска документов, содержащих эти слова. Чтобы улучшить скорость запоминания, производится расширение синонимов, например, «зима» расширяется до «зима». Кроме того, при вызове текста также необходимо учитывать расстояние между словами, а также вес слов, чтобы исключить нерелевантные документы.
- **Векторный отзыв:** Это важная схема отзыва, появившаяся в последние годы. Она преодолевает ограничения отзыва текста и может вызывать документы, которые семантически связаны, но не соответствуют тексту. Суть векторного вызова заключается в представлении слов запроса и документов в виде векторов соответственно, а затем вычислении сходства между векторами. Система предварительно вычисляет векторные представления всех документов и использует технологию индексации приближенного ближайшего соседа (ANN) для ускорения процесса поиска. Векторное запоминание можно разделить на корреляционное запоминание и персонализированное запоминание. Разница между ними заключается в разных целях обучения. Модель. Первое соответствует показателю корреляции, а второе — поведению пользователя.
- **Отзыв офлайн:** Это решение использует простаивающие вычислительные ресурсы для получения высококачественного индекса «слова запроса → список документов» в автономном режиме для онлайн-воспоминания. Существует множество методов офлайн-запоминания, таких как: анализ журналов воздействия, использование документов с высоким рейтингом и высоким рейтингом кликов на страницах результатов онлайн-поиска для создания индексов, выполнение поисковых ссылок в автономном режиме, вызов и сортировка большого количества терминов запроса; и сортировка. Результаты сохраняются в виде индексов; используйте модель NLP, например doc2query, для поиска терминов запроса, тесно связанных с документом в автономном режиме, и создания индекса.
3. **Сортировать (Ranking)**
- **Вспомнить прослушивание:** Быстро извлекайте десятки тысяч документов из сотен миллионов библиотек документов, используйте простые правила и правила для оценки документов и выбирайте тысячи документов с наивысшими оценками для перехода на следующий уровень сортировки. Чтобы контролировать объем вычислений, при напоминании о релевантности прослушиваний обычно используются башни-близнецы для сопоставления слов запроса и документов с векторным пространством соответственно и расчета векторного сходства. Модель рейтинга кликов также использует структуру с двумя башнями, которая использует характеристики пользователя, характеристики слова запроса и характеристики документа для оценки вероятности клика пользователя. Прослушивание припоминаний может проводиться с использованием правил или простого линейного слияния оценок корреляции и других характеристик или без модели слияния.
- **Грубый ряд:** Выберите сотни документов из тысяч документов, полученных в ходе повторного прослушивания, в качестве набора кандидатов для получения высокого рейтинга. При грубом скрининге используется немного больший размер модели, чтобы более точно оценить релевантность документа условиям запроса и оценить вероятность клика пользователя, чем при повторном прослушивании. На грубом этапе ранжирования можно использовать глубокую нейронную сеть (DNN) или модель BERT для расчета показателя релевантности, а также модель DNN для оценки рейтинга кликов. Модель Fusion обычно использует модель GBDT для объединения релевантности, рейтинга кликов и других функций для получения окончательного балла.
- **Тонкий ряд:** Fine Ranking использует глубокие нейронные сети для оценки сотен документов, сортировки их по степени слияния и, наконец, отображения на странице результатов поиска. Модель, используемая для точного ранжирования, является самой крупной. Вы можете использовать модель BERT для расчета корреляции и модель DNN для оценки рейтинга кликов. Модель Fusion обычно использует модель GBDT, которая объединяет несколько показателей, таких как релевантность, рейтинг кликов, качество контента, своевременность, региональность, персонализация и т. д., чтобы в конечном итоге определить рейтинг документов.
**Технология искусственного интеллекта находится в поиске Применение в программе отзыва системы: **
- **Причастие:** Разделите слово запроса на несколько слов, например разделите «рекомендация по зимней толстовке» на «зима», «толстовка» и «рекомендуется». Методы глубокого обучения, такие как BERT, показали хорошие результаты в задачах сегментации слов.
- **Вес слова:** Рассчитайте важность каждого слова в запросе для использования в стратегии удаления слов при вызове текста. Вес слов можно определить с помощью аннотации вручную или с помощью машинного обучения. Модель.
- **Слово запроса переписано:** Создайте другие выражения, имеющие ту же семантику, что и исходный термин запроса, например, замените «побочные эффекты» на «побочные реакции». Переписывание слов запроса может быть основано на правилах, списках синонимов, списках гипонимии или может быть создано с использованием модели глубокого обучения.
- **Модель семантического соответствия:** При вызове векторов слова запроса и документы встраиваются в векторное пространство и вычисляется сходство векторов. Обычно используемые модели включают модель башен-близнецов, BERT и т. д.
- **Приблизительный поиск ближайшего соседа (ANN):** Он используется для вызова векторов, чтобы быстро найти документы, наиболее похожие на представление вектора слова запроса в крупномасштабных библиотеках документов.
Совместное использование решений множественного отзыва и технологии ИИ может улучшить поисковую Отзыв системы Ставка,Представляйте пользователям более актуальные документы.
Следует отметить, что,Предоставленная информация не детализирует конкретный Модельный план для каждого этапа трехуровневой воронки.,Например, используемая структура модели BERT, количество слоев и функций активации модели DNN, количество и глубина деревьев модели GBDT и другая информация. Если вам нужно знать эти детали,Возможно, потребуется обратиться к другим источникам. Готовый продукт:
преимущество:
Оптимизированные направления:
NotebookLM
给了我们一个很好изLLM时代изpersonalized AI
Пример продукта: хороший посадочный продукт RAG. Во многих случаях способность остается способностью благодаря интерактивным инновациям. best software ever created for leveraging AI in your creative work"。