Руководство по развертыванию TTS API: создание персонализированной службы синтеза речи
Руководство по развертыванию TTS API: создание персонализированной службы синтеза речи

Используйте легкий сервер приложений для создания API преобразования текста в речь TTS.

Предисловие

  • Поскольку в предыдущей статье я посчитал, что сторонний API использовался слишком часто, и я беспокоился, что однажды он внезапно станет непригодным для использования, поэтому я подумал о создании его самостоятельно (PS: В основном потому, что я не видел компанию объявить об этом интерфейсе внешнему миру)
  • Я искал везде и наконец нашел TTS, который можно собрать самому. Его можно модифицировать и превратить в API (не боюсь шуток, это тоже сторонний интерфейс-edge-tts).

1. введение в Edge-TTS

  • Edge-TTS — это библиотека Python, использующая преобразование текста в речь Microsoft.
  • Текст можно преобразовать в речь, поддерживается несколько языков и голосов.

2. Подготовка

  • сервер,Здесь я рекомендуюЛегкий сервер приложений Tencent Cloud,Используется для развертывания служб TTS.
  • Пакет файлов, который необходимо развернуть, необходим во время развертывания.
  • Доменное имя, которое может понадобиться, если его использует третья сторона.

3. Специальные инструкции

  • На этот раз для развертывания мы используем метод докера, поэтому серверная среда должна отдавать приоритет среде Linux. Конечно, если вы большой начальник, среда Windows также приемлема. Ниже я буду использовать серверную среду Centos7 в качестве примера для выполнения руководства по развертыванию.
  • Поскольку используемая в этот раз библиотека является службой Microsoft, она может существовать всегда или может быть отключена через некоторое время. Это неясно, но если появится новая, я снова опубликую новую статью. Объясните, как это сделать. используйте это.

4. Фактический эффект работы

  • Использовать хранилище объектовcos в качестве хранилища для создания снимка экрана (обратный адрес хранилища)

  • Запуск снимка экрана с использованием локального хранилища (возвращает локальный адрес)

5. Начать развертывание

5.1 Для удобства и скорости,Здесь я использую панель Pagoda для операций быстрого развертывания.!ВходитьЛегкий сервер приложений Tencent CloudКупитьлегкий сервер приложений, выберите панель «Пагода». Конечно, вы можете выбрать centos7.6 и установить его самостоятельно.

5.2 После покупки сервера адрес входа в панель и пароль учетной записи отобразятся в сообщении Tencent Cloud через несколько минут. Затем просто запустите его прямо в браузере.

5.3 При входе в панель управления Pagoda вам будет предложено привязать и зарегистрировать учетную запись Pagoda. Вы можете просто зарегистрироваться. После успешной привязки выберите файл в левом столбце и войдите в этот каталог.

5.4 Давайте создадим каталог. Поскольку нам нужно загрузить код, я сначала загружу код на основе объекта хранилища cos (эта версия загрузит преобразованный голос в cos и вернет адрес).

версия-2024-2-29.zip

5.5 После загрузки распакуйте (лучше всего создать в директории www директорию для запуска, чтобы потом не забыть)

5.6 После распаковки дважды щелкните файл Edge-tts.py. Нам нужно настроить некоторые функции. Функция каждого места указана в файле. Всего нужно настроить 6 мест, 4 перед кодом и 2. сзади! Все очень просто! В правой части параметров, которые необходимо настроить, указано, где их настроить.

Облачное объектное хранилище TencentОткрыть адресhttps://curl.qcloud.com/f3qqvIGU

5.6 После завершения вышеуказанного процесса (внимательно проверьте, есть ли пробелы в параметрах и нет ли ошибок в параметрах), откройте докер в левом столбце. Если он не установлен, нажмите его установить.

5.7 После установки докера нажимаем на терминал в левом столбце! Введите каталог, в котором хранится загруженный пакет файлов выше, а затем введите команду. Введите команду ниже и выполните ее самостоятельно.

Язык кода:php
копировать
cd /www/tts
chmod +x dockerRun.sh
./dockerRun.sh

5.8 Затем дождитесь выполнения кода. Если появится скриншот ниже, это означает, что операция прошла успешно.

5.9 После успешного запуска напрямую введите IP-адрес вашего сервера: 2020, чтобы проверить, доступен ли к нему доступ. Если он не открывается, возможно, брандмауэр вашего сервера не открыт. Вам также необходимо перейти в консоль Tencent Cloud, чтобы активировать брандмауэр сервера. и пагода Фаервол панели должен быть включен.

5.10 Затем вводим полный путь в браузере. ip:2020+текст, который нужно преобразовать+актер озвучки

Язык кода:php
копировать
    "xiaoxiao": "zh-CN-XiaoxiaoNeural",
    "xiaoyi": "zh-CN-XiaoyiNeural",
    "yunjian": "zh-CN-YunjianNeural",
    "yunxi": "zh-CN-YunxiNeural",
    "yunxia": "zh-CN-YunxiaNeural",
    "yunyang": "zh-CN-YunyangNeural",
    "xiaobei": "zh-CN-liaoning-XiaobeiNeural",
    "xiaoni": "zh-CN-shaanxi-XiaoniNeural",
    "hiugaai": "zh-HK-HiuGaaiNeural",
    "hiumaan": "zh-HK-HiuMaanNeural",
    "wanlung": "zh-HK-WanLungNeural",
    "hsiaochen": "zh-TW-HsiaoChenNeural",
    "hsioayu": "zh-TW-HsiaoYuNeural",
    "yunjhe": "zh-TW-YunJheNeural",
Язык кода:php
копировать
серверip:2020/dealAudio?text=Добро пожаловатьtts&voice=xiaoxiao
  • text — это текст, который вам нужно преобразовать
  • Голос - актер озвучки, вы можете выбрать его сами

5.10 Выше представлен метод развертывания Tencent Cloud COS, затем приведен метод развертывания локального хранилища. Процесс развертывания тот же, но пакеты файлов разные, поэтому вы можете просто посмотреть процесс развертывания выше. необходимо настроить что-либо для локального развертывания. Его можно использовать сразу после установки.

bendi.zip

5.11 Привязываем доменное имя для внешнего доступа! Лучше всего использовать SSL-сертификат.

6. Меры предосторожности

  • Их нельзя развернуть на одном сервере одновременно, поскольку они оба имеют один и тот же порт. Прежде чем их можно будет развернуть вместе, необходимо изменить порт.
  • Для развертывания локального хранилища, если доменное имя привязано, вам необходимо рассмотреть вопрос о междоменном использовании! Я уже написал это в коде, и весь доступ доступен. Вы можете изменить его для собственного использования или ограничить определенные доменные имена. .
  • Опять же помните, что интерфейс непостоянен и может внезапно исчезнуть.

7. Заключение

  • через эту статью,Мы узнали, как создать API TTS (преобразование текста в речь) с использованием легкого сервера приложений. Преимущество этого в том, что мы можем сами управлять этой услугой.,Не нужно слишком полагаться на третьи стороны。Мы подробно представили Легкий сервер приложений Tencent Процесс развертывания с использованием библиотеки Edge-TTS в облаке также предусматривает использование хранилища. объектов COS и локальное хранилище — два варианта развертывания.

  • Как новичок,Мы должны идти в ногу с технологическими изменениями. в этой статье,Мы используем Docker для управления нашими приложениями.,Это не только удобно,Это также повышает мобильность и воспроизводимость приложений. Мы также упомянули некоторые вопросы, требующие внимания.,Например, при развертывании нескольких сервисов на одном сервере необходимо обращать внимание на конфликты портов.,При развертывании локального хранилища необходимо учитывать ограничения междоменного доступа.

  • В целом, благодаря этой статье мы узнали, как создать API преобразования текста в речь TTS, и получили глубокое понимание некоторых технических деталей и мер предосторожности в процессе развертывания. Как технические специалисты, мы должны продолжать изучать и исследовать новые технологии, чтобы лучше реагировать на меняющиеся потребности и проблемы.
boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода