Сегодня я представляю вам чатттс, наиболее реалистичную модель генерации речи с открытым исходным кодом, созданную отечественной командой и готовую к использованию.
Исходный адрес проекта: https://github.com/2noise/ChatTTS/tree/main.
Используя эту среду, вы можете быстро использовать обученную модель синтеза речи для генерации звуков.
Основные характеристики модели:
Для подробного ознакомления с моделью см. Вы можете сослаться на то, что участник проекта выпустил на станции B. Рекламный видеоролик
2. Выполните блоки кода, чтобы загрузить модель. После завершения загрузки запустите модуль вывода по требованию (первая скорость вывода низкая, пожалуйста, подождите терпеливо).
Информация в этом документе предназначена только для академического общения. Он предназначен только для образовательных и исследовательских целей и не может быть использован в каких-либо коммерческих или юридических целях. Автор не гарантирует точность, полноту и достоверность информации. Информация и данные, используемые в этом документе, предназначены только для академических исследовательских целей. Данные получены из общедоступных источников, и авторы не претендуют на право собственности или авторские права на данные.
ChatTTS — мощная система преобразования текста в речь. Однако важно использовать эту технологию ответственно и этично. Чтобы ограничить использование ChatTTS, мы добавили небольшое количество дополнительного высокочастотного шума в процессе обучения 4-часовой модели и использовали формат mp3, чтобы максимально снизить качество звука и не допустить использования преступниками это для потенциальных преступлений. При этом мы обучили модель обнаружения внутри компании и планируем открыть ее в будущем.