Библиотека искусственного интеллекта AI Spleeter, бесплатная практика разделения вокала и фоновой музыки (Python3.10)
Библиотека искусственного интеллекта AI Spleeter, бесплатная практика разделения вокала и фоновой музыки (Python3.10)

Предположим, что при монтаже видео мы получаем фрагмент материала из фильма или сериала. Если мы воспроизведем его непосредственно в отредактированном видео, мы можем столкнуться с проблемами авторских прав. В большинстве случаев нам необходимо разделить человеческий голос и фоновую музыку, а затем. заменить фоновую музыку во второй раз. Для создания AI-библиотека искусственного интеллекта Spleeter может помочь нам завершить процесс разделения вокала и фоновой музыки для большинства материалов.

Источник модели Spleeter взят с крупнейшего музыкального веб-сайта Deezer. Нижний уровень основан на системе глубокого обучения Tensorflow. Он может идентифицировать фоновый музыкальный материал в материале с помощью модели, тем самым определяя, какая фоновая музыка является фоновой, а какая — внешним вокалом.

Установка сплитера

Выполните команду pip в терминале:

Язык кода:javascript
копировать
pip3 install spleeter --user

После успешной установки введите команду для проверки пути установки Spleeter:

Язык кода:javascript
копировать
pip show spleeter

Программа возвращает:

Язык кода:javascript
копировать
PS C:\Users\liuyue\www\videosite> pip show spleeter                                        WARNING: Ignoring invalid distribution -umpy (c:\python39\lib\site-packages)               Name: spleeter                                                                             Version: 2.3.2
Summary: The Deezer source separation library with pretrained models based on tensorflow.
Home-page: https://github.com/deezer/spleeter
Author: Deezer Research
Author-email: spleeter@deezer.com
License: MIT
Location: c:\users\liuyue\appdata\roaming\python\python39\site-packages                    Requires: ffmpeg-python, httpx, librosa, llvmlite, norbert, numpy, pandas, protobuf, tensorflow, typer

 Означает, что установка прошла успешно.

Если вы не хотите создавать среду глубокого обучения локально,Его также можно установить через образ Docker. О Докере,Пожалуйста, переместите:Дюйм простоя — это дюйм крови, сто тысяч контейнеров и сто тысяч солдат | Создайте высокодоступный веб-кластер Gunicorn+Flask на базе Kubernetes (k8s) под системой Win10/Mac. , мы не будем здесь вдаваться в подробности.

Запустите команду Docker:

Язык кода:javascript
копировать
docker pull deezer/spleeter:3.8-5stems

Эта программа плюс предварительно обученная модель требуют примерно 1,73 ГБ места на жестком диске.

Сплитер разделяет вокал и фоновую музыку.

Spleeter поддерживает разделение человеческих голосов и фоновой музыки как из видео, так и из аудиофайлов. Spleeter поставляется с тремя предварительно обученными моделями:

    1、человеческий голос&разделение аккомпанемента Модель 2 стебли, отдельные две звуковые дорожки

2. Барабанная, басовая и другая модель разделения звука (4 основы, разделенные на 4 дорожки)

3. Барабан, бас, фортепиано и другая модель разделения звука (5 стеблей, разделенных на 5 дорожек)

Последние две модели относительно сложны. Они могут разделять звуки вокала, ударных, баса и фортепиано на несколько дорожек. Обычно они подходят для использования профессионалами музыкальной индустрии.

В большинстве случаев нам нужно использовать только первые стемы модели 2, которые разделяют звук на две дорожки: звуки вокала и фоновой музыки:

Язык кода:javascript
копировать
spleeter separate -o /output/ -p spleeter:2stems /test.mp3

Здесь -o представляет выходной каталог, -p представляет выбранную модель разделения и, наконец, материал, который нужно разделить.

Первый запуск будет медленным, поскольку spleeter загрузит предварительно обученную модель размером около 1,73 г. После завершения запуска в выходном каталоге будет создан отдельный файл звуковой дорожки:

Язык кода:javascript
копировать
accompaniment.wav
vocals.wav

Accompaniment.wav представляет человеческий голос, а voices.wav — фоновую музыку.

Если он установлен на базе Docker, нужно запустить соответствующую команду Docker:

Язык кода:javascript
копировать
docker run -v $(pwd)/output:/output deezer/spleeter:3.8-5stems separate test.mp3 -o /output

Заключение

Spleeter можно рассматривать как лучшее местное решение для функции бесплатного разделения вокала и фоновой музыки. Помимо вторичного создания разделения вокала и фоновой музыки для материалов фильмов и телевизионных драм, если видеоблог записывается во внешней среде, окружающий звук. будет очень шумно. Если вам придется записывать на месте, вы можете использовать Spleeter, чтобы отделить человеческий голос от окружающего звука, избавив от необходимости дважды записывать закадровый голос.

boy illustration
Учебное пособие по Jetpack Compose для начинающих, базовые элементы управления и макет
boy illustration
Код js веб-страницы, фон частицы, код спецэффектов
boy illustration
【новый! Суперподробное】Полное руководство по свойствам компонентов Figma.
boy illustration
🎉Обязательно к прочтению новичкам: полное руководство по написанию мини-программ WeChat с использованием программного обеспечения Cursor.
boy illustration
[Забавный проект Docker] VoceChat — еще одно приложение для мгновенного чата (IM)! Может быть встроен в любую веб-страницу!
boy illustration
Как реализовать переход по странице в HTML (html переходит на указанную страницу)
boy illustration
Как решить проблему зависания и низкой скорости при установке зависимостей с помощью npm. Существуют ли доступные источники npm, которые могут решить эту проблему?
boy illustration
Серия From Zero to Fun: Uni-App WeChat Payment Practice WeChat авторизует вход в систему и украшает страницу заказа, создает интерфейс заказа и инициирует запрос заказа
boy illustration
Серия uni-app: uni.navigateЧтобы передать скачок значения
boy illustration
Апплет WeChat настраивает верхнюю панель навигации и адаптируется к различным моделям.
boy illustration
JS-время конвертации
boy illustration
Обеспечьте бесперебойную работу ChromeDriver 125: советы по решению проблемы chromedriver.exe не найдены
boy illustration
Поле комментария, щелчок мышью, специальные эффекты, js-код
boy illustration
Объект массива перемещения объекта JS
boy illustration
Как открыть разрешение на позиционирование апплета WeChat_Как использовать WeChat для определения местонахождения друзей
boy illustration
Я даю вам два набора из 18 простых в использовании фонов холста Power BI, так что вам больше не придется возиться с цветами!
boy illustration
Получить текущее время в js_Как динамически отображать дату и время в js
boy illustration
Вам необходимо изучить сочетания клавиш vsCode для форматирования и организации кода, чтобы вам больше не приходилось настраивать формат вручную.
boy illustration
У ChatGPT большое обновление. Всего за 45 минут пресс-конференция показывает, что OpenAI сделал еще один шаг вперед.
boy illustration
Copilot облачной разработки — упрощение разработки
boy illustration
Микросборка xChatGPT с низким кодом, создание апплета чат-бота с искусственным интеллектом за пять шагов
boy illustration
CUDA Out of Memory: идеальное решение проблемы нехватки памяти CUDA
boy illustration
Анализ кластеризации отдельных ячеек, который должен освоить каждый&MarkerгенетическийВизуализация
boy illustration
vLLM: мощный инструмент для ускорения вывода ИИ
boy illustration
CodeGeeX: мощный инструмент генерации кода искусственного интеллекта, который можно использовать бесплатно в дополнение к второму пилоту.
boy illustration
Машинное обучение Реальный бой LightGBM + настройка параметров случайного поиска: точность 96,67%
boy illustration
Бесшовная интеграция, мгновенный интеллект [1]: платформа больших моделей Dify-LLM, интеграция без кодирования и встраивание в сторонние системы, более 42 тысяч звезд, чтобы стать свидетелями эксклюзивных интеллектуальных решений.
boy illustration
LM Studio для создания локальных больших моделей
boy illustration
Как определить количество слоев и нейронов скрытых слоев нейронной сети?
boy illustration
[Отслеживание целей] Подробное объяснение ByteTrack и детали кода