SDXL может синтезировать изображения с разрешением до 1024×1024, которые можно увеличить до 4 раз в сочетании с нашим собственным алгоритмом масштабирования, а DemoFusion позволяет SDXL генерировать изображения с разрешением 4×, 16× или даже более высокого разрешения без каких-либо корректировок и большого количества память нужна. Все сгенерированные изображения созданы с использованием одного графического процессора RTX 3090.
Краткое описание структуры DemoFusion выглядит следующим образом:
а) DemoFusion начинается с традиционной генерации разрешения с использованием цикла «повышающая дискретизация-диффузия-шумоподавление». Он использует результаты, полученные с низким разрешением, в качестве инициализации для получения более высокого разрешения за счет инверсии шума. В цикле «повышающая дискретизация-диффузия-шумоподавление» инвертированное шумом представление соответствующего временного шага в предыдущем процессе диффузии используется в качестве остатка скачка в качестве глобального ориентира.
б) Чтобы улучшить локальный путь шумоподавления MultiDiffusion, DemoFusion вводит расширенную выборку для установления глобального пути шумоподавления, тем самым способствуя созданию более глобально согласованного контента. Платформа DemoFusion используется в сочетании с SDXL, что в сочетании с ControlNet обеспечивает управляемую генерацию данных высокого разрешения.
DemoFusion имеет функции без настройки,
Может быть легко интегрирован с приложениями на основе LDM.
DemoFusion работает прогрессивно, обеспечивая реалистичное увеличение изображения. Распределение скрытых данных на основе базового LDM.
Использование генеративного искусственного интеллекта (GenAI) для создания изображений высокого разрешения имеет огромный потенциал.
принцип
Фреймворк DemoFusion.
(a) Начиная с традиционной генерации разрешения, DemoFusion применяет цикл «повышающая дискретизация-диффузия-шумоподавление», используя результат генерации с низким разрешением в качестве инициализации для получения более высокого разрешения посредством инверсии шума. В цикле «повышающая дискретизация-диффузия-шумоподавление» представление инверсии шума из соответствующего временного шага в предыдущем процессе диффузии представляется как невязка скачка в качестве глобального ориентира.
(б) Чтобы улучшить локальный путь шумоподавления MultiDiffusion, мы вводим расширенную выборку для создания глобального пути шумоподавления, тем самым способствуя более глобально согласованной генерации контента.
и ControlNet Используется совместно сDemoFusion Функция без настройки позволяет и многие основанные на LDM приложений легко интегрируются. Например,DemoFusion иControlNet[3] в сочетании,Можно достичь контролируемого высокого разрешения
Увеличить реальное изображение由于 DemoFusion Работая поступательно, мы можем разделить этапы на #1 Выходные данные заменяются кодированным представлением реального изображения, тем самым достигая усиления реального изображения. Однако мы стараемся избегать использования термина «суперразрешение», поскольку выходные данные имеют тенденцию к основному распределению данных базового LDM, что делает процесс более похожим на генерацию изображений на основе реальных изображений.
До этого в Stable Diffusion Reimagine было реализовано увеличение одного изображения на основе нового алгоритма, созданного на основе Sustainable.ai.
Проект: https://ruoyidu.github.io/demofusion/demofusion.html
Документ: https://drive.google.com/file/d/1pAWCfpEgwy4UAkUqTGDuqypJt-5bl8se/view?usp=sharing
GitHub:https://github.com/PRIS-CV/DemoFusion
Онлайн-опыт: https://huggingface.co/spaces/radames/Enhance-This-DemoFusion-SDXL
Многие коллекции искусственного интеллекта были организованы по адресу https://yv4kfv1n3j.feishu.cn/docx/MRyxdaqz8ow5RjxyL1ucrvOYnnH.