Sora: новое поколение инструмента преобразования текста в видео

Shortcuts

Calendar Appointments

Invoice App Manage Accounts

User App Manage Users

Role Management Permission

Dashboard Analytics

Setting Account Settings

FAQs FAQs & Articles

Modals Useful Popups
- Notification
  8 New
- - Congratulation Lettie 🎉
    Won the monthly best seller gold badge
    
    1h ago
  - CF
    
    Charles Franklin
    Accepted your connection
    
    12hr ago
  - New Message ✉️
    You have new message from Natalie
    
    1h ago
  - Whoo! You have new order 🛒
    ACME Inc. made new order $1,154
    
    1 day ago
  - Application has been approved 🚀
    Your ABC project application has been approved.
    
    2 days ago
  - Monthly report is generated
    July monthly financial report is generated
    
    3 days ago
  - Send connection request
    Peter sent you connection request
    
    4 days ago
  - New message from Jane
    Your have new message from Jane
    
    5 days ago
  - CPU is running high
    CPU Utilization Percent is currently at 88.63%,
    
    5 days ago
- View all notifications

введение

🧠 Благодаря постоянному развитию технологий создания видео на основе искусственного интеллекта производство видеоконтента вызвало волну инноваций. Под руководством исследователей и инженеров искусственный интеллект расширяет границы, и это преобразующее путешествие меняет и освобождает видеопроизводство.

Благодаря быстрому прогрессу обработки естественного языка (NLP) и технологий компьютерного зрения создание видео высокой четкости теперь может быть достигнуто путем написания простых подсказок. Технология использует сложные алгоритмы и модели глубокого обучения для интерпретации пользовательского ввода, создания сценариев, распознавания визуальных эффектов и имитации человеческого повествования. Весь процесс включает в себя понимание семантики подсказки с учетом таких элементов, как тон, эмоции и контекст.

📡 После выпуска генераторов текста в видео, таких как Gen-2 от Runway, Stable Video Diffusion от Stability AI, Emu от Meta и Lumiere от Google, OpenAI, создатель ChatGPT, запустил современную программу для преобразования текста в видео. -видео глубокого обучения Модель под названием Sora AI. Эта модель специально разработана для создания коротких видеороликов на основе текстовых подсказок. Хотя Sora AI еще не доступна для широкой публики, выпущенные образцы ее продукции вызвали неоднозначную реакцию: некоторые выражали энтузиазм, а другие выражали обеспокоенность из-за ее впечатляющего качества.

🤔 Содержание этой главы

🔎 Что такое Сора

🔎 Новое видео Соры

🔎 Варианты использования Соры

🔎 Как работает Сора

🔎 Ограничения Соры

🔎 Lumiere Vs Sora AI

🔎 Моральные ограничения Соры

🔎 Меры безопасности, принятые по модели Сора

🔎 в заключение

Что такое Сора

🧐 Sora AI — революционное достижение OpenAI в области исследований искусственного интеллекта, знаменующее беспрецедентную новую эру создания мультимедиа. В качестве передового решения для создания видео на основе текста Sora AI использует свою передовую технологию для мгновенного создания непрерывных, визуально потрясающих видеоклипов, которые могут длиться до минуты или более, на основе подробного ввода текста от пользователей. Суть этой технологии заключается в глубоком понимании и моделировании разнообразного динамического поведения реального физического мира. Это означает, что пользователям достаточно использовать точные и краткие языковые описания, чтобы превращать идеи в подробные видеосцены и создавать их одним щелчком мыши. .

Сегодня Сора AI 不仅限于特定из Профессиональные команды, такие как красные команды（Red Teaming）внутригрупповое заявление,Используется для оценки рисков безопасности и потенциальных кризисов в различных сценариях.,И оно было широко ориентировано на изобразительное искусство.、Дизайн, кино- и телепроизводство и другие сферыиз Открыт для профессиональных пользователей。Эти пользователи могут воспользоваться Sora AI Технологии значительно повышают творческую эффективность, вдохновляют на новые художественные идеи и обеспечивают ценную обратную связь посредством практических операций, которые помогают OpenAI Постоянно оптимизируйте и улучшайте производительность и выразительность модели.

Придерживаясь своего последовательного духа научных исследований и концепции открытого исходного кода, OpenAI активно приглашает все слои общества принять участие в процессе испытаний и непрерывного развития Sora AI, а также поощряет первых пользователей и команду исследований и разработок совместно исследовать безграничный творческий потенциал, содержащийся в этом продукте. передовые технологии. Этот шаг не только способствует практическому применению технологий искусственного интеллекта в области создания видео, но также активно формирует и возглавляет будущее направление развития искусственного интеллекта в совместном создании и взаимодействии с пользователями.

🪐 Например:

SoraPrompt: A movie trailer featuring the adventures of the 30-year-old spaceman wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

👽 Трейлер фильма об этом 30 Приключения пожилого космонавта в вязаном мотоциклетном шлеме из красной шерсти, голубое небо, соляная пустыня, стиль кино, с 35 Снято на миллиметровую пленку, цвета яркие.

SoraPrompt: The animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, focusing on lighting and texture. The mood of the painting is one of wonder and curiosity as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.

👽 Крупный план анимационной сцены показывает невысокого пушистого монстра, стоящего на коленях рядом с тающей красной свечой. Художественный стиль трехмерный и реалистичный, с упором на освещение и текстуры. Настроение картины - удивление и любопытство, поскольку монстр смотрит на пламя широко раскрытыми глазами и открытым ртом. Его поза и выражение лица передают ощущение невинности и игривости, как будто он впервые исследует окружающий мир. Использование теплых тонов и драматического освещения еще больше усиливает уютную атмосферу изображения.

⚛️ Sora AI может создавать сложные сцены с несколькими персонажами, определенными типами движений, а также точными деталями объекта и фона. Модель понимает подсказки пользователя и то, как эти элементы существуют в физическом мире. Благодаря глубокому пониманию языка Sora AI может точно интерпретировать сигналы и создавать привлекательных персонажей, выражающих яркие эмоции. Он может создавать несколько кадров в одном видео, сохраняя единообразие персонажей и визуального стиля.

Новое видео Соры

Latest Sora Prompt: A giant, towering cloud in the shape of a man looms over the earth. The cloud man shoots lightning bolts down to the earth.

👾 Огромное, возвышающееся облако в форме человека нависло над Землей. Облачный человек стреляет молнией в землю.

Latest Sora Prompt: A Samoyed and a Golden Retriever dog are playfully romping through a futuristic neon city at night. The neon lights emitted from the nearby buildings glisten off of their fur.

👾 Самоедская собака и золотистый ретривер игриво играют ночью в футуристическом неоновом городе. Неоновые огни близлежащих зданий мерцали на их шерсти.

Latest Sora Prompt: A cat waking up its sleeping owner demanding breakfast. The owner tries to ignore the cat, but the cat tries new tactics, and finally, the owner pulls out a secret stash of treats from under the pillow to hold the cat off a little longer.

👾 Кот будит спящего хозяина и требует завтрака. Хозяин пытается игнорировать кошку, но кошка пробует новую тактику, и в конце концов хозяин вытаскивает из-под подушки тайник с лакомствами и позволяет кошке остаться еще немного.

Варианты использования Соры

🪐 Текст в видео:

Sora специализируется на преобразовании текстовых описаний в визуально привлекательные видеоролики, позволяющие пользователям легко превращать идеи в динамический визуальный контент.

🪐 Анимация изображения:

Эта модель может оживлять неподвижные изображения, анимируя их, придавая статическим изображениям движение и яркость.

🪐 Видео продолжается:

Сора может расширить существующие видеоролики, чтобы сцены и повествование плавно перетекали в единое целое, расширяя возможности повествования.

🪐 Монтаж видео:

Пользователи могут использовать Sora для выполнения задач по редактированию видео, таких как изменение фона или настроек видео, демонстрируя его универсальность в улучшении и изменении визуального контента.

🌠 Потенциал применения технологии Sora AI очень широк и выходит за рамки простой функции преобразования текста в видео. Его можно расширить, включив, помимо прочего, создание анимированных неподвижных изображений, непрерывное создание видеоклипов и расширенное редактирование видео. Это означает, что графические дизайнеры используют эту технологию для быстрого преобразования статических проектов в яркие анимации, или преподаватели, создающие индивидуальные анимации для учебного контента, чтобы улучшить учебный процесс учащихся, или даже студенты-архитекторы и биологи и специалисты по специальностям, которые используют Sora AI для создания концепций. демонстрационные видеоролики или визуализация сложных научных процессов могут принести большую пользу.

В то же время OpenAI четко осознает, что с популяризацией и развитием таких передовых технологий также будут возрастать соответствующие этические и социальные риски, такие как проблемы авторского права, распространение ложной информации и возможные изменения на рынке труда. Таким образом, OpenAI уделяет особое внимание сотрудничеству с внешними сторонами, активно ищет отзывы пользователей и мнения экспертов для обеспечения безопасного и разумного использования технологий, а также стремится сформулировать соответствующие руководящие принципы и стратегии для смягчения потенциальных негативных последствий и дать полную свободу влиянию ИИ на Положительный эффект на развитие человеческого общества.

Как работает Сора

Sora Технология опирается на OpenAI Перспективное развитие Техническая архитектура DALL-E 3,Присвоено звание «диффузионный преобразователь».,Его основная технология используетмодель скрытой метод диффузиииз шумоподавления. В этом механизме Сора AI Тщательно спроектированный преобразователь используется в качестве основного компонента для выполнения операции шумоподавления, а трехмерные «патчи» постепенно создаются в основных пространственных измерениях. Эти «патчи» затем сопоставляются с фактической последовательностью видеокадров с помощью специализированного видеодекодера, таким образом. Создавайте высококачественный непрерывный динамический видеоконтент.

Чтобы еще больше улучшить производительность модели и обогатить набор обучающих данных, Сора Также было введено новшествоизВидео в тексттехнология。该технология能够自动生成详尽且准确из Видео субтитры,Через глубокое понимание и интерпретацию существующих видеоресурсов.,Эффективно повышает способность системы к семантическому пониманию и эффект кросс-модального обучения.,делать Sora AI Он продемонстрировал отличную производительность во многих сценариях, таких как создание анимированных неподвижных изображений, непрерывное создание видео и даже постредактирование видео.

☄️ В архитектуру данной модели входят визуальный кодер, диффузионный преобразователь и визуальный декодер.

Визуальные кодеры сжимают видео в скрытое пространство, тем самым уменьшая размерность.
Диффузионный преобразователь генерирует последовательность визуальных клипов на основе подсказок пользователя, а визуальный декодер затем меняет кодировку для создания окончательного видео.

🌌 Sora принцип работы

🧪 модель скрытой диффузии：

SoraУсыновленныймодель скрытой диффузии（Latent Diffusion Model, LDM) в качестве основы эта модель начинается со случайного шума и восстанавливает целевой результат путем постепенного добавления информации. В Sora LDM используется для постепенного уточнения связных и содержательных видеокадров из неструктурированных зашумленных данных.

🧪 Трансформаторная архитектура：

SoraИнтегрированный Трансформаторная архитектура,Эта архитектура хороша для понимания и моделирования долгосрочных зависимостей между данными последовательностей. В сценариях создания видео,Трансформатор помогает модели анализировать и обрабатывать пространственно-временные отношения между последовательными видеокадрами.,Это гарантирует, что сгенерированное видео будет иметь плавные движения и единый визуальный стиль.

🧪 патч пространства-времени：

Сора использует инновационный подход при обработке видео - патч пространства-времени,Он не отображает текст напрямую в полном объеме видеокадров.,И да обрабатывает видео из локальных сегментов пространства и времени. Детали складываются вместе, как микроскопический видеопазл.,сформировать весь видеоряд.

🧪 интеграция знаний：

Сора объединяет графики знаний, которые содержат такую информацию, как правила физического мира, взаимодействие между объектами и различные художественные стили. Это позволяет Соре понимать сложную динамику и семантику сцены при создании видео, например, точно моделировать процесс цветения цветов на основе текстовых описаний или корректировать видеоконтент в зависимости от изменений освещения.

🧪 Создать процесс：

После того, как пользователь вводит фрагмент описательного текста, Сора сначала анализирует текст, чтобы понять содержание и контекст, содержащиеся в нем.
Затем в скрытом пространстве на основе текстового описания строится серия соответствующих потенциальных состояний.
Фактическая последовательность видеокадров генерируется шаг за шагом из этих скрытых состояний с использованием модели диффузии и сети Transformer.
Наконец, синтезированные видеокадры оптимизируются и обрабатываются для формирования связного и высококачественного видео.

🌌 Sora AI демонстрирует новые возможности, демонстрируя уровень понимания согласованности 3D, согласованности на больших расстояниях, постоянства объектов, интерактивности и моделирования всего цифрового мира. Мы с нетерпением ждем появления более инновационных моделей, таких как Sora AI.

Ограничения Соры

💻 Хотя модель Sora продемонстрировала потрясающие возможности в области генерации видео,Но есть еще некоторые вещи, которые нельзя игнорировать. первый,Моделирование сложных сценариев,Особенно, когда речь идет о тонких физических взаимодействиях и динамических изменениях.,Точность Сораиз нуждается в повышении. В качестве примера возьмем смоделированного человека, кусающего печенье.,Модель может неточно отражать изменения формы печенья после его надкусывания.,Например, отсутствие следов укусов и т. д.

Источники данных и вопросы авторского права

Стоит отметить, что OpenAI использовала большое количество наборов видеоданных при обучении модели Sora. Хотя эти наборы данных включают в себя разрешенные законом и общедоступные видеоресурсы, они также охватывают некоторый контент, защищенный авторскими правами. К сожалению, OpenAI не раскрывает общественности точный размер и источник данных, что вызывает опасения по поводу авторских прав и соблюдения требований.

Проблемы пространственного позиционирования и временной непрерывности

Кроме того, необходимо повысить точность пространственного позиционирования Sora при обработке определенных типов сигналов, особенно при распознавании направления слева направо. Столкнувшись с непрерывными событиями, которые развиваются с течением времени, модели иногда могут описывать неточные ситуации. Например, при представлении сложной динамической сцены, в которой волки размножаются и образуют большую группу, Сора может испытывать трудности с точным отслеживанием и воспроизведением деталей каждого временного узла.

Направления будущих улучшений

В ответ на вышеуказанные ограничения будущие исследователи могут внести следующие улучшения в модель Сора:

Улучшите способность модели моделировать сложные сцены и тонкие физические взаимодействия, что позволит ей более точно отображать динамику реального мира.
Улучшите возможности обработки пространственного позиционирования и временной непрерывности модели, чтобы лучше справляться с проблемами непрерывных событий и сложных сцен.
Укрепить соблюдение требований и прозрачность при сборе и использовании данных, чтобы обеспечить законность и безопасность данных обучения моделей.

Подводя итог, можно сказать, что, хотя модель Sora добилась замечательных результатов в области генерации видео, ее все еще необходимо оптимизировать и улучшать в некоторых аспектах для достижения более зрелых и широко распространенных приложений.

Lumiere Vs Sora AI

🧲 Техническая база：

Люмьер: Основанный на архитектуре диффузионного трансформатора, это гибридный метод, сочетающий в себе преимущества диффузионной модели и модели трансформатора.
Сора AI: Также на основе модели диффузии, в частности, с использованием технологии каскадной диффузии и потенциальной диффузии, а также технологии реконструкции в DALL-E 3.

🧲 генеративная способность：

Люмьер: Способен генерировать высококачественные видеоролики на основе текстовых описаний, включая множество сложных сцен и динамических элементов.
Sora AI: Помимо создания видео, он может расширять существующее видео, анимировать неподвижные изображения и поддерживать непрерывность объекта, когда он ненадолго скрывается из поля зрения.

🧲 понимание текста：

Люмьер: обеспечивает глубокое понимание значения и контекста входного текста благодаря архитектуре диффузного преобразователя.
Sora AI: он использует архитектуру преобразователя, аналогичную GPT, обладает превосходной способностью понимать текстовые инструкции и может точно преобразовывать намерения пользователя в видеоконтент.

🧲 визуальное качество：

Люмьер: Генерация видео с высоким визуальным уровнем. качество и реализм, способные точно отражать текстовое описание сцены.
Сора AI: Также известен высококачественными визуальными эффектами, особенно в области трехмерной согласованности, постоянства объектов и моделирования физического взаимодействия.

🧲 Гибкость и масштабируемость：

Люмьер: обладающий очень высокой изгибкостью и Масштабируемость может адаптироваться к различным сценариям и потребностям применения.
Sora ИИ: продемонстрировал превосходство в управлении данными и вычислительными ресурсами. Гибкость и Масштабируемость позволяет пользователю регулировать размер модели и количество маркеров по мере необходимости.

🧲 Безопасность и соответствие требованиям：

Люмьер: Перед публикацией проводятся строгие оценки безопасности и соответствия, чтобы гарантировать, что созданный видеоконтент соответствует социальной этике и правовым нормам.
Sora AI: Также ориентированная на безопасность и соответствие нормативным требованиям, она использует различные технические средства для обнаружения и предотвращения создания вводящего в заблуждение или неприемлемого контента.

Выбираете между Люмьером или Сорой? Опен АИ,Пользователи должны учитывать свои собственные потребности в качестве видео, продолжительности и гибкости постредактирования. Оба являются передовыми инструментами создания видео на основе искусственного интеллекта.,Все они показывают отличные результаты в практическом применении.,Однако иногда выходные результаты оказываются противоречивыми или возникает нереалистичная обратная связь. Благодаря итеративному обновлению технологий,Ожидается, что проблемы, существующие в этих двух моделях, будут постепенно преодолены.,И далее способствовать общему прогрессу индустрии создания видео с использованием искусственного интеллекта.

Особо стоит отметить, что модель Sora, разработанная OpenAI, демонстрирует более продвинутые возможности в построении сцены и визуальном макете, позволяя пользователям легко создавать легко адаптируемые и согласованные изображения в соответствии с требованиями различных размеров экрана устройства и исходных соотношений сторон. Высококачественная графика. содержание. Это означает, что использование Sora позволяет не только добиться разнообразия в создании видео, но и гарантировать оптимизацию эстетики и впечатлений от просмотра видеоконтента при его распределении на разных платформах.

🛰️ Также читайте：Google Люмьер: преобразование создания контента с помощью фотореалистичного синтеза видео.

Моральные ограничения Соры

Модель Сора вызывает серьезные опасения, что она может быть использована не по назначению для создания вредоносного контента, включая, помимо прочего, следующее:

🔭 Создание порнографического контента:

Sora AI способен создавать реалистичные высококачественные видеоролики на основе текстовых подсказок, что может сопровождаться риском создания откровенного или порнографического контента. Злоумышленники могут использовать эту модель для создания неприемлемого, эксплуататорского и вредного контента.

🔭 Распространяйте фейковые новости и дезинформацию:

Возможности Sora AI по преобразованию текста в видео можно использовать для создания убедительных фейковых новостей или дезинформации. Например, модель может создавать реалистичные видеоролики, на которых политические лидеры делают ложные заявления, распространяют дезинформацию и потенциально наносят ущерб общественному восприятию и доверию.

🔭 Создавайте контент, который ставит под угрозу меры общественного здравоохранения:

Способность Sora AI создавать видео на основе подсказок вызвала обеспокоенность по поводу создания вводящего в заблуждение контента, связанного с мерами общественного здравоохранения. Злоумышленники могут использовать эту модель для создания видеороликов, которые препятствуют вакцинации, пропагандируют ложное лечение или подрывают рекомендации общественного здравоохранения, тем самым ставя под угрозу общественную безопасность.

🔭 Возможность возникновения дисгармонии и социальных волнений:

Реализм видеороликов, созданных Sora OpenAI, можно использовать для создания контента, разжигающего раздор и социальные волнения. Например, модель может генерировать фальшивые видеоролики о насилии, дискриминации или беспорядках, что приводит к напряженности и возможным последствиям в реальном мире.

OpenAI ожидает, что Sora окажет значительное влияние на творчество, но также признает необходимость устранения угроз безопасности. Этические проблемы включают прозрачность данных обучения моделей, проблемы авторского права и концентрацию власти, поскольку OpenAI оказывает значительное влияние на инновации в области ИИ.

Хотя потенциал Sora огромен, монополия OpenAI на мощные модели искусственного интеллекта вызывает обеспокоенность по поводу прозрачности, подотчетности и этических соображений в более широкой области искусственного интеллекта. Однако OpenAI осознает возможность злоупотреблений и предпринимает шаги для решения проблем безопасности.

🛰️ Также читайте：2024 использовать в течение года 11 Видеогенератор искусственного интеллекта: Преобразование текста в видео.

Меры безопасности, принятые по модели Сора

OpenAI реализует несколько ключевых мер безопасности, прежде чем выпускать модели Sora в свои продукты. Ключевые моменты включают в себя

🧰 Фильтрация и цензура контента：

Модели Sora могут быть оснащены классификаторами текста и изображений для предварительного просмотра текстовых подсказок, предоставленных пользователем, перед созданием контента, чтобы избежать создания контента, который включает в себя крайнее насилие, разжигание ненависти, порнографию или нарушает конфиденциальность или авторские права других лиц.
Выполняйте анализ сгенерированных видеокадров в режиме реального времени, чтобы обнаружить и заблокировать видеовыход, который не соответствует политике использования и этическим стандартам.

🧰 Состязательная тренировка и стратегия：

Сотрудничайте с экспертами по безопасности и этике (Red Teaming), чтобы повысить устойчивость модели к вредоносному вводу посредством состязательного обучения, чтобы предотвратить ее использование для создания ложной информации или вводящего в заблуждение контента.
Разрабатывайте методы тестирования безопасности, специально направленные на устранение слабых мест модели, заранее выявляйте потенциальные сценарии злоупотреблений и целенаправленно улучшайте конструкцию модели.

🧰 Водяные знаки и отслеживаемость：

В создаваемые видео можно вставлять невидимые или видимые водяные знаки, чтобы отслеживать их происхождение по мере их распространения, что помогает бороться с такими проблемами, как дипфейки.

🧰 Разрешения пользователей и механизм аудита：

Внедрите строгую аутентификацию пользователей и управление разрешениями, ограничьте использование функций высокого риска и внедрите ручные или полуавтоматические процессы проверки созданного контента.

🧰 Соблюдение и соблюдение законов и правил：

Разработайте систему так, чтобы она соответствовала соответствующим правилам защиты данных и авторских прав в различных странах и регионах, чтобы гарантировать, что создаваемый контент не нарушает права интеллектуальной собственности и другие законные права и интересы других лиц.

🧰 Прозрачность и объяснимость：

Обеспечение прозрачности решений по модели, чтобы пользователи понимали, почему модель генерирует определенный контент, повышает доверие пользователей и облегчает обнаружение и исправление потенциальных неправомерных действий или неблагоприятных последствий.

🧰 Интегрированные метаданные C2PA:

OpenAI планирует включить метаданные C2PA в будущие развертывания моделей. Эти метаданные будут служить дополнительным слоем информации, показывающим, является ли модель Сора генератором видео.

🧰 Тесно сотрудничать с заинтересованными сторонами:

OpenAI будет тесно сотрудничать с политиками, педагогами и художниками по всему миру.,Поймите их проблемы и определите положительные варианты использования. Эта инициатива направлена на сбор различных точек зрения и отзывов.,Обеспечить основу для ответственного развертывания и использования моделей Sora.

в заключение

Короче говоря, Sora AI — это модель, основанная на диффузии, которая постепенно преобразует статический шум в видеоконтент. Он уникален своей способностью создавать полное видео за один раз, расширять существующее видео и сохранять непрерывность объекта после его ненадолго исчезновения. Sora использует архитектуру преобразователя, подобную GPT, для достижения превосходной производительности масштабирования.

При обработке видео и изображений Sora представляет их в виде патчей, что позволяет обучать диффузионные преобразователи на различных визуальных данных, включая различную длительность, разрешение и соотношение сторон. Вдохновленный исследованиями DALL-E и GPT, Сора также использует технологию реконструкции DALL-E 3 для повышения точности генерации пользовательских текстовых инструкций в видео.

Sora достаточно универсальна, чтобы создавать видеоролики на основе текстовых инструкций, анимировать неподвижные изображения и расширять существующие видеоролики, заполняя недостающие кадры. Эта модель представляет собой фундаментальный прогресс на пути к созданию общего искусственного интеллекта (AGI), поскольку она демонстрирует способность понимать и моделировать реальный мир.

🖥️Ссылка на ссылку:

Sora OpenAI ：https://openai.com/sora

OpenAI Модель генерации видео: https://openai.com/research/video-generation-models-as-world-simulators

Справочная статья:https://www.analyticsvidhya.com/blog/2024/02/new-gen-text-to-video-tool-sora-by-openai

Рекомендация

Категории

openai chatgpt sora Сборник эссе по горячим технологиям, выпуск 5 Сора texttovideo

Новые посты

Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).

[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).

Прочитайте нейросетевую модель Трансформера в одной статье

.ART Теплые зимние предложения уже открыты

Сравнительная таблица описания кодов ошибок Amap

Уведомление о последних правилах Points Mall в декабре 2022 года.

Даже новички могут быстро приступить к работе с легким сервером приложений.

Взгляд на RSAC 2024｜Защита конфиденциальности в эпоху больших моделей

Вы используете ИИ каждый день и до сих пор не знаете, как ИИ дает обратную связь? Одна статья для понимания реализации в коде Python общих функций потерь генеративных моделей + анализ принципов расчета.

Используйте (внутренний) почтовый ящик для образовательных учреждений, чтобы использовать Microsoft Family Bucket (1T дискового пространства на одном диске и версию Office 365 для образовательных учреждений)

Руководство по началу работы с оперативным проектом (7) Практическое сочетание оперативного письма — оперативного письма на основе интеллектуальной системы вопросов и ответов службы поддержки клиентов

[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста

Обзор Cloud-init и этапы создания в рамках PVE

Корпоративные пользователи используют пакет регистрационных ресурсов для регистрации ICP для веб-сайта и активации оплаты WeChat H5 (с кодом платежного узла версии API V3)

Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.

Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!

[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !

[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз

Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.

Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?

Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента

Sora: новое поколение инструмента преобразования текста в видео

введение

Что такое Сора

Новое видео Соры

Варианты использования Соры

Как работает Сора

Ограничения Соры

Lumiere Vs Sora AI

Моральные ограничения Соры

Меры безопасности, принятые по модели Сора

в заключение

Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).

[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).

Прочитайте нейросетевую модель Трансформера в одной статье

.ART Теплые зимние предложения уже открыты

Сравнительная таблица описания кодов ошибок Amap

Уведомление о последних правилах Points Mall в декабре 2022 года.

Даже новички могут быстро приступить к работе с легким сервером приложений.

Взгляд на RSAC 2024｜Защита конфиденциальности в эпоху больших моделей

[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста

Обзор Cloud-init и этапы создания в рамках PVE

Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.

Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!

[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !

[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз

Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.

Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?

Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента

Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.

Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)

[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши

Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)

Кодирование Base64 в MultipartFile

5 точек расширения SpringBoot, супер практично!

Глубокое понимание сопоставления индексов Elasticsearch.

15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.

Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.

Congratulation Lettie 🎉

Charles Franklin

New Message ✉️

Whoo! You have new order 🛒

Application has been approved 🚀

Monthly report is generated

Send connection request

New message from Jane

CPU is running high

Sora: новое поколение инструмента преобразования текста в видео

введение

Что такое Сора

Новое видео Соры

Варианты использования Соры

Как работает Сора

Ограничения Соры

Lumiere Vs Sora AI

Моральные ограничения Соры

Меры безопасности, принятые по модели Сора

в заключение

Углубленный анализ переполнения памяти CUDA: OutOfMemoryError: CUDA не хватает памяти. Попыталась выделить 3,21 Ги Б (GPU 0; всего 8,00 Ги Б).

[Решено] ошибка установки conda. Среда решения: не удалось выполнить первоначальное зависание. Повторная попытка с помощью файла (графическое руководство).

Прочитайте нейросетевую модель Трансформера в одной статье

.ART Теплые зимние предложения уже открыты

Сравнительная таблица описания кодов ошибок Amap

Уведомление о последних правилах Points Mall в декабре 2022 года.

Даже новички могут быстро приступить к работе с легким сервером приложений.

Взгляд на RSAC 2024｜Защита конфиденциальности в эпоху больших моделей

[docker] Версия сервера «Чтение 3» — создайте свою собственную программу чтения веб-текста

Обзор Cloud-init и этапы создания в рамках PVE

Подробное объяснение таких показателей производительности с высоким уровнем параллелизма, как QPS, TPS, RT и пропускная способность.

Удачи в конкурсе Python Essay Challenge, станьте первым, кто испытает новую функцию сообщества [Запускать блоки кода онлайн] и выиграйте множество изысканных подарков!

[Техническая посадка травы] Кровавая рвота и отделка позволяют вам необычным образом ощипывать гусиные перья! Не распространяйте информацию! ! !

[Официальное ограниченное по времени мероприятие] Сейчас ноябрь, напишите и получите приз

Прочтите это в одной статье: Учебник для няни по созданию сервера Huanshou Parlu на базе CVM-сервера.

Cloud Native | Что такое CRD (настраиваемые определения ресурсов) в K8s?

Как использовать Cloudflare CDN для настройки узла (CF самостоятельно выбирает IP) Гонконг, Китай/Азия узел/сводка и рекомендации внутреннего высокоскоростного IP-сегмента

Дополнительные правила вознаграждения амбассадоров акции в марте 2023 г.

Можно ли открыть частный сервер Phantom Beast Palu одним щелчком мыши? Супер простой урок для начинающих! (Прилагается метод обновления сервера)

[Играйте с Phantom Beast Palu] Обновите игровой сервер Phantom Beast Pallu одним щелчком мыши

Maotouhu делится: последний доступный внутри страны адрес склада исходного образа Docker 2024 года (обновлено 1 декабря)

Кодирование Base64 в MultipartFile

5 точек расширения SpringBoot, супер практично!

Глубокое понимание сопоставления индексов Elasticsearch.

15 рекомендуемых платформ разработки с нулевым кодом корпоративного уровня. Всегда найдется та, которая вам понравится.

Аннотация EasyExcel позволяет экспортировать с сохранением двух десятичных знаков.