OpenAI запустила Sora 2
OpenAI представила нову версію генератора відео й аудіо Sora 2. Компанія обіцяє реалістичнішу фізику руху об’єктів, кращий контроль над сценами та синхронізований звук. Паралельно запускається соціальний застосунок Sora для iOS із функцією «камео».
У своєму пресрелізі OpenAI пояснює, що Sora 2 точніше дотримується причинно-наслідкових зв’язків: м’яч після промаху відскакує від щита, серфборд реагує на хвилі, а трюки більше схожі на роботу реальних м’язів і матеріалів. Також з’явився помітно кращий «послух» до складних інструкцій на кілька кадрів і сцен.
Модель краще утримує «стан світу» між планами: можна задавати послідовність дій, змінювати ракурси, але зберігати об’єкти та їхні властивості. Для творців це означає менш менше викривлень об’єктів й «телепортацій» предметів при складних запитах.
Sora 2 генерує голос, шумове тло й ефекти, які стикуються з картинкою — від мови персонажів до кроків, що збігаються з рухом у кадрі. Це зменшує потребу в подальшій ручній озвучці.
У застосунку Sora для iOS можна записати короткий відео- й аудіоеталон та додавати себе чи друзів у будь-які сцени. Додаток дозволяє реміксувати роботи інших, формує персональний фід і, за твердженням OpenAI, орієнтований на створення, а не «залипання» в перегляді.
Компанія наголошує на інструментах керування стрічкою, обмеження для підлітків, модерацію випадків булінгу, контроль використання вашої подоби (можна відкликати дозвіл і видалити відео з вашим камео). Sora має системи запобігання створенню шкідливого контенту та маркування походження матеріалів.
Додаток Sora стартує в США та Канаді за інвайтами, доступ розширюватимуть поступово. На початку Sora 2 буде безплатною з «щедрими лімітами», але з урахуванням обмежень обчислювальних ресурсів. Підписники ChatGPT Pro зможуть спробувати експериментальну версію Sora 2 Pro на sora.com (пізніше і в застосунку). Також планують випуск Sora 2 через API. Попередня Sora 1 Turbo лишається доступною.