Przełom w rozrywce cyfrowej? OpenAI stworzy film na podstawie wskazówek słownych

Lider w dziedzinie sztucznej inteligencji, OpenAI, wprowadził nowy model sztucznej inteligencji o nazwie Sora, który, jak twierdzi, może tworzyć „realistyczne” i „pomysłowe” 60-sekundowe filmy z szybkich podpowiedzi tekstowych.

W tym tygodniu na blogu firma poinformowała, że Sora jest w stanie generować filmy o długości do 60 sekund z instrukcji tekstowych, z możliwością serwowania scen z wieloma postaciami, określonymi rodzajami ruchu i szczegółowymi szczegółami tła.

„Model rozumie nie tylko to, o co użytkownik poprosił w poleceniu, ale także to, w jaki sposób te rzeczy istnieją w świecie fizycznym”

 – napisano w poście.

OpenAI poinformowało, że zamierza wytrenować modele sztucznej inteligencji tak, aby mogły „pomagać ludziom rozwiązywać problemy, które wymagają interakcji w świecie rzeczywistym”.

Jak zaznaczają eksperci, choć „modele multimodalne” nie są niczym nowym, a systemy przenoszące text-to-video już istnieją, to, co je obecnie wyróżnia, to długość i dokładność, którą według OpenAI ma Sora.

Uważa się, że tego typu modele sztucznej inteligencji mogą mieć duży wpływ na rynki rozrywki cyfrowej, ponieważ nowe spersonalizowane treści będą przesyłane strumieniowo między kanałami.

Jednocześnie OpenAI zastrzegło jednak, że Sora jest nadal w toku doskonalenia z wyraźnymi „słabościami”, szczególnie jeśli chodzi o przestrzenne szczegóły podpowiedzi – mieszanie lewego i prawego – oraz przyczynę i skutek.
 

Źródło

Skomentuj artykuł: