Depois de aperfeiçoar uma ferramenta de inteligência artificial por texto, o ChatGPT, a OpenAI sobe mais um degrau na sua busca por primazia na área de tecnologia. No fim da semana passada, a empresa de Sam Altman anunciou o lançamento do Sora, um gerador de vídeos por meio de comandos escritos. Os primeiros exemplos apresentados pela empresa de San Francisco não resistem a um exame mais cuidadoso, mas impressionam pela riqueza de detalhes. Embora não seja um recurso inédito no mercado, a grita foi instantânea, especialmente na indústria de entretenimento americana, que usa muitos programas de efeitos especiais. E os analistas correram para dizer que a sua introdução marca um salto significativo tanto para a pioneira companhia como para o futuro dessa classe de programas.
O que é?
Na definição da OpenAI, Sora é um gerador de texto para vídeo – criando vídeos de até 60 segundos de duração com base em instruções escritas usando IA generativa. O modelo também pode gerar vídeo a partir de uma imagem estática existente.
A IA generativa é um ramo da IA que pode criar algo novo. Os exemplos incluem chatbots, como ChatGPT da OpenAI, e geradores de imagens como DALL-E e Midjourney. Conseguir um sistema de IA para gerar vídeos é mais novo e desafiador, mas depende de parte da mesma tecnologia.
Posso usar?
Sora ainda não está disponível para o grande público (a OpenAI diz que está interagindo com legisladores e artistas antes de lançar oficialmente a ferramenta) e há muita coisa que ainda não se sabe. Mas desde o anúncio, a empresa compartilhou alguns exemplos de vídeos gerados por Sora para mostrar o que o programa pode fazer.
É perfeito?
Embora os vídeos gerados pelo Sora possam representar cenas complexas e incrivelmente detalhadas, a OpenAI observa que ainda existem alguns pontos fracos – incluindo alguns elementos espaciais e de causa e efeito. Por exemplo, a OpenAI acrescenta em seu site: “uma pessoa pode dar uma mordida em um biscoito, mas depois o cookie pode não ter marca de mordida”.
Existem outras ferramentas parecidas?
Sora não é o primeiro desse tipo. Google, Meta e a startup Runway ML estão entre as empresas que demonstraram tecnologia semelhante. Ainda assim, os analistas do setor enfatizam a aparente qualidade e a duração impressionante dos vídeos Sora compartilhados até agora.
Quais são os riscos?
As empresas de tecnologia ainda estão no comando quando se trata de controlar a IA e seus riscos, enquanto os governos de todo o mundo trabalham para se atualizar. Em dezembro, a União Europeia chegou a um acordo sobre as primeiras regras abrangentes de IA do mundo, mas a lei só entrará em vigor dois anos após a aprovação final.
A OpenAI disse que estava tomando medidas de segurança importantes antes de disponibilizar amplamente o Sora. “Estamos trabalhando com red teamers – especialistas em áreas como desinformação, conteúdo de ódio e preconceito – que testarão o modelo de forma adversa”, escreveu a empresa. “Também estamos construindo ferramentas para ajudar a detectar conteúdo enganoso, como um classificador de detecção que pode dizer quando um vídeo foi gerado por Sora.”
Como foi criada?
A OpenAI revelou informações limitadas sobre como o Sora foi construído. O relatório técnico da OpenAI não revelou quais fontes de imagens e vídeos foram usadas para treinar Sora.
O lançamento do Sora também chega em meio a processos judiciais contra a OpenAI e sua parceira de negócios Microsoft por alguns autores e pelo New York Times sobre o uso de obras escritas protegidas por direitos autorais para treinar o ChatGPT.