Agora todo mundo pode usar o Dall-E para gerar imagens a partir de texto


Liberou geral. A OpenAI não exige mais que os interessados em brincar com o Dall-E 2 se cadastrem em uma lista de espera para isso. O anúncio, feito nesta semana, significa que você só precisa fazer login na página da inteligência artificial para ela criar imagens com base no que você digitar.

Como funciona a inteligência artificial5 exemplos de inteligência artificial no dia a dia

Imagem de astronauta em um cavalo gerada pelo Dall-E (imagem: reprodução/OpenAI)

O Dall-E 2 é uma ferramenta baseada em aprendizagem de máquina que gera imagens a partir das palavras que o usuário informa em um campo. Há outras com a mesma proposta, como o Midjourney e a Stable Diffusion (que pode até ser usado para comprimir imagens, olha só). Todos são de uso tão fácil que se tornaram um passatempo na web.

Pudera. Muitas imagens geradas a partir das instruções de texto são tão impressionantes que chegam a ser consideradas obras de artes. Outras são tão bizarras que acabam virando uma diversão.

A lista de espera do Dall-E

Responsável pelo projeto, a OpenAI apresentou a primeira versão do Dall-E no começo de 2021. Os resultados eram tão impressionantes que agradaram tanto especialistas em inteligência artificial quanto o público leigo.

Mas o crescente interesse pela ferramenta poderia trazer problemas para a OpenAI. Dependendo da combinação de palavras, o Dall-E poderia gerar imagens com contexto negativo, que serviriam para desinformação, preconceito e constrangimento de pessoas, por exemplo.

Essa é a principal razão para a OpenAI ter criado uma lista de espera para o Dall-E. Enquanto mantinha o acesso ao serviço controlado, a organização tratava de implementar filtros para evitar que o sistema criasse imagens problemáticas.

Os tais filtros evitam — ou tentam evitar — que o Dall-E gere imagens com teor sexual, violento ou racista, por exemplo.

Há críticas para a forma como a OpenAI lidou com o problema. Ao The Verge, a organização confirmou que, além de ativar filtros, pode acrescentar palavras invisíveis às instruções dos usuários para evitar resultados potencialmente danosos.

Por exemplo, o Dall-E pode inserir “mulher asiática” em um conjunto de palavras que envolve pessoas, mas não especifica gênero ou etnia. É uma forma de evitar que somente brancos ou homens apareçam nos resultados. No entanto, essa abordagem tem sido criticada por, muitas vezes, deixar as imagens longe do resultado esperado.

Seja como for, a OpenAI considera que os seus mecanismos de segurança já são competentes o suficiente para o Dall-E 2 ser liberado para todo mundo. A organização também testa uma API para permitir que a tecnologia seja usada em aplicativos ou plugins de terceiros.

Imagens geradas com as palavras bottle, keyboard, book e printer (imagem: Emerson Alecrim/Tecnoblog)

Brinque com o Dall-E 2

Se você quiser testar a versão mais recente da tecnologia, precisa apenas criar uma conta na OpenAI e fazer login no site do Dall-E 2. Ao acessar o serviço, você recebe 50 créditos. Depois disso, mais 15 créditos são fornecidos todos os meses.

Cada crédito permite gerar uma imagem, editar uma imagem já gerada (inpainting) ou estender uma imagem já criada (outpainting). Se os créditos gratuitos não forem suficientes, é possível comprar mais.

Dentro do serviço, é só digitar palavras no campo principal do site e esperar pelo resultado. Para gerar as imagens logo acima, digitei alguns objetos que estavam em minha mesa: bottle (garrafa), keyboard (teclado), book (livro) e printer (impressora).

Mó brisa, né?

Agora todo mundo pode usar o Dall-E para gerar imagens a partir de texto


Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *