Olhar vazio, seis dedos, sombras posições não relacionadas a fontes de luz: novamente ontem, as características mais óbvias das imagens geradas pela inteligência artificial (IA) saltaram nos olhos – e dificilmente eram lisonjeiros. Hoje, essas aberrações estão se tornando mais raras. No entanto, a maioria das imagens criadas por IA mantém características, como tiques visuais, que não escapam dos observadores mais informados. Elementos estilísticos recorrentes que, combinados, podem dar aos olhos uma impressão de irrealidade. E que são explicados pela maneira como essas inteligências artificiais são treinadas.

A intuição mais comum, se tivéssemos que transcrever em palavras, é a impressão de contemplar o trabalho de um designer talentoso tentando imitar uma fotografia. O motivo está documentado, pelo menos em difusão estável, um dos AIS visuais mais eficientes: seus neurônios artificiais foram treinados em imagens de imagens que combinam fotos e desenhos. “Em particular na base de Laion, que tem 5 bilhões de imagens. Há tudo e qualquer coisa”confirma Bruno Galerne, pesquisador visual da IA da Universidade de Orleans.
Quando você questiona a difusão estável com uma instrução muito simples, como “uma criança sopra suas velas de aniversário”, a IA criará uma imagem ao desenhar indistintamente suas inspirações em fotos, desenhos e pinturas. “É muito provável que os modelos concorrentes também sejam treinados em imagens de natureza mista, mas não temos certeza absoluta. Os editores não fornecem essas informações, porque o assunto é muito sensível ao nível de direitos autorais”Assim, Sublinha o Sr. Galerne. De acordo com as descobertas de MondeMidjourney, Imagen (Google) ou Dall-E (Openai) geradores de imagens tendem a produzir fotos no estilo misto a vários graus.
Você tem 67,68% deste artigo para ler. O restante é reservado para assinantes.



