A Stable Diffusion, conhecida por seus modelos de IA de código aberto para geração de imagens, acaba de lançar o Stable Diffusion 3 Medium. Este modelo está disponível para download e pode ser executado localmente em placas gráficas. Diferente de outras ferramentas como Midjourney ou DALL-E, que funcionam via APIs online, o Stable Diffusion 3 pode ser utilizado diretamente no seu hardware, oferecendo vantagens significativas em termos de velocidade e resolução de saída, especialmente com GPUs mais poderosas.
Detalhes do Modelo Stable Diffusion 3 Medium
O Stable Diffusion 3 Medium é um dos modelos mais avançados e esperados da Stability AI para geração de imagens a partir de texto. Com 2 bilhões de parâmetros, ele se posiciona entre os modelos menores de 800 milhões e os maiores de 8 bilhões que estão planejados. Esta versão média oferece um equilíbrio entre complexidade e performance, sendo adequada para uma ampla gama de aplicações.
Principais Características
- Melhoria na Qualidade das Imagens: O novo modelo apresenta uma qualidade superior, especialmente em fotorealismo, permitindo a geração de imagens mais detalhadas e realistas.
- Compreensão Avançada de Prompts: Ele é capaz de interpretar comandos mais complexos, compreendendo melhor a composição de elementos, relações espaciais, ações e estilos.
- Tipografia Aprimorada: Uma das inovações mais notáveis é a melhoria na geração de texto dentro das imagens. O modelo agora pode criar textos em vários estilos e com menos erros, tornando mais difícil distinguir se uma imagem foi gerada por IA ou criada manualmente.
Otimizações para NVIDIA e AMD
A Stability AI colaborou com a NVIDIA e a AMD para otimizar o desempenho do modelo em GPUs dessas marcas.
- NVIDIA: As otimizações incluem o uso do TensorRT, que pode aumentar o desempenho em até 50% em todas as GPUs GeForce RTX. No entanto, é necessário um modelo especial do TensorRT, que ainda não foi publicado.
- AMD: Para as GPUs da AMD, incluindo APUs e a GPU de data center Instinct MI300X, foram implementadas otimizações que não exigem modelos especiais para serem baixados.
Como Baixar e Usar
Para aqueles interessados em utilizar o novo modelo Stable Diffusion 3 Medium, há um guia disponível no Reddit, escrito pela equipe da Stability AI. Este guia fornece instruções detalhadas sobre como realizar o download e configurar o modelo para uso não comercial.