Language

Arabic
العربية

Chinese
中文

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Country/Area

Antigua and Barbuda
Antigua and Barbuda

Bosnia and Herzegovina
Bosna i Hercegovina

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

Equatorial Guinea
Guinea Ecuatorial

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Solomon Islands
Solomon Islands

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

Vatican City
Città del Vaticano

Language
Country/Area

Arabic
العربية

Chinese
中文

中国简体
Simplified Chinese

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Antigua and Barbuda
Antigua and Barbuda

The Bahamas
The Bahamas

Bosnia and Herzegovina
Bosna i Hercegovina

Burkina Faso
Burkina Faso

Cape Verde
Cape Verde

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Costa Rica
Costa Rica

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

El Salvador
El Salvador

Equatorial Guinea
Guinea Ecuatorial

The Gambia
The Gambia

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Lucia
Saint Lucia

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

San Marino
San Marino

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Sierra Leone
Sierra Leone

Solomon Islands
Solomon Islands

South Africa
South Africa

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

United States
United States

Vatican City
Città del Vaticano

A história da origem da difusão estável: como surgiu esse modelo revolucionário?

Com o rápido desenvolvimento da tecnologia de inteligência artificial, o Stable Diffusion, um modelo de aprendizado profundo de texto para imagem, foi lançado oficialmente em 2022 e rapidamente atraiu ampla atenção na comunidade. Este modelo revolucionário não só pode gerar imagens detalhadas com base em descrições de texto, mas também pode ser aplicado a uma variedade de outras tarefas, como pintura interna e externa.

Por trás da difusão estável está o resultado de uma colaboração conjunta entre a equipe CompVis da Universidade Ludwig Maximilian em Munique, Alemanha, e pesquisadores da Runway. O modelo foi desenvolvido com o suporte da Stability AI e usa uma grande quantidade de dados de treinamento de organizações sem fins lucrativos, fazendo com que essa inovação funcione na maioria dos hardwares de consumo, diferentemente dos modelos profissionais anteriores que eram acessíveis apenas por meio de serviços em nuvem. Existem text-to- modelos de imagem como DALL-E e Midjourney em forte contraste.

O surgimento da difusão estável marca uma nova revolução na inteligência artificial e pode levar a formas mais inovadoras e convenientes de criação no futuro.

Processo de desenvolvimento

A difusão estável originou-se de um projeto chamado Difusão Latente, desenvolvido por pesquisadores da Ludwig-Maximilians-Universität Munich e da Universidade de Heidelberg. Os quatro autores originais do projeto posteriormente se juntaram à Stability AI e lançaram versões subsequentes do Stable Diffusion. A equipe CompVis lançou uma licença técnica para o modelo.

Os principais membros da equipe de desenvolvimento incluem Patrick Esser da Runway e Robin Rombach da CompVis, que inventaram a estrutura do modelo de difusão latente usada pela difusão estável nos primeiros dias. O projeto também é apoiado pela EleutherAI e pela LAION, uma organização sem fins lucrativos alemã responsável por organizar dados estáveis de treinamento de difusão.

Arquitetura Técnica

O modelo de difusão estável usa uma arquitetura chamada Modelo de Difusão Latente (LDM), que foi proposta em 2015 para treinar o modelo removendo gradualmente o ruído gaussiano. Esse processo envolve a compressão da imagem do espaço de pixels para um espaço latente menor, capturando assim o significado semântico mais básico da imagem.

A difusão estável consiste em três partes: Autocodificador Variacional (VAE), U-Net e um codificador de texto opcional.

O codificador VAE comprime a imagem em um espaço latente, enquanto o U-Net reduz o ruído da representação latente de saída. Por fim, o decodificador VAE converte a representação de volta para o espaço de pixels. A etapa de redução de ruído neste processo pode ser ajustada de forma flexível com base em texto, imagens ou outras modalidades.

Dados e programas de treinamento

O StableDiffusion é treinado no conjunto de dados LAION-5B, um conjunto de dados público de 5 bilhões de pares de imagem e texto filtrados por idioma. A versão mais recente do treinamento, SD 3.0, marca uma revisão completa da arquitetura principal, com uma estrutura de análise aprimorada e detalhes e precisão de geração aprimorados.

Uso e disputas

O modelo de difusão estável permite que os usuários gerem imagens completamente novas e modifiquem imagens existentes com base em instruções textuais. No entanto, o uso dessa tecnologia também causou alguma controvérsia em termos de propriedade intelectual e ética, especialmente porque os dados de treinamento inicial do modelo contêm uma grande quantidade de informações privadas e confidenciais. Além disso, como o modelo é treinado principalmente usando dados em inglês, as imagens geradas podem ser tendenciosas em diferentes origens culturais.

Será que a difusão estável pode equilibrar a aplicação tecnológica e o impacto social será uma questão a ser resolvida, e este é um teste importante para o desenvolvimento futuro?

Trending Knowledge

A magia cada vez mais disseminada do aprendizado profundo: por que ele funciona em hardware doméstico?

Com o rápido crescimento da inteligência artificial generativa, o Stable Diffusion é, sem dúvida, um produto estrela que atrai a atenção. Desde o seu lançamento em 2022, este modelo de conversão de te

O segredo tecnológico por trás da proliferação constante: como ela transforma palavras em imagens impressionantes?

Desde 2022, a Difusão Estável emergiu rapidamente como um modelo de aprendizagem profunda de texto para imagem baseado na tecnologia de difusão. Esta tecnologia generativa de inteligência artificial l

Multimedia

A história da origem da difusão estável: como surgiu esse modelo revolucionário?

Processo de desenvolvimento

Arquitetura Técnica

Dados e programas de treinamento

Uso e disputas

Trending Knowledge

Responses

Language

Country/Area

No result found

Multimedia

A história da origem da difusão estável: como surgiu esse modelo revolucionário?

Processo de desenvolvimento

Arquitetura Técnica

Dados e programas de treinamento

Uso e disputas

Trending Knowledge

Responses

Responses