Language

Arabic
العربية

Chinese
中文

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Country/Area

Antigua and Barbuda
Antigua and Barbuda

Bosnia and Herzegovina
Bosna i Hercegovina

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

Equatorial Guinea
Guinea Ecuatorial

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Solomon Islands
Solomon Islands

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

Vatican City
Città del Vaticano

Language
Country/Area

Arabic
العربية

Chinese
中文

中国简体
Simplified Chinese

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Antigua and Barbuda
Antigua and Barbuda

The Bahamas
The Bahamas

Bosnia and Herzegovina
Bosna i Hercegovina

Burkina Faso
Burkina Faso

Cape Verde
Cape Verde

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Costa Rica
Costa Rica

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

El Salvador
El Salvador

Equatorial Guinea
Guinea Ecuatorial

The Gambia
The Gambia

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Lucia
Saint Lucia

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

San Marino
San Marino

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Sierra Leone
Sierra Leone

Solomon Islands
Solomon Islands

South Africa
South Africa

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

United States
United States

Vatican City
Città del Vaticano

La historia del origen de la difusión estable: ¿Cómo surgió este modelo revolucionario?

Con el rápido desarrollo de la tecnología de inteligencia artificial, Stable Diffusion, un modelo de texto a imagen de aprendizaje profundo, se lanzó oficialmente en 2022 y rápidamente atrajo la atención generalizada de la comunidad. Este modelo revolucionario no sólo puede generar imágenes detalladas basadas en descripciones de texto, sino que también puede aplicarse a una variedad de otras tareas, como por ejemplo, pintar para dentro y para fuera.

Detrás de la difusión estable se encuentra el resultado de una colaboración conjunta entre el equipo CompVis de la Universidad Ludwig Maximilian de Múnich, Alemania, e investigadores de Runway. El modelo se desarrolló con el apoyo de Stability AI y utiliza una gran cantidad de datos de entrenamiento de organizaciones sin fines de lucro, lo que hace que esta innovación funcione en la mayoría del hardware de consumo, a diferencia de los modelos profesionales anteriores a los que solo se podía acceder a través de servicios en la nube. modelos de imagen como DALL-E y Midjourney en marcado contraste.

La aparición de la difusión estable marca una nueva revolución en la inteligencia artificial y puede conducir a formas de creación más innovadoras y convenientes en el futuro.

Proceso de desarrollo

La difusión estable se originó a partir de un proyecto llamado Difusión Latente, desarrollado por investigadores de la Ludwig-Maximilians-Universität Munich y la Universidad de Heidelberg. Los cuatro autores originales del proyecto se unieron posteriormente a Stability AI y lanzaron versiones posteriores de Stable Diffusion. El equipo de CompVis ha publicado una licencia técnica para el modelo.

Los miembros principales del equipo de desarrollo incluyen a Patrick Esser de Runway y Robin Rombach de CompVis, quienes inventaron el marco del modelo de difusión latente utilizado por la difusión estable en los primeros días. El proyecto también cuenta con el apoyo de EleutherAI y LAION, una organización alemana sin fines de lucro responsable de organizar datos de entrenamiento de difusión estable.

Arquitectura técnica

El modelo de difusión estable utiliza una arquitectura llamada Modelo de Difusión Latente (LDM), que se propuso en 2015 para entrenar el modelo eliminando gradualmente el ruido gaussiano. Este proceso implica comprimir la imagen desde el espacio de píxeles a un espacio latente más pequeño, capturando así el significado semántico más básico de la imagen.

Stable Diffusion consta de tres partes: Autocodificador Variacional (VAE), U-Net y un codificador de texto opcional.

El codificador VAE comprime la imagen en un espacio latente, mientras que U-Net elimina el ruido de la representación latente de salida. Finalmente, el decodificador VAE convierte la representación nuevamente al espacio de píxeles. El paso de eliminación de ruido en este proceso se puede ajustar de forma flexible en función del texto, las imágenes u otras modalidades.

Datos y programas de entrenamiento

StableDiffusion está entrenado en el conjunto de datos LAION-5B, un conjunto de datos público de 5 mil millones de pares de imágenes y textos filtrados por idioma. La última versión de entrenamiento, SD 3.0, marca una revisión completa de la arquitectura central, con una estructura de análisis mejorada y mayor precisión y detalle de generación.

Uso y disputas

El modelo de difusión estable permite a los usuarios generar imágenes completamente nuevas y modificar imágenes existentes basándose en indicaciones textuales. Sin embargo, el uso de esta tecnología también ha provocado cierta controversia en términos de propiedad intelectual y ética, especialmente porque los datos de entrenamiento iniciales del modelo contienen una gran cantidad de información privada y sensible. Además, dado que el modelo se entrena principalmente con datos en inglés, las imágenes generadas pueden estar sesgadas en diferentes contextos culturales.

¿Podrá la difusión estable equilibrar la aplicación tecnológica y el impacto social será una cuestión por resolver y constituye una prueba importante para el desarrollo futuro?

Trending Knowledge

La magia cada vez más extendida del aprendizaje profundo: ¿por qué funciona en el hardware doméstico?

Con el rápido aumento de la inteligencia artificial generativa, Stable Diffusion es sin duda un producto estrella llamativo. Desde su lanzamiento en 2022, este modelo de texto a imagen de aprendizaje

El secreto tecnológico detrás de la proliferación constante: ¿Cómo convierte las palabras en imágenes impresionantes?

Desde 2022, Stable Diffusion ha surgido rápidamente como un modelo de aprendizaje profundo de texto a imagen basado en tecnología de difusión. Esta tecnología de inteligencia artificial generativa lan

Multimedia

La historia del origen de la difusión estable: ¿Cómo surgió este modelo revolucionario?

Proceso de desarrollo

Arquitectura técnica

Datos y programas de entrenamiento

Uso y disputas

Trending Knowledge

Responses

Language

Country/Area

No result found

Multimedia

La historia del origen de la difusión estable: ¿Cómo surgió este modelo revolucionario?

Proceso de desarrollo

Arquitectura técnica

Datos y programas de entrenamiento

Uso y disputas

Trending Knowledge

Responses

Responses