Language

Arabic
العربية

Chinese
中文

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Country/Area

Antigua and Barbuda
Antigua and Barbuda

Bosnia and Herzegovina
Bosna i Hercegovina

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

Equatorial Guinea
Guinea Ecuatorial

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Solomon Islands
Solomon Islands

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

Vatican City
Città del Vaticano

Language
Country/Area

Arabic
العربية

Chinese
中文

中国简体
Simplified Chinese

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Antigua and Barbuda
Antigua and Barbuda

The Bahamas
The Bahamas

Bosnia and Herzegovina
Bosna i Hercegovina

Burkina Faso
Burkina Faso

Cape Verde
Cape Verde

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Costa Rica
Costa Rica

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

El Salvador
El Salvador

Equatorial Guinea
Guinea Ecuatorial

The Gambia
The Gambia

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Lucia
Saint Lucia

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

San Marino
San Marino

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Sierra Leone
Sierra Leone

Solomon Islands
Solomon Islands

South Africa
South Africa

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

United States
United States

Vatican City
Città del Vaticano

السحر المنتشر بشكل مطرد للتعلم العميق: لماذا يعمل على الأجهزة المنزلية؟

مع الارتفاع السريع للذكاء الاصطناعي التوليدي، لا شك أن Stable Diffusion هو منتج نجمي يلفت الانتباه. منذ إطلاقه في عام 2022، لم يذهل نموذج تحويل النص إلى صورة القائم على تقنية الانتشار المستخدمين بقدراته التفصيلية في إنشاء الصور فحسب، بل كسر أيضًا نهج الخدمة المستندة إلى السحابة، مما يسمح للمستهلكين العاديين باستخدام الأجهزة المنزلية. على. كيف يتم تحقيق هذا الابتكار التكنولوجي؟

الخلفية الفنية

تم تطوير الانتشار المستقر من قبل باحثين من مجموعة CompVis في جامعة لودفيج ماكسيميليانز في ميونيخ وRunway.

الانتشار المستقر عبارة عن شبكة عصبية اصطناعية توليدية عميقة تسمى نموذج الانتشار الكامن. تتطلب عملية تطويرها الكثير من موارد الحوسبة، لكن الكود المفتوح وأوزان النموذج تجعل من السهل على المزيد والمزيد من الأشخاص الوصول إلى هذه التكنولوجيا. وبالمقارنة بنماذج النص إلى الصورة الملكية مثل DALL-E و Midjourney التي كانت متاحة في السابق فقط من خلال الخدمات السحابية، فإن وصول الانتشار المستقر يسمح للمستخدمين الذين لديهم وحدات معالجة رسومية عادية بالاستمتاع بأحدث تقنيات الذكاء الاصطناعي.

الهندسة المعمارية والأداء

تتكون بنية Stable Diffusion من ثلاثة مكونات رئيسية: مشفر ذاتي متغير (VAE)، وشبكة U، ومشفر نص اختياري. من خلال إطار عمل U-Net القوي، يصبح النموذج قادرًا على استعادة صور واضحة من التمثيلات المشفرة التي تحتوي على ضوضاء غاوسية، وهي العملية المعروفة بإزالة الضوضاء. بالنسبة للعديد من المستخدمين، فإن U-Net والمشفر الثقيلين بالمعلمات مكثفان للغاية للعمل بهما، ولكن الخفة النسبية لـ Stable Diffusion تجعله خيارًا مناسبًا للاستخدام الشخصي.

يحقق الانتشار المستقر 8.6 مليون تحسين للمعلمات على أنماط الصور المولدة ويمكن تشغيله على وحدات معالجة الرسوميات المخصصة للمستهلك.

مصدر البيانات وعملية التدريب

تأتي بيانات التدريب الخاصة بالانتشار المستقر من مجموعة البيانات LAION-5B، التي تحتوي على 500 مليون زوج من الصور والأوصاف الموضحة، وتم فحصها لضمان جودة البيانات وتنوعها. قام المطورون باستخدام هذه البيانات بشكل انتقائي أثناء عملية التدريب وأجروا جولات عديدة من تدريب التعلم العميق لتحسين قدرات إنشاء النموذج.

ميزات سهلة الاستخدام

لا يستطيع الانتشار المستقر إنشاء الصور فحسب، بل يدعم أيضًا تعديل الصورة، بما في ذلك الاستكمال والتوسيع. يمكن للمستخدمين توجيه عملية إنشاء الصورة من خلال مطالبات نصية، مما يجعل من السهل نسبيًا على المستخدمين تحقيق أفكارهم الخاصة.

توفر العديد من الواجهات الصديقة للبرامج مفتوحة المصدر مثل DreamStudio وAUTOMATIC1111 وظائف غنية، مما يسمح للمستخدمين بغض النظر عن خلفيتهم التقنية باستخدام هذه التقنية بسهولة.

تحديات قابلية التعديل والتحيز

على الرغم من أن الانتشار المستقر يُظهر أداءً ممتازًا في جميع الجوانب، إلا أنه لا يزال هناك بعض التحديات في تشغيله. على سبيل المثال، نظرًا لأن النموذج يتم تدريبه بشكل أساسي على البيانات الموضحة باللغة الإنجليزية، فإن الصور الناتجة غالبًا ما تحتوي على تحيزات ثقافية غربية ولا تمثل الثقافات الأخرى.

يعترف المبدعون بأن النموذج قد يكون لديه تحيز خوارزمي، وهو أحد التحديات التي يجب التغلب عليها في المستقبل.

خاتمة باختصار، يوفر ظهور الانتشار المستقر منظورًا جديدًا لتكنولوجيا التعلم العميق. فهو لا يعمل على نشر التكنولوجيا المتطورة فحسب، بل يحفز أيضًا تصادم الإبداع. باعتبارها تقنية تعلّم عميق يمكن تشغيلها على أجهزة المستهلك العادية، ربما سيكون هناك المزيد من الابتكارات والتطبيقات في المستقبل. كيف ستؤثر هذه التكنولوجيا على الطريقة التي نبتكر بها، وما هي الإمكانيات الجديدة التي ستفتحها؟

Trending Knowledge

قصة أصل الانتشار المستقر: كيف ظهر هذا النموذج الثوري؟

مع التطور السريع لتكنولوجيا الذكاء الاصطناعي، تم إطلاق Stable Diffusion، وهو نموذج التعلم العميق لتحويل النص إلى صورة، رسميًا في عام 2022 وجذب بسرعة اهتمامًا واسع النطاق في المجتمع. لا يستطيع هذا النم

السر التكنولوجي وراء الانتشار المطرد: كيف يحول الكلمات إلى صور مذهلة؟

منذ عام 2022، برز Stable Diffusion بسرعة كنموذج للتعلم العميق لتحويل النص إلى صورة يعتمد على تقنية النشر. أصبحت تقنية الذكاء الاصطناعي التوليدي التي أطلقتها شركة Stability AI منتجًا نجميًا في طفرة الذ

Multimedia

السحر المنتشر بشكل مطرد للتعلم العميق: لماذا يعمل على الأجهزة المنزلية؟

الخلفية الفنية

الهندسة المعمارية والأداء

مصدر البيانات وعملية التدريب

ميزات سهلة الاستخدام

تحديات قابلية التعديل والتحيز

Trending Knowledge

Responses

Language

Country/Area

No result found

Multimedia

السحر المنتشر بشكل مطرد للتعلم العميق: لماذا يعمل على الأجهزة المنزلية؟

الخلفية الفنية

الهندسة المعمارية والأداء

مصدر البيانات وعملية التدريب

ميزات سهلة الاستخدام

تحديات قابلية التعديل والتحيز

Trending Knowledge

Responses

Responses