مع الارتفاع السريع للذكاء الاصطناعي التوليدي، لا شك أن Stable Diffusion هو منتج نجمي يلفت الانتباه. منذ إطلاقه في عام 2022، لم يذهل نموذج تحويل النص إلى صورة القائم على تقنية الانتشار المستخدمين بقدراته التفصيلية في إنشاء الصور فحسب، بل كسر أيضًا نهج الخدمة المستندة إلى السحابة، مما يسمح للمستهلكين العاديين باستخدام الأجهزة المنزلية. على. كيف يتم تحقيق هذا الابتكار التكنولوجي؟
الانتشار المستقر عبارة عن شبكة عصبية اصطناعية توليدية عميقة تسمى نموذج الانتشار الكامن. تتطلب عملية تطويرها الكثير من موارد الحوسبة، لكن الكود المفتوح وأوزان النموذج تجعل من السهل على المزيد والمزيد من الأشخاص الوصول إلى هذه التكنولوجيا. وبالمقارنة بنماذج النص إلى الصورة الملكية مثل DALL-E و Midjourney التي كانت متاحة في السابق فقط من خلال الخدمات السحابية، فإن وصول الانتشار المستقر يسمح للمستخدمين الذين لديهم وحدات معالجة رسومية عادية بالاستمتاع بأحدث تقنيات الذكاء الاصطناعي.تم تطوير الانتشار المستقر من قبل باحثين من مجموعة CompVis في جامعة لودفيج ماكسيميليانز في ميونيخ وRunway.
يحقق الانتشار المستقر 8.6 مليون تحسين للمعلمات على أنماط الصور المولدة ويمكن تشغيله على وحدات معالجة الرسوميات المخصصة للمستهلك.
توفر العديد من الواجهات الصديقة للبرامج مفتوحة المصدر مثل DreamStudio وAUTOMATIC1111 وظائف غنية، مما يسمح للمستخدمين بغض النظر عن خلفيتهم التقنية باستخدام هذه التقنية بسهولة.
خاتمة باختصار، يوفر ظهور الانتشار المستقر منظورًا جديدًا لتكنولوجيا التعلم العميق. فهو لا يعمل على نشر التكنولوجيا المتطورة فحسب، بل يحفز أيضًا تصادم الإبداع. باعتبارها تقنية تعلّم عميق يمكن تشغيلها على أجهزة المستهلك العادية، ربما سيكون هناك المزيد من الابتكارات والتطبيقات في المستقبل. كيف ستؤثر هذه التكنولوجيا على الطريقة التي نبتكر بها، وما هي الإمكانيات الجديدة التي ستفتحها؟يعترف المبدعون بأن النموذج قد يكون لديه تحيز خوارزمي، وهو أحد التحديات التي يجب التغلب عليها في المستقبل.