Language

Arabic
العربية

Chinese
中文

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Country/Area

Antigua and Barbuda
Antigua and Barbuda

Bosnia and Herzegovina
Bosna i Hercegovina

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

Equatorial Guinea
Guinea Ecuatorial

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Solomon Islands
Solomon Islands

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

Vatican City
Città del Vaticano

Language
Country/Area

Arabic
العربية

Chinese
中文

中国简体
Simplified Chinese

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Antigua and Barbuda
Antigua and Barbuda

The Bahamas
The Bahamas

Bosnia and Herzegovina
Bosna i Hercegovina

Burkina Faso
Burkina Faso

Cape Verde
Cape Verde

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Costa Rica
Costa Rica

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

El Salvador
El Salvador

Equatorial Guinea
Guinea Ecuatorial

The Gambia
The Gambia

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Lucia
Saint Lucia

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

San Marino
San Marino

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Sierra Leone
Sierra Leone

Solomon Islands
Solomon Islands

South Africa
South Africa

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

United States
United States

Vatican City
Città del Vaticano

إمكانات البيانات غير المسماة: لماذا هي مهمة جدًا للتعلم الآلي؟

مع ظهور نماذج اللغات الكبيرة، زادت أهمية البيانات غير المسماة في التعلم الآلي بشكل كبير. ويسمى هذا النموذج بالتعلم الخاضع للإشراف الضعيف، أو التعلم شبه الخاضع للإشراف. جوهرها هو الجمع بين كمية صغيرة من البيانات التي يحمل علامة بشرية وكمية كبيرة من البيانات غير المسماة للتدريب. وهذا يعني أنه يتم تصنيف جزء فقط من قيم مخرجات البيانات، في حين أن البيانات المتبقية تكون غير مصنفة أو مصنفة بشكل غير دقيق. يوفر هذا الأسلوب حلاً فعالاً لتحقيق الاستفادة الكاملة من البيانات الغنية غير المسماة عندما يكون وضع العلامات مكلفًا ويستغرق وقتًا طويلاً.

في مجال التعلم الآلي الحديث، غالبًا ما تكون تكلفة الحصول على البيانات المشروحة مرتفعة للغاية، مما يجعل من غير العملي الحصول على مجموعات بيانات مشروحة كاملة واسعة النطاق.

عندما يتعلق الأمر بوضع العلامات على البيانات، يفكر العديد من الأكاديميين والمهندسين على الفور في التكلفة العالية التي تنطوي عليها عملية وضع العلامات. وقد تتطلب هذه العملية موظفين متخصصين، مثل نسخ المقاطع الصوتية أو إجراء تجارب فيزيائية للتعرف على ظواهر معينة. لذلك، فإن التعلم شبه الخاضع للإشراف ليس مثيرًا للاهتمام من الناحية النظرية فحسب، بل يوفر أيضًا حلولاً ممكنة لمختلف المشكلات. تصبح هذه أداة قوية للربط بين البيانات المصنفة وغير المسماة.

تفترض تقنية التعلم شبه الخاضع للإشراف وجود علاقة معينة، مما يسمح لها باستخدام كميات كبيرة من البيانات غير المسماة لتحسين أداء التصنيف بشكل ملحوظ.

تفترض تقنية التعلم شبه الخاضع للإشراف القدرة على استخلاص معلومات ذات معنى من التوزيع الأساسي للبيانات. تتضمن هذه التقنيات افتراضات الاستمرارية، وافتراضات التجميع، والافتراضات المتعددة. تساعد هذه الافتراضات على تعلم البنية من البيانات غير المسماة، على سبيل المثال، عندما تكون نقاط البيانات قريبة من بعضها البعض، فمن المرجح أن تحمل نفس التسمية. بالإضافة إلى ذلك، غالبًا ما تشكل البيانات مجموعات منفصلة، لذلك قد تتشارك النقاط الموجودة داخل نفس المجموعة في التسميات. وفي ظل هذا الافتراض، يمكن للتعلم شبه الخاضع للإشراف أن يتعلم الخصائص الجوهرية للبيانات بشكل أكثر كفاءة.

تنص فرضية المتشعبات على أن البيانات غالبًا ما تكون موجودة في متشعبات منخفضة الأبعاد، وهذا الرأي يسمح لعملية التعلم بتجنب لعنة الأبعاد.

يمكن إرجاع تاريخ التعلم شبه الخاضع للإشراف إلى أسلوب التدريب الذاتي في الستينيات. لاحقًا، في السبعينيات، قدم فلاديمير فابنيك رسميًا إطار التعلم التوصيلي وبدأ في استكشاف التعلم المستحث باستخدام النماذج التوليدية. بدأت هذه الأساليب تصبح نقطة ساخنة في البحث النظري وتعزز تطوير التعلم الآلي.

في التطبيقات العملية، تتشابك الأساليب المختلفة لتشكل نظامًا بيئيًا معقدًا نسبيًا. يقوم النموذج التوليدي أولاً بتقدير توزيع البيانات ضمن فئات مختلفة، مما يمكّن النموذج من التعلم بفعالية حتى في حالة عدم وجود بيانات مشروحة كافية. وبالمثل، تحقق طرق الفصل منخفضة الكثافة غرض فصل البيانات المصنفة عن البيانات غير المسماة عن طريق رسم الحدود في المناطق التي تكون فيها نقاط البيانات متناثرة.

في هذه السلسلة من التقنيات، يستخدم التنظيم اللابلاسي تمثيل الرسم البياني لإجراء تعلم البيانات. تربط هذه الرسوم البيانية كل عينة مصنفة وغير مصنفة من خلال التشابه، وتؤكد على الاتصال الداخلي للبيانات من خلال بنية الرسم البياني، وتستخدم أيضًا البيانات غير المسماة لدفع عملية التعلم. <بلوككوت>

من الناحية النظرية، يعد التعلم شبه الخاضع للإشراف نموذجًا يحاكي عملية التعلم لدى الإنسان، مما يجعله جذابًا وعمليًا.

لتلخيص ذلك، فإن ظهور التعلم ضعيف الإشراف يهدف على وجه التحديد إلى حل التحدي المتمثل في ندرة البيانات المصنفة ويوضح الإمكانات الهائلة للبيانات غير المصنفة. مع النمو السريع للبيانات والتطور المستمر لتكنولوجيا التعلم الآلي، قد نحتاج إلى إعادة التفكير: كيف يمكننا الاستفادة بشكل أفضل من إمكانات البيانات غير المسماة في الأبحاث المستقبلية؟

Trending Knowledge

nan

في عملية استكشاف الفضاء ، كان كيفية استخدام الوقود بشكل أكثر فعالية ، وخفض التكاليف ، والوصول إلى وجهتك بشكل أسرع دائمًا موضوعًا يفكر فيه العلماء والمهندسون.في عام 1987 ، أعطى مفهوم "حدود الاستقرار ا

سر التعلم الخاضع للإشراف الضعيف: كيف نغير مستقبل الذكاء الاصطناعي بكمية صغيرة من البيانات المصنفة؟

<ص> مع ظهور نماذج اللغة الكبيرة، حظي مفهوم الإشراف الضعيف باهتمام متزايد. في التعلم الخاضع للإشراف التقليدي، يتطلب النموذج كمية كبيرة من البيانات المصنفة بواسطة الإنسان للتدريب، مما يزيد م

التعلم شبه الخاضع للإشراف: كيف نحول البيانات الثمينة إلى كنوز ذكية؟

<ص> مع ظهور نماذج اللغة الكبيرة، ازدادت أهمية وضرورة التعلم شبه الخاضع للإشراف. يقوم نموذج التعلم هذا بدمج كمية صغيرة من البيانات المصنفة مع كمية كبيرة من البيانات غير المصنفة، مما يؤدي إل

Multimedia

إمكانات البيانات غير المسماة: لماذا هي مهمة جدًا للتعلم الآلي؟

Trending Knowledge

Responses

Language

Country/Area

No result found

Multimedia

إمكانات البيانات غير المسماة: لماذا هي مهمة جدًا للتعلم الآلي؟

Trending Knowledge

Responses

Responses