Language

Arabic
العربية

Chinese
中文

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Country/Area

Antigua and Barbuda
Antigua and Barbuda

Bosnia and Herzegovina
Bosna i Hercegovina

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

Equatorial Guinea
Guinea Ecuatorial

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Solomon Islands
Solomon Islands

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

Vatican City
Città del Vaticano

Language
Country/Area

Arabic
العربية

Chinese
中文

中国简体
Simplified Chinese

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Antigua and Barbuda
Antigua and Barbuda

The Bahamas
The Bahamas

Bosnia and Herzegovina
Bosna i Hercegovina

Burkina Faso
Burkina Faso

Cape Verde
Cape Verde

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Costa Rica
Costa Rica

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

El Salvador
El Salvador

Equatorial Guinea
Guinea Ecuatorial

The Gambia
The Gambia

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Lucia
Saint Lucia

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

San Marino
San Marino

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Sierra Leone
Sierra Leone

Solomon Islands
Solomon Islands

South Africa
South Africa

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

United States
United States

Vatican City
Città del Vaticano

从初代到高代：早期模型崩溃如何悄悄影响少数据？

随着机器学习技术的迅猛发展，许多研究者开始注意到一个新出现的现象：模型崩溃。这个现象描述了机器学习模型在使用未经整理的合成数据进行训练时，逐渐流失信息和性能的过程。根据Shumailov等人所提出的定义，模型崩溃分为早期模型崩溃和晚期模型崩溃两个阶段。

在早期模型崩溃中，模型开始丧失关于数据分布尾部的信息，这主要影响了少数数据的准确度。

当我们使用合成数据来训练模型时，潜在的问题便会浮出水面，这包括功能近似错误、抽样错误和学习错误。即便是在最简单的模型上，这些问题也有可能发生，尤其是在复杂模型中，错误更加容易累积，从而使模型崩溃加速。这使得早期崩溃难以察觉，因为整体性能可能看似有所提升，而对于少数数据的性能却是下降的。

晚期模型崩溃则会导致模型性能的重大损失，错误混淆概念，并失去大部分变异性。

模型崩溃的根本原因

模型崩溃的根本原因可以概括为三方面，一是功能近似错误，二是抽样错误，三是学习错误。这些问题的累积会导致模型的整体表现下降。尤其是在资料的互联网共享中，AI生成的数据会进入未来的训练数据集中，造成恶性循环。

许多研究者对此现象表示担忧，认为模型崩溃将会对未来的生成式AI发展形成根本性的威胁。然而，最近有一些研究员对此提出了不同的观点。他们认为，只要合成数据与人类生成的数据一起累积，则模型崩溃是可以避免的。他们的研究指出，数据随时间累积的模式更符合现实，而不只是每年删除所有数据。

现实世界的影响可能不像人们想像的那么悲观。

替代解法的探索

除了以上讨论，另一派文献则研究了机器学习检测器和水印技术的使用，以识别模型生成的数据并过滤掉这类数据。这些方法为处理模型崩溃提供了新的思路。

数学模型的初步探索

在2024年，研究者首次尝试使用简单的1D高斯模型来展示崩溃现象。该模型采用基于原始数据的不偏估计器计算均值和方差。尽管这种简单模型的结果不能充分反映出现实中的复杂性，但它为进一步的研究提供了基础。

随着模型的演进，即便是第一代后，完整的分布已不再呈现常态，反而会转变为方差-伽玛分布。

这一探索虽然看似理论性，但其意义在于提供了一种工具，以帮助理解和评估不同世代之间的变化。透过这些模型，研究者能够计算出在每一代中预期的均值和方差，从而更佳地掌握模型崩溃的动态过程。

在面对机器学习模型逐渐芬芳的现实中，我们应该进一步思考：未来的生成式AI是否能够成功应对模型崩溃的挑战，还是会在不知不觉中陷入更深的困境呢？

Trending Knowledge

为什么人工智慧生成的数据可能成为未来的隐患？

随着人工智慧技术的快速发展，利用AI生成数据已日益普及。然而，这种使用合成数据训练AI模型的做法，却可能隐藏着潜在的风险和问题。随着数据的质量和可靠性受到质疑，模型的性能也可能因此下降，并造成未来在使用这些数据时的各种挑战。 <blockquote> 合成数据的使用在某些情况下会引发模型崩溃（model collapse），这是一个渐进的过程，导致模型性能的下降，特别是在处理少数据的情

nan

埃及金字塔不仅是古代建筑的奇迹，更是人类历史上一个重要的文化符号。在金字塔的建设过程中，矿产的利用成为了一个至关重要的因素。这篇文章将探讨古埃及人如何运用各种矿产来建立这些宏伟的结构，以及这一过程对于埃及社会的影响。埃及的金字塔建造于公元前26世纪，正值古埃及的古王国时期。为了实现这一壮观的建筑，埃及人需要大量的石材、金属及其他自然资源。根据考古学家的研究，金字塔的建设涉及到了广泛的矿产

模型崩溃的秘密：为什么人工智慧可能陷入性能衰退的漩涡？

在人工智慧的迅速发展中，一个新的概念──模型崩溃（model collapse）逐渐引起专家们的关注。这个现象是指，机器学习模型由于在其他模型的输出上进行了未经筛选的训练，因而逐渐退化。这种输出通常被称为合成数据，而模型崩溃的过程可以分为两个主要阶段：早期模型崩溃和晚期模型崩溃。 <blockquote> 早期模型崩溃表现为模型逐渐失去对数据分布末尾的资讯，这对少数数据

Multimedia

从初代到高代：早期模型崩溃如何悄悄影响少数据？

模型崩溃的根本原因

替代解法的探索

数学模型的初步探索

Trending Knowledge

Responses

Language

Country/Area

No result found

Multimedia

从初代到高代：早期模型崩溃如何悄悄影响少数据？

模型崩溃的根本原因

替代解法的探索

数学模型的初步探索

Trending Knowledge

Responses

Responses