Language

Arabic
العربية

Chinese
中文

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Country/Area

Antigua and Barbuda
Antigua and Barbuda

Bosnia and Herzegovina
Bosna i Hercegovina

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

Equatorial Guinea
Guinea Ecuatorial

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Solomon Islands
Solomon Islands

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

Vatican City
Città del Vaticano

Language
Country/Area

Arabic
العربية

Chinese
中文

中国简体
Simplified Chinese

香港繁體
Traditional Chinese

臺灣正體
Traditional Chinese

English
English

French
Français

German
Deutsch

Italian
Italiano

Indonesian
Bahasa Indonesia

Japanese
日本語

Korean
한국어

Portuguese
Português

Russian
Русский

Spanish
español

Vietnamese
Tiếng Việt

Antigua and Barbuda
Antigua and Barbuda

The Bahamas
The Bahamas

Bosnia and Herzegovina
Bosna i Hercegovina

Burkina Faso
Burkina Faso

Cape Verde
Cape Verde

Central African Republic
République Centrafricaine

Congo, Democratic Republic of the
République Démocratique du Congo

Congo, Republic of the
République du Congo

Costa Rica
Costa Rica

Côte d'Ivoire
Côte d'Ivoire

Czech Republic
Česká republika

Dominican Republic
República Dominicana

El Salvador
El Salvador

Equatorial Guinea
Guinea Ecuatorial

The Gambia
The Gambia

Marshall Islands
Aolepān Aorōkin M̧ajeļ

North Macedonia
Северна Македонија

Papua New Guinea
Papua Niugini

Saint Kitts and Nevis
Saint Kitts and Nevis

Saint Lucia
Saint Lucia

Saint Vincent and the Grenadines
Saint Vincent and the Grenadines

San Marino
San Marino

Sao Tome and Principe
São Tomé e Príncipe

Saudi Arabia
المملكة العربية السعودية

Sierra Leone
Sierra Leone

Solomon Islands
Solomon Islands

South Africa
South Africa

Sri Lanka
ශ්‍රී ලංකාව

South Sudan
جنوب السودان

Trinidad and Tobago
Trinidad and Tobago

United Arab Emirates
الإمارات العربية المتحدة

United Kingdom
United Kingdom

United States
United States

Vatican City
Città del Vaticano

IBM的成功故事：统计机器翻译如何在1980年代重新引起关注？

统计机器翻译（SMT）是一种依赖于统计模型生成翻译的机器翻译方法，这些模型的参数源自双语文本语料的分析。自从1949年Warren Weaver首次提出这些想法以来，统计机器翻译的基本概念一直不断演变。到了1980年代末期，IBM的托马斯·J·华生研究中心的研究人员再次将这一技术带入聚光灯下，并促进了其进一步发展。这一阶段的重新兴起，是因为他们结合了信息论的概念以及计算机技术的进步，让SMT适应了更宽广的语言范畴。

统计机器翻译能够利用大量的双语和单语数据，提升翻译的流畅性与准确性。

SMT的优势在于，用于翻译的模型不是基于明确的语言规则，而是通过对大量语料进行统计分析来自动学习语言之间的转换。因此，这一方法相较于传统的基于规则的翻译系统，其人力和数据资源的利用更为高效。此外，由于SMT系统通常不针对特定语言对进行优化，这使得它在应用上具有更大的灵活性及可扩展性。

统计机器翻译的流畅度往往来自于其背后运行的语言模型。

然而，统计机器翻译也并非完美无瑕。创建语料库的成本高昂，特定错误难以预测和修正，并且翻译结果有时表面上流畅，却隐藏了潜在的翻译问题。特别是在语言结构差异较大的语言对之间，SMT的效果可能不如预期，这一点在西方欧洲语言以外的其他语言对中尤其明显。

最早的词基翻译模型使翻译的基本单位为自然语言中的单个词。随着词语结构的复杂性，翻译后的句子长度往往不一致，这使得单词对应的“生育率”成为了灵活处理的难点。这种基于单词的翻译方法无法有效处理语言之间的高生育率情况，因为其无法将两个英语单词映射到一个法语单词，即便在一些情况下可能从字面上看起来合理。

phrase-based translation试图克服词基翻译的局限性，通过翻译整个词序列来进行更为灵活的转换。

依赖于短语的翻译方法引入了另一种创新架构，透过统计方法自语料中提取的「短语」来进行翻译，这种方法更加灵活，能有效减少对单词和语序的限制。如此一来，短语可以透过翻译表直接映射，且在翻译过程中可能进行重新排序，从而提升翻译结果的质量。

1980年代至1990年代，IBM的研究不断发展，将句法结构纳入考量，融合上下文的方式来进行翻译。这一时期的统计机器翻译模型逐渐建立起多层次的语言理解，标志着翻译技术的一次质变。

语言模型是统计机器翻译系统中一个不可或缺的组成部分，它帮助提升翻译的流畅性。

随着时间的推进，许多知名的翻译系统，如Google翻译和Microsoft翻译，开始改进其底层技术，向深度学习的神经机器翻译转型，这标志着统计机器翻译的逐渐过时。然而，SMT的历史意义依然存在，因为它为后续技术的进步奠定了基础，实现了翻译领域的跨越式发展。

现在，当我们回顾这段技术的历史进程时，不禁要思考，随着人工智能的快速发展，未来的机器翻译技术会如何进一步演变？

Trending Knowledge

1949年翻译的奥秘：Warren Weaver 如何将信息理论应用于机器翻译？

在翻译技术的发展历史中，1949年无疑是个关键的转捩点。那一年，Warren Weaver正式提出了将Claude Shannon的信息理论应用于机器翻译的想法，并由此奠定了统计机器翻译（Statistical Machine Translation, SMT）的理论基础。在此之前，翻译主要依赖于繁琐的规则基础方法，这通常需要详细的语言规则定义与大量的专业知识，这样的方式不仅低效，且难以泛化到其他

统计机器翻译的革命：为何它能取代旧有的规则基础方法？

在机器翻译的领域，统计方法的引入可谓是一场革命。自1949年Warren Weaver首次提出的概念以来，这种方法逐渐取代了以规则为基础的翻译系统。传统的规则基础翻译方法依赖于对语言规则的精细规划，这种方法不仅耗时且难以扩展至不同语言。相较之下，统计机器翻译（SMT）能够有效利用大量的语料库进行翻译，其背后的核心思想来自资讯理论。 <blockquote>

Multimedia

IBM的成功故事：统计机器翻译如何在1980年代重新引起关注？

Trending Knowledge

Responses

Language

Country/Area

No result found

Multimedia

IBM的成功故事：统计机器翻译如何在1980年代重新引起关注？

Trending Knowledge

Responses

Responses