統計学において、最大尤度推定法 (MLE) は、観測データから仮説確率分布のパラメータを推定する方法です。この方法は、尤度関数を最大化して、想定される統計モデルの下で観測データの尤度が最大化されるようにします。尤度関数が最大値に達するパラメータ空間内の点が最大尤度推定値です。このロジックは直感的であるだけでなく柔軟性もあるため、統計的推論の主流の手段となっています。
最尤推定により、データは沈黙したままではなくなり、パラメータ調整によってデータ内の隠れた情報が目覚めます。
最大尤度推定の基本原理は、一連の観測値を、ある未知の結合確率分布からのランダムサンプルとみなすことです。目標は、データを観測する最高の結合確率を与えるパラメータ値を決定することです。
共同割り当てを制御するパラメータをベクトルθ = [θ1, θ2, ..., θkとして表します。 ] はパラメータファミリ {f(⋅; θ) | θ ∈ Θ} 内に収まるようにする。ここで、Θ はパラメータ空間であり、ユークリッド空間の有限次元サブセットである。
観測データ上の結合密度y = (y1, y2, ..., yn)を評価すると、サンプル のとき、尤度関数Ln(θ) = Ln(θ; y)と呼ばれる実数値関数を得ることができます。独立かつ同一に分布するランダム変数の場合、尤度関数は単変量密度関数の積になります。
最大尤度推定の目的は、パラメータ空間内の尤度関数を最小化するパラメータ値を見つけることです。
このプロセスは直感的に理解できます。最尤推定の鍵は、観測されたデータが発生する可能性が最も高くなるパラメータ値を選択することです。計算上、一般的なアプローチは、対数尤度と呼ばれる尤度関数の自然対数を使用することです。
尤度関数と呼ばれるものを計算することで、可能な最大値を見つけることができます。一部のモデルでは、これらの方程式を明示的に解くことができますが、一般的には閉じた形式の解は存在しないため、最大尤度推定値を見つけるには数値最適化に頼る必要があります。
データ分析において、MLE は単なる数式ではなく、データに語らせる技術です。
数値最適化に加えて、有限サンプルの場合、複数の解が存在する可能性があることにも注意することが重要です。特定した解が実際に(局所的)最大値であるかどうかは、ヘッセ行列と呼ばれる 2 次導関数の行列によって決まります。
通常、最大尤度推定はベイズ推論にも対応します。一様事前分布の下では、MLE は最大事後推定 (MAP) を近似できます。これは、統計的推論を実行し、モデルを構築するときに特に重要です。
最大尤度推定法の優れた点は、データ自体の特性を明らかにするだけでなく、意思決定のための有意義な基盤を提供できることです。したがって、経済学、医学、その他の科学研究のいずれにおいても、MLE は不可欠な位置を占めています。
最後に、データの力はそれを理解するプロセスにあるということを振り返る必要があります。データの背後にあるストーリーを説明するために、データを最大限に活用したでしょうか?