近似ベイジアン計算 (ABC) は、ベイズ統計に根ざした、モデル パラメーターの事後分布を推定するための計算手法です。すべてのモデルベースの統計推論において、尤度関数は中心的な役割を果たします。尤度関数は、特定の統計モデルの下でデータを観察する確率を表し、それによってデータが特定のパラメーター値をサポートする度合いを定量化するためです。単純なモデルの場合、通常、尤度関数の解析式を導出することが可能です。しかし、より複雑なモデルの場合、分析式を取得するのが難しくなったり、尤度関数の計算に法外なコストがかかる場合があります。 ABC 法は尤度関数の評価をバイパスするため、考慮できる統計的推論モデルの範囲が広がります。
ABC メソッドには強固な数学的基礎がありますが、必然的にいくつかの仮定と近似が行われるため、これらの仮定の影響を慎重に評価する必要があります。
それだけでなく、ABC の適用範囲が広くなったことで、パラメータの推定とモデルの選択の課題も増加しました。近年、ABC は生物科学の分野、特に集団遺伝学、生態学、疫学、システム生物学などの問題の分析において徐々に注目を集めています。
ABC の初期のアイデアは 1980 年代に遡ります。 1984 年、ベイジアン ステートメントの解釈について議論した際、ドナルド ルービンは事後分布からサンプルを取得するための仮説的なサンプリング メカニズムについて説明しました。このスキームは、パラメータの事後分布を推論するときに何が行われるかを実証するための概念的な思考実験です。
時間の経過とともに、ABC メソッドは進化しました。 Peter Diggle と Richard Grattan は 1984 年に、特に解析形式が実行不可能な場合に、尤度関数を近似するためにシステム シミュレーション スキームを使用することを提案しました。彼らのスキームは、パラメータ空間でグリッドを定義し、各グリッド点でいくつかのシミュレーションを実行して尤度を近似することに依存しています。
ABC は推論のベイジアン版とみなされ、ABC 事後分布からサンプリングするためにモンテカルロベースの多数の手法が導入されました。
したがって、ABC 法はパラメータ推定の方法を変えるだけでなく、生物学、環境、システム科学の分野に新たな地平を切り開きます。
ABC 法の一般的な形式は、ベイズの定理と密接に関連しています。ベイズの定理は、特定のパラメーター値の条件付き確率とデータが与えられた確率の間の関係を明示的に結び付けます。多くのアプリケーションでは、尤度関数の評価に計算コストがかかることが多く、これが ABC メソッドの動機となっています。
ABC 拒否アルゴリズムは、すべての ABC ベースのメソッドの中核です。この基本的な形式は、事前分布に基づいてパラメータ ポイントのセットをランダムにサンプリングすることから始まります。選択したパラメーター値について、指定された統計モデルに従ってデータ セットをシミュレートします。生成されたデータセットが観測データと大きく異なる場合、パラメーター値は破棄されます。
データの次元が増加するにつれて、要件を満たすデータセットが生成される確率は減少し、基本的な ABC メソッドの計算効率が大幅に低下します。一般的な方法は、概要統計を使用して高次元データ セットを置き換えることです。
モデル パラメーターの要約統計量の適切性が満たされている場合、このアプローチではエラーが発生しません。定義上の適切性とは、データ内のパラメーターに関するすべての情報が要約統計量によって取得されることを意味するためです。
これにより、複雑なモデルを推論する場合、ABC が効率的かつ効果的な選択肢になります。
たとえば、双安定システムは、測定ノイズの影響を受ける隠れマルコフ モデル (HMM) によって記述できます。このようなモデルは、さまざまな生物学的システムで広く使用されています。ショウジョウバエの Sonic Hedgehog 転写因子 (Shh) の動作を例にとると、HMM を通じてモデル化できます。モデルは 2 つの状態 A と B から構成され、遷移確率はパラメーター θ として定義されます。パラメータの事後推論のためのこのモデルに基づいて、ABC メソッドはその実用性を示します。
最後に、これらの手法の有効性を分析することで、近似ベイジアン コンピューティングが統計的推論の進化する分野における将来の研究や実用化にどのような影響を与えるのか、そしてこれらの変化にどのように適応すべきなのかを思い出させます。