在现代决策理论中,反向推理(Backward Induction)被视为一种重要的分析工具,透过从问题或情境的终点回推,来确定最佳选择的序列。这种过程不仅在数学优化领域得到应用,还广泛存在于博弈论、经济学以及其他决策模型之中。反向推理的神秘力量,究竟如何解开最佳决策的秘密呢?
反向推理的基本过程是从一系列决策的最终点开始,分析为达到该点所需的最佳行动,再逐步往回推进,直到每个可能的点都被分析。这一方法在1875年由亚瑟·凯利(Arthur Cayley)首次提出,他用这一思想解决了秘书问题。在动态规划中,反向推理被用来求解贝尔曼方程式。此外,在自动化计画、调度以及自动定理证明的相关领域,这一方法也被称为反向搜寻或反向链接。
反向推理可帮助决策者在多个选择中找到最佳路径,从而有效地解决复杂问题。
举例来说,假如一个人正在评估未来十年的工作机会,每年他可能会面对两种工作选择:一份「好」工作的年薪为100美元,另一份「坏」工作则为44美元。假设这两种工作出现的机率相等。通过反向推理,可以从第十年开始分析:
在第十年,选择「好」工作将获得100美元,而「坏」工作则只有44美元。这意味着如果他仍然失业,在最后一年应该接受任何工作。往回推到第九年,若他获得「好」工作的收益为200美元,而「坏」工作总收益仅为88美元,这显示出他应该接受「好」工作……
这说明了一个重要原则:长期工作时,选择的谨慎程度必须提高。
在博弈论中,反向推理则是一种解决方案方法,通过序列理性来识别每个信息集的最佳行动。为了找到一个子博弈完美均衡,必须将游戏以扩展形式表示,并将其划分为子博弈。解决过程从最远的子博弈开始,然后反向推进至初始节点。在此过程中,选择期望报酬最高的行动,并逐步标记下来,最终形成子博弈完美均衡。
以一个两名玩家计划去看电影的多阶段游戏为例,玩家1想看《终结者》,而玩家2偏爱《小丑》。玩家1会首先购票并告诉玩家2选择。接下来,玩家2根据玩家1的选择做出反应……
整个过程中,透过反向推理的分析,游戏的最优路径日益清晰。
尽管反向推理是一个有力的工具,但它仅适用于有限类型的游戏。特别是在完全信息的博弈中,反向推理定义明确,但当涉及不完全信息或存在多个玩家时,该方法的有效性可能会受到影响。
因此,我们不禁要问:在日益复杂的现实世界中,反向推理是否能真正帮助我们做出明智的决策并预测他人的行为?