ラグランジュの未定乗数法とは何か?:束縛条件下の最適化問題を幾何学的に理解する
目次
前提知識
この記事をスムーズに理解するために、以下の知識があることが望ましいです。
- 関数の等高線の概念
- 偏微分
- ベクトルの基本的な演算
- 勾配ベクトル ($\nabla f$) が等高線に直交し、関数値が最も増加する方向を指すこと
要点まとめ
この記事では、物理や経済学など、様々な分野で現れる束縛条件付き最適化問題を解くための強力な手法である「ラグランジュの未定乗数法」の基本的な考え方を解説します。
- 問題の核心:
$g(x, y) = 0$という制約(束縛条件)の上で、関数$f(x, y)$の値が最大または最小になる点$(x, y)$を見つけること。- 用いる数学的手法: 関数の勾配ベクトルと、束縛条件が定める曲線の法線ベクトルとの関係に着目します。
- 最終的な結論: 最適な点では、目的関数
$f$の勾配$\nabla f$と束縛条件$g$の勾配$\nabla g$が平行になります。この関係を$\nabla f = \lambda \nabla g$と表現し、これと元の束縛条件を連立させることで解を求めます。
1. はじめに
「限られた予算の中で、最大の効用を得る商品の組み合わせは何か?」 「決まった長さのロープで、囲える面積が最大になる図形は何か?」
これらは、単に何かを最大化・最小化するだけでなく、「限られた予算」や「決まった長さのロープ」といった制約(束縛条件)の中で最適解を探す問題です。このような問題を系統的に解くための数学的な道具が、本記事で解説するラグランジュの未定乗数法です。
この手法の核心は、一見複雑な束縛付きの問題を、より扱いやすい「ある関数の偏微分がすべてゼロになる点を探す」という問題に変換する点にあります。本記事では、なぜそのような変換が可能なのかを、幾何学的な直感に基づいて丁寧に解説していきます。
2. 問題設定:円周上の最大値
具体的なイメージを掴むため、以下の問題を考えましょう。
問題: 円 $x^2 + y^2 = 1$ という束縛条件の下で、関数 $f(x, y) = x + y$ を最大化する点 $(x, y)$ を求めてください。
これは、xy平面上の単位円の上を移動できるとして、その中で $x+y$ の値が最も大きくなる場所はどこか?という問題です。
- 最大化したい関数(目的関数):
$f(x, y) = x + y$ - 束縛条件:
$g(x, y) = x^2 + y^2 - 1 = 0$
上の図は、目的関数 $f(x, y)$ の等高線($x+y=c$、破線)と、束縛条件である円 $g(x,y)=0$ (実線)を同時に描画したものです。私たちの目的は、この円周上で、最も値の大きい(右上に位置する)等高線と交わる点を見つけることです。
3. 解法のロードマップ
この問題を解決するために、以下のステップで思考を進めます。
- Step 1: 幾何学的な考察(等高線と束縛曲線が「接する」点) 最適解が満たすべき幾何学的な条件を、図を用いて直感的に理解します。
- Step 2: 勾配ベクトルを用いた条件の定式化 「接する」という幾何学的条件を、勾配ベクトルを用いて数学の言葉に翻訳します。
- Step 3: ラグランジアンの導入と求解 定式化された条件を、ラグランジアンという補助関数を用いて形式的に解く手続きを確立します。
4. 理論展開と計算
上記のロードマップに従って、具体的な議論を進めていきましょう。
Step 1: 幾何学的な考察(等高線と束縛曲線が「接する」点)
もし、目的関数 $f$ の等高線が、束縛条件の円と2点で交わっている状況を考えてみましょう。この場合、円周に沿って一方の交点からもう一方の交点へ移動することで、複数の異なる等高線を横切ることができます。これは、円周上にまだ $f$ の値が大きい(または小さい)点が存在することを意味します。
では、$f$ の値が最大または最小になるのはどのような瞬間でしょうか?
それは、$f$ の等高線が、束縛条件の円とちょうど1点で「接する」ときです。もし接していれば、その接点の周りでは、円周上をどちらに動いても、それ以上 $f$ の値を大きく(または小さく)することはできません。この点が、私たちが探している極値の候補となります。
Step 2: 勾配ベクトルを用いた条件の定式化
「2つの曲線が接する」という幾何学的な条件を、どうすれば数式で表現できるでしょうか。ここで勾配ベクトル $\nabla$ が登場します。
$\nabla f = (\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y})$: 関数$f$の勾配ベクトルは、その点において$f$が最も急激に増加する方向を指し、$f$の等高線とは常に直交します。$\nabla g = (\frac{\partial g}{\partial x}, \frac{\partial g}{\partial y})$: 同様に、関数$g$の勾配ベクトルは、$g$の等高線(この場合は$g=0$の円そのもの)に直交します。つまり、$\nabla g$は円の法線ベクトルです。
2つの曲線($f$ の等高線と $g=0$ の円)が点 $(x, y)$ で接するとき、それらの法線ベクトルは同じ方向(または真逆の方向)を向くはずです。つまり、勾配ベクトル $\nabla f$ と $\nabla g$ が互いに平行になるのです。
この「平行である」という条件は、あるスカラー(実数) $\lambda$ を用いて、次のように数式で表現できます。
$$ \nabla f(x, y) = \lambda \nabla g(x, y) $$
この $\lambda$ が、ラグランジュの未定乗数(Lagrange Multiplier)と呼ばれるものです。
Step 3: ラグランジアンの導入と求解
$\nabla f = \lambda \nabla g$ は、ベクトル方程式なので、成分ごとに書き下すと以下の2つの式が得られます。
$$
\begin{aligned}
\frac{\partial f}{\partial x} &= \lambda \frac{\partial g}{\partial x} \\
\frac{\partial f}{\partial y} &= \lambda \frac{\partial g}{\partial y}
\end{aligned}
$$
これに、私たちが忘れてはならない元の束縛条件
$$
g(x, y) = 0
$$
を加えた3つの連立方程式を、3つの未知数 $x, y, \lambda$ について解けば、極値の候補点が得られます。
ここで、この手続きをよりエレガントに形式化するために、ラグランジアン $L(x, y, \lambda)$ という補助関数を以下のように定義します。
$$
L(x, y, \lambda) = f(x, y) - \lambda g(x, y)
$$
このラグランジアン $L$ の、すべての変数に関する偏微分が$0$になる条件を考えてみましょう。
$$
\frac{\partial L}{\partial x} = \frac{\partial f}{\partial x} - \lambda \frac{\partial g}{\partial x} = 0 \implies \frac{\partial f}{\partial x} = \lambda \frac{\partial g}{\partial x}
$$
$$
\frac{\partial L}{\partial y} = \frac{\partial f}{\partial y} - \lambda \frac{\partial g}{\partial y} = 0 \implies \frac{\partial f}{\partial y} = \lambda \frac{\partial g}{\partial y}
$$
$$
\frac{\partial L}{\partial \lambda} = -g(x, y) = 0 \implies g(x, y) = 0
$$
驚くべきことに、ラグランジアン $L$ の停留点を探す条件($\nabla L = 0$)は、私たちが先ほど導出した3つの連立方程式と全く同じものになります。
したがって、束縛条件付き最適化問題は、ラグランジアンを定義し、そのすべての変数に関する偏微分を$0$とおいて解く、という機械的な手続きに帰着させることができます。
実際に解いてみる
それでは、具体例をこの手続きで解いてみましょう。
$f(x, y) = x + y$$g(x, y) = x^2 + y^2 - 1 = 0$
ラグランジアンを定義します。
$$
L(x, y, \lambda) = (x + y) - \lambda (x^2 + y^2 - 1)
$$
各変数で偏微分して$0$と置きます。
$$
\frac{\partial L}{\partial x} = 1 - 2\lambda x = 0 \quad \cdots (1)
$$
$$
\frac{\partial L}{\partial y} = 1 - 2\lambda y = 0 \quad \cdots (2)
$$
$$
\frac{\partial L}{\partial \lambda} = -(x^2 + y^2 - 1) = 0 \quad \cdots (3)
$$
(1)式より $x = \frac{1}{2\lambda}$、(2)式より $y = \frac{1}{2\lambda}$ が得られます($\lambda \neq 0$)。これより $x = y$ がわかります。
この結果を(3)式に代入します。
$$
x^2 + x^2 - 1 = 0 \implies 2x^2 = 1 \implies x = \pm \frac{1}{\sqrt{2}}
$$
$x=y$ なので、候補点は
$$
(x, y) = \left(\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}\right) \quad \text{and} \quad \left(-\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}}\right)
$$
の2点です。それぞれの点での $f(x, y)$ の値を計算すると、
$f(\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}) = \frac{1}{\sqrt{2}} + \frac{1}{\sqrt{2}} = \sqrt{2}$(最大値)$f(-\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}}) = -\frac{1}{\sqrt{2}} - \frac{1}{\sqrt{2}} = -\sqrt{2}$(最小値)
となり、求める最大値は $\sqrt{2}$ で、そのときの点は $(\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}})$ であることがわかりました。
5. 結論と物理的考察
ラグランジュの未定乗数法は、束縛条件 $g=0$ の下で関数 $f$ を最適化するという問題を、幾何学的には「$f$ の等高線と $g=0$ の曲線が接する点を探す」という問題として捉え直したものです。
この幾何学的条件は、2つの関数の勾配ベクトルが平行になる $\nabla f = \lambda \nabla g$ という数式で表現されます。そして、この条件式と元の束縛条件をまとめてエレガントに扱うための道具が、ラグランジアン $L = f - \lambda g$ です。束縛付きの問題は、ラグランジアン $L$ の(束縛のない)停留点問題へと見事に変換されるのです。
この手法の美しさは、複雑な制約を機械的な計算手順に落とし込める点にあります。物理学では、最小作用の原理など、自然法則そのものが一種の束縛条件付き最適化問題として定式化されることがあり、ラグランジュ形式(ラグランジアン)は解析力学の根幹をなす非常に重要な概念となっています。
6. 発展と関連テーマ
今回のテーマは、ラグランジュ法の最も基本的な側面に過ぎません。この考え方は、さらに奥深い世界へとつながっています。
- 束縛条件が複数ある場合:
$L = f - \sum_i \lambda_i g_i$のように、束縛条件ごとに未定乗数を導入することで同様に扱えます。