偏導関数と全微分可能性

偏微分とその例

実多変数関数に微分を拡張するのがこの記事の目的である。その手法と して、ある変数を固定し、それ以外の変数を定数とみなして微分するようなもの 偏微分を考える。

定義:偏微分係数・偏導関数

領域 $D$ 上の実 $2$ 変数関数 $f(x, y)$ に対して、その極限
$$\dlim_{h \to 0} \dfrac{f(a+h, b)-f(a, b)}{h}$$が存在すれば、これを $f$ の点 $(a, b)$ における偏微分係数と呼び、$f_x(a, b), \dpdv{f}{x}(a,b)$ と表す。

領域 $D$ の各点に偏微分係数を対応させる関数を $f$ の偏導関数と呼び、$f_x(a, b), \dpdv{f}{x_i}$ と表す。関数に偏導関数を対応させる操作を偏微分と呼ぶ。

偏微分のイメージをつかむために、以下の例を計算する。

例:偏微分係数の計算例

$x^2 + 5xy + y^3$ の点 $(4, 7)$ における偏微分係数

$x$ についての偏微分係数

$\qquad \left.\dpdv{\qty(x^2 + 5xy + y^3)}{y}\right|_{(x,y)=(4,7)}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty( (4+h)^2 + 5 \cdot (4+h) \cdot 7 + 7^3 )-\qty(4^2 + 5 \cdot 4 \cdot 7 + 7^3)}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{ \qty(\cancel{16}+8h+h^2) + (\cancel{140} + 35h) + \cancel{343}-( \cancel{16} + \cancel{140} + \cancel{343} )}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{8h + h^2 + 35h}{h}$
$\qquad = \dlim_{h \to 0} (43 + h)$
$\qquad = 43 + 0$
$\qquad = 43.$

$y$ についての偏微分係数

$\qquad \left.\dpdv{\qty(x^2 + 5xy + y^3)}{y}\right|_{(x,y)=(4,7)}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty( 4^2 + 5 \cdot 4 \cdot (7+k) + (7+k)^3 )-\qty(4^2 + 5 \cdot 4 \cdot 7 + 7^3)}{k}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty\big(\cancel{16} + \cancel{140} + 20k + (\cancel{343} + 147k + 21k^2 + k^3))-(\cancel{16} + \cancel{140} + \cancel{343})}{k}$
$\qquad = \dlim_{h \to 0} \dfrac{20k + 147k + 21k^2 + k^3}{k}$
$\qquad = \dlim_{h \to 0} \qty(167 + 21k + k^2)$
$\qquad = 167 + 21 \cdot 0 + 0^2$
$\qquad = 167.$

例:偏導関数の計算例
  1. $x^2 y$ の $x$ についての偏導関数
  2. $x^2 y$ の $y$ についての偏導関数
  3. $x^2 + 5xy + y^3$ の $x$ についての偏導関数
  4. $x^2 + 5xy + y^3$ の $y$ についての偏導関数

1. $x^2 y$ の $x$ についての偏導関数

$\qquad \dpdv{x^2 y}{x}$
$\qquad = \dlim_{h \to 0} \dfrac{(x + h)^2y-x^2y}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty\big(x^2y + 2hxy + h^2y)-x^2y}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{2hxy + h^2y}{h}$
$\qquad = \dlim_{h \to 0} (2xy + hy)$
$\qquad = 2xy.$

2. $x^2 y$ の $y$ についての偏導関数

$\qquad \dpdv{x^2 y}{y}$
$\qquad = \dlim_{h \to 0} \dfrac{x^2(y+h)-x^2y}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{(x^2y+hx^2)-x^2y}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{hx^2}{h}$
$\qquad = \dlim_{h \to 0} x^2$
$\qquad = x^2.$

3. $x^2 y$ の $x$ についての偏導関数

$\qquad \dpdv{\qty(x^2 + 5xy + y^3)}{y}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty( (x+h)^2 + 5(x+h)y + y^3 )-\qty(x^2 + 5xy + y^3)}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty\Big(\qty(\cancel{x^2} + 2xh + h^2) + (\cancel{5xy} + 5hy) + \cancel{y^3})-\qty(\cancel{x^2} + \cancel{5xy} + \cancel{y^3})}{h}$
$\qquad = \dlim_{h \to 0} \dfrac{2xh + 5hy}{h}$
$\qquad = 2x+5y.$

4. $x^2 y$ の $y$ についての偏導関数

$\qquad \dpdv{\qty(x^2 + 5xy + y^3)}{y}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty( x^2 + 5x(y+k) + (y+k)^3 )-\qty(x^2 + 5xy + y^3)}{k}$
$\qquad = \dlim_{h \to 0} \dfrac{\qty\Big( \cancel{x^2} + (\cancel{5xy} + 5xk) + \qty(\cancel{y^3} + 3y^2k + 3yk^2 + k^3))-\qty( \cancel{x^2} + \cancel{5xy} + \cancel{y^3})}{k}$
$\qquad = \dlim_{h \to 0} \dfrac{5xk + 3y^2k + 3yk^2 + k^3}{k}$
$\qquad = \dlim_{h \to 0} \qty(5x + 3y^2 + 3yk + k^2)$
$\qquad = 5x + 3y^2 + 3y \cdot 0 + 0^2$
$\qquad = 5x + 3y^2.$

偏微分の性質

定義:高階偏微分係数高階偏導関数

領域 $D$ 上の実 $2$ 変数関数 $f(x, y)$ に対して、複数回の偏微分によって得られる点 $(a,b)$ における偏微分係数を高階偏微分係数と呼ぶ。
特に、$n$ 回の偏微分によって得られる点 $(a,b)$ における偏微分係数を $n$ 階偏微分係数と呼ぶ。$x, y$ それぞれについて何回どの順序で偏微分するかによって、さまざまな表記が存在する。
その表記例を以下に記す。

  • 表記例:
    • $f_{xx}(a,b),\, f_{yy}(a,b),\, f_{xy}(a,b),\, f_{yx}(a,b)$
    • $\dfrac{\partial^2}{\partial x^2} f(a,b),\, \dfrac{\partial^3}{\partial x^3} f(a,b),\, \ldots, \dfrac{\partial^n}{\partial x^n} f(a,b),\, \ldots$
    • $f_{xx}(a,b) = \dfrac{\partial^2}{\partial x^2} f(a,b) = \dfrac{\partial^2f}{\partial x^2} (a,b) = \dpdv{x}\dpdv{x} f(a,b) = \dpdv{x} \left( \dpdv{f}{x} \right) (a,b)$
    • $f_{xy}(a,b) = \dfrac{\partial^2}{\partial x \partial y} f(a,b) = \dfrac{\partial^2f}{\partial x \partial y} (a,b) = \dpdv{x}\dpdv{y} f(a,b) = \dpdv{x} \left( \dpdv{f}{y} \right)(a,b)$
    • $\dfrac{\partial^5 f}{\partial x^3 \partial y^2} (a,b)$

領域 $D$ 上の実 $2$ 変数関数 $f(x, y)$ に対して、複数回の偏微分によって得られる偏導関数を高階偏導関数と呼ぶ。
特に、$n$ 回の偏微分によって得られる偏導関数を $n$ 階偏導関数と呼ぶ。
$x, y$ それぞれについて何回どの順序で偏微分するかによって、さまざまな表記が存在する。その表記例を以下に記す。

  • 表記例:
    • $f_{xx},\, f_{yy},\, f_{xy},\, f_{yx}$
    • $\dfrac{\partial^2}{\partial x^2} f,\, \dfrac{\partial^3}{\partial x^3} f,\, \ldots, \dfrac{\partial^n}{\partial x^n} f,\, \ldots$
    • $f_{xx} = \dfrac{\partial^2}{\partial x^2} f = \dfrac{\partial^2f}{\partial x^2} = \dpdv{x}\dpdv{x} f = \dpdv{x} \left( \dpdv{f}{x} \right)$
    • $f_{xy} = \dfrac{\partial^2}{\partial x \partial y} f = \dfrac{\partial^2f}{\partial x \partial y} = \dpdv{x}\dpdv{y} f = \dpdv{x} \left( \dpdv{f}{y} \right)$
    • $\dfrac{\partial^5 f}{\partial x^3 \partial y^2}$

“一般に” $f_{xy} = f_{yx}$ は成り立たない。しかし、偏微分の順序は条件付きで “基本的に” 交換可能である。

定理:シュワルツの定理

$2$ 変数関数 $f(x,y)$ に対して、$f_x,\, f_y,\, f_{xy}$ が存在して、$f_{xy}$ が連続なら $f_{yx}$ が存在して、
$$f_{xy} = f_{yx}$$が成り立つ。

命題:

命題:偏導関数が連続ならば全微分可能

$f_x, f_y$ が存在して、いずれかが $(a, b)$ で連続ならば、$(a, b)$ で全微分可能である。

全微分可能性と全微分

偏微分を用いて、全微分可能性を定義したのち、全微分を定義する。

定義:全微分可能性(total differentiability)

点 $(a,b)$ の近傍 $D$ 上で定義された実関数 $f(x,y)$ に対して、
$$\dlim_{(h, k) \to (0, 0)} \dfrac{ f(a+h, b+k)-f(a,b)-\alpha h-\beta k }{ \sqrt{h^2 + k^2} } = 0$$となる実数 $\alpha, \beta$ が存在するとき、$f$ は点 $(a,b)$ において全微分可能という。

全微分可能性の定義の意味・由来

  • 全微分可能性の定義式は、接平面の方程式
    $$f(x,y)-f(a, b) = f_x(a, b)(x-a) + f_y(a, b)(y-b)$$に由来する。もっと言えば、この方程式も $1$ 変数関数における $y=f(x)$ の接線の方程式
    $$f(x)-f(a) = f'(a)(x-a)$$を $2$ 変数関数に拡張したものであり、その極限が微分係数であるのと同様である。
  • 接線の方程式の $x = a$ における極限が微分係数であり、接平面の方程式の $f_x=0, f_y=0$ における極限が全微分可能性である。
例:全微分可能な関数の例・反例

全微分不可能な関数の例

  1. $\begin{cases}f(x, y) = 0\ (xy \neq 0) \\ f(x, y) = 1\ (xy=0)\end{cases}$ は $(0,0)$ において偏微分可能であるが全微分可能ではない。

例:全微分の計算例

命題:偏導関数が連続ならば全微分可能

$f_x, f_y$ が存在して、いずれかが $(a, b)$ で連続ならば、$(a, b)$ で全微分可能である。

$f_x$ が $(a, b)$ で連続であるとして、全微分可能であることを示す。
平均値の定理より、
$\qquad f(a+h, b+k)-f(a, b)$
$\qquad \qty\big( f(a+h, b+k)-f(a, b) ) + \qty\big( f(a, b+k)-f(a, b) )$
$\qquad hf_x(a+\theta_{h,k}, b+k) + \qty\big( f(a, b+k)-f(a, b) )$

系:$C^1$ 級関数ならば全微分可能

$C^1$ 級関数ならば、$(a, b)$ で全微分可能である。

命題:全微分可能ならば連続

実関数 $f(x, y)$ が点 $(a, b)$ で全微分可能ならば、$f(x, y)$ は点 $(a, b)$ で連続である。

$f(x, y)$ は点 $(a, b)$ で全微分可能であるから、全微分可能性の定義に現れる実数 $\alpha, \beta$ に対して、
$$\varepsilon(h, k) = f(a+h, b+k)-\qty\big( f(a,b) + \alpha h + \beta k )$$とおけば、
$$\dlim_{(h,k)\to (0,0)} \dfrac{\varepsilon(h,k)}{ \sqrt{h^2 + k^2} } = \dlim_{(h,k)\to (0,0)} \dfrac{f(a+h, b+k)-\qty\big( f(a,b) + \alpha h + \beta k )}{ \sqrt{h^2 + k^2} }$$はそのまま全微分可能性の定義に合致するから、
$$\dlim_{(h,k)\to (0,0)} \dfrac{\varepsilon(h,k)}{ \sqrt{h^2 + k^2} } = 0 \tag{1}$$が成り立つ。よって、$(h,k) \neq (0,0)$ のとき、
$\qquad \mathrel{\phantom{\iff}}\dfrac{\varepsilon(h,k)}{ \sqrt{h^2 + k^2} } = \dlim_{(h,k)\to (0,0)} \dfrac{f(a+h, b+k)-\qty\big( f(a,b) + \alpha h + \beta k )}{ \sqrt{h^2 + k^2} }$
$\qquad \iff f(a+h, b+k) = f(a,b) + \alpha h + \beta k + \sqrt{h^2 + k^2} \cdot \dfrac{\varepsilon(h,k)}{ \sqrt{h^2 + k^2} }$
と変形すれば、
$\qquad \dlim_{(h,k)\to (0,0)} f(a+h, b+k)$
$\qquad = \dlim_{(h,k)\to (0,0)} \qty( f(a,b) + \alpha h + \beta k + \sqrt{h^2 + k^2} \cdot \dfrac{\varepsilon(h,k)}{ \sqrt{h^2 + k^2} })$
$\qquad = \dlim_{(h,k)\to (0,0)} f(a,b) + \dlim_{(h,k)\to (0,0)} \qty( \alpha h + \beta k + \sqrt{h^2 + k^2} ) \cdot \dlim_{(h,k)\to (0,0)} \dfrac{\varepsilon(h,k)}{ \sqrt{h^2 + k^2} }$
$\alpha h, \beta k, \sqrt{h^2 + k^2}$ は単純に $0$ が代入され、$0$ になり、$\dfrac{\varepsilon(h,k)}{ \sqrt{h^2 + k^2} }$ も上の式 $(1)$ により、$0$ になるから、
$\qquad = f(a,b)$
となる。よって、
$$\dlim_{(h,k)\to (0,0)} f(x,y) = f(a,b)$$が得られた。これは $f(x,y)$ が点 $(a,b)$ で連続であることを意味する。$\Box$

命題:全微分可能ならば偏微分可能

実関数 $f(x, y)$ が点 $(a,b)$ で全微分可能ならば、点 $(a,b)$ で偏微分可能である。さらに、全微分可能性の定義における $\alpha, \beta$ について
$$\alpha = f_x(a,b),\, \beta = f_y(a,b)$$が成り立つ。

全微分可能性の定義と、上記の命題によって、全微分が定義可能になる。

定義:全微分(total derivative)

実関数 $f(x,y)$ が $D$ 上すべての点において全微分可能であるとき、$f$ は $D$ 上で全微分可能といい、$$\dd f = \pdv{f}{x} \dd x + \pdv{f}{y} \dd y = f_x\, \dd x + f_y\, \dd y$$を $f$ の全微分と呼ぶ。

$\dd f, \dd x, \dd y$ について

  • $(h, k) \to (0, 0)$は、$h$ と $k$ が同時に $0$ に近づくという意味であるが、$(h, k) \to (0, 0)$ としたとき、
    $f(x,y)-f(a, b)$ は $\dd f$ に、$x-a$ は $\dd x$ に、$y-b$ は $\dd y$ に、それぞれ置き換わる。数式にすると、
    $$f(x,y)-f(a,b) \approx \dd f$$$$x-a \approx \dd x$$$$y-b \approx \dd y$$となる。
  • 全微分の定義式の $\dd x, \dd y$ に特別な意味があるわけではなくて、単なる「微小な変化量」くらいの意味しかない。$\dd x, \dd y$ に直接的な値を代入したときに、$\dd f$ がどのくらい変化するのかを計算できるのが、全微分のメリットである。
    特に、全微分の表記においては、$\dd f, \dd x, \dd y$ に合わせてなのかライプニッツの記法 $\dpdv{f}{x}, \dpdv{f}{y}$ がよく用いられる。