Hoofdstuk 3 - Lineaire operatoren en eigenwaarden
Doel van dit hoofdstuk
$$ % Math operators % %
% VECTORS% specifically for vectors in F^n
% MATRICES% SCALARS
% LINEAR MAPS% FIELDS
% RELATIONS
% % % % % % % % %
%
$$
Herhaling:
Machten en veeltermen van operatoren
Karakteristieke veelterm
Eigenwaarden en eigenvectoren, diagonalisatie
Doel van dit hoofdstuk
Nieuw:
Idempotente en nilpotente operatoren
Minimaalveelterm, Cayley-Hamiltontheorema
Companion-matrix van een veelterm
Invariante deelruimten en veralgemeende eigenruimten, Jordan-decompositie
Functies van operatoren
Toepassing: Lineaire dynamische sytemen
Machten en veeltermen
Machten en veeltermen
Lineaire operator = endomorfisme: {\hat{A}} \in \mathop{\mathrm{End}}(V) = \mathop{\mathrm{Hom}}(V,V)
\mathop{\mathrm{End}}(V) is een “associatieve algebra met eenheid” = “ring die een vectorruimte is”
Machten: aangezien {\hat{A}} een afbeelding (V \to V) is, kunnen we composities nemen van {\hat{A}} met zichzelf:
{\hat{A}}^n = \underbrace{{\hat{A}} \circ {\hat{A}} \circ \cdots \circ {\hat{A}}}_{\text{$n$ times}} en {\hat{A}}^0 = {\hat{1}}_V
Veeltermen: aangezien \mathop{\mathrm{End}}(V) ook een vectorruimte is, kunnen we lineaire combinaties nemen
p({\hat{A}}) = p_s {\hat{A}}^s + p_{s-1} {\hat{A}}^{s-1} + \ldots + p_1 {\hat{A}} + p_0 {\hat{1}}_V \in \mathop{\mathrm{End}}(V)
Eigenschappen van veeltermen
- Voor twee veeltermen p(x) en q(x) en {\hat{A}}\in \mathop{\mathrm{End}}(V) geldt
[p({\hat{A}}),q({\hat{A}})] = p({\hat{A}})q({\hat{A}}) - q({\hat{A}})p({\hat{A}}) = {\hat{0}}
- Voor een veelterm p(x), een lineaire operator {\hat{A}}\in \mathop{\mathrm{End}}(V) en een lineaire transformatie (=inverteerbare lineaire afbeelding) {\hat{T}} \in \mathop{\mathrm{Hom}}(V,W) geldt
\underbrace{p({\hat{T}} {\hat{A}} {\hat{T}}^{-1})}_{\in \mathop{\mathrm{End}}(W)} = {\hat{T}} \underbrace{p({\hat{A}})}_{\in \mathop{\mathrm{End}}(V)} {\hat{T}}^{-1}
Nilpotente operatoren
Een element a fvan een ring R dat voldoet aan aan a^s = 0 heet nilpotent met index s (als n=s de kleinste waarde is waarvoor a^n=0)
Nilpotente operatoren {\hat{N}} \in \mathop{\mathrm{End}}(V) voldoen dus aan {\hat{N}}^s = {\hat{0}} en spelen een rol bij de veralgemeene eigenwaardendecompositie
Voorbeeld: {\mathsf{A}} = \begin{bmatrix} 0 & c \\ 0 & 0 \end{bmatrix} is nilpotent met index s=2 (voor elke c \neq 0)
Projectie-operator
Een element a van een ring R dat voldoet aan a^2 = a heet idempotent.
Idempotente lineaire operatoren {\hat{P}} \in \mathop{\mathrm{End}}(V) worden vaak projectie-operatoren, of kortweg projectoren, genoemd, omwille van de volgende eigenschap:
{\hat{P}}^2 ={\hat{P}} \Rightarrow V = \mathop{\mathrm{im}}({\hat{P}}) \oplus \mathop{\mathrm{ker}}({\hat{P}})
\forall {v}\in V: {v}= \underbrace{{\hat{P}}{v}}_{{v}_1} + \underbrace{({\hat{1}}- {\hat{P}}){v}}_{{v}_2}
omgekeerd: gegeven V = V_1 \oplus V_2, de decompositie {v}= {v}_1 + {v}_2 definieert een projector op V_1 parallel met V_2:
{\hat{P}}{v}= {v}_1 \in V_1 (en {v}_2 = {v}-{v}_1 = ({\hat{1}}- {\hat{P}}){v}).
Annihilerende veeltermen
Een veelterm p \in {\mathbb{F}}[x] annihileert {\hat{A}}\in \mathop{\mathrm{End}}(V) als p({\hat{A}})={\hat{0}}
Voorbeeld: {\hat{P}}^2 = {\hat{P}} \Rightarrow p(x) = x^2 - x annihileert {\hat{P}}
V eindig-dimensionaal \Rightarrow \mathop{\mathrm{dim}}(\mathop{\mathrm{End}}(V)) = \mathop{\mathrm{dim}}(V)^2
- \Rightarrow er bestaat een s waarvoor \{{\hat{A}}^0,{\hat{A}}^1,\ldots,{\hat{A}}^k\,\ldots,{\hat{A}}^s\} niet meer lineair onafhankelijk is
- minimaalveelterm m_{{\hat{A}}}(x)= x^s + \ldots is de monische veelterm van laagste graad s die {\hat{A}} annihileert en is uniek
Elke annihilerende veelterm p van {\hat{A}} voldoet aan
p(x) = m_{{\hat{A}}}(x) q(x)
Eigenwaarden, eigenruimten en diagonalisatie
Eigenwaarden en eigenvectoren
{\hat{A}} \in \mathop{\mathrm{End}}(V), \lambda \in {\mathbb{F}}, {v}\in V met {v}\neq {o}:
{\hat{A}} {v}= \lambda {v}
- Eigenwaarde (karakteristieke waarde) \lambda, eigenvector {v}
- elke a {v} met a \neq 0 is ook een eigenvector
Eigenwaarden en eigenvectoren
- Belang van het veld {\mathbb{F}}: {\mathsf{A}} = \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}
\lambda \in {\mathbb{R}}: geen
\lambda \in {\mathbb{C}}: {\mathsf{A}}(\boldsymbol{e}_1 \pm {\mathrm{i}}\boldsymbol{e}_2) = \mp {\mathrm{i}}(\boldsymbol{e}_1 \pm {\mathrm{i}}\boldsymbol{e}_2)
\Rightarrow \lambda = +{\mathrm{i}} en \lambda = -{\mathrm{i}}
- Belang van domein: {\hat{D}} = \frac{{\mathrm{d}}\ }{{\mathrm{d}}x}
- Op C^{\infty}({\mathbb{R}},{\mathbb{F}}): \frac{{\mathrm{d}}\ }{{\mathrm{d}}x} {\mathrm{e}}^{\lambda x} = \lambda {\mathrm{e}}^{\lambda x}
- Op {\mathbb{F}}[x]: geen eigenvectoren / eigenwaarden
Eigenruimten
Eigenruimte V_\lambda = \{{v}\in V | {\hat{A}} {v}= \lambda {v}\} = \mathop{\mathrm{ker}}({\hat{A}} - \lambda )
- \Rightarrow \lambda is eigenwaarde als \mathop{\mathrm{dim}}(V_\lambda) > 0
- r_\lambda = \mathop{\mathrm{dim}}(V_\lambda): geometrische multipliciteit
V eindigdimensionaal: r_\lambda > 0 \Rightarrow \mathop{\mathrm{rank}}({\hat{A}}-\lambda {\hat{1}}) < \mathop{\mathrm{dim}}(V) en dus is {\hat{A}}-\lambda {\hat{1}} niet injectief en niet-inverteerbaar. Er geldt dus ook \det({\hat{A}}-\lambda {\hat{1}})=0.
Spectrum
Spectrum: \sigma_{{\hat{A}}} = \{ \lambda \in {\mathbb{F}}| ({\hat{A}} - \lambda) heeft geen ‘goed gedefinieerde inverse’\}
V eindig-dimensionaal: \sigma = \{\lambda_1,\ldots,\lambda_m\} bevat alleen eigenwaarden
V oneindig-dimensionaal: zie later
Terzijde: {\hat{R}}_{{\hat{A}}}(z) = (z{\hat{1}}-{\hat{A}})^{-1} voor waarden z \in {\mathbb{C}}\setminus \sigma_{{\hat{A}}} is de resolvent.
Nuttig in theoretische fysica met behulp van technieken uit de complexe analyse.
Eigenschappen van eigenwaarden en eigenruimten
- {\hat{A}}{v}= \lambda {v}\Rightarrow p({\hat{A}}){v}= p(\lambda) {v}
- p(x) is een annihilerende veelterm van {\hat{A}}: \lambda is een nulpunt van p
- verzameling van eigenvectoren \{{v}_1,\ldots,{v}_k\} horende bij onderling verschillende eigenwaarden \{\lambda_1,\ldots,\lambda_k\} met \lambda_i\neq \lambda_j zijn linear onafhankelijk.
- \Rightarrow Som van eigenruimten \sum_{k} V_{\lambda_k} wordt directe som \bigoplus_{k} V_{\lambda_k}
- \Rightarrow \sum_{\lambda \in \sigma_{{\hat{A}}}} r_\lambda \leq \mathop{\mathrm{dim}}(V)
Eigenruimten van producten van lineaire afbeeldingen
Beschouw {\hat{A}} \in \mathop{\mathrm{Hom}}(V,W) en {\hat{B}} \in \mathop{\mathrm{Hom}}(W,V), dan is {\hat{A}}{\hat{B}} \in \mathop{\mathrm{Hom}}(W,W) en {\hat{B}}{\hat{A}} \in \mathop{\mathrm{Hom}}(V,V).
- Elke eigenwaarde \lambda\neq 0 van {\hat{B}}{\hat{A}} is ook een eigenwaarde van {\hat{A}}{\hat{B}} (en vice versa)
- Eigenruimte W_\lambda van {\hat{A}}{\hat{B}} komt overeen met {\hat{A}} V_\lambda, en \mathop{\mathrm{dim}}(W_\lambda) = \mathop{\mathrm{dim}}(V_\lambda), i.e. de restrictie van {\hat{A}} tot V_\lambda is injectief
- ((\lambda^{-1}{\hat{B}})\circ {\hat{A}}){v}= {v},\qquad \forall {v}\in V_\lambda
- ({\hat{A}} \circ (\lambda^{-1}{\hat{B}})){w}= {w},\qquad \forall {w}\in W_\lambda
Karakteristieke veelterm
Voor V eindig-dimensionaal en {\hat{A}}\in \mathop{\mathrm{End}}(V) k_{{\hat{A}}}(z) = \det(z{\hat{1}}- {\hat{A}}) = z^n + c_{n-1} z^{n-1} + \ldots + c_0
met c_{n-1} = - \mathop{\mathrm{tr}}({\hat{A}}) en c_0 = (-1)^n \det({\hat{A}}).
Elke eigenwaarde is een nulpunt, elk nulpunt is een eigenwaarde
k_{{\hat{A}}} = (z - \lambda_1)^{q_{\lambda_1}} (z- \lambda_2)^{q_{\lambda_2}} \ldots (z-\lambda_m)^{q_{\lambda_m}}
met q_{\lambda} de algebraische multipliciteit
\mathop{\mathrm{tr}}({\hat{A}})= q_{\lambda_1} \lambda_1+ q_{\lambda_2} \lambda_2+ \cdots + q_{\lambda_m} \lambda_m = \sum_{\lambda \in \sigma_{{\hat{A}}}} q_{\lambda} \lambda
\det({\hat{A}})= \lambda_1^{q_{\lambda_1}} \lambda_2^{q_{\lambda_2}} \cdots \lambda_m^{q_{\lambda_m} } = \prod_{\lambda \in \sigma_{{\hat{A}}}} \lambda^{q_{\lambda}}
Companian matrix
Gegeven een veelterm p(z) = z^n + p_{n-1} z^{n-1} + \ldots + p_0 \in {\mathbb{F}}[z], construeer een matrix {\mathsf{A}} \in {\mathbb{F}}^n zodat p(z) = k_{{\mathsf{A}}}(z)?
- Companion matrix {\mathsf{C}}_p = \begin{bmatrix} 0 & 1 & 0 & \ldots & 0 & 0\\ 0 & 0 & 1 &\ldots & 0 & 0\\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots\\ 0 & 0 & 0 &\ldots & 0 & 1\\ -p_0 & -p_1 & -p_2& \ldots & -p_{n-2} & -p_{n-1} \end{bmatrix}
Stelling van Caley - Hamilton
De karakteristieke veelterm k_{{\hat{A}}}(z) annihileert {\hat{A}}.
\Rightarrow k_{{\hat{A}}}(z)= m_{{\hat{A}}}(z) q(z) met bovendien: k_{{\hat{A}}}(z) en m_{{\hat{A}}}(z) hebben dezelfde nulpunten
\Rightarrow k_{{\hat{A}}}(z) = \prod_{\lambda \in \sigma_{{\hat{A}}}}(z - \lambda)^{q_\lambda}, m_{{\hat{A}}}(z) = \prod_{\lambda \in \sigma_{{\hat{A}}}}(z - \lambda)^{s_\lambda} met s_\lambda \leq q_\lambda
Toepassingen:
{\hat{A}}^n = - c_{n-1} {\hat{A}}^{n-1} - \ldots - c_1 {\hat{A}} - c_0 {\hat{1}}
en als c_0 = (-1)^n \det({\hat{A}}) \neq 0:
{\hat{A}}^{-1} = \frac{(-1)^{n-1}}{\det({\hat{A}})} \left({\hat{A}}^{n-1} + c_{n-1} {\hat{A}}^{n-2} + \ldots + c_1 {\hat{1}}\right)
Voorbeelden van karakteristieke en minimaalveelterm
{\mathsf{A}} = \begin{bmatrix} 1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix}
\rightarrow m_{{\mathsf{A}}}(z) = z(z- 1) en k_{{\mathsf{A}}}(z) = z^2 (z-1)^2
{\mathsf{A}} = \begin{bmatrix} 1 & c \\ 0 & 1 \end{bmatrix}
\rightarrow k_{{\mathsf{A}}}(z) = m_{{\mathsf{A}}}(z) = (z- 1)^2.
Diagonalisatie
{\hat{A}} \in \mathop{\mathrm{End}}(V) is diagonaliseerbaar als
\bigoplus_{\lambda \in \sigma_{{\hat{A}}}} V_\lambda = V \Leftrightarrow \sum_{\lambda \in \sigma_{{\hat{A}}}} r_\lambda = \mathop{\mathrm{dim}}(V)
\sum_{\lambda \in \sigma_{{\hat{A}}}} r_\lambda < \mathop{\mathrm{dim}}(V): {\hat{A}} is niet-diagonaliseerbaar of defect
Er bestaat een basis van eigenvectoren
Matrixrepresentatie: er bestaat een basistransformatie {\mathsf{V}} naar deze nieuwe basis van eigenvectoren zodat
{\mathsf{A}} = {\mathsf{V}}{\mathsf{D}} {\mathsf{V}}^{-1} \quad \Leftrightarrow \quad {\mathsf{A}} {\mathsf{V}} = {\mathsf{V}} {\mathsf{D}} met
{\mathsf{D}} = \text{diag}(\begin{bmatrix} \lambda_{i_1} & \lambda_{i_2} & \cdots & \lambda_{i_n} \end{bmatrix})
Diagonalisatie: voorbeelden
\underbrace{\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}}_{{\mathsf{A}}}\underbrace{\begin{bmatrix} 1 & 1 \\ -{\mathrm{i}}& + {\mathrm{i}}\end{bmatrix}}_{{\mathsf{V}}} = \underbrace{\begin{bmatrix} 1 & 1 \\ -{\mathrm{i}}& +{\mathrm{i}}\end{bmatrix}}_{{\mathsf{V}}} \underbrace{\begin{bmatrix} {\mathrm{i}}& 0 \\ 0 & -{\mathrm{i}}\end{bmatrix}}_{{\mathsf{D}}}
{\mathsf{A}} = \begin{bmatrix} 1 & c \\ 0 & 1 \end{bmatrix}: m_{{\mathsf{A}}}(z)=(z-1)^2
\Rightarrow niet diagonaliseerbaar: \sigma_{{\mathsf{A}}} = \{1\} met r_1 = 1 < q_1=2
Diagonalisatie en minimaalveelterm
Stelling: {\hat{A}} \in \mathop{\mathrm{End}}(V) is diagonaliseerbaar als en slechts als s_{\lambda} =1 voor alle eigenwaarden \lambda \in \sigma_{{\hat{A}}}, of dus
m_{{\hat{A}}}(z) = \prod_{\lambda \in \sigma_{{\hat{A}}}} (z-\lambda)
Spectrale decompositie
{\hat{A}} diagonaliseerbaar: \bigoplus_{\lambda \in \sigma_{{\hat{A}}}} V_\lambda = V
spectrale projector {\hat{P}}_\lambda op V_\lambda parallel met \bigoplus_{\lambda' \neq \lambda} V_{\lambda'}
eigenschappen:
- {\hat{P}}_\lambda {\hat{P}}_{\lambda'} = \delta_{\lambda,\lambda'} {\hat{P}}_\lambda
- \sum_{\lambda \in \sigma_{{\hat{A}}}} {\hat{P}}_\lambda = {\hat{1}}_V (resolutie van de identiteit)
- {\hat{A}} {\hat{P}}_\lambda = {\hat{P}}_\lambda {\hat{A}} = \lambda {\hat{P}}_\lambda
spectrale decompositie: {\hat{A}} = \sum_{\lambda \in \sigma_{{\hat{A}}}} \lambda {\hat{P}}_\lambda
(diagonaalvorm in operatornotatie)
\Rightarrow p({\hat{A}}) = \sum p(\lambda) {\hat{P}}_\lambda,\quad {\hat{A}}^{-1} = \sum \lambda^{-1} {\hat{P}}_\lambda (als 0\not\in \sigma_{{\hat{A}}})
Spectrale decompositie
Expliciete uitdrukkingen voor de spectrale projector:
{\hat{P}}_\lambda = \prod_{\substack{\lambda'\in\sigma_{{\hat{A}}}\\\lambda\neq \lambda'}} \frac{({\hat{A}} - \lambda')}{(\lambda - \lambda')}
Terzijde: {\hat{P}}_{\lambda}=\lim_{z \to \lambda} (z - \lambda) R_{{\hat{A}}}(z)
Spectrale decompositie van commuterende operatoren
Diagonaliseerbare operatoren {\hat{A}},{\hat{B}} \in \mathop{\mathrm{End}}(V) die bovendien commuteren, d.w.z.
{\left[{\hat{A}},{\hat{B}}\right]}={\hat{A}}{\hat{B}} - {\hat{B}}{\hat{A}}={\hat{0}}
hebben een gezamelijke spectrale decompositie
\begin{align} {\hat{P}}_{i} {\hat{P}}_j &= \delta_{i,j} {\hat{P}}_i,&\sum_{i\in I} {\hat{P}}_i = {\hat{1}}_V\\ {\hat{A}} &= \sum_{i\in I} \lambda_{i} {\hat{P}}_i&{\hat{B}} = \sum_{i\in I} \mu_{i} {\hat{P}}_i \end{align}
Veralgemeende eigenruimten en de Jordan normaalvorm
Invariante deelruimten
Voor {\hat{A}}\in \mathop{\mathrm{End}}(V), een invariante deelruimte is een deelruimte U {\preccurlyeq}V waarvoor {\hat{A}} U = \{ {\hat{A}} {u}| {u}\in U\} {\preccurlyeq}U.
De restrictie van {\hat{A}} tot U, genoteerd als \left.{\hat{A}}\right|_{U}, kan geïnterproteerd worden als een lineaire operator op U
Gegeven een basis B_U = \{{u}_1,\ldots,{u}_k\} voor U, die uitgebreid wordt tot een volledige basis B_V = \{{u}_1, \ldots, {u}_k, {u}_{k+1}, \ldots, {u}_n \} voor V, dan geldt:
{\mathsf{A}} = \Phi_{B_V} ({\hat{A}}) = \begin{bmatrix} {\mathsf{A}}_U & \cdots\\ {\mathsf{O}}& \ddots \end{bmatrix}
met {\mathsf{A}}_U = \Phi_{B_U}\left(\left.{\hat{A}}\right|_{U}\right).
Invariante deelruimten
Als we een complement U^\text{c} voor U kunnen kiezen (met dus V = U \oplus U^\text{c}) die zelf ook een invariante deelruimte is ten opzichte van {\hat{A}}, dan krijgen we
{\mathsf{A}} = \Phi_{B_V} ({\hat{A}}) = \begin{bmatrix} {\mathsf{A}}_U & {\mathsf{O}}\\ {\mathsf{O}}& {\mathsf{A}}_{U^\text{c}} \end{bmatrix} (blokdiagonaalmatrix)
met dus B_V = B_U \cup B_{U^{\text{c}}}.
Notatie: {\mathsf{A}} = {\mathsf{A}}_U \oplus {\mathsf{A}}_{U^\text{c}} (directe som van matrices)
Directe som van operatoren: gegeven {\hat{A}}_i \in \mathop{\mathrm{End}}(V_i) voor i=1,2, we definiëren {\hat{A}} = {\hat{A}}_1 \oplus {\hat{A}}_2 \in \mathop{\mathrm{End}}(V_1 \oplus V_2) via de eigenschap dat \left.{\hat{A}}\right|_{V_i} = {\hat{A}}_i voor i=1,2.
Invariante deelruimten: voorbeelden en eigenschappen
Invariante deelruimte van een gegeven operator {\hat{A}}\in\mathop{\mathrm{End}}(V)
- Triviaal: \{{o}\} en V
- Eigenvector {\mathbb{F}}{v}_{\lambda} = \{a {v}_{\lambda}; a \in {\mathbb{F}}\}; eigenruimte V_\lambda
- \mathop{\mathrm{im}}({\hat{A}}): {\hat{A}} \mathop{\mathrm{im}}({\hat{A}}) {\preccurlyeq}\mathop{\mathrm{im}}({\hat{A}})
- \mathop{\mathrm{ker}}({\hat{A}}): {\hat{A}} \mathop{\mathrm{ker}}({\hat{A}}) = \{0\} {\preccurlyeq}\mathop{\mathrm{ker}}({\hat{A}})
Invariante deelruimten
{\hat{A}} en {\hat{A}} + a {\hat{1}} hebben dezelfde invariante deelruimten
Twee reeksen van invariante deelruimten:
\{{o}\} = \mathop{\mathrm{ker}}(({\hat{A}}-{a}{\hat{1}})^0) {\preccurlyeq}\mathop{\mathrm{ker}}({\hat{A}}-{a}{\hat{1}}) {\preccurlyeq}
\qquad\qquad\mathop{\mathrm{ker}}(({\hat{A}}-{a}{\hat{1}})^2) {\preccurlyeq}\ldots {\preccurlyeq}\mathop{\mathrm{ker}}(({\hat{A}}-{a}{\hat{1}})^k) {\preccurlyeq}\ldots
V = \mathop{\mathrm{im}}(({\hat{A}}-{a}{\hat{1}})^0) {\succcurlyeq}\mathop{\mathrm{im}}({\hat{A}}-{a}{\hat{1}}) {\succcurlyeq}
\qquad\qquad\mathop{\mathrm{im}}(({\hat{A}}-{a}{\hat{1}})^2) {\succcurlyeq}\ldots {\succcurlyeq}\mathop{\mathrm{im}}(({\hat{A}}-{a}{\hat{1}})^k) {\succcurlyeq}\ldots
Dimensie van deze deelruimten is monotoon stijgend (strikte relatie, eigenlijke deelruimten) in de eerste reeks, en monotoon dalend in de tweede, tot een bepaalde index k=s, waar beide reeksen stabiliseren:
- \mathop{\mathrm{ker}}(({\hat{A}}-{a}{\hat{1}})^s) = \mathop{\mathrm{ker}}(({\hat{A}}-{a}{\hat{1}})^{s+1})= \ldots
- \mathop{\mathrm{im}}(({\hat{A}}-{a}{\hat{1}})^s) = \mathop{\mathrm{im}}(({\hat{A}}-{a}{\hat{1}})^{s+1})= \ldots
Er geldt dan ook V = \mathop{\mathrm{ker}}(({\hat{A}}-{a}{\hat{1}})^s) \oplus \mathop{\mathrm{im}}(({\hat{A}}-{a}{\hat{1}})^s)
Veralgemeende eigenruimten:
Gegeven een eigenwaarde \lambda \in \sigma_{{\hat{A}}}, dan bestaat er een s zodat
V = \underbrace{\mathop{\mathrm{ker}}(({\hat{A}}-\lambda{\hat{1}})^s)}_{\text{veralgemeende eigenruimte $U_\lambda$}} \oplus \underbrace{\mathop{\mathrm{im}}(({\hat{A}}-\lambda{\hat{1}})^s)}_{\text{complement $U_\lambda^{\text{c}}$}}
met U_\lambda en U_\lambda^{\text{c}} beide invariante deelruimten van {\hat{A}}
Per constructie is {\hat{A}}|_{U_\lambda} = \lambda {\hat{1}}_{U_\lambda} + {\hat{N}} voor een nilpotente operator {\hat{N}} met index s
\Rightarrow m_{{\hat{A}}|_{U_\lambda}}(z) = (z-\lambda)^s en k_{{\hat{A}}|_{U_\lambda}}(z) = (z-\lambda)^{\mathop{\mathrm{dim}}(U_\lambda)}
Per constructie is {\hat{A}}|_{U_{\lambda}^{\text{c}}}-\lambda {\hat{1}}_{U_\lambda^{\text{c}}} injectief/inverteerbaar, zodat {\hat{A}}|_{U_{\lambda}^{\text{c}}} geen eigenwaarden \lambda kan hebben.
\Rightarrow m_{{\hat{A}}}(z) = m_{{\hat{A}}|_{U_\lambda}}(z) m_{{\hat{A}}|_{U_\lambda^{\text{c}}}}(z) en k_{{\hat{A}}}(z) = k_{{\hat{A}}|_{U_\lambda}}(z) \underbrace{k_{{\hat{A}}|_{U_\lambda^{\text{c}}}}(z)}_{\text{geen nulpunten $\lambda$}}
\Rightarrow \mathop{\mathrm{dim}}(U_\lambda) = q_\lambda en s = s_\lambda (macht van (z-\lambda) in m_{{\hat{A}}}(z))
Veralgemeende eigenruimten: voorbeeld
p(z) = (z-1)(z+1)^2 = z^3 + z^2 - z - 1 \Rightarrow {\mathsf{C}}_p = \begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 1 & 1 & -1 \end{bmatrix}:
vanwege de constructie: \sigma_{{\mathsf{C}}_p} = \{-1, +1\} met q_{-1} = 2 en q_{+1} = 1
{\mathsf{C}}_p {v}_\lambda = \lambda {v}_\lambda \Rightarrow \boldsymbol{v}_\lambda = {a}\begin{bmatrix} 1 \\ \lambda \\ \lambda^2 \end{bmatrix} \Rightarrow r_{-1} = r_{+1} = 1
\boldsymbol{v}_{+1} = (1,1,1): V_{+1} = U_{+1} = {\mathbb{F}}\boldsymbol{v}_{+1}
\boldsymbol{v}_{-1} = (1,-1,1): V_{-1} = {\mathbb{F}}\boldsymbol{v}_{-1}
U_{-1} = \mathop{\mathrm{ker}}(({\mathsf{C}}_p - (-1) {\mathsf{I}})^2) = \mathop{\mathrm{ker}}\left(\begin{bmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \\ 1 & 1 & 0 \end{bmatrix}^2\right) = \mathop{\mathrm{ker}}\left(\begin{bmatrix} 1 & 2 & 1 \\ 1 & 2 & 1 \\ 1 & 2 & 1 \end{bmatrix}\right)
Veralgemeende eigenruimten: voorbeeld
p(z) = (z-1)(z+1)^2 = z^3 + z^2 - z - 1 \Rightarrow {\mathsf{C}}_p = \begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 1 & 1 & -1 \end{bmatrix}:
U_{-1} = \mathop{\mathrm{ker}}(({\mathsf{C}}_p - (-1) {\mathsf{I}})^2) = \mathop{\mathrm{ker}}\left(\begin{bmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \\ 1 & 1 & 0 \end{bmatrix}^2\right) = \mathop{\mathrm{ker}}\left(\begin{bmatrix} 1 & 2 & 1 \\ 1 & 2 & 1 \\ 1 & 2 & 1 \end{bmatrix}\right)
basis voor U_{-1}: \{\boldsymbol{v}_{-1}=(+1,-1,+1), \boldsymbol{w}_{-1} = (1, 0, -1)\}
{\mathsf{C}}_p \begin{bmatrix} 1 & 1\\ -1 & 0 \\ 1 & -1\end{bmatrix} = \begin{bmatrix} -1 & 0 \\ 1 & -1 \\ -1 & 2 \end{bmatrix}=\begin{bmatrix} 1 & 1\\ -1 & 0 \\ 1 & -1\end{bmatrix} \underbrace{\begin{bmatrix} -1 & 1 \\ 0 & -1\end{bmatrix}}_{\left.{\mathsf{C}}_p\right|_{U_{-1}} = (-1) {\mathsf{I}}+ {\mathsf{N}}}
Veralgemeende eigenruimten
We kunnen nu V volledig ontbinden als
V = U_{\lambda_1} \oplus U_{\lambda_1}^{\text{c}} = U_{\lambda_1} \oplus (U_{\lambda_2} \oplus \cdots) = \bigoplus_{\lambda \in \sigma_{{\hat{A}}}} U_\lambda
Elke deelruimte in deze ontbinding is een invariante deelruimte van {\hat{A}}, en er geldt
{\hat{A}}|_{U_\lambda} = \lambda {\hat{1}}_{U_\lambda} + {\hat{N}}_\lambda
met ({\hat{N}}_\lambda)^{s_\lambda} ={\hat{0}} (nilpotent met index s^\lambda)
Als alle s_\lambda=1 \Leftrightarrow alle N_\lambda={\hat{0}} \Rightarrow diagonaalvorm
Jordan normaalvorm (geen bewijzen)
We kunnen een specifieke basis kiezen voor U_\lambda zodat {\hat{N}}_\lambda een canonische vorm / normaalvorm aanneemt
Beschouw de k \times k matrix {\mathsf{N}}_k = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 & 0\\ 0 & 0 & 1 & \cdots & 0 & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots\\ 0 & 0 & 0 & \cdots & 0 & 1\\ 0 & 0 & 0 & \cdots & 0 & 0 \end{bmatrix}
\Rightarrow nilpotent met index k
Gegeven {\hat{N}} met {\hat{N}}^s={\hat{0}}, er bestaat een basis B zodat:
{\mathsf{N}} = \Phi_B({\hat{N}}) = \bigoplus_{k=1}^s \bigoplus_{i=1}^{p_k} {\mathsf{N}}_k
met p_k \geq 0 het aantal keer dat er een blok met index k voorkomt, en dus p_s \geq 1.
Jordan normaalvorm (geen bewijzen)
Jordan normaalvorm / canonische vorm: er bestaat een basis B zodat
{\mathsf{J}}_{{\hat{A}}}= \Phi_B({\hat{A}}) = \bigoplus_{\lambda \in \sigma_{{\hat{A}}}} \bigoplus_{k=1}^{s_\lambda} \bigoplus_{i=1}^{p_{\lambda,k}} {\mathsf{J}}_k(\lambda)
met J_k(\lambda) = \lambda {\mathsf{I}}_{k} + {\mathsf{N}}_k (Jordan-blokken)
en p_{\lambda,k} \geq 0 voor k=1,\ldots,s_\lambda-1 en p_{\lambda,s_\lambda} > 0
Per Jordan-blok is er 1 eigenvector: r_\lambda = \sum_{k=1}^{s_\lambda} p_{\lambda,k} en q_\lambda = \sum_{k=1}^{s_\lambda} k p_{\lambda,k}
Jordan decompositie: er bestaat een basistransformatie {\mathsf{V}} \in \mathop{\mathrm{GL}}(n,{\mathbb{C}}) zodat
{\mathsf{A}}= {\mathsf{V}} {\mathsf{J}}_{\mathsf{A}} {\mathsf{V}}^{-1} = {\mathsf{V}} \left[\bigoplus_{\lambda \in \sigma_{{\mathsf{A}}}} \bigoplus_{k=1}^{s_\lambda} \bigoplus_{i=1}^{p^{(\lambda)}_{k}} {\mathsf{J}}_k(\lambda) \right]{\mathsf{V}}^{-1}
Companion matrix herbekeken
Voor een companion matrix {\mathsf{C}} \in {\mathbb{F}}^{n \times n} met (unieke) eigenwaarden {\lambda_1,\lambda_2,\cdots,\lambda_m} geldt
r_\lambda=1 met \boldsymbol{v}_\lambda = (1,\lambda,\ldots,\lambda^{n-1}); s_\lambda=q_\lambda: 1 Jordan-blok per eigenwaarde
als m = n (alle q_\lambda=1, alle eigenwaarden verschillend): diagonalisatie van {\mathsf{C}} via
{\mathsf{V}}(\lambda_1,\ldots,\lambda_n) = \begin{bmatrix} 1 & 1 & 1 &\dots & 1\\ \lambda_1 & \lambda_2 & \lambda_3 & \dots & \lambda_n\\ \lambda_1^2 & \lambda_2^2 & \lambda_3^2 & \dots & \lambda_n^2\\ \vdots & \vdots & \vdots & \ddots & \vdots\\ \lambda_1^{n-1} & \lambda_2^{n-1} & \lambda_3^{n-1} &\dots & \lambda_n^{n-1} \end{bmatrix} (Vandermonde matrix)
q_\lambda = s_\lambda > 1: Jordan-basisvectoren voor k=1,\ldots,q_\lambda:
(\boldsymbol{u}_{\lambda,k})^i = \frac{1}{k!}\frac{{\mathrm{d}}^k }{{\mathrm{d}}\lambda^k} \lambda^{i-1} = \begin{cases} 0,& i \leq k \\ {i-1 \choose k} \lambda^{i-1-k},& i > k\end{cases}\qquad (\text{voor $i=1,\ldots,n$})
(afgeleiden als gevolg van limiet van samenvallende eigenwaarden)
Sensitiviteit van eigenwaarden en eigenruimten
- sensitiviteitsanalyse \approx perturbatietheorie
- Hoe sterk verandert de eigenwaardedecompositie of Jordandecompositie van een matrix bij een kleine variatie in de matrixcomponenten? Is er een notie van “continuïteit” of “gladheid”?
- moeilijk en uitgebreid onderwerp waarvoor we nog niet alle gereedschappen en concepten ter beschikking hebben (normen, hermitische matrices, …)
Sensitiviteit van eigenwaarden en eigenruimten
Voorbeeld 1: {\mathsf{A}}_1({\varepsilon}) = \begin{bmatrix} 0 & 1\\ {\varepsilon}& 0 \end{bmatrix}
- {\varepsilon}= 0: \sigma_{{\mathsf{A}}}=\{0\} met q_0 = s_0 = 2, r_0=1: 1 Jordan blok
- {\varepsilon}> 0: \sigma_{{\mathsf{A}}}=\{+\sqrt{{\varepsilon}},-\sqrt{{\varepsilon}}\} en {\mathsf{V}}({\varepsilon}) = \begin{bmatrix} 1 & 1 \\ +\sqrt{{\varepsilon}} & -\sqrt{{\varepsilon}} \end{bmatrix}
Voorbeeld 2: {\mathsf{A}}_2({\varepsilon}) = \begin{bmatrix} 0 & 1\\ 0 & {\varepsilon}\end{bmatrix}
- {\varepsilon}= 0: \sigma_{{\mathsf{A}}}=\{0\} met q_0 = s_0 = 2, r_0=1: 1 Jordan blok
- {\varepsilon}> 0: \sigma_{{\mathsf{A}}}=\{0,{\varepsilon}\} met {\mathsf{V}}({\varepsilon}) = \begin{bmatrix} 1 & 1 \\ 0 & {\varepsilon}\end{bmatrix}
Problemen omdat \mathop{\mathrm{GL}}(V) niet compact is: limieten van inverteerbare matrices kunnen niet-inverteerbare matrices opleveren
Verwante eigenwaardenproblemen
- {\mathsf{A}} \boldsymbol{v} = \lambda \boldsymbol{v} \Rightarrow {\overline{{\mathsf{A}}}} {\overline{\boldsymbol{v}}} = {\overline{\lambda}} {\overline{\boldsymbol{v}}}
{\mathsf{A}} reëel: voor elke \lambda \in {\mathbb{C}} is ook {\overline{\lambda}} een eigenwaarde (complex toegevoegde paren), bijbehorende eigenvectoren zijn ook complex toegevoegd
{\mathsf{A}} reëel en \lambda reëel: zowel \boldsymbol{v} als {\overline{\boldsymbol{v}}} zijn eigenvectoren, en dus ook de reële combinaties \mathop{\mathrm{Re}}(\boldsymbol{v}) = (\boldsymbol{v}+{\overline{\boldsymbol{v}}})/2 en \mathop{\mathrm{Im}}(\boldsymbol{v}) = (\boldsymbol{v}+{\overline{\boldsymbol{v}}})/(2{\mathrm{i}}) (minstens 1 van beide is niet nul)
\Rightarrow eigenvectoren horende bij reële eigenwaarden kunnen reëel worden gekozen
Verwante eigenwaardenproblemen
{\mathsf{A}} en {\mathsf{A}}^{\mathsf{T}} hebben dezelfde karakteristieke veelterm (en minimaalveelterm)
Voor elke eigenwaarde \lambda van {\mathsf{A}} bestaan er ook “linkse” eigenvectoren
\boldsymbol{w}^{\mathsf{T}}{\mathsf{A}} = \lambda \boldsymbol{w}^{\mathsf{T}}\iff {\mathsf{A}}^{\mathsf{T}}\boldsymbol{w} = \lambda \boldsymbol{w}
Intrinsieke betekenis:
als {\mathsf{A}} = \Phi_B({\hat{A}}) voor een basis B=\{{e}_1,\ldots,{e}_n\}, beschouw dan duale basis B^\ast=\{\varepsilon^1,\ldots,\varepsilon^n\} met \varepsilon^i[{e}_j] = \delta^i_{\ j}:
\omega = w_i \varepsilon^i voldoet aan {\hat{A}}^\ast(\omega) = \lambda \omega
Verwante eigenwaardenproblemen
Stel {\hat{A}}^\ast(\omega') = \lambda' \omega' en {\hat{A}}{v}= \lambda {v}:
\omega'[{\hat{A}}{v}] = ({\hat{A}}^\ast \omega')[{v}] \Rightarrow \lambda \omega'[{v}] = \lambda' \omega'[{v}]
\lambda \neq \lambda' \Rightarrow \omega'[{v}] = 0
\lambda = \lambda' : \omega[{v}] \neq 0?
Uit Jordan-decompositie {\mathsf{J}}_{{\mathsf{A}}} = \bigoplus_{\lambda \in \sigma_{{\hat{A}}}} \bigoplus_{k=1}^{s_\lambda} \bigoplus_{i=1}^{p^{(\lambda)}_{k-1}} {\mathsf{J}}^{(k)}(\lambda) leren we dat elke Jordan-blok één rechtse eigenvector oplevert (de basisvector geassocieerd met de eerste kolom van het blok), en één linkse eigenvector (de basisvector geassocieerd met de laatste rij van het blok)
\Rightarrow \omega[{v}] \neq 0 enkel als ze horen bij een Jordan-blok van grootte 1
Functies van lineaire operatoren
Functies van lineaire operatoren
We kunnen al veeltermen p({\hat{A}}) en inverses {\hat{A}}^{-1} berekenen:
samen geeft dit alle rationale functies r({\hat{A}})=p({\hat{A}})/q({\hat{A}})
Andere functies f van {\hat{A}} \in \mathop{\mathrm{End}}(V)?
Hoe definieren we f({\hat{A}})?
Functies van lineaire operatoren: verwachtingen
{\hat{A}}{v}= \lambda {v}\Rightarrow f({\hat{A}}){v}= f(\lambda){v}
f moet goed gedefinieerd zijn voor alle \lambda \in \sigma_{{\hat{A}}}
Voor elke lineaire transformatie {\hat{T}} \in \mathop{\mathrm{Hom}}(V,W): f({\hat{T}} {\hat{A}} {\hat{T}}^{-1}) = {\hat{T}} f({\hat{A}}) {\hat{T}}^{-1}
Voor {\hat{A}} \in \mathop{\mathrm{End}}(V) en {\hat{B}} \in \mathop{\mathrm{End}}(W): f({\hat{A}} \oplus {\hat{B}}) = f({\hat{A}}) \oplus f({\hat{B}})
(blokdiagonale matrix: f werkt op afzonderlijke diagonaalblokken)
Voor {\hat{A}},{\hat{B}} \in \mathop{\mathrm{End}}(V) met {\left[{\hat{A}},{\hat{B}}\right]}={\hat{0}} en twee functies f,g: {\left[f({\hat{A}}),g({\hat{B}})\right]}={\hat{0}}
Functies van lineaire operatoren: definitie 1
Als {\hat{A}} diagonaliseerbaar is, definitie van f({\hat{A}}) via diagonaalvorm / spectrale decompositie:
{\hat{A}} = \sum_{\lambda} \lambda {\hat{P}}_\lambda \Rightarrow f({\hat{A}}) = \sum_\lambda f(\lambda) {\hat{P}}_\lambda
Voorbeeld:
{\mathsf{A}} = \begin{bmatrix} 0 & -\theta\\ \theta & 0 \end{bmatrix} = \underbrace{\begin{bmatrix} 1 & 1 \\ -{\mathrm{i}}& +{\mathrm{i}}\end{bmatrix}}_{{\mathsf{V}}} \underbrace{\begin{bmatrix} {\mathrm{i}}\theta & 0 \\ 0 & -{\mathrm{i}}\theta\end{bmatrix}}_{{\mathsf{D}}} \underbrace{\begin{bmatrix} \frac{1}{2} & +\frac{{\mathrm{i}}}{2} \\ \frac{1}{2} & -\frac{{\mathrm{i}}}{2}\end{bmatrix}}_{{\mathsf{V}}^{-1}}
\exp({\mathsf{A}}) = \begin{bmatrix} 1 & 1 \\ -{\mathrm{i}}& +{\mathrm{i}}\end{bmatrix} \begin{bmatrix} {\mathrm{e}}^{{\mathrm{i}}\theta } & 0 \\ 0 & {\mathrm{e}}^{-{\mathrm{i}}\theta} \end{bmatrix} \begin{bmatrix} \frac{1}{2} & +\frac{{\mathrm{i}}}{2} \\ \frac{1}{2} & -\frac{{\mathrm{i}}}{2}\end{bmatrix} = \begin{bmatrix} \cos(\theta) & -\sin(\theta) \\ \sin(\theta) & \cos(\theta) \end{bmatrix}
Functies van lineaire operatoren: definitie 2
Als f(z) = \sum_{n=0}^{+\infty} f_n z^n een Taylorreeks rond z=0 (Maclaurin reeks) heeft:
f({\hat{A}}) = \sum_{n=0}^{+\infty} f_n {\hat{A}}^n
Betekenis van een reeks van een operator? Convergentie? Zie Hoofdstuk 4
Voorbeeld: f(z)=\exp(z)=\sum_{n=0}^{+\infty} \frac{1}{n!} z^n
{\mathsf{A}}^{2n+1} = (-1)^{n} \begin{bmatrix} 0 & -\theta^{2n+1}\\ \theta^{2n+1} & 0 \end{bmatrix} en {\mathsf{A}}^{2n} = (-1)^n \begin{bmatrix} \theta^{2n} & 0\\ 0 & \theta^{2n} \end{bmatrix} voor alle n\in {\mathbb{N}}
f({\mathsf{A}}) = \sum_{n=0}^{+\infty} \frac{(-1)^n}{(2n)!} \begin{bmatrix} \theta^{2n} & 0\\ 0 & \theta^{2n} \end{bmatrix} + \sum_{n=0}^{+\infty} \frac{(-1)^n}{(2n+1)!}\begin{bmatrix} 0 & -\theta^{2n+1}\\ \theta^{2n+1} & 0 \end{bmatrix}
\qquad = \begin{bmatrix} \cos(\theta) & -\sin(\theta) \\ \sin(\theta) & \cos(\theta) \end{bmatrix}
Functies van lineaire operatoren: definitie 3
Via Jordan-decompositie: f({\mathsf{A}}) = {\mathsf{V}} \left[\bigoplus_{\lambda \in \sigma_{{\mathsf{A}}}} \bigoplus_{k=1}^{s_\lambda} \bigoplus_{i=1}^{p^{(\lambda)}_{k}} f\left({\mathsf{J}}_k(\lambda)\right) \right]{\mathsf{V}}^{-1}
functie van een Jordan-blok J_k(\lambda): voldoende dat f een Taylorreeks rond z=\lambda heeft met eindige convergentieradius a:
f(z) = \sum_{n=0}^{+\infty} \frac{f^{(n)}(\lambda)}{n!} (z - \lambda)^n, \qquad \forall z\ \text{met}\ |z - \lambda| < a,\ \text{voor een $a > 0$}
f(J_k(\lambda)) = \sum_{n=0}^{+\infty} \frac{f^{(n)}(\lambda)}{n!} (J_k(\lambda) - \lambda{\mathsf{I}}_k)^n = \sum_{n=0}^{+\infty} \frac{f^{(n)}(\lambda)}{n!} ({\mathsf{N}}_k)^n = \sum_{n=0}^{k-1} \frac{f^{(n)}(\lambda)}{n!} ({\mathsf{N}}_k)^n
\Rightarrow f({\mathsf{J}}^{(k)}(\lambda)) = \begin{bmatrix} f(\lambda) & f^{(1)}(\lambda) & \frac{f^{(2)}(\lambda)}{2} & \frac{f^{(3)}(\lambda)}{3!} & \cdots & \frac{f^{(k-2)}(\lambda)}{(k-2)!} & \frac{f^{(k-1)}(\lambda)}{(k-1)!}\\ 0 & f(\lambda) & f^{(1)}(\lambda) & \frac{f^{(2)}(\lambda)}{2} & \cdots & \frac{f^{(k-3)}(\lambda)}{(k-3)!} & \frac{f^{(k-2)}(\lambda)}{(k-2)!}\\ 0 & 0 & f(\lambda) & f^{(1)}(\lambda) & \cdots & \frac{f^{(k-4)}(\lambda)}{(k-4)!} & \frac{f^{(k-3)}(\lambda)}{(k-3)!}\\ 0 & 0 & 0 & f(\lambda) & \cdots & \frac{f^{(k-5)}(\lambda)}{(k-5)!} & \frac{f^{(k-4)}(\lambda)}{(k-4)!}\\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots\\ 0 & 0 & 0 & 0 & \cdots & f(\lambda) & f^{(1)}(\lambda)\\ 0 & 0 & 0 & 0 & \cdots & 0 & f(\lambda) \end{bmatrix}
Exponentiële functie
\exp(t J^{(k)}(\lambda)) = e^{t \lambda} \left({\mathsf{I}}+ t {\mathsf{N}}_k + \frac{t^2}{2} \big({\mathsf{N}}_k\big)^2 + \ldots \right) \\ = e^{t \lambda} \begin{bmatrix} 1 & t & \frac{t^2}{2} & \frac{t^3}{3!} & \cdots & \frac{t^{k-2}}{(k-2)!} & \frac{t^{k-1}}{(k-1)!}\\ 0 & 1 & t & \frac{t^2}{2} & \cdots & \frac{t^{k-3}}{(k-3)!} & \frac{t^{k-2}}{(k-2)!}\\ 0 & 0 & 1 & t & \cdots & \frac{t^{k-4}}{(k-4)!} & \frac{t^{k-3}}{(k-3)!}\\ 0 & 0 & 0 & 1 & \cdots & \frac{t^{k-5}}{(k-5)!} & \frac{t^{k-4}}{(k-4)!}\\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots\\ 0 & 0 & 0 & 0 & \cdots & 1 & t\\ 0 & 0 & 0 & 0 & \cdots & 0 & 1 \end{bmatrix}
Exponentiële functie: eigenschappen
\exp({\hat{A}}) is goed gedefinieerd en uniek
exponentiële van reële matrix is reëel
{\mathrm{e}}^{t_1 {\hat{A}}} {\mathrm{e}}^{t_2{\hat{A}}} = {\mathrm{e}}^{(t_1 + t_2){\hat{A}}} en (\exp({\hat{A}}))^{-1} = \exp(-{\hat{A}})
\det(\exp({\hat{A}})) = \exp(\mathop{\mathrm{tr}}({\hat{A}}))
\frac{{\mathrm{d}}\ }{{\mathrm{d}}t} {\mathrm{e}}^{t{\hat{A}}} = {\hat{A}} {\mathrm{e}}^{t {\hat{A}}} = {\mathrm{e}}^{t{\hat{A}}} {\hat{A}}
Maar niet:
\exp({\hat{A}} + {\hat{B}}) \neq \exp({\hat{A}})\exp({\hat{B}}) \neq \exp({\hat{B}})\exp({\hat{A}})
\frac{{\mathrm{d}}\ }{{\mathrm{d}}t} {\mathrm{e}}^{{\mathsf{A}}(t)}\neq \frac{{\mathrm{d}}{\mathsf{A}}(t)}{{\mathrm{d}}t} {\mathrm{e}}^{{\mathsf{A}}(t)}\neq {\mathrm{e}}^{{\mathsf{A}}(t)} \frac{{\mathrm{d}}{\mathsf{A}}(t)}{{\mathrm{d}}t}
Exponentiële functie: eigenschappen
Baker-Campbell-Haussdorf formule: e^{t{\hat{A}}} e^{t{\hat{B}}} = e^{{\hat{C}}} met {\hat{C}} = t({\hat{A}} + {\hat{B}}) + \frac{t^2}{2} {\left[{\hat{A}},{\hat{B}}\right]} +
\qquad \frac{t^3}{12} {\left[{\hat{A}},{\left[{\hat{A}},{\hat{B}}\right]}\right]}- \frac{t^3}{12} {\left[{\hat{B}},{\left[{\hat{A}},{\hat{B}}\right]}\right]}+\mathop{\mathrm{\mathscr{O}}}(t^4)
Zassenhaus formule
e^{t({\hat{A}}+{\hat{B}})} = e^{t{\hat{A}}} e^{t{\hat{B}}} e^{-\frac{t^2}{2} {\left[{\hat{A}},{\hat{B}}\right]}}e^{\frac{t^3}{6}\left(2 {\left[{\hat{B}},{\left[{\hat{A}},{\hat{B}}\right]}\right]}+ {\left[{\hat{A}},{\left[{\hat{A}},{\hat{B}}\right]}\right]}\right)}\cdots
Bewijs: door uitwerking van de Taylorreeks en vergelijken van de machten in t
Logaritmische functie en machten
f(z) = \log(z) of f(z)=z^{\alpha} met \alpha \not\in{\mathbb{N}}: geen Taylorreeks rond z=0
\begin{align*} \log(z) &= \log(\lambda + (z-\lambda)) = \log(\lambda) + \log\left(1 + \frac{z-\lambda}{\lambda}\right) \\ &= \log(\lambda) + \sum_{n=1}^{+\infty} (-1)^{n+1} \frac{(z-\lambda)^n}{n\lambda^n} \end{align*}
\begin{equation} z^\alpha = \lambda^\alpha\left(1 + \frac{z-\lambda}{\lambda}\right)^\alpha = \lambda^\alpha \sum_{n=0}^{+\infty} \frac{\alpha (\alpha-1) \cdots (\alpha - n + 1)}{n!}\left(\frac{z-\lambda}{\lambda}\right)^n \end{equation}
Voor de definitie van \log(\lambda) of \lambda^{\alpha}: meerdere keuzes (vertakkingslijnen in complexe analyse)
\Rightarrow typisch niet uniek (meerdere {\hat{B}} voldoen aan {\hat{A}}=\exp({\hat{B}}) voor gegeven {\hat{A}}), maar altijd mogelijk zolang geen \lambda=0
Logaritmische functie en machten
- Voorbeeld: J_3(\lambda)^{1/2}=\begin{bmatrix} \lambda & 1 & 0\\ 0 & \lambda & 1 \\ 0 & 0 & \lambda \end{bmatrix}^{1/2} = \begin{bmatrix} \sqrt{\lambda} & \frac{1}{2\sqrt{\lambda}} & -\frac{1}{4 \lambda^{3/2}}\\ 0 & \sqrt{\lambda} & \frac{1}{2\sqrt{\lambda}} \\ 0 & 0 & \sqrt{\lambda}\end{bmatrix}
Toepassing: lineaire dynamische systemen
(enkel voor oefeningen/project)
Dynamische systemen
Een dynamisch systeem is een algemene naam voor de wiskundige modellering van een tijdsafhankelijk fenomeen of process van natuurlijke of menselijke origine (fysisch, chemisch, biologisch, ecologisch, economisch, sociaal, …).
Dynamische systemen
Ingrediënten van een (deterministisch en autonoom/translatie-invariant) dynamisch systeem:
Toestandsruimte / configuratieruimte S: verzameling van toestanden waarin het systeem zich op bepaald tijdstip kan bevinden
Verzameling T van tijdstippen t waarover het systemen kan worden geëvolueerd, waarbij tijdstippen kunnen worden opgeteld: t_1 + t_2 \in T voor alle t_1,t_2 \in T
(T,+) is een abelse monoïde; inverse evolutie moet niet bestaan
Evolutieregel \Phi_t:S\to S voor alle t \in T zodat \Phi_{t_1} \circ \Phi_{t_2} = \Phi_{t_1 + t_2} en \Phi_0 = \mathop{\mathrm{id}}_S
Dynamische systemen
- In deze cursus: S is vectorruimte
- Evolutieregel vaak geschreven als \Phi:T \times S \to S
- Opsplitsing in:
- T = ({\mathbb{R}}_{\geq 0},+): continue (tijd) dynamisch systemen
- T = ({\mathbb{N}}, +): discrete (tijd) dynamisch systemen
- Algemene concepten:
- ‘fixpunt’, vast punt of evenwichtspunt x^\ast: \Phi(t,x^\ast) = x^\ast, \forall t \in T
- traject \gamma_x: T\to S : t \mapsto \Phi(t,x); baan O_x = \gamma_x(T)
Discreet dynamisch systeem
\Phi_n(x) = (\Phi_{n-1} \circ \phi)(x) = \underbrace{\phi \circ \phi \circ \cdots \circ \phi}_{\text{$n$ times}}(x) = \phi^n(x)
met \phi = \Phi_1
\Rightarrow \boldsymbol{x}_{n+1} = \phi(x_{n}) : recurrentierelatie, iteratief process
Discreet dynamisch systeem
Beschouw nu S = {\mathbb{R}}^m: \boldsymbol{x}, \boldsymbol{\phi},
Evenwichtspunt: \boldsymbol{\phi}(\boldsymbol{x}^\ast) = \boldsymbol{x}^\ast
Affien: \boldsymbol{\phi}(\boldsymbol{x}) = {\mathsf{A}}\boldsymbol{x}+\boldsymbol{b}; linear: \boldsymbol{\phi}(\boldsymbol{x}) = {\mathsf{A}}\boldsymbol{x}
Typische dynamische systemen zijn niet linear:
\Rightarrow linearisatie rond evenwichtspunt
\boldsymbol{\phi}(\boldsymbol{x}_\ast + \boldsymbol{y}_n) \approx \underbrace{\boldsymbol{\phi}(\boldsymbol{x}^\ast)}_{= \boldsymbol{x}^\ast} + \underbrace{\sum_{j=1}^{n}\frac{\partial \boldsymbol{\phi}}{\partial x^j}(\boldsymbol{x}^\ast) (\boldsymbol{y}_n)^j}_{={\mathsf{J}}_{\boldsymbol{\phi}}(\boldsymbol{x}^\ast) \boldsymbol{y}_n}+ \mathop{\mathrm{\mathscr{O}}}(\boldsymbol{y}^2)
\Rightarrow eigenschappen van {\mathsf{J}}_{\varphi}(\boldsymbol{x}^\ast) bepalen gedrag rond en stabiliteit van \boldsymbol{x}^\ast
Discreet dynamisch systeem
\boldsymbol{x}_n = {\mathsf{A}} \boldsymbol{x}_{n-1} \Rightarrow \boldsymbol{x}_n = {\mathsf{A}}^n \boldsymbol{x}_0
Perturbaties rond \boldsymbol{x}^\ast=\boldsymbol{0} bepaald door eigenwaarden (Jordan-decompositie) van {\mathsf{A}}:
- {\left\lvert\lambda\right\rvert} > 1: afstand tot evenwichtspunt neemt exponentieel toe
- alle {\left\lvert\lambda\right\rvert} < 1: perturbaties rond evenwicht convergeren terug naar evenwichtspunt \Rightarrow stabiliteit
- \lambda = \exp({\mathrm{i}}2\pi/p) periodieke oplossingen met periode p
Recurrentierelaties
Dynamisch systeem: \boldsymbol{x}_{n+1}= \boldsymbol{\phi}(\boldsymbol{x}_n)
Meer algemeen: \boldsymbol{x}_{n+1}= \boldsymbol{\phi}(n, \boldsymbol{x}_n)
Niet autonoom / tijdshomogeen / translatie-invariant
Hogere orde (maar autonoom): \boldsymbol{x}_{n+k} = \boldsymbol{\phi}(\boldsymbol{x}_{n}, \dots, \boldsymbol{x}_{n+k-2}, \boldsymbol{x}_{n+k-1})
kan omgezet worden in een eerste orde relatie voor \boldsymbol{y}_{n} = (\boldsymbol{x}_{n}, \dots, \boldsymbol{x}_{n+k-2}, \boldsymbol{x}_{n+k-1}) \in {\mathbb{R}}^{km}
\begin{align*}\small \boldsymbol{y}_{n+1} = \boldsymbol{\psi}(\boldsymbol{y}_n) &= \boldsymbol{\psi}(\boldsymbol{x}_{n}, \dots, \boldsymbol{x}_{n+k-2}, \boldsymbol{x}_{n+k-1}) \\ &= (\boldsymbol{x}_{n+1}, \dots, \boldsymbol{x}_{n+k-1}, \boldsymbol{\phi}(\boldsymbol{x}_{n}, \dots, \boldsymbol{x}_{n+k-2}, \boldsymbol{x}_{n+k-1})) \end{align*}
Recurrentierelaties
\boldsymbol{x}_{n+k} = {\mathsf{A}}_{0} \boldsymbol{x}_{n} + {\mathsf{A}}_{1} \boldsymbol{x}_{n+1} + \dots + {\mathsf{A}}_{k-2} \boldsymbol{x}_{n+k-2} + {\mathsf{A}}_{k-1} \boldsymbol{x}_{n_k-1}
\begin{equation} \Rightarrow \boldsymbol{y}_{n+1} = \begin{bmatrix} \boldsymbol{x}_{n+1} \\ \boldsymbol{x}_{n+2} \\ \dots \\ \boldsymbol{x}_{n+k-1} \\ \boldsymbol{x}_{n+k} \end{bmatrix} = \begin{bmatrix} {\mathsf{O}}& {\mathsf{I}}& \dots & {\mathsf{O}}& {\mathsf{O}}\\ {\mathsf{O}}& {\mathsf{O}}& \dots & {\mathsf{O}}& {\mathsf{O}}\\ \vdots & \vdots & \ddots & \vdots & \vdots\\ {\mathsf{O}}& {\mathsf{O}}& \dots & {\mathsf{O}}& {\mathsf{I}}\\ {\mathsf{A}}_{0} & {\mathsf{A}}_{1} & \dots & {\mathsf{A}}_{k-2} & {\mathsf{A}}_{k-1} \end{bmatrix}\begin{bmatrix} \boldsymbol{x}_{n} \\ \boldsymbol{x}_{n+1} \\ \dots \\ \boldsymbol{x}_{n+k-2} \\ \boldsymbol{x}_{n+k-1} \end{bmatrix}. \end{equation}
Voor k=1 (x_n scalair): y_{n+1} = {\mathsf{C}} \boldsymbol{y}_n = {\mathsf{C}}^{n+1}\boldsymbol{y}_0 met {\mathsf{C}} een companion matrix
Algemene oplossing is een lineaire combinatie van elementaire oplossingen x_n = n^j \lambda^n voor \lambda een nulpunt van de bijbehorende polynoom en j=0,1,\ldots,q-1 met q de algebraïsche multipliciteit van \lambda.
Polynoom voor \lambda kan gevonden worden door oplossingen x_n=\lambda^n in te vullen in de recurrentierelatie
Lineaire combinatie vinden door te “matchen” met beginvoorwaarden x_0,\ldots,x_{k-1}.
Recurrentierelatie: voorbeeld
Bekendste voorbeeld: Fibonacci
x_{n+2} = x_{n} + x_{n+1}
\Rightarrow \lambda^2 = \lambda + 1
\Rightarrow: \lambda = \frac{1\pm \sqrt{5}}{2}
x_0 = 0, x_1 = 1 \Rightarrow (x_n)_{n \in {\mathbb{N}}} = (0,1,1,2,3,5,8,13,\ldots)
\Rightarrow x_n = \frac{1}{\sqrt{5}} \left[\left(\frac{1 + \sqrt{5}}{2}\right)^n - \left(\frac{1 - \sqrt{5}}{2}\right)^n\right]
Continue dynamische systemen
Er is geen “kleinste eenheid van evolutie”
\dot{\boldsymbol{x}}(t) = \boldsymbol{\varphi}(\boldsymbol{x}(t)) (eerste orde differentiaalvergelijking)
Evenwichtspunt \boldsymbol{\varphi}(\boldsymbol{x}^\ast) = \boldsymbol{0}
Linearisatie rond evenwichtspunt
\boldsymbol{\varphi}(\boldsymbol{x}_\ast + \boldsymbol{y}(t)) \approx \underbrace{\boldsymbol{\phi}(\boldsymbol{x}^\ast)}_{=\boldsymbol{0}} + \underbrace{\sum_{j=1}^{n}\frac{\partial \boldsymbol{\varphi}}{\partial x^j}(\boldsymbol{x}^\ast) (\boldsymbol{y}(t))^j}_{={\mathsf{J}}_{\boldsymbol{\phi}}(\boldsymbol{x}^\ast) \boldsymbol{y}(t)}+ \mathop{\mathrm{\mathscr{O}}}(\boldsymbol{y}^2)
Continue dynamische systemen
Lineaire systemen: \dot{\boldsymbol{x}}(t) = {\mathsf{A}}\boldsymbol{x}(t)
\Rightarrow\boldsymbol{x}(t) = {\mathrm{e}}^{t{\mathsf{A}}} \boldsymbol{x}_0
Perturbaties rond \boldsymbol{x}^\ast=\boldsymbol{0} bepaald door eigenwaarden (Jordan-decompositie) van {\mathsf{A}}:
- alle \mathop{\mathrm{Re}}{\lambda}<0: perturbaties sterven uit, evenwichtspunt stabiel
- een \mathop{\mathrm{Re}}{\lambda}>0: perturbatie groeit exponentieel in de tijd
- \lambda = {\mathrm{i}}2\pi/p: periodieke baan met periode p
Hogere orde differentiaalvergelijkingen
\boldsymbol{x}^{(k)}(t) = \boldsymbol{\varphi}(t, \boldsymbol{x}(t), \dot{\boldsymbol{x}(t)},\ldots, \boldsymbol{x}^{(k-1)}(t))
Herleidbaar naar eerste orde differentiaalvergelijking voor \boldsymbol{y}(t) = (\boldsymbol{x}(t), \dot{\boldsymbol{x}}(t), \ddot{\boldsymbol{x}}(t), \dots, \boldsymbol{x}^{(k-1)}(t))
Voor k=1 (x(t) scalair):
x^{(k)}(t) = a_{0} x(t) + a_{1} \dot{x}(t) + \dots + a_{k-2} x^{(k-2)}(t) + a_{k-1} x^{(k-1)}(t)
\Rightarrow \dot{\boldsymbol{y}}(t) = {\mathsf{C}} \boldsymbol{y}(t) met {\mathsf{C}} een companion matrix
Algemene oplossing is een lineaire combinatie van elementaire oplossingen x(t) = t^j {\mathrm{e}}^{\lambda t} voor \lambda een nulpunt van de bijbehorende polynoom en j=0,1,\ldots,q-1 met q de algebraïsche multipliciteit van \lambda
Polynoom voor \lambda kan gevonden worden door oplossingen x(t)={\mathrm{e}}^{\lambda t} in te vullen in de recurrentierelatie
Lineaire combinatie vinden door te “matchen” met beginvoorwaarden x(0),\dot{x}(0),\ldots,x^{(k-1)}(0).