Ortogonální projektory na podprostor

Ortogonální projekce$ V$ do $ W\subset V$ je zobrazení, které $ \vec{v}\in V$ přiřadí $ \vec{w}=P\vec{v}$ tak, že $ \vec{v}-\vec{w}$ je kolmý na podprostor $ W$, viz obrázek. Lze jednoduše ukázat, že $ P\vec{v}$ je mezi vektory z $ W$ nejlepší aproximace vektoru $ \vec{v}\in V$, tedy $ \Vert\vec{v}-\vec{x}\Vert$, $ \vec{x}\in W$ nabývá minima pro $ \vec{x}=P\vec{v}$.

Úkol: Najděte matice zobrazení, které $ \vec{v} \in$   {\bb R}$ ^{4}$ přiřadí ortogonální projekci $ \vec{v}$ na následující zadané podprostory (matice určete vzhledem ke kanonické bázi):

Ortogonální projekce vektoru z  {\bb R}$ ^3$ do {\bb R}$ ^2$. (0.32,2cm)[r]\begin{center}\vbox{\input{OBRAZKY/projtor.fig}
}\end{center}0


a) $ W_{1}=${\Cal L}$ \big((1,-2,0,2)\big)$,


b) $ W_{2}=${\Cal L}$ \bigl(\,\{(1,1,-1,-1),\;(1,0,-1,0)\}\,\bigr)$,


c) $ W_{3}=${\Cal L}$ \bigl(\,\{(1,-1,1,-1),\;(1,1,1,1)\}\,\bigr)$.


d) Ověřte, že všechny tyto matice jsou symetrické a idempotentní ($ A^2=A$), a vysvětlete, proč tomu tak musí být u všech ortogonálních projektorů.

Za skalární součin berte složkový součin $ \vec{x}\cdot \vec{y}=\sum_i x_iy_i$.


Řešení:


a) Je třeba si uvědomit, že skalární součin libovolného vektoru $ \vec{v}$ s libovolným jednotkovým vektorem $ \vec{j}$ je velikost (ortogonálního) průmětu vektoru $ \vec{v}$ do směru daného vektorem $ \vec{j}$ (do podprostoru {\Cal L}$ (\vec{j})$). Navíc víme, že promítnutý vektor leží ve zvoleném podprostoru, takže vektor $ \vec{p}$ vzniklý projekcí je

$\displaystyle \vec{p} = (\vec{v}\cdot\vec{j}\,)\vec{j}$

Z libovolného vektoru vytvoříme jednotkový vektor tím, že jej vydělíme jeho velikostí (normou). Zobrazení $ f$, které vektoru $ \vec{v}$ přiřadí jeho projekci do směru daného obecným vektorem $ \vec{s}$, má proto předpis

$\displaystyle f(\vec{v})=\frac{1}{\Vert s\Vert^{2}}\:(\vec{v}.\vec{s})\:\vec{s}$

Nyní můžeme s využitím vzorečku pro skalární součin vyjádřit $ i$-tou složku $ f(\vec{v})$:

$\displaystyle [f(\vec{v})]_{i}=\frac{1}{\Vert s\Vert^{2}}\:s_{i}\:\sum_{j=1}^{4}\:s_{j}v_{j}$

To lehce upravíme do tvaru

$\displaystyle [f(\vec{v})]_{i}=\sum_{j=1}^{4}\:\left(\frac{1}{\Vert s\Vert^{2}}\:s_{i}s_{j}\right)\:v_{j}$

Lineární zobrazení lze napsat ve tvaru součinu matice (které říkáme matice zobrazení) a vektoru, na který toto zobrazení působí. Tvar, do kterého jsme převedli naše zobrazení, přesně odpovídá maticovému násobení. Když si rozmyslíme, co která část výrazu znamená, zjistíme, že matice zobrazení $ A$ je

$\displaystyle A_{ij}\equiv (f)_{ij}=\frac{1}{\Vert s\Vert^{2}}\:s_{i}s_{j}\,,\q...
...
-2 & 4 & 0 & -4 \cr
0 & 0 & 0 & 0 \cr
2 & -4 & 0 & 4 \cr\end{array}\right)
$


b) Využijeme tvrzení (viz příklad 4.8), že pokud je $ \vec{u}_1,\ldots,\vec{u}_n$ ortogonální báze, pak lze složky libovolného vektoru $ \vec{w}$ vůči této bázi psát jako $ w_i=\vec{u}_i\cdot\vec{w}/\Vert\vec{u}_i\Vert^2$. Je proto nejprve potřeba najít ve $ W_2=${\Cal L}$ (\{\vec{u}_1,\vec{u}_2\})$ nějakou ortogonální bázi $ \{\vec{o}_{1},\vec{o}_{2}\}$. Projekce na prostor {\Cal L}$ (\{\vec{o}_1,~\vec{o}_2\})$ je potom dána součtem projekcí na $ L(\vec{o}_1)$ a $ L(\vec{o}_2)$. To samé pak platí i pro jejich matice.

Ortogonální bázi najdeme například Gramm-Schmidtovou ortogonalizací:

$\displaystyle \vec{o}_1=\vec{u}_{1}=(1,~1,~-1,~-1)\,,\quad \vec{u}_{2}=(1,~0,~-1,~0)
$

Vektor $ \vec{o}_2$, pak hledáme ve tvaru

$\displaystyle \vec{o}_2=\vec{o}_1\:+\:\alpha \vec{u}_{2}\,,$

přičemž $ \vec{o}_1$ a $ \vec{o}_2$ na sebe musí být kolmé, tedy jejich skalární součin musí být nulový. Z  $ 0=\vec{u}_1\cdot\vec{u}_1+\alpha\vec{u}_1\cdot\vec{u}_2$ lehce spočítáme $ \alpha=-2$, neboli

$\displaystyle \vec{o}_2=(-1,~1,~1,~-1)\,.$

Matice projekce na prvky báze jsou

$\displaystyle P_{\vec{o}_1}=\frac{1}{4}\left(\begin{array}{ccccccccccccc}
1 &...
... & 1 & 1 & -1 \cr
-1 & 1 & 1 & -1 \cr
1 & -1 & -1 & 1 \cr
\end{array}\right)$

Matice $ B$ je součtem $ P_{\vec{o}_1}$ a $ P_{\vec{o}_2}$:

$\displaystyle B=B_{\vec{o}_1}\:+\:B_{\vec{o}_2}=\frac{1}{2}\left(\begin{array}{...
...
0 & 1 & 0 & -1 \cr
-1 & 0 & 1 & 0 \cr
0 & -1 & 0 & 1 \cr
\end{array}\right)$


c) Tady odpadá práce s hledáním ortogonální báze, protože zadané vektory ( $ \vec{u}_{3}$ a $ \vec{u}_{4}$) už jsou na sebe kolmé. Najdeme tedy matice projekcí na tyto vektory:

$\displaystyle P_{\vec{u}_3}=\frac{1}{4}\left(\begin{array}{ccccccccccccc}
1 &...
...cr
1 & 1 & 1 & 1 \cr
1 & 1 & 1 & 1 \cr
1 & 1 & 1 & 1 \cr
\end{array}\right)$

Výsledná matice projekce na celý podprostor je opět součtem těchto matic:

$\displaystyle P=P_{\vec{u}_3}\:+\:P_{\vec{u}_4}=\frac{1}{2}\left(\begin{array}{...
...cr
0 & 1 & 0 & 1 \cr
1 & 0 & 1 & 0 \cr
0 & 1 & 0 & 1 \cr
\end{array}\right)$

Tuto úlohu šlo řešit ještě jinak; ale jen pokud si všimneme, že $ W_{2}\bigcup W_{3}=${\bb R}$ ^{4}$ a $ W_2\perp W_3$ (všechny zadané vektory jsou lineárně nezávislé). Ortogonální projekcí vektoru na celý prostor získáme původní vektor. Půjde tedy o identické zobrazení. Díky tomu můžeme projekci na prostor {\Cal L}$ (\vec{u}_1,
\vec{u}_2, \vec{u}_3, \vec{u}_4)$ napsat jako součet projekcí na prostory $ W_{2}=${\Cal L}$ (\vec{u}_1, \vec{u}_2)$ a $ W_{3}=${\Cal L}$ (\vec{u}_3,\vec{u}_4)$. Maticově řečeno

$\displaystyle B\:+\:C=\mathbbm{1}$

a to nám skutečně vyšlo. Takže matici $ C$ jsme mohli dopočítat podle $ C=\mathbbm{1}\:-\:B.$


d) Symetrii matic $ A,B,C$ vidíme přímo a ověření idempotence ponecháme čtenářům, kteří rádi násobí matice (třeba na počítači). Jelikož $ f(\vec{v})\in W$, $ \vec{v}\in V$, pro obecný projektor musí platit $ f[f(\vec{v})]=f(\vec{v})$, neboli $ f^2=f$ -- ve smyslu tvrzení za definicí v úvodu příkladu (o   $ f(\vec{v})\in W$) už není co aproximovat.

V obecném případě dokážeme také symetrii ($ f^T=f$): nechť $ \vec{v},\vec{u}$ jsou libovolné vektory z $ V$, které rozložíme na jejich ortogonální projekci do $ W$ a zbytek: $ \vec{v}=f(\vec{v})+\vec{v}_\perp$ a $ \vec{u}=f(\vec{u})+\vec{u}_\perp$. Víme, že zcela obecně platí $ \vec{v}\cdot f(\vec{u})=f^T(\vec{v})\cdot \vec{u}$, a chceme tedy dokázat $ \vec{v}\cdot f(\vec{u})=f(\vec{v})\cdot\vec{u}$. To nám nedá mnoho práce, pokud budeme mít na paměti, že $ f(\vec{v})\cdot \vec{u}_\perp=0$, $ f(\vec{u})\cdot \vec{v}_\perp=0$:

$\displaystyle \vec{v}\cdot f(\vec{u})=[f(\vec{v})+\vec{v}_\perp]\cdot
f(\vec{u})=f(\vec{v})\cdot f(\vec{u})\,,
$

$\displaystyle f(\vec{v})\cdot \vec{u}=f(\vec{v})\cdot [f(\vec{u})+\vec{u}_\perp]
=f(\vec{v})\cdot f(\vec{u})\,.
$

Jiný způsob: Zůstaneme u projekce na jednorozměrné prostory, rozšíření na větší prostory je ale přímočaré. Použijeme vyjádření projekce, které jsme odvodili v bodě a) a položíme pro jednoduchost $ \Vert\vec{s}\Vert=1$.

$\displaystyle f(\vec{v})=\left( \vec{v} \cdot \vec{s}\right) \vec{s}
$

Nejprve dokážeme idempotenci zobrazení $ f$. Spočtěme si, čemu se rovná

$\displaystyle f[f( \vec{v})]= f [ \left( \vec{v}\cdot\vec{s}\right)
\vec{s}]=
\{[( \vec{v} \cdot \vec{s}) \vec{s}] \cdot \vec{s}\} \vec{s},
$

coz je po úpravě

$\displaystyle \left(\vec{s} \cdot \vec{s} \right)
\left(\vec{v} \cdot \vec{s} \right) \vec{s}=
\left( \vec{v} \cdot \vec{s}\right) \vec{s}
=f(\vec{v})\,,
$

čímz byla dokázána idempotence. Dále máme dokázat, ze zobrazení $ f$ je symetrické, tzn. ze platí $ f=f^{T}$. Transponované zobrazení k zobrazení $ f$ je takové zobrazení, které pro kazdé $ \vec{u}$ a $ \vec{v}$ splňuje rovnost:

$\displaystyle f \left( \vec{u} \right) \cdot \vec{v} = \vec{u} \cdot f^{T} \left(
\vec{v} \right)
$

Začneme tedy upravovat levou stranu tak, abychom dostali skalární součin $ \vec{u}$ s nějakým vektorem. Jest

$\displaystyle f \left( \vec{u} \right) \cdot \vec{v}
=
\left( \left( \vec{u} ...
...dot \vec{s}\right) \vec{s}
\right)
=\vec{u} \cdot f \left( \vec{v} \right),
$

nelze proto jinak, nez ze $ f=f^{T}$.

$ \ast$JK,KV$ \ast$