Ortogonální polynomy

Ve skriptech [PLA] najdeme několik zajímavých příkladů ortogonálních systémů polynomů. Víceméně se vždy jedná o ortogonalizaci báze $ 1,x,x^2,\dots$ vůči vhodnému skalárnímu součinu

$\displaystyle (f\cdot g)=\int_a^bf(x)g(x)\rho(x)\,{\rm d}x$ (124)

s váhou $ \rho(x)$. Podíváme se teď trochu podrobněji na některé obecné vlastnosti ortogonálních polynomů. Místo skalárního součinu (124) je vhodnější uvažovat momentový funkcionál

$\displaystyle {\mbox{{\Cal L}}}[f]=\int_a^bf(x)\rho(x)\,{\rm d}x$

jakožto lineární zobrazení na našem prostoru polynomů. Potom je ovšem $ (f\cdot g)={\mbox{{\Cal L}}}[f(x)g(x)]$. Výhoda momentového funkcionálu je v tom, že je již jednoznačně určen posloupností čísel $ \mu_n={\mbox{{\Cal L}}}[x^n]$. Pro libovolný polynom $ P(x)=\sum a_kx^k$ je potom díky linearitě

$\displaystyle {\mbox{{\Cal L}}}[P(x)]=\sum a_k\mu_k\,.$ (125)

Zapomeňme teď na naše původní odvození funkcionálu $ {\mbox{{\Cal L}}}$ pomocí skalárního součinu s váhou $ \rho(x)$ a zaveďme jej abstraktně tak, že zadáme (komplexní) čísla $ \mu_n$ a působení na komplexní polynom reálné proměnné $ P(x)$ definujeme pomocí (125).

systému polynomů $ \{P_n(x)\}_{n=0}^{\infty}$ řekneme, že je ortogonální (krátce OPS) vůči $ {\mbox{{\Cal L}}}$, jestliže $ P_n$ je polynom stupně $ n$, pro $ m\neq n$ platí $ {\mbox{{\Cal L}}}[P_m(x)P_n(x)]=0$ a navíc $ {\mbox{{\Cal L}}}[P^2_n(x)]\neq0$.


Úkol:

a)
Na $ {\mbox{{\Cal L}}}$ se ovšem nepřenášejí všechny vlastnosti skalárního součinu. Může se stát, že k danému funkcionálu $ {\mbox{{\Cal L}}}$ neexistuje OPS. Naopak k danému systému polynomů $ \{P_n(x)\}$ ($ P_n$ je polynom stupně $ n$) nemusí existovat takové $ {\mbox{{\Cal L}}}$, ve kterém je systém ortogonální. Najděte příklady!

b)
Dokažte následující jednoduchou vlastnost OPS, kterou budeme ještě potřebovat: systém $ \{P_n(x)\}$ je OPS vůči $ {\mbox{{\Cal L}}}$, právě když

$\displaystyle \forall n,\ \forall m\le n:\ {\mbox{{\Cal L}}}[x^mP_n(x)]=K_n\delta_{mn},\quad K_n\neq0\,.$ (126)


Řešení:
a)
Za prvé vezměme třeba polynomy stupně max. $ 1$, kde položíme $ \mu_0=\mu_1=\mu_2=1$. Nechť existuje OPS sestávající z polynomů

$\displaystyle P_0(x)=a\,,\quad P_1(x)=bx+c\,,\quad a,b\neq0\,.$

Potom mají být nenulová čísla $ {\mbox{{\Cal L}}}[P_0^2]=a^2$ a $ {\mbox{{\Cal L}}}[P_1^2]=(b+c)^2$ a zároveň má být $ 0={\mbox{{\Cal L}}}[P_0P_1]=a(b+c)$, což zřejmě nemůže nastat současně.

Ve druhém případě vezmeme ten nejjednodušší příklad, co existuje: systém $ 1,x,x^2,\dots$. Jistě nemůže zároveň platit $ {\mbox{{\Cal L}}}[1\cdot x^2]=0$ a $ {\mbox{{\Cal L}}}[x\cdot
x]\not=0$.

b)
Pro $ m<n$ plyne tvrzení z toho, že systém $ \{P_m(x)\}_{m=0}^{n-1}$ tvoří bázi na prostoru polynomů stupně nejvýše $ n-1$, a tedy lze $ x^m$, $ m<n$ napsat jako lineární kombinaci $ P_0(x)$, $ \ldots$, $ P_{n-1}(x)$, což jsou všechno polynomy ortogonální na $ P_n(x)$. Dále podle předchozí úvahy platí $ {\mbox{{\Cal L}}}[P_n^2(x)]={\mbox{{\Cal L}}}[P_n(x)a_nx^n]$, kde $ a_n$ je koeficient u $ x^n$$ P_n(x)$, a tedy musí být $ {\mbox{{\Cal L}}}[P_n(x)x^n]\not=0$.


Díky ortogonalitě vůči $ {\mbox{{\Cal L}}}$ naštěstí zůstávají zachovány jiné příjemné vlastnosti OPS, jako třeba ta, že pro libovolný polynom $ \pi(x)$ stupně $ n$ existují koeficienty $ c_k$, že $ \pi(x)=\sum_{k=0}^nc_kP_k(x),$ přičemž zřejmě

$\displaystyle c_k={{\mbox{{\Cal L}}}[\pi(x)P_k(x)]\over{\mbox{{\Cal L}}}[P_k^2(x)]}\,.$

Úkol: Ukažte, že pro dané $ {\mbox{{\Cal L}}}$ je OPS $ \{P_n(x)\}$ už jednoznačně určen konstantami $ K_n={\mbox{{\Cal L}}}[x^nP_n(x)]$.


Řešení: Nechť $ \{P_n(x)\}$ a $ \{Q_n(x)\}$ jsou dva různé OPS vůči $ {\mbox{{\Cal L}}}$. Pak díky (126) platí $ {\mbox{{\Cal L}}}[Q_k(x)P_n(x)]=0$ pro $ k<n$. Zároveň ale podle předchozího můžeme rozvinout

$\displaystyle P_n(x)=\sum_{k=0}^nc_kQ_k(x)\,,\quad
c_k={{\mbox{{\Cal L}}}[P_n(x)Q_k(x)]\over{\mbox{{\Cal L}}}[Q_k^2(x)]}\,.$

Pro $ k<n$ jsou tedy všechna $ c_k$ nulová, neboli $ P_n(x)=c_nQ_n(x)$. Pokud ale má platit $ K_n={\mbox{{\Cal L}}}[P_n(x)x^n]=
{\mbox{{\Cal L}}}[c_nQ_n(x)x^n]$ a $ K_n={\mbox{{\Cal L}}}[Q_n(x)x^n]$, nezbývá než $ c_n=1$.


Z předchozího ovšem ještě neplyne, za jakých podmínek existuje k danému $ {\mbox{{\Cal L}}}$ aspoň jeden OPS. V tomto směru teď dokážeme jedno zásadní tvrzení.


Úkol: Nechť funkcionál $ {\mbox{{\Cal L}}}$ je daný čísly $ \mu_n$. Položme

$\displaystyle \Delta_n=\left\vert\begin{array}{cccc} \mu_0&\mu_1&\dots&\mu_n\\ ...
...s&\vdots&\ddots&\vdots\\ \mu_n&\mu_{n+1}&\dots&\mu_{2n} \end{array}\right\vert.$ (127)

Potom existuje OPS vůči $ {\mbox{{\Cal L}}}$, právě když $ \Delta_n\neq0$ pro každé $ n=0,1,2,\dots$.


Řešení: Nechť mají hledané polynomy tvar $ P_n(x)=\sum_{k=0}^nc_{nk}x^k$. Podmínku (126), aby tvořily OPS, napíšeme do matic

$\displaystyle \left(\begin{array}{cccc} \mu_0&\mu_1&\dots&\mu_n\\
\mu_1&\mu_2&...
...{array}\right)= \left(\begin{array}{c}
0\\ 0\\ \vdots\\ K_n \end{array}\right).$

Jsou-li determinanty $ \Delta_n$ nenulové, pak má tato soustava rovnic jistě řešení. Naopak, víme-li, že existuje řešení, pak je toto řešení podle předchozího úkolu už jednoznačně dáno sadou čísel $ K_n$, a tedy musí mít soustava (pro každé $ n$) právě jedno řešení, což nastane pouze pro $ \Delta_n\not=0$. Z Cramerova pravidla dostaneme navíc jednoduchý důsledek (determinant v čitateli rozvíjíme podle posledního sloupce)

$\displaystyle c_{nn}=K_n\cdot{\Delta_{n-1}\over\Delta_n}\,.$ (128)

Úkol: Dokažte, že pokud $ \forall n$ je $ \Delta_n\not=0$ (rovnice 127), pak můžeme následující konstrukcí explicitně sestrojit (jeden z možných) OPS

$\displaystyle P_n(x)\df=\left\vert \begin{array}{cccc} \mu_0&\mu_1&\dots&\mu_n\...
...dots\\ \mu_{n-1}&\mu_n&\dots&\mu_{2n-1}\\ 1&x&\dots&x^n \end{array}\right\vert.$ (129)


Řešení: Je to jednoduché: ukážeme, že polynomy (129) splňují podmínku (126).

Determinant (129) rozvineme podle posledního řádku, čímž dostaneme přímo koeficienty u jednotlivých mocnin $ x$. Tento polynom vynásobíme $ x^m$ a zapůsobíme na to $ {\mbox{{\Cal L}}}$. Tam, kde bylo v původním polynomu $ x^j$ ( $ 0\le j\le n$), bude teď $ {\mbox{{\Cal L}}}[x^{j+m}]=\mu_{j+m}$. Nyní vše zpátky poskládáme do determinantu a dostaneme

$\displaystyle {\mbox{{\Cal L}}}[x^mP_n(x)]=\left\vert\begin{array}{cccc}
\mu_0&...
...u_n&\dots&\mu_{2n-1}\\
\mu_m&\mu_{m+1}&\dots&\mu_{m+n}
\end{array}\right\vert,$

což evidentně vyhovuje (126): pro $ m<n$ je determinant nula (opakují se v něm dva řádky), pro $ m=n$ je to $ {\mbox{{\Cal L}}}[x^mP_n(x)]=\Delta_n\not=0$.



Úkol: To nejzajímavější nakonec. Nechť $ \{P_n(x)\}$ je takový OPS vůči $ {\mbox{{\Cal L}}}$, že koeficient u nejvyšší mocniny $ x$ je vždy $ 1$. Ukažte, že potom existují konstanty $ c_n$ a $ \lambda_n\neq0$, že

$\displaystyle P_n(x)=(x-c_n)P_{n-1}(x)-\lambda_nP_{n-2}(x)\,,\quad n=1,2,\dots\,,$ (130)

když klademe $ P_{-1}(x)=0$.


Řešení: Polynom $ xP_{n-1}(x)$ lze jako každý polynom stupně $ n$ rozvinout

$\displaystyle xP_{n-1}(x)=\sum_{k=0}^na_kP_k(x)\,,$

přičemž $ a_k={{\mbox{{\Cal L}}}[xP_{n-1}(x)P_k(x)]/{\mbox{{\Cal L}}}[P_k^2(x)]}$. Z (126) ovšem plyne, že $ a_k=0$ pro $ k+1<n-1$, tedy když je stupeň $ xP_k(x)$ menší než stupeň $ P_{n-1}(x)$. Rozvoj má tudíž jenom tři členy

$\displaystyle xP_{n-1}(x)=P_n(x)+a_{n-1}P_{n-1}(x)+a_{n-2}P_{n-2}(x)\,,$

koeficient u $ P_n(x)$ je jedna díky tomu, že koeficienty u nejvyšších mocnin v $ P_n(x)$ i $ xP_{n-1}(x)$ jsou jedna. Menší úpravou a přeznačením konstant dostaneme výsledek

$\displaystyle P_n(x)=(x-c_n)P_{n-1}(x)-\lambda_nP_{n-2}(x)\,.$ (131)


Když poslední rovnost přenásobíme $ x^{n-2}$ a zapůsobíme $ {\mbox{{\Cal L}}}$, dostaneme pomocí (128) a (126) hezký vzoreček (stále pro OPS s koeficientem jedna u nejvyšší mocniny)

$\displaystyle 0={\mbox{{\Cal L}}}[x^{n-1}P_{n-1}(x)]-\lambda_n{\mbox{{\Cal L}}}...
...Delta_{n-2}\over\Delta_{n-1}}=
\lambda_n\cdot{\Delta_{n-3}\over\Delta_{n-2}}\,,$

který umožňuje snadno počítat koeficienty $ \lambda_n$.

Navíc lze ukázat62, že je $ c_n=0$, pokud je funkcionál $ {\mbox{{\Cal L}}}$ symetrický, tj. pro každou funkci $ f(x)$ je $ {\mbox{{\Cal L}}}[f(x)]={\mbox{{\Cal L}}}[f(-x)]$ (konkrétně třeba když v (124) integrujeme přes interval $ \langle-a,a\rangle$ a váha $ \rho(x)$ je sudá). Tak je tomu třeba u polynomů Legendreových, Hermiteových, či Čebyševových.

Pokud si budete chtít vyzkoušet, jak funguje vzorec 131 v konkrétních případech, dejte si pozor na to, že ve standardním zápisu některé (co si budeme namlouvat, skoro všechny) polynomy nemají u nejvyšší mocniny $ x$ jedničku. Vzorec (130) lze samozřejmě modifikovat i na tento obecnější případ, vedoucí koeficient polynomu $ P_n(x)$ označme třeba $ A_n$. Zkuste napřed výše zmíněný jednodušší případ s $ c_n=0$. Snad vám nakonec vyjde

$\displaystyle {A_n\over A_{n+1}}P_{n+1}(x)=xP_n(x)-{A_{n-1}\over
A_n}{{\mbox{{\Cal L}}}[P_n^2(x)]\over{\mbox{{\Cal L}}}[P_{n-1}^2(x)]}P_{n-1}(x)\,.$

Abychom mohli odvodit rekurzivní vztah pro zadaný OPS, stačí tedy znát například jenom koeficienty u nejvyšší mocniny a normu jednotlivých polynomů.

Formulky, které jsme odvodili, si můžete ověřit na následujících OPS.

Již jen ve formě závěrečných poznámek si řekneme další zajímavé vlastnosti funkcionálu $ {\mbox{{\Cal L}}}$. Jestliže pro každý polynom $ \pi(x)\not\equiv 0$ takový, že $ \pi(x)\geq0$ na zadaném intervalu, platí $ {\mbox{{\Cal L}}}[\pi(x)]>0$, řekneme, že $ {\mbox{{\Cal L}}}$ je pozitivně definitní. Pro takový funkcionál můžeme OPS zkonstruovat např. z báze $ 1,x,x^2,\dots$ pomocí Grammova-Schmidtova ortogonalizačního procesu. Všechny kořeny polynomů $ P_n(x)$ z OPS jsou pak reálné a jednoduché a dokonce mezi každými dvěma kořeny $ P_n(x)$ leží kořen polynomu následujícího, tj. $ P_{n+1}(x)$.

$ \ast$TB$ \ast$