Résolution de problèmes aux valeurs propres

1. Introduction

Etant donné une matrice carrée \(\mathrm{A} \in \mathbb{C}^{n \times n}\), le problème de valeurs propres consiste à trouver un scalaire \(\lambda\) (réel ou complexe) et un vecteur non nul \(\mathbf{x}\) tel que

\[A \mathbf{x}=\lambda \mathbf{x}\]

Un tel \(\lambda\) est appelé valeur propre de A, et \(\mathbf{x}\) est appelé vecteur propre associé. Ce dernier n’est pas unique; en effet tous les vecteurs \(\alpha \mathbf{x}\) avec \(\alpha \neq 0\), réel ou complexe, sont aussi des vecteurs propres associés à \(\lambda\). Si \(\mathbf{x}\) est connu, on peut trouver \(\lambda\) en utilisant le quotient de Rayleigh \(\mathbf{x}^H \mathrm{Ax} /\|\mathbf{x}\|^2\), où \(\mathbf{x}^H=\overline{\mathbf{x}}^T\) est le vecteur dont la \(i\)-ème composante est égale à \(\bar{x}_i\).

Un nombre \(\lambda\) est une valeur propre de \(A\) s’il est racine du polynôme suivant de degré \(n\) (appelé polynôme caractéristique de A)

\[p_{\mathrm{A}}(\lambda)=\operatorname{det}(\mathrm{A}-\lambda \mathrm{I}) .\]

Ainsi, une matrice carrée d’ordre \(n\) a exactement \(n\) valeurs propres (réelles ou complexes), non nécessairement distinctes. Si les coefficients de A sont réels, il en est de même de ceux de \(p_{\mathrm{A}}(\lambda)\). Par conséquent dans ce cas, si une valeur propre est complexe, le complexe conjugué est aussi valeur propre.

Rappelons qu’une matrice \(\mathrm{A} \in \mathbb{C}^{n \times n}\) est dite diagonalisable s’il existe une matrice inversible \(\mathrm{U} \in \mathbb{C}^{n \times n}\) telle que

\[\mathrm{U}^{-1} \mathrm{AU}=\Lambda=\operatorname{diag}\left(\lambda_1, \ldots, \lambda_n\right) .\]

Les colonnes de U sont les vecteurs propres de A et forment une base de \(\mathbb{C}^n\).

Dans le cas particulier où \(A\) est diagonale ou triangulaire, ses valeurs propres sont simplement ses coefficients diagonaux. Mais quand A est une matrice quelconque d’ordre \(n\), assez grand, il n’est en général pas facile de déterminer les zéros de \(p_{\mathrm{A}}(\lambda)\). Les algorithmes de recherche des valeurs propres sont en fait mieux adaptés.

2. Rappel sur la réduction

Dans ce chapitre, \(\mathbb{R}^n\) ou \(\mathbb{C}^n\) sont munis de leur produit scalaire (hermitien) canonique.

Toute matrice carrée complexe est semblables à une matrice triangulaire supérieure via un changement de base orthonormée.

Toute matrice carrée admet le même spectre que sa transconjuguée.

Toutes matrice symétrique [resp. hermitienne] est diagonalisable en base orthornormée.

2.1. Localisation des valeurs propres

Proposition 1.

_Soit \(A \in \mathscr{M}_n(\mathbb{C})\) à diagonale dominante, i.e pour tout \(i =1, \dots, n\)

\[|a_{i,i}| > \sum_{j \ne i} |a_{i,j}|.\]

Alors \(A\) est inversible, i.e \(0 \notin \mathop{\mathrm{\mathrm{Sp}}}(A)\)._

Définition 2: (Disque de Gerschgorin).

Soit \(A \in \mathscr{M}_n({\mathbb{C}})\), on appelle disque de Gerschgorin l’ensemble

\[D_i(A) = \{ z \in {\mathbb{C}} : |a_{i,i} -z| \leqslant\sum_{j \ne i} |a_{i,j}| \}.\]

C’est un disque fermé centré en \(a_{i,i}\). On note \(r_i(A)\) son rayon.

Théorème 3

\(\displaystyle\mathop{\mathrm{\mathrm{Sp}}}(A) \subset \bigcup_{i=1}^n D_i(A) \cap \bigcup_{i=1}^n D_i(A^T)\).

Details

Comme \(\mathop{\mathrm{\mathrm{Sp}}}(A) = \mathop{\mathrm{\mathrm{Sp}}}(A^T)\), il suffit de démontrer que \(\displaystyle\mathop{\mathrm{\mathrm{Sp}}}(A) \subset \bigcup_{i=1}^n D_i(A)\).

Soit \(\lambda \in \mathop{\mathrm{\mathrm{Sp}}}(A)\). Alors \(A-\lambda I_n\) n’est pas inversible, donc en particulier n’est pas à diagonale dominante. Ainsi, il existe \(i_0\) tel que \(\displaystyle|a_{i_0,i_0} - \lambda| \leqslant\sum_{j \ne i_0} |a_{i_0,j}|\), autrement dit \(\lambda \in D_{i_0}(A)\). ◻

Théorème 4 (Stabilité du spectre par perturbation, Bauer-Fike)

On note \(\| \cdot \|\) une norme \(\ell^p\) sur \({\mathbb{C}}^n\), ainsi que la norme d’opérateur associée.

_Soit \(A \in \mathscr{M}_n({\mathbb{C}})\) une matrice diagonalisable par le changement de base \(P\): \(P^{-1} AP = \mathop{\mathrm{\mathrm{diag}}}(\lambda_1, \dots, \lambda_n)\). Soit \(\delta A \in \mathscr{M}_n({\mathbb{C}})\). Alors on a

\[\mathop{\mathrm{\mathrm{Sp}}}(A +\delta A) \subset \bigcup_{i=1}^n B(\lambda_i, \mathop{\mathrm{\mathrm{cond}}}(P) \| \delta A \|).\]

Details

Soit \(\mu \in \mathop{\mathrm{\mathrm{Sp}}}(A + \delta A)\). Si \(\mu \in \mathop{\mathrm{\mathrm{Sp}}}(A)\), on a terminé. Supposons donc que \(\mu \notin \mathop{\mathrm{\mathrm{Sp}}}(A)\). On note \(D = P^{-1} AP\) et \(\delta D = P^{-1} \delta A P\), et \(v \in \ifdefequal{C}{1} {\mathbbm{C}} {\mathbb{C}} ^n\) tel que

\[(D+\delta D)v = \mu v.\]

(si \((A+\delta A)u = \mu u\), alors \(v = P^{-1} u\) convient). Comme \(\mu \notin \mathop{\mathrm{\mathrm{Sp}}}(A) = \mathop{\mathrm{\mathrm{Sp}}}(D)\), \(D-\mu\) est inversible et \(w:=(D-\mu)(v)\) n’est pas nul. Alors

\[0 = (D-\mu+\delta D) v = (I_n + \delta D (D-\mu)^{-1}) (D-\mu) v = (I_n + (D-\mu)^{-1}\delta D) w.\]

Ceci signifie que \(-1 \in \mathop{\mathrm{\mathrm{Sp}}}(\delta D (D-\mu)^{-1})\). On en déduit que

\[1 \leqslant\| \delta D (D-\mu)^{-1} \| \leqslant\| P^{-1} \delta A P \| \| (D-\mu)^{-1} \| \leqslant\| (D-\mu)^{-1} \| \mathop{\mathrm{\mathrm{cond}}}(P) \| \delta A \|.\]

Mais \((D-\mu)^{-1} = \mathop{\mathrm{\mathrm{diag}}}(1/(\lambda_i-\mu))\) est diagonale donc on peut calculer sa norme:

\[\begin{aligned} \| (D-\mu)^{-1} x \| & = \left( \sum_{i=1}^n \left| \frac{1}{\lambda_i - \mu} x_i \right|^p \right)^{1/p} \leqslant\max_{i=1, \dots n} \frac{1}{|\lambda_i - \mu|} \left( \sum_{i=1}^n \left| x_i \right|^p \right)^{1/p}\\ & \leqslant\frac{1}{\displaystyle\min_{i=1, \dots n} |\lambda_i - \mu|} \| x \|. \end{aligned}\]

(Il y a en fait égalité, en choisissant pour \(x\) un vecteur propre adéquat). Donc

\[\min_{i=1, \dots n} |\lambda_i - \mu| \leqslant\| \mathop{\mathrm{\mathrm{cond}}}(P) \| \delta A \|. \qedhere\]

Corollaire 5

Si \(A\) est normale et \(\delta A \in \mathscr{M}_n({\mathbb{C}})\), alors

\[\mathop{\mathrm{\mathrm{Sp}}}(A +\delta A) \subset \bigcup_{\lambda \in \mathop{\mathrm{\mathrm{Sp}}}(A)} B(\lambda, \| \delta A \|_2).\]

Details

\(A\) étant normale, elle est diagonalisable dans une base orthonormée: on peut choisir \(P \in SU_n( \ifdefequal{C}{1} {\mathbbm{C}} {\mathbb{C}} )\). Mais alors \(\| P \|_2 = \| P^{-1} \|_2 =1\) et \(\mathop{\mathrm{\mathrm{cond}}}_2(P)=1\). ◻

Exemple 6 Attention au cas non diagonalisable.

Soit \(A_\varepsilon= \displaystyle\begin{pmatrix} 0 & \cdots & 0 & \varepsilon\\ 1 & 0 & & 0 \\ & \ddots & \ddots & \vdots \\ 0 & & 1 & 0 \end{pmatrix}\).

Alors \(\mathop{\mathrm{\mathrm{Sp}}}(A_0) = \{ 0 \}\) et pour \(\varepsilon>0\), \(\mathop{\mathrm{\mathrm{Sp}}}(A_\varepsilon) = \{ \varepsilon^{1/n} e^{2ik\pi/n}, k =0,\dots, n-1 \}\).