53  A Lei da Inêrcia de Sylvester

53.1 Formas bilineares e formas quadráticas

Nesta última seção da disciplina, vamos generalizar os conceitos de produto interno (Definição 47.1) e norma (Definição 47.3).

Definição 53.1 Dada uma forma bilinear simétrica (Definição 47.2) \(B:V\times V\to \R\) em um espaço vetorial \(V\), a forma quadrática \(Q_B\) associada com \(B\) é definida como \[ Q_B:V\to \R,\quad Q_B(v)=B(v,v)\quad\mbox{para todo}\quad v\in V. \]

Exercício 53.1 Sejam \(V\), \(B\) e \(Q_B\) como na Definição 53.1. Demonstre que \[ Q_B(\alpha v)=\alpha^2 Q(v)\quad \mbox{para todo}\quad \alpha\in \R,\ v\in V \] e \[ B(u,v)=\frac 12 (Q(u+v)-Q(u)-Q(v)). \] Em particular, se \(\left<-,-\right>\) é um produto interno no espaço vetorial \(V\), deduza que \[ \left<u,v\right>=\frac 12(\|u+v\|^2-\|u\|^2-\|v\|^2). \]

Exemplo 53.1  

  1. Seja \(V\) espaço com produto interno \(\left<-,-\right>\). Então a aplicação \(Q(v)=\left<v,v\right>=\|v\|^2\) é uma forma quadrática.
  2. Assuma que \(x_1,\ldots,x_n\) são variáveis e seja \(Q(x_1,\ldots,x_n)\in\R[x_1,\ldots,x_n]\) um polinômio homogêneo de grau 2: \[ Q(x_1,\ldots,x_n)=\sum_{1\leq i\leq j\leq n} \alpha_{i,j}x_ix_j. \] Ou seja, \(Q(x_1,\ldots,x_n)\) contém apenas termos do segundo grau. O polinômio \(Q\) pode ser considerado como uma função \(Q:\R^n\to \R\). Afirmamos que \(Q\) é uma forma quadrática. Seja \(A_Q=(a_{i,j})\) é a matriz \(n\times n\) tal que
    \[ a_{i,j}=\left\{\begin{array}{ll} \alpha_{i,i} &\mbox{se $i=j$}\\ \frac 12\alpha_{i,j} & \mbox{se $i<j$}\\ \frac 12\alpha_{j,i} & \mbox{se $j<i$.}\end{array}\right. \] É fácil verificar que \(A_Q\) é uma matriz simétrica e, para \(v=(\alpha_1,\ldots,\alpha_n)\in \R^n\), que
    \[ Q(v)=vA_Qv^t. \] Defina \(B:\R^n\times \R^n\to \R\) como a aplicação \[ B(u,v)=uA_Qv^t \] (considerando \(u\) e \(v\) como vetores linhas). Como \(A_Q\) é uma matriz simétrica e a multiplicação matrcial satisfaz a lei distributiva, temos que \(B\) é uma forma bilinear simétrica em \(\R^n\). Ora, observe que \[ Q(v)=v A_Qv^t=B(v,v) \] vale para todo \(v\in \R^n\).

53.2 Mudança de base para formas bilineares

Definição 53.2 Seja \(V\) um espaço vetorial de dimensão finita com base \(X=\{b_1,\ldots,b_n\}\). A matriz de Gram de uma forma bilinear simétrica \(B\) em \(V\) na base \(X\) é a matriz \([B]_X\) tal que a entrada de \([B]_X\) na posição \((i,j)\) é \(B(b_i,b_j)\).

Exercício 53.2 Seja \(V\), \(B\) e \(X\) como na Definição 53.2 e sejam \(u,v\in V\). Sejam \(u_X\) e \(v_x\) os vetores colunas das coordenadas de \(u\) e \(v\) na base \(X\). Demonstre que \[ B(u,v)=u_X^t\cdot[B]_X\cdot v_X \quad \mbox{e}\quad Q(u)=u_X^t\cdot [Q]_X\cdot u_X \] Dica: Veja o Exemplo 47.2.

Lema 53.1 Seja \(V\) um espaço vetorial de dimensão finita com bases \(X\) e \(Y\) e seja \(B\) uma forma bilinear simétrica em \(V\). Seja \(P=[\mbox{id}_V]^Y_X\). Então \[ [B]_Y=P^t\cdot [B]_X\cdot P. \]

Comprovação. Sejam \(u,v\in V\). Seja \(u_X\) e \(u_Y\) os vetores colunas das coordenadas de \(u\) nas bases \(X\) e \(Y\), respetivamente. Usamos Lema 44.1 para obter \[ u_X=(\mbox{id}_V(u))_X=[\mbox{id}_V]^Y_X\cdot u_Y=P\cdot u_Y. \] Se \(A\) é a matriz de \(B\) na base \(Y\), então temos que \[ u_Y^t\cdot A\cdot v_Y=B(u,v)=u_X^t\cdot [B]_X\cdot v_X =(P\cdot u_Y)^t\cdot [B]_X\cdot (P\cdot u_Y)= u_Y\cdot P^t\cdot [B]_X\cdot P\cdot u_Y. \] Como isso vale, para todo \(u,v\in V\), temos que \(A=[B]_Y=P^t\cdot [B]_X\cdot P\).

53.3 A Lei da Inêrcia de Sylvester

Teorema 53.1 (A Lei da Inêrcia de Sylvester) Seja \(B\) uma forma bilinear simétrica em um espaço vetorial \(V\) de dimensão finita. Então existe uma base \(Y\) de \(V\) na qual a matriz de \(B\) é diagonal na forma \[ \begin{pmatrix} I_p & 0_{p\times q} & 0_{p\times r} \\ 0_{q\times p} & -I_q & 0_{q\times r} \\ 0_{r\times p} & 0_{r\times q} & 0_{r\times r} \end{pmatrix} \] onde \(I_p\) e \(I_q\) denotam matrizes de identidade \(p\times p\) e \(q\times q\), respetivamente, e \(0_{a\times b}\) denota matriz nula \(a\times b\). Além disso, os números \(p\), \(q\), e \(r\) são unicamente determinados pela forma \(B\).

Comprovação. Existência: Seja \(X\) uma base de \(V\) e seja \(A=[B]_X\) a matriz de \(B\) na base \(X\). Então \(A\) é matriz simétrica. Pelo Teorema 52.3, existe uma matriz \(P\) ortogonal tal que \(P^tAP=D\) é diagonal. Seja \(Y\) a base de \(V\) tal que \(P=[\mbox{id}_V]^Y_X\). O Lema 53.1, implica que \[ D=P^t\cdot [B]_X\cdot P=[B]_Y \] é diagonal. Assuma que \(Y=\{\tilde y_1,\ldots,\tilde y_n\}\). A diagonalidade de \(D=[B]_Y\) implica que \[ B(\tilde y_i,\tilde y_j)=\left\{\begin{array}{ll} 0&\mbox{se } i\neq j\\ D_{i,i} & \mbox{se }i=j.\end{array}\right. \] Agora, defina, para \(i\in\{1,\ldots,n\}\), \[ y_i=\left\{\begin{array}{ll} \tilde y_i&\mbox{se } D_{i,i}=0\\ \frac 1{\sqrt{D_{i,i}}}\tilde y_i & \mbox{se }D_{i,i}>0\\ \frac 1{\sqrt{-D_{i,i}}}\tilde y_i & \mbox{se }D_{i,i}<0.\end{array}\right. \] Neste caso, temos que \(B(y_i,y_i)\in\{0,1,-1\}\) e \(B(y_i,y_j)=0\) para todo \(i,j\) tal que \(i\neq j\). Agora, permute os elementos de \(Y\) tal que tenhamos \[\begin{align*} B(y_1,y_1)&=\cdots=B(y_p,y_p)=1;\\ B(y_{p+1},y_{p+1})&=\cdots=B(y_{p+q},y_{p+q})=-1; \\ B(y_{p+q+1},y_{p+q+1})&=\cdots=B(y_{p+q+r},y_{p+q+r})=0. \end{align*}\]
Ora, nesta base, a matriz de \(B\) é como afirmado no teorema.

Unicidade: Assuma que existe uma base \(Z=\{z_1,\ldots,z_n\}\) tal que \([B]_Z\) é diagonal com blocos diagonais \(I_{p'}\), \(-I_{q'}\) e \(0_{r'\times r'}\). Primeiro, afirmamos que \[ V^\perp=\{v\in V\mid B(v,w)=0\mbox{ para todo }w\in V\}=\left<y_{p+q+1},\ldots,y_{p+q+r}\right>. \] (Note que o espaço \(V^\perp\) é chamado de radical da forma \(B\). Quando \(B\) for um produto interno, seu radical é \(0\), mas isso não precisa ser assim para uma forma qualquer.) Primeiro, se \(w\in V\), então, temos para todo \(k\in\{1,\ldots,r\}\) que \[ B(y_{p+q+k},w)=(y_{p+q+k})_Y^t D w_Y=(D_{p+q+k,p+q+k}(y_{p+q+k})_Y^t) w_Y=0. \] e \(\left<y_{p+q+1},\ldots,y_{p+q+r}\right>\leq V^\perp\). Por outro lado, se \(v\in V^\perp\), escreva \[ v=\alpha_1 y_1+\cdots+\alpha_{p}y_p+\alpha_{p+1} y_{p+1}+\cdots+\alpha_{p+q}y_{p+q}+\alpha_{p+q+1} y_{p+q+1}+\cdots+\alpha_{p+q+r}y_{p+q+r} \] e considere \[ 0=B(v,y_k)=v_Y^tD(y_k)_Y=D_{k,k}\alpha_k. \] Se \(k\in\{1,\ldots,p+q\}\), então \(D_{k,k}\neq 0\) e segue que \(\alpha_k=0\). Portanto \[ v=\alpha_{p+q+1} y_{p+q+1}+\cdots+\alpha_{p+q+r}y_{p+q+r}\in\left<y_{p+q+1},\ldots,y_{p+q+r}\right>. \] Logo \(V^\perp\leq \left<y_{p+q+1},\ldots,y_{p+q+r}\right>\) e, de fato, vale a igualdade \(V^\perp= \left<y_{p+q+1},\ldots,y_{p+q+r}\right>\). Em particular, temos que \(\dim V^\perp=r\). Como o mesmo argumento vale para a base \(Z\), obtemos que \(r'=\dim V^\perp=r\). Como \(n=p+q+r=p'+q'+r'\), temos também que \(p+q=p'+q'\).

Seja \(W=\left<y_1,\ldots,y_p,z_{p'+1},\ldots,z_{p'+q'}\right>\). Primeiro, note que \(W\cap V^\perp=0\). Isso segue do fato do que se \(\alpha_1y_1+\cdots+\alpha_py_p+\beta_1 z_{p'+1}+\cdots+\beta_{q'}z_{p'+q'}\in V^\perp\), então \[ 0=B(v,y_k)=\alpha_k\quad \mbox{and}\quad 0=B(v,z_{p'+l})=-\beta_l \] vale para todo \(k\in\{1,\ldots,p\}\) e \(l\in\{1,\ldots,q'\}\). Em particular, \(\dim W\leq n-\dim V^\perp=n-r\).

Afirmamos que \(y_1,\ldots,y_p,z_{p'+1},\ldots,z_{p'+q'}\) são LI. De fato assuma que \[ 0=\alpha_1y_1+\cdots+\alpha_py_p+\beta_1 z_{p'+1}+\cdots+\beta_{q'}z_{p'+q'}. \] Então \[ \alpha_1y_1+\cdots+\alpha_py_p=-\beta_1 z_{p'+1}-\cdots-\beta_{q'}z_{p'+q'}. \] Aplicando \(Q_B\) nos dois lados, temos que \[ Q_B(\alpha_1y_1+\cdots+\alpha_py_p)=\alpha_1^2+\cdots+\alpha_p^2 \] e \[ Q_B(-\beta_1 z_{p'+1}-\cdots-\beta_{q'}z_{p'+q'})=-\beta_1^2-\cdots-\beta_{q'}^2. \] Como o primeiro valor é não negativo, o segundo valor é não positivo, igualdade só pode ocorrer se os dois valores são iguais a zero. Mas neste caso \(\alpha_1=\cdots=\alpha_p=0\) e \(\beta_1=\ldots=\beta_{q'}=0\); ou seja, os vetores são LI como foi afirmado.

Mas isso implica que \(\dim W=p+q'\leq n-r=p+q\); ou seja \(q'\leq q\). O mesmo argumento implica que \(q\leq q'\) e assim \(p=p'\). Ora, segue também que \(p=p'\). Portanto \((p,q,r)=(p',q',r')\) como foi afirmado.

Definição 53.3 Se \(V\) e \(B\) estão como no Teorema 53.1, então a tripla \((p,q,r)\) é chamada de assinatura da forma \(B\). Pelo Teorema 53.1, a assinatura está bem definida.

Exemplo 53.2  

  1. Se \(B\) é uma forma bilinear simétrica em \(\R^n\) com assinatura \((p,q,r)\), então o espaço \(\R^n\) com esta forma é frequentemente denotado por \(\R^{p+q+r}\). O espaço \(\R^n\) com forma bilinear com assinatura \((p,q,0)\) é escrito como \(\R^{p+q}\).
  2. Se \(V\) é um espaço como produto interno, então a assinatura desta forma é \((n,0,0)\). De fato, se \(V\) é espaço com forma bilinear simétrica \(B\) com assinatura \((n,0,0)\), então a forma \(B\) é um produto interno. Neste caso, dizemos que \(B\) é uma forma bilinear simétrica posititiva.
  3. Se a forma \(B\) tem assinatura \((p,0,r)\), então dizemos que a forma \(B\) é não-negativa.
  4. Se a forma \(B\) tem assinatura \((0,q,0)\), então dizemos que a forma \(B\) é negativa.
  5. Se a forma \(B\) tem assinatura \((0,q,r)\), então dizemos que a forma \(B\) é não-positiva.
  6. O espaço \(\R^{1+3}=\R^{1+3+0}\) é conhecido como o Espaço de Minkowski e a sua geometria é a geometria do espaço-tempo que aparece na teoria da relatividade especial.

53.4 Aplicação: Identificação das cônicas

Vamos brevemente revisar o processo da identificação das cônicas que foi estudada na disciplina GAAL. Aqui, nós omitimos alguns detalhes que podem ser encontrados nas suas notas de GAAL ou no livro do Reginaldo.
Seja \[ f(x,y)=ax^2+by^2+cxy+dx+ey+f =0 \] uma equação no plano \(\R^2\) nas incôgnitas \(x\) e \(y\). O conjunto das soluções desta equação é uma cônica no plano. Desconsiderando os casos degenerados, esta curva é uma elipse, uma parábola, ou uma hipérbole.

A parte quadrática desta equação é \[ Q(x,y)=ax^2+by^2+cxy \] e isso defina uma forma quadrática em \(\R^2\) (como no Exemplo 53.1). De acordo com a Lei da Inêrcia de Sylvester, a assinatura da forma bilinear simétrica associada com \(Q\) é \((2,0,0)\), \((0,2,0)\), \((0,0,2)\), \((1,1,0)\), \((1,0,1)\), ou \((0,1,1)\). Assumindo que \(f(x,y)\) é uma equação quadrática, temos que \(a\neq 0\) ou \(b\neq 0\) ou \(c\neq 0\) e a assinatura \((0,0,2)\) não ocorre. A curva pode ser caraterizada de acordo com as assinaturas: Temos elipse com assinatura \((2,0,0)\) ou \((0,2,0)\), hipérbole com assinatura \((1,1,0)\), e parábola com assinatura \((1,0,1)\) ou \((0,1,1)\).

Os detalhes deixamos para o leitor. Recomendamos revisar as notas de GAAL e comparar as contas com as contas nesta página.