Ângulos entre apartamentos - Angles between flats

O conceito de ângulos entre linhas no plano e entre pares de duas linhas, dois planos ou uma linha e um plano no espaço pode ser generalizado para uma dimensão arbitrária . Essa generalização foi discutida pela primeira vez por Jordan . Para qualquer par de apartamentos em um espaço euclidiano de dimensão arbitrária, pode-se definir um conjunto de ângulos mútuos que são invariantes sob a transformação isométrica do espaço euclidiano. Se os apartamentos não se cruzam, sua distância mais curta é mais uma invariante. Esses ângulos são chamados de canônicos ou principais . O conceito de ângulos pode ser generalizado para pares de apartamentos em um espaço de produto interno de dimensão finita sobre os números complexos .

Definição de Jordan

Deixe e seja planos de dimensões e no espaço euclidiano dimensional . Por definição, uma tradução de ou não altera seus ângulos mútuos. Se e não se cruzarem, eles o farão mediante qualquer tradução dos mapas de algum ponto em para algum ponto em . Portanto, pode ser assumido sem perda de generalidade que e se cruzam.

Jordan mostra que as coordenadas cartesianas em seguida, pode ser definido de tal forma que e são descritos, respectivamente, pelos conjuntos de equações

e

com . Jordan chama essas coordenadas de canônicas . Por definição, os ângulos são os ângulos entre e .

Os inteiros não negativos são restringidos por

Por estas equações para determinar os cinco números inteiros não negativos completamente, além das dimensões e e o número de ângulos , o número inteiro não negativo deve ser dado. Este é o número de coordenadas , cujos eixos correspondentes são aqueles situados inteiramente dentro de e . O inteiro é, portanto, a dimensão de . O conjunto de ângulos pode ser complementado com ângulos para indicar que tem aquela dimensão.

A prova de Jordan se aplica essencialmente inalterada quando é substituída pelo espaço do produto interno dimensional sobre os números complexos. (Para ângulos entre subespaços , a generalização para é discutida por Galántai e Hegedũs em termos da caracterização variacional abaixo .)

Ângulos entre subespaços

Agora vamos e sejam subespaços do espaço do produto interno dimensional sobre os números reais ou complexos. Geometricamente, e são planos, então a definição de Jordan de ângulos mútuos se aplica. Quando para qualquer coordenada canônica, o símbolo denota o vetor unitário do eixo, os vetores formam uma base ortonormal para e os vetores formam uma base ortonormal para , onde

Por estarem relacionados a coordenadas canônicas, esses vetores básicos podem ser chamados de canônicos .

Quando denotar os vetores básicos canônicos para e os vetores básicos canônicos para então o produto interno desaparece para qualquer par de e exceto os seguintes.

Com a ordem dos vetores básicos acima, a matriz dos produtos internos é, portanto, diagonal . Em outras palavras, se e são bases ortonormais arbitrárias em e então as transformações reais, ortogonais ou unitárias da base para a base e da base para a base realizam uma decomposição de valor singular da matriz de produtos internos . Os elementos da matriz diagonal são os valores singulares da última matriz. Pela unicidade da decomposição de valor singular, os vetores são então únicos até uma transformação real, ortogonal ou unitária entre eles, e os vetores e (e portanto ) são únicos até transformações reais, ortogonais ou unitárias iguais aplicadas simultaneamente aos conjuntos dos vetores associados a um valor comum de e aos conjuntos correspondentes de vetores (e, portanto, aos conjuntos correspondentes de ).

Um valor singular pode ser interpretado como correspondendo aos ângulos introduzidos acima e associados com e um valor singular pode ser interpretado como correspondendo a ângulos retos entre os espaços ortogonais e , onde sobrescrito denota o complemento ortogonal .

Caracterização variacional

A caracterização variacional de valores singulares e vetores implica como um caso especial uma caracterização variacional dos ângulos entre subespaços e seus vetores canônicos associados. Esta caracterização inclui os ângulos e introduzidos acima e ordena os ângulos aumentando o valor. Pode ter a forma da definição alternativa abaixo. Neste contexto, costuma-se falar de ângulos e vetores principais .

Definição

Deixe ser um espaço de produto interno. Dados dois subespaços com , existe então uma sequência de ângulos chamada ângulos principais, o primeiro definido como

onde está o produto interno e a norma induzida . Os vetores e são os vetores principais correspondentes .

Os outros ângulos e vetores principais são então definidos recursivamente via

Isso significa que os ângulos principais formam um conjunto de ângulos minimizados entre os dois subespaços e os vetores principais em cada subespaço são ortogonais entre si.

Exemplos

Exemplo geométrico

Geometricamente, os subespaços são planos (pontos, linhas, planos, etc.) que incluem a origem, portanto, quaisquer dois subespaços se cruzam pelo menos na origem. Dois subespaços bidimensionais e geram um conjunto de dois ângulos. Em um espaço euclidiano tridimensional , os subespaços e são idênticos ou sua interseção forma uma linha. No primeiro caso, ambos . Neste último caso, apenas , onde os vetores e estão na linha de interseção e têm a mesma direção. O ângulo será o ângulo entre os subespaços e no complemento ortogonal para . Imaginando o ângulo entre dois planos em 3D, pensamos intuitivamente no maior ângulo ,.

Exemplo algébrico

No espaço coordenado real 4-dimensional R 4 , deixe o subespaço bidimensional ser medido por e , e deixe o subespaço bidimensional ser medido por e com algum real e tal . Então e são, de fato, o par de vetores principais correspondentes ao ângulo com , e e são os vetores principais correspondentes ao ângulo com

Para construir um par de subespaços com qualquer dado conjunto de ângulos em um espaço euclidiano dimensional (ou maior) , pegue um subespaço com uma base ortonormal e complete-o em uma base ortonormal do espaço euclidiano, onde . Então, uma base ortonormal do outro subespaço é, por exemplo,

Propriedades básicas

  • Se o maior ângulo for zero, um subespaço é um subconjunto do outro.
  • Se o maior ângulo for , há pelo menos um vetor em um subespaço perpendicular ao outro subespaço.
  • Se o menor ângulo for zero, os subespaços se cruzam pelo menos em uma linha.
  • Se o menor ângulo for , os subespaços são ortogonais.
  • O número de ângulos igual a zero é a dimensão do espaço onde os dois subespaços se cruzam.

Propriedades avançadas

  • Ângulos não triviais (diferentes de e ) entre dois subespaços são iguais aos ângulos não triviais entre seus complementos ortogonais.
  • Ângulos não-trivial entre os subespaços e e os correspondentes ângulos não-trivial entre os subespaços e resumir a .
  • Os ângulos entre os subespaços satisfazem a desigualdade do triângulo em termos de majorização e, portanto, podem ser usados ​​para definir uma distância no conjunto de todos os subespaços transformando o conjunto em um espaço métrico .
  • O seno dos ângulos entre os subespaços satisfaz a desigualdade do triângulo em termos de majorização e, portanto, pode ser usado para definir uma distância no conjunto de todos os subespaços transformando o conjunto em um espaço métrico . Por exemplo, o seno do maior ângulo é conhecido como uma lacuna entre subespaços .

Extensões

A noção dos ângulos e algumas das propriedades variacionais podem ser naturalmente estendidas para produtos internos arbitrários e subespaços com dimensões infinitas .

Computação

Historicamente, os ângulos e vetores principais aparecem pela primeira vez no contexto de correlação canônica e foram originalmente calculados usando SVD de matrizes de covariância correspondentes . No entanto, como observado pela primeira vez em, a correlação canônica está relacionada ao cosseno dos ângulos principais, que é mal condicionado para ângulos pequenos, levando a cálculos muito imprecisos de vetores principais altamente correlacionados em aritmética computacional de precisão finita . O algoritmo baseado em seno corrige esse problema, mas cria um novo problema de cálculo muito impreciso de vetores principais altamente não correlacionados, uma vez que a função seno é mal condicionada para ângulos próximos a π / 2. Para produzir vetores principais precisos em aritmética de computador para toda a gama dos ângulos principais, a técnica combinada primeiro calcula todos os ângulos e vetores principais usando a abordagem clássica baseada no cosseno e, em seguida, recalcula os ângulos principais menores que π / 4 e o principal correspondente vetores usando a abordagem baseada em seno . A técnica combinada é implementada nas bibliotecas de código aberto Octave e SciPy e contribuiu e para o MATLAB .

Veja também

Referências

  1. ^ a b c Jordan, C. (1875). "Essai sur la géométrie à dimensions" . Touro. Soc. Matemática. França . 3 : 103.
  2. ^ Afriat, SN (1957). "Projetores ortogonais e oblíquos e a caracterização de pares de espaços vetoriais". Matemática. Proc. Cambridge Philos. Soc . 53 (4): 800. doi : 10.1017 / S0305004100032916 .
  3. ^ a b c d e Björck, Å .; Golub, GH (1973). "Métodos numéricos para calcular ângulos entre subespaços lineares". Matemática. Comp . 27 (123): 579. doi : 10.2307 / 2005662 . JSTOR   2005662 .
  4. ^ Galántai, A .; Hegedũs, Cs. J. (2006). "Principais ângulos de Jordan em espaços vetoriais complexos". Numer. Linear Algebra Appl . 13 (7): 589–598. CiteSeerX   10.1.1.329.7525 . doi : 10.1002 / nla.491 .
  5. ^ Halmos, PR (1969), "Two subspaces", Trans. Amer. Matemática. Soc. , 144 : 381–389, doi : 10.1090 / S0002-9947-1969-0251519-5
  6. ^ a b c Knyazev, AV; Argentati, ME (2006), "Majorization for Changes in Angles Between Subespaaces, Ritz Values, and Graph Laplacian Spectra", SIAM J. Matrix Anal. Appl. , 29 (1): 15–32, CiteSeerX   10.1.1.331.9770 , doi : 10.1137 / 060649070 , S2CID   16987402
  7. ^ a b c Knyazev, AV; Jujunashvili, A .; Argentati, ME (2010), "Ângulos entre subespaços de dimensão infinita com aplicações aos métodos de Rayleigh-Ritz e projetores alternados", Journal of Functional Analysis , 259 (6): 1323–1345, arXiv : 0705.1023 , doi : 10.1016 / j. jfa.2010.05.018 , S2CID   5570062
  8. ^ Qiu, L .; Zhang, Y .; Li, C.-K. (2005), "Unitarily invariant metrics on the Grassmann space" (PDF) , SIAM Journal on Matrix Analysis and Applications , 27 (2): 507-531, doi : 10.1137 / 040607605
  9. ^ Kato, DT (1996), Perturbation Theory for Linear Operators , Springer, Nova York
  10. ^ a b c Knyazev, AV; Argentati, ME (2002), "Principais ângulos entre subespaços em um produto escalar baseado em A: Algoritmos e estimativas de perturbação", SIAM Journal on Scientific Computing , 23 (6): 2009-2041, CiteSeerX   10.1.1.73.2914 , doi : 10.1137 / S1064827500377332
  11. ^ Subespaço da função Octave
  12. ^ Função de álgebra linear SciPy subspace_angles
  13. ^ Subespaço de função MATLAB FileExchange
  14. ^ Subespacial da função MATLAB FileExchange