AApproximation rationnelle de sous-espacesvectoriels
Thèse de doctorat – non encore soutenue
Elio Joseph a r X i v : . [ m a t h . N T ] J a n able des matières Table des matières 31 Introduction 5 R n . . . . 61.3 Présentation des résultats en direction du problème 1.12 . . . . . . . 111.3.1 Les résultats originaux de Schmidt . . . . . . . . . . . . . . . 111.3.2 Le cas min( d, e ) = 1 . . . . . . . . . . . . . . . . . . . . . . . 131.3.3 Les résultats de Moshchevitin . . . . . . . . . . . . . . . . . . 141.3.4 Les résultats de Saxcé . . . . . . . . . . . . . . . . . . . . . . 161.4 Plan de la thèse et résultats principaux . . . . . . . . . . . . . . . . . 171.5 Les résultats connus jusqu’en dimension . . . . . . . . . . . . . . . 191.6 Une conjecture sur ˚ µ n ( d | e ) e . . . . . . . . . . . . . . . . . . . . . . . 21 R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403.2.1 Construction de plans mal approchés de I (2 , . . . . . . . 413.2.2 Les preuves . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423.3 Dans R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463.3.1 Construction de sous-espaces mal approchés de I (3 , . . . 463.3.2 Les preuves . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.4 Commentaires généraux . . . . . . . . . . . . . . . . . . . . . . . . . 563.5 Application d’un résultat de Moshchevitin . . . . . . . . . . . . . . . 573 Approximation de sommes directes de sous-espaces vectoriels 61 ˚ µ n ( d | e ) j . . . . . . . . . . . . . . . . . . . . . . 66 µ n ( •| (cid:96) ) (cid:96) Bibliographie 107 hapitre 1Introduction La thèse qui suit s’inscrit dans le domaine de l’approximation diophantienne. Onexpose brièvement ce domaine dans la section 1.1, puis on introduit le problèmede l’approximation diophantienne de sous-espaces vectoriels de R n dans la section1.2. La section 1.3 est consacrée à une présentation des résultats connus de ce do-maine. Enfin, un plan de la thèse et des résultats principaux obtenus se trouve dansla section 1.4, une présentation explicite des résultats connus et obtenus jusqu’endimension est donnée dans la section 1.5, et une conjecture est formulée dans lasection 1.6. On introduit ici le domaine de l’approximation diophantienne avec un double objec-tif. Le premier objectif est d’exposer de manière large l’endroit où se situe ce travaildans le monde mathématique, le second est de préparer l’introduction de notions quiserviront de façon centrale dans cette thèse. Ces notions pourront alors être com-parées à celles vues dans cette section en approximation diophantienne rationnelleclassique.L’approximation diophantienne a pour but d’approcher les nombres réels par desnombres rationnels. Plus précisément, pour un réel ξ donné, on cherche un rationnel p/q tel que la quantité (cid:12)(cid:12)(cid:12)(cid:12) ξ − pq (cid:12)(cid:12)(cid:12)(cid:12) soit la plus petite possible. Par densité de Q dans R , ce problème n’a pas d’intérêten l’état, cette quantité pouvant être rendue arbitrairement petite pour tout réel ξ .On précise donc la question en demandant que le rationnel p/q approchant le réel ξ soit le moins compliqué possible. Plus précisément, on veut lier la qualité de l’ap-proximation | ξ − p/q | à la complexité du rationnel. Ainsi, s’autoriser des rationnelsplus compliqués impose d’obtenir en retour une approximation plus précise.5crivons plus rigoureusement ceci. On donne une notion de complexité d’un rationnelen regardant la taille de son dénominateur. On fixe alors un réel ξ ∈ R , et on chercheles réels µ > tels qu’il existe une infinité de rationnels p/q vérifiant (cid:12)(cid:12)(cid:12)(cid:12) ξ − pq (cid:12)(cid:12)(cid:12)(cid:12) < q µ . (1.1)Un nombre émerge naturellement de ce problème : l’ exposant d’irrationalité de ξ .Celui-ci est défini comme la borne supérieure de l’ensemble des réels µ > véri-fiant l’inégalité (1.1) pour une infinité de nombres rationnels p/q . On notera par lasuite µ ( ξ ) cette borne supérieure (éventuellement infinie). C’est ce nombre qui estau coeur de la théorie de l’approximation diophantienne.De nombreux résultats sont connus sur cette quantité, mais des conjectures de-meurent. Par exemple, le théorème de Dirichlet (19 ème siècle) affirme que si ξ est irra-tionnel, alors pour tout entier Q (cid:62) , il existe deux entiers p et q , avec q ∈ { , . . . , Q } ,tels que (cid:12)(cid:12)(cid:12)(cid:12) ξ − pq (cid:12)(cid:12)(cid:12)(cid:12) (cid:54) qQ . De ceci on déduit immédiatement que pour tout ξ / ∈ Q , µ ( ξ ) (cid:62) . On peut aussiénoncer un théorème profond (théorème page 2 de [Rot55]) que K. F. Roth a dé-montré en 1955 en s’appuyant sur des travaux de Thue, Siegel et Dyson : si ξ est unnombre algébrique de degré au moins , alors µ ( ξ ) = 2 . La réciproque étant fausse :on peut par exemple montrer que µ ( e ) = 2 .Enfin, on mentionne que c’est la théorie des fractions continues – à laquelle une intro-duction claire peut être trouvée dans le livre [HW07] de G. H. Hardy et E. M. Wright– qui permet de répondre à de nombreuses questions d’approximation diophantienne.Les fractions continues permettent notamment de montrer que (cid:110) µ ( ξ ) , ξ ∈ R (cid:111) = { } ∪ [2 , + ∞ ] . Les nombres ξ tels que µ ( ξ ) = + ∞ sont appelés nombres de Liouville , et ce sont euxqui fournirent le premier nombre transcendant défini explicitement ([Lio44] pages910–911).Le lecteur qui souhaite approfondir le sujet de l’approximation diophantienne ra-tionnelle classique peut consulter [Niv63], [Cas57] ou encore [Sch80], et [TT96] ausujet de l’approximation diophantienne de matrices. R n Cette thèse suit l’idée donnée par W. M. Schmidt en 1967 dans un article fondateur[Sch67]. L’idée consiste à généraliser le problème de l’approximation diophantienne ationnelle classique qui a été introduit en section 1.1, pour créer une théorie del’approximation diophantienne des sous-espaces vectoriels de R n .Il est alors intéressant de raisonner de façon similaire à l’approximation diophan-tienne classique. Soient n (cid:62) et d, e ∈ { , . . . , n − } tels que d + e (cid:54) n . Soit A un sous-espace vectoriel de R n de dimension d . Le but est de chercher à approcher l’espace A par des sous-espaces rationnels B de dimension e "pas trop" compliqués .Pour formaliser ce problème, il reste donc à définir les termes rationnel , approcher et compliqué . Remarque 1.1
Comme le fait Schmidt dans [Sch67] à partir de la section III, onsupposera toujours dans cette thèse que d + e (cid:54) n , avec d la dimension du sous-espaceapproché et e la dimension des sous-espaces rationnels approchants. Définition 1.2
Un sous-espace B de R n est dit rationnel s’il admet une base forméede vecteurs à coordonnées rationnelles. On note R n ( e ) l’ensemble des sous-espacesrationnels de R n de dimension e .Comme dans le cas de l’approximation des irrationnels par les rationnels, il est utilede définir une notion d’ irrationalité pour le sous-espace A qu’on cherche à approcher.Schmidt en donne une dans le corollaire du théorème 12 page 459 de [Sch67]. Définition 1.3
Soient d, e ∈ { , . . . , n − } tels que d + e (cid:54) n ; on pose t = min( d, e ) .Soit j ∈ { , . . . , t } . Un sous-espace A de dimension d de R n est dit ( e, j ) -irrationnel si pour tout sous-espace rationnel B de dimension e , dim( A ∩ B ) < j. On note I n ( d, e ) j l’ensemble des sous-espaces ( e, j ) -irrationnels de dimension d de R n . Remarque 1.4
On utilisera souvent la condition "être ( e, -irrationnel", précisonsdonc celle-ci. Un sous-espace A est ( e, -irrationnel si, et seulement si, il intersectetrivialement tous les sous-espace vectoriels rationnels de dimension e . Le fait que A soit ( e, -irrationnel est plus fort que le fait qu’il ne contienne pas de vecteurrationnel. Le sous-espace A est ( e, -irrationnel si, et seulement si, ∀ ( ξ , . . . , ξ n ) ∈ A \ { } , dim Q Vect Q ( ξ , . . . , ξ n ) (cid:62) e + 1 . On a commencé à formuler le problème d’approximation diophantienne de sous-espaces vectoriels en définissant les notions de rationalité et d’irrationalité pourceux-ci. Il reste à formuler les notions de proximité et de complexité pour des sous-espaces.Commençons par la complexité , notion définie dans [Sch67] pages 432–433. Pourcela, on a besoin des coordonnées de Plücker (définition 2.4), auxquelles une brèveintroduction est exposée dans la sous-section 2.1.1, basée sur le livre [CG15] de . Caldero et J. Germoni.Sauf mention explicite du contraire, ici et dans toute la suite, la norme (cid:107)·(cid:107) désignerala norme euclidienne canonique. Définition 1.5
Soit B ∈ R n ( e ) . Posons N = (cid:0) ne (cid:1) et notons Ξ = ( ξ , . . . , ξ N ) levecteur d’un représentant des coordonnées de Plücker de B . Comme B est un sous-espace rationnel, on peut choisir Ξ à coordonnées entières et premières entre elles.On définit alors la hauteur de B comme H ( B ) = (cid:107) Ξ (cid:107) = (cid:118)(cid:117)(cid:117)(cid:116) N (cid:88) i =1 ξ i . Ainsi, de même que la complexité d’un nombre rationnel se mesure grâce à la taille deson dénominateur sous forme irréductible, la complexité d’un sous-espace rationnelse mesure grâce à sa hauteur.
Remarque 1.6 Si Ξ = ( ξ , . . . , ξ N ) est un représentant quelconque des coordonnéesde Plücker, notons a l’idéal fractionnaire de Z engendré par les ξ i : a = ξ Z + · · · + ξ N Z . L’équation (1) page 432 de [Sch67] permet de généraliser la définition 1.5 : H ( B ) = (cid:107) Ξ (cid:107) /N ( a ) .Il reste enfin à définir une notion de proximité entre deux sous-espaces de R n , pasnécessairement de même dimension. On pose de nouveau t = min( d, e ) . Cette no-tion de proximité vient encore de l’article [Sch67], page 443, où Schmidt définit –en s’appuyant notamment sur l’article [Sei55] de J. J. Seidel – t angles entre lessous-espaces A et B de la façon suivante.On munit R n ainsi que la puissance extérieure Λ ( R n ) de leurs normes euclidiennescanoniques respectives. On note pour X, Y ∈ R n \ { } , ψ ( X, Y ) = sin (cid:92) ( X, Y ) = (cid:107) X ∧ Y (cid:107)(cid:107) X (cid:107) · (cid:107) Y (cid:107) où (cid:92) ( X, Y ) désigne l’angle géométrique entre les vecteurs X et Y , et ∧ le produitextérieur sur R n à valeurs dans Λ ( R n ) .On peut alors définir ψ ( A, B ) = min X ∈ A \{ } Y ∈ B \{ } ψ ( X, Y ) (1.2)et on note X , Y des vecteurs unitaires réalisant ce minimum.On construit alors d’autres quantités ψ ( A, B ) , . . . , ψ t ( A, B ) par récurrence sur j ∈ { , . . . , t } .Soit j ∈ { , . . . , t − } , on suppose que ψ ( A, B ) , . . . , ψ j ( A, B ) ont été construites,associées à des couples de vecteurs ( X , Y ) , . . . , ( X j , Y j ) ∈ A × B . On note A j e supplémentaire orthogonal de Vect( X , . . . , X j ) dans A et B j le supplémentaireorthogonal de Vect( Y , . . . , Y j ) dans B . On définit de la même façon ψ j +1 ( A, B ) = min X ∈ A j \{ } Y ∈ B j \{ } ψ ( X, Y ) et on note X j +1 , Y j +1 des vecteurs unitaires réalisant ce minimum. Définition 1.7
Pour j ∈ { , . . . , t } on pose θ j = Arcsin( ψ j ( A, B )) et on appelle θ j le j -ème angle canonique entre A et B .Ces angles sont canoniques dans le sens du théorème 1.8 suivant, qui est le théorème4 page 443 de l’article [Sch67]. Dans ce qui suit, le point · désigne le produit scalaireusuel sur R n . Théorème 1.8
Il existe des bases orthonormales ( X , . . . , X d ) et ( Y , . . . , Y e ) de A et B respectivement, et il existe des réels (cid:54) θ t (cid:54) · · · (cid:54) θ (cid:54) tels que ∀ ( i, j ) ∈ { , . . . , d } × { , . . . , e } , X i · Y j = δ i,j cos θ i où δ est le symbole de Kronecker.De plus, les nombres θ , . . . , θ t sont indépendants des bases ( X , . . . , X d ) et ( Y , . . . , Y e ) vérifiant cette propriété, et sont invariants sous l’effet d’une isométrie appliquée si-multanément à A et à B . Enfin, les réels θ j sont les angles canoniques de la dé-finition 1.7, et les vecteurs X , . . . , X t , Y , . . . , Y t construits avant la définition 1.7peuvent être complétés pour former de telles bases orthonormales.Comme ψ j ( A, B ) = sin( θ j ) , ces bases orthonormales vérifient ∀ ( i, j ) ∈ { , . . . , d } × { , . . . , e } , ψ ( X i , Y j ) = (cid:40) si i (cid:54) = jψ j ( A, B ) si i = j. Remarque 1.9
On utilisera à plusieurs reprises le fait que dim( A ∩ B ) (cid:62) j ⇐⇒ ψ j ( A, B ) = 0 . Ceci permet de formuler une définition équivalente à la définition 1.3 : A ∈ I n ( d, e ) j ⇐⇒ ∀ B ∈ R n ( e ) , ψ j ( A, B ) (cid:54) = 0 . Avec les définitions 1.2, 1.3, 1.5 et avec la définition des ψ j page 8, il est désormaispossible d’énoncer un problème analogue à l’inéquation (1.1) en approximation dio-phantienne classique, mais cette fois-ci avec des sous-espaces vectoriels de R n . C’estce qui est fait page 459 de [Sch67].Soient n (cid:62) et d, e ∈ { , . . . , n − } des entiers tels que d + e (cid:54) n , soit j ∈ { , . . . , min( d, e ) } .Soit A ∈ I n ( d, e ) j un sous-espace ( e, j ) -irrationnel de R n . On cherche les réels β > tels qu’il existe une infinité de sous-espaces rationnels B ∈ R n ( e ) tels que j ( A, B ) (cid:54) H ( B ) β . (1.3)On peut alors observer la similarité entre les inéquations (1.1) et (1.3).Définissons ensuite deux quantités importantes. Notation 1.10
Soit A ∈ I n ( d, e ) j . Notons µ n ( A | e ) j la borne supérieure de l’en-semble des β > tels que l’inéquation (1.3) soit vérifiée pour une infinité de B ∈ R n ( e ) ; si cet ensemble n’est pas majoré, on pose µ n ( A | e ) j = + ∞ .Notons aussi ˚ µ n ( d | e ) j = inf A ∈ I n ( d,e ) j µ n ( A | e ) j . Ainsi, on peut formuler trois problèmes :
Problème 1.11
Pour A ∈ I n ( d, e ) j , déterminer µ n ( A | e ) j en fonction de A et ( n, e, j ) . Problème 1.12
Déterminer ˚ µ n ( d | e ) j en fonction de ( n, d, e, j ) . Problème 1.13
Déterminer l’ensemble µ n ( I n ( d, e ) j | e ) j en fonction de ( n, d, e, j ) , i.e. l’ensemble des valeurs prises par µ n ( A | e ) j lorsque A décrit I n ( d, e ) j .Continuons la comparaison avec l’approximation diophantienne rationnelle clas-sique : • Répondre au problème 1.11 dans le cas de l’approximation diophantienne clas-sique, revient à déterminer l’exposant d’irrationalité d’un irrationnel donné. Ceproblème est encore largement ouvert. À titre d’exemple, la recherche de l’expo-sant d’irrationalité de π est toujours en cours (voir figure 1.1), et de nombreuxprogrès sont faits régulièrement à ce sujet ; on conjecture que µ ( π ) = 2 . • Répondre au problème 1.12 dans le cas de l’approximation diophantienne clas-sique, revient à déterminer le meilleur exposant d’approximation qui soit validepour tous les irrationnels. Le théorème de Dirichlet (voir théorème 2.27) répondà cette question : est le meilleur exposant d’approximation qui fonctionne si-multanément pour tous les irrationnels, c’est-à-dire qu’on a µ ( ξ ) (cid:62) pour tout ξ ∈ R \ Q avec égalité pour au moins un ξ . • Le problème 1.13 dans le cas de l’approximation diophantienne classique revient àdéterminer l’ensemble { µ ( ξ ) , ξ ∈ R \ Q } . Grâce à la théorie des fractions continues(voir par exemple [Jar29]), on peut montrer que { µ ( ξ ) , ξ ∈ R \ Q } = [2 , + ∞ ] .
953 K. Mahler [Mah53] µ ( π ) (cid:54) µ ( π ) (cid:54) . µ ( π ) (cid:54) . µ ( π ) (cid:54) . µ ( π ) (cid:54) . µ ( π ) (cid:54) . Figure 1.1 – Majorations successives de l’exposant d’irrationalité de π Enfin, on peut conclure cette généralisation en remarquant que le problème de l’ap-proximation d’irrationnels par des rationnels est contenu dans la généralisation don-née avec des sous-espaces vectoriels. En effet, approcher ξ ∈ R \ Q revient dans lelangage de l’approximation rationnelle des sous-espaces vectoriels à approcher A ξ = Vect (cid:32)(cid:32) ξ (cid:33)(cid:33) ∈ I (1 , par des sous-espaces vectoriels rationnels B ∈ R (1) . On a µ ( A ξ | = µ ( ξ ) . La réponse idéale au problème 1.12 serait d’avoir une formule donnant explicitementla valeur de la quantité ˚ µ n ( d | e ) j en fonction de ( n, d, e, j ) . Cependant cet objectifest encore loin d’être atteint. Cette section présente les différents résultats connusà ce jour apportant des réponses partielles à ce problème. Dans la sous-section1.3.1, on énonce les résultats initiaux obtenus par Schmidt en 1967, et dans la sous-section 1.3.2 on détaille le cas min( d, e ) = 1 à travers les résultats de M. Laurent en2009. Enfin, on présente dans la sous-section 1.3.3 les résultats récents obtenus parN. Moshchevitin en 2020, et dans la sous-section 1.3.4 ceux obtenus par N. de Saxcé,aussi en 2020. Exposons ici les résultats généraux obtenus par Schmidt sur ˚ µ n ( d | e ) j dans [Sch67].Dans toute la suite, on fixe n (cid:62) et d, e ∈ { , . . . , n − } tels que d + e (cid:54) n . Onnote t = min( d, e ) .Le théorème 12 page 459 de l’article [Sch67] fournit une première minoration. héorème 1.14 (Schmidt, 1967) On a pour tout j ∈ { , . . . , t } , ˚ µ n ( d | e ) j (cid:62) d ( n − j ) j ( n − d )( n − e ) , et même mieux dans le cas j = 1 : ˚ µ n ( d | e ) (cid:62) n ( n − n − d )( n − e ) . Schmidt améliore ce résultat sous une condition dans le théorème 13 page 460 de[Sch67] :
Théorème 1.15 (Schmidt, 1967)
Soit j ∈ { , . . . , t } . Si j + n − t (cid:62) j ( j + n − d − e ) , (1.4)alors ˚ µ n ( d | e ) j (cid:62) j + n − tj ( j + n − d − e ) . Ce théorème est surtout utile lorsque d + e est grand, ce qui permet à la condition(1.4) d’être vérifiée. En effet, si d + e est petit devant n , seul le cas j = 1 permet desatisfaire l’inégalité (1.4).Le théorème 15 page 462 de [Sch67] donne une réponse exacte au problème 1.12dans certains cas particuliers : Théorème 1.16 (Schmidt, 1967) Si n (cid:62) t ( t + n − d − e ) , (1.5)alors ˚ µ n ( d | e ) t = nt ( t + n − d − e ) . On peut remarquer que la condition (1.5) est toujours vérifiée dans le cas où t =min( d, e ) = 1 .Ainsi, Schmidt a donné une réponse complète au problème 1.12 dans le cas où oncherche : • soit à approcher une droite par des sous-espaces rationnels, • soit à approcher un sous-espace par des droites rationnelles.Ce cas a continué à être étudié depuis, et une présentation en est faite dans la sous-section 1.3.2 ci-dessous.Schmidt fournit aussi page 465 de [Sch67], sans aller jusqu’à l’optimalité, une ma-joration dans le cas général : héorème 1.17 (Schmidt, 1967) Soit j ∈ { , . . . , t } . On a ˚ µ n ( d | e ) j (cid:54) j (cid:24) e ( n − e ) + 1 n + 1 − d − e (cid:25) . Ces différentes bornes permettent d’obtenir des encadrements de ˚ µ n ( d | e ) j en fonc-tion de ( n, d, e, j ) . À titre d’exemple et d’illustration, les différents encadrementsconnus de ˚ µ n ( d | e ) j pour n ∈ { , . . . , } sont exposés dans la section 1.5 ci-dessous.Le premier cas encore ouvert est le cas ( n, d, e, j ) = (4 , , , . Les résultats de Schmidt ne donnent que l’encadrement (cid:54) ˚ µ (2 | (cid:54) , qui a été amélioré par Moshchevitin – voir sous-section 1.3.3 – en (cid:54) ˚ µ (2 | (cid:54) et sera l’objet du théorème 3.3. min( d, e ) = 1 A. Khintchine et A. V. Groshev (voir [Gro38]) ont travaillé sur l’approximation d’unsous-espace vectoriel par une droite, mais d’après l’article [Lau09] de Laurent, c’estsurtout Schmidt qui fut le premier à étudier les exposants µ n ( L | e ) où L est unedroite rationnelle de R n . Schmidt adopte un point de vue plus géométrique que celuide Khintchine et Groshev. Grâce au théorème 1.16, Schmidt a complètement résolule problème consistant à déterminer ˚ µ n (1 | e ) et ˚ µ n ( d | , i.e. à approcher des droitesou à approcher par des droites. Cependant d’autres résultats furent apportés sur cesexposants, comme celui du théorème 2 page 3 de l’article [Lau09] de Laurent, énoncéci-dessous. Théorème 1.18 (Laurent, 2009)
Soit A une droite ( n − , -irrationnelle de R n .Alors on a un résultat de Going-up : ∀ e ∈ { , . . . , n − } , µ n ( A | e + 1) (cid:62) ( n − e ) µ n ( A | e ) n − e − , et un résultat de Going-down : ∀ e ∈ { , . . . , n − } , µ n ( A | e − (cid:62) eµ n ( A | e ) µ n ( A | e ) + e − . La première partie de ce théorème améliore le théorème 11 du Going-up de Schmidt([Sch67] page 457) dans le cas particulier dans lequel se place Laurent. Dans laseconde, il retrouve la même minoration que le théorème 2.30.Laurent déduit du théorème 1.18 le corollaire suivant ([Lau09] page 4), qui a untriple intérêt : il retrouve la minoration de Schmidt du théorème 1.15 dans le cas d = 1 , • il donne l’exposant générique, • il donne le spectre de l’exposant dans le cas particulier où A est une droite ( n − , -irrationnelle, répondant au problème 1.13 dans ce cas. Corollaire 1.19 (Laurent)
Soit A une droite ( n − , -irrationnelle de R n . On a ∀ e ∈ { , . . . , n − } , µ n ( A | e ) (cid:62) nn − e avec égalité pour presque tout A par rapport à la mesure de Lebesgue sur R n .De plus, l’ensemble µ n ( I n (1 , n − | e ) est entièrement déterminé : pour tout e ∈{ , . . . , n − } , on a (cid:110) µ n ( A | e ) , A ∈ I n (1 , n − (cid:111) = (cid:20) nn − e , + ∞ (cid:21) . Cet article [Lau09] soulève aussi le problème de déterminer l’ensemble (cid:110) ( µ n ( A | , . . . , µ n ( A | n − ) , A ∈ I n (1 , n − (cid:111) , problème qui a connu des avancées grâce à A. Marnat en 2018 (voir [Mar18]).Enfin, pour approfondir le cas min( d, e ) = 1 , on peut consulter à ce sujet [BL05a],[BL05b] ou [BL10]. Schmidt a montré que ˚ µ (2 | ∈ [3 , . Ce résultat a été amélioré en 2020 : Mosh-chevitin montre dans [Mos20] le théorème 1.20 ci-dessous.Ici, Moshchevitin construit une mesure sur la Grassmannienne Gr , en la plongeantdans R grâce à un système de six cartes affines, puis en tirant en arrière la mesurede Lebesgue sur R ; c’est ce qui lui permet de parler de presque tout sous-espacevectoriel. Théorème 1.20 (Moshchevitin, 2020)
Soit ω une application positive et dé-croissante telle que ∞ (cid:88) j =1 jω ( (cid:112) j ) < ∞ . Pour presque tout A ∈ I (2 , , il existe une constante c > telle que ∀ B ∈ R (2) , ψ ( A, B ) (cid:62) c ω ( H ( B )) . Du théorème 1.20 (appliqué avec ω ( t ) = t − − ε pour ε > ) découle notammentl’existence d’un sous-espace A ∈ I (2 , approché à l’exposant au plus , d’où lecorollaire suivant : orollaire 1.21 (Moshchevitin, 2020) On a ˚ µ (2 | (cid:54) , et même pour presque tout A ∈ I (2 , , µ ( A | (cid:54) . Ainsi, Moshchevitin montre que l’exposant générique relatif au premier angle pourdeux plans dans R se situe dans [3 , . Il énonce de plus une généralisation duthéorème 1.20, en affirmant que la preuve est similaire à celle du théorème 1.20. Théorème 1.22 (Moshchevitin, 2020)
Soient n = 2 d , et ω une application po-sitive et décroissante telle que ∞ (cid:88) j =1 j d − ω ( (cid:112) j ) < ∞ . Pour presque tout A ∈ I n ( d, d ) , il existe une constante c > telle que ∀ B ∈ R n ( d ) , ψ ( A, B ) (cid:62) c ω ( H ( B )) . Comme pour le corollaire 1.21, le théorème 1.22 donne un sous-espace A ∈ I n ( d, d ) approché à l’exposant au plus d , ce qui implique le corollaire suivant : Corollaire 1.23 (Moshchevitin, 2020)
Soit n = 2 d , on a ˚ µ n ( d | d ) (cid:54) d, et même pour presque tout A ∈ I n ( d, d ) , µ n ( A | d ) (cid:54) d. Ceci améliore considérablement la majoration de Schmidt, car le théorème 1.17 avec n = 2 d donne ˚ µ n ( d | d ) (cid:54) d + 1 . À titre d’exemple, le corollaire 1.23 montre que ˚ µ (3 | (cid:54) , ce qui améliore la majoration de Schmidt ˚ µ (3 | (cid:54) . .3.4 Les résultats de Saxcé Soient n (cid:62) et d ∈ { , . . . , (cid:98) n/ (cid:99)} . D’après le théorème 1.14, on a ˚ µ n ( d | d ) d (cid:62) n − d . (1.6)Dans [dS20], Saxcé donne dans le théorème 9.3.2 page 105 l’exposant génériquerelatif au d -ième angle pour deux sous-espaces vectoriels de dimension d de R n . Cetexposant générique est supérieur à la minoration (1.6) de Schmidt. La mesure queSaxcé utilise est la mesure de Lebesgue sur les points réels de la Grassmannienne Gr( d, n ) , c’est ce qui lui permet de parler de presque tout A ∈ Gr( d, n ) . Théorème 1.24 (Saxcé, 2020)
Soient A un sous-espace vectoriel de R n de di-mension d et ω : R + ! R + une fonction décroissante. On considère pour B ∈ R n ( d ) l’inégalité ψ d ( A, B ) (cid:54) ω ( H ( B )) H ( B ) − n/ ( d ( n − d )) . (1.7) • Si (cid:82) ∞ t − ω ( t ) d ( n − d ) t. = + ∞ , alors pour presque tout A ∈ Gr( d, n ) l’inégalité (1.7)admet une infinité de solutions B ∈ R n ( d ) . • Si (cid:82) ∞ t − ω ( t ) d ( n − d ) t. < ∞ , alors pour presque tout A ∈ Gr( d, n ) l’inégalité (1.7)n’admet qu’un nombre fini de solutions B ∈ R n ( d ) .Comme I n ( d, d ) d = X ( R ) \ X ( Q ) avec X = Gr( d, n ) , on déduit du théorème 1.24 lecorollaire suivant. Corollaire 1.25 (Saxcé, 2020)
Pour presque tout A ∈ I n ( d, d ) d , on a µ n ( A | d ) d = nd ( n − d ) . Corollaire 1.26 (Saxcé, 2020)
On a ˚ µ n ( d | d ) d (cid:54) nd ( n − d ) . Saxcé estime possible ([dS20] page 106) qu’on ait égalité dans ce corollaire.Enfin, Saxcé s’intéresse au cas des sous-espaces définis par des équations à coefficientsalgébriques.
Théorème 1.27 (Saxcé, 2020)
Soit A ∈ I n ( d, d ) d un sous-espace vectoriel définipar des équations à coefficients algébriques. Alors µ n ( A | d ) d (cid:62) nd ( n − d ) . (1.8) Remarque 1.28
Dans [dS20] page 107, Saxcé donne une condition nécessaire etsuffisante pour que la minoration (1.8) soit une égalité, ce qui apporte une réponsepartielle au problème 1.11. .4 Plan de la thèse et résultats principaux On termine cette introduction par un bref résumé du contenu de chaque chapitre.On énonce aussi les théorèmes principaux démontrés dans cette thèse.
Chapitre 2
De nombreux outils qui seront utiles pour la suite sont regroupés dans ce chapitre.On commence par développer dans la sous-section 2.1.1 ce que sont les coordonnéesde Plücker, qui permettent de travailler avec la hauteur d’un sous-espace rationnel.On donne ensuite plusieurs outils sur la hauteur dans les sous-sections 2.1.2 et 2.1.3,et sur la proximité dans la section 2.2.Enfin, on énonce deux théorèmes d’approximation simultanée dans la section 2.3, etles théorèmes du Going-up et du Going-down dans la section 2.4.
Chapitre 3
Différents cas particuliers sont étudiés dans ce chapitre. On commence par énoncerquelques outils dans la section 3.1, puis on traite deux cas particuliers dans R et R , respectivement dans les sections 3.2 et 3.3.Le cas le plus simple encore ouvert est la détermination de ˚ µ (2 | , quantité enca-drée entre et par Schmidt en 1967, puis entre et par Moshchevitin en 2020.Le théorème 3.3 la détermine exactement, grâce à un plan explicite de I (2 , particulièrement mal approché par les plans rationnels. C’est ainsi qu’on obtient le : Théorème 3.3
On a ˚ µ (2 | = 3 . Par ailleurs, en considérant un élément explicite de I (3 , mal approché par lesplans rationnels, on obtient une amélioration de l’encadrement connu de ˚ µ (3 | dûà Schmidt. Cette quantité est encadrée par et d’après les théorèmes 1.15 et 1.17respectivement. Théorème 3.9
On a ˚ µ (3 | (cid:54) . Dans la section 3.5, on déduit un nouveau majorant de ˚ µ n ( d | d − comme corollairedu théorème 1.22 : pour d (cid:62) un entier et n = 2 d , on a ˚ µ n ( d | d − (cid:54) d d + 1 . hapitre 4 Des résultats de reconstruction sur le comportement de la proximité et de la hauteurpar somme directe sont obtenus dans la sous-section 4.1.2. Grâce à ces résultats dereconstruction, on améliore asymptotiquement le minorant connu de ˚ µ n ( d | e ) j dansle théorème 4.1. Dans le cas particulier où d = e = j , on obtient alors le corollairesuivant. Corollaire 4.3
Soient n (cid:62) et d (cid:54) n/ un entier. On a ˚ µ n ( d | d ) d (cid:62) dn − d + d + 22 d n − d + d . En combinant ce corollaire avec le corollaire 1.26 de Saxcé, on obtient pour n (cid:62) d l’encadrement dn − d + d + 22 d n − d + d (cid:54) ˚ µ n ( d | d ) d (cid:54) nd ( n − d ) , ce qui permet d’en déduire le résultat suivant. Corollaire 4.4
On a lim n ! + ∞ ˚ µ n ( d | d ) d = 1 d . Chapitre 5
Dans ce chapitre, on démontre le théorème 5.1, qui permet de baisser la dimensionde l’espace ambiant lorsque le sous-espace vectoriel approché est inclus dans unsous-espace rationnel :
Théorème 5.1
Soient n (cid:62) et k ∈ { , . . . , n } . Soient d, e ∈ { , . . . , k − } telsque d + e (cid:54) k , et j ∈ { , . . . , min( d, e ) } . Soit A un sous-espace vectoriel de R n dedimension d tel qu’il existe un sous-espace vectoriel rationnel F ∈ R n ( k ) vérifiant A ⊂ F .Notons ϕ un isomorphisme rationnel de F dans R k et ˜ A = ϕ ( A ) , qui est un sous-espace vectoriel de dimension d de R k .Supposons que pour tout sous-espace rationnel B (cid:48) de F de dimension e , on a dim( A ∩ B (cid:48) ) < j. (1.9)Alors A ∈ I n ( d, e ) j , ˜ A ∈ I k ( d, e ) j et µ n ( A | e ) j = µ k ( ˜ A | e ) j . On déduit ensuite de ce théorème l’amélioration de quelques majorations connuesde ˚ µ n ( d | e ) j dans la section 5.2. On obtient que ˚ µ (2 | (cid:54) , e qui améliore le majorant connu ˚ µ (2 | (cid:54) donné par le théorème 1.17. Ondéduit aussi que pour tout d (cid:62) et pour tout n (cid:62) d , on a ˚ µ n ( d | d ) (cid:54) d et ˚ µ n ( d | d − (cid:54) d d + 1 , ce qui améliore des majorations dans des cas où n est proche de d : ˚ µ (3 | (cid:54) devient ˚ µ (3 | (cid:54) et ˚ µ (4 | (cid:54) devient ˚ µ (4 | (cid:54) / . par exemple. Chapitre 6
L’objectif de ce chapitre est de montrer le résultat suivant sur le spectre de l’exposantrelatif au (cid:96) -ième angle entre deux sous-espaces vectoriels de dimension (cid:96) : Théorème 6.1
Soient n (cid:62) et (cid:96) ∈ { , . . . , (cid:98) n/ (cid:99)} .Alors (cid:34) (cid:96) + (cid:114) (cid:96) , + ∞ (cid:35) ⊂ (cid:110) µ n ( A | (cid:96) ) (cid:96) , A ∈ I n ( (cid:96), (cid:96) ) (cid:96) (cid:111) . Pour ce faire, on construit explicitement un sous-espace vectoriel d’exposant prescritdans la section 6.1. On expose ici les premières valeurs de ˚ µ n ( d | e ) j pour n ∈ { , . . . , } , ce qui per-met d’avoir une idée de l’ordre de grandeur de ˚ µ n ( d | e ) j . Ces valeurs sont présentéesdans les tableaux 1.2, 1.3, 1.4, 1.5 et 1.6 ci-dessous. On se place dans les cas où d + e (cid:54) n , avec d = dim A et e = dim B ; les étoiles correspondent aux cas d + e > n .Pour n ∈ { , . . . , } , les encadrements connus sont principalement dus à Schmidt(théorèmes 1.14, 1.15, 1.16 et 1.17). Les majorations ˚ µ (2 | (cid:54) et ˚ µ (3 | (cid:54) sont dues à Moshchevitin (corollaires 1.21 et 1.23 respectivement), le théorème 1.17de Schmidt donnant seulement ˚ µ (2 | (cid:54) et ˚ µ (3 | (cid:54) . Les majorations ˚ µ (2 | (cid:54) / , ˚ µ (2 | (cid:54) / et ˚ µ (3 | (cid:54) / sont dues à Saxcé (corollaire 1.26),le théorème 1.17 donnant seulement ˚ µ (2 | (cid:54) , ˚ µ (2 | (cid:54) / et ˚ µ (3 | (cid:54) / .Les lignes en gras correspondent aux améliorations présentées dans cette thèse desencadrement connus jusqu’ici de ˚ µ n ( d | e ) j .Remarquons que Schmidt émet l’hypothèse dans [Sch67] page 471 que ˚ µ n ( d | e ) j estune fonction symétrique en d et e , sans aller jusqu’à conjecturer ce résultat. dim A = 1dim B = 1 ˚ µ (1 | = 2 Figure 1.2 – Le cas de R R dim A = 1 dim A = 2dim B = 1 ˚ µ (1 | = ˚ µ (2 | = 3dim B = 2 ˚ µ (1 | = 3 (cid:63) Figure 1.3 – Le cas de R R dim A = 1 dim A = 2 dim A = 3dim B = 1 ˚ µ (1 | = ˚ µ (2 | = 2 ˚ µ (3 | = 4dim B = 2 ˚ µ (1 | = 2 3 (cid:54) ˚ µ (2 | (cid:54) ˚ µ ( | ) = (cid:63) ˚ µ (2 | = 1dim B = 3 ˚ µ (1 | = 4 (cid:63) (cid:63) Figure 1.4 – Le cas de R Le résultat ˚ µ (2 | = 3 est celui du théorème 3.3. R dim A = 1 dim A = 2 dim A = 3 dim A = 4dim B = 1 ˚ µ (1 | = ˚ µ (2 | = ˚ µ (3 | = ˚ µ (4 | = 5dim B = 2 ˚ µ (1 | =
53 209 (cid:54) ˚ µ (2 | (cid:54) (cid:54) ˚ µ (3 | (cid:54) (cid:63) ˚ µ ( | ) (cid:54) µ ( | ) (cid:54) (cid:54) ˚ µ (2 | (cid:54) / µ (3 | = (cid:54) ˚ µ ( | ) dim B = 3 ˚ µ (1 | = (cid:54) ˚ µ (2 | (cid:54) (cid:63) (cid:63) ˚ µ (2 | = dim B = 4 ˚ µ (1 | = 5 (cid:63) (cid:63) (cid:63) Figure 1.5 – Le cas de R La majoration ˚ µ (2 | (cid:54) est celle de la proposition 5.6 (proposition qui combine la roposition 3.5 et le théorème 5.1), la majoration ˚ µ (3 | (cid:54) provient du théorème3.9 et la minoration ˚ µ (2 | (cid:62) / se déduit du théorème 4.1. R dim A = 1 dim A = 2 dim A = 3 dim A = 4 dim A = 5dim B = 1 ˚ µ (1 | = ˚ µ (2 | = ˚ µ (3 | = 2 ˚ µ (4 | = 3 ˚ µ (5 | = 6dim B = 2 ˚ µ (1 | =
32 158 (cid:54) ˚ µ (2 | (cid:54) (cid:54) ˚ µ (3 | (cid:54) (cid:54) ˚ µ (4 | (cid:54) (cid:63) (cid:54) ˚ µ (2 | (cid:54) ˚ µ ( | ) (cid:54) ˚ µ (4 | = (cid:54) ˚ µ ( | ) ˚ µ (3 | = 1dim B = 3 ˚ µ (1 | = 2 (cid:54) ˚ µ (2 | (cid:54) (cid:54) ˚ µ (3 | (cid:54) (cid:63) (cid:63) (cid:54) ˚ µ (3 | (cid:54) µ (2 | = 1 (cid:54) ˚ µ (3 | (cid:54) (cid:54) ˚ µ ( | ) dim B = 4 ˚ µ (1 | = 3 5 (cid:54) ˚ µ (2 | (cid:54) (cid:63) (cid:63) (cid:63) ˚ µ (2 | = dim B = 5 ˚ µ (1 | = 6 (cid:63) (cid:63) (cid:63) (cid:63) Figure 1.6 – Le cas de R Les minorations ˚ µ (2 | (cid:62) / et ˚ µ (3 | (cid:62) / sont des cas particuliers duthéorème 4.1. La majoration ˚ µ (3 | (cid:54) / se déduit du théorème 3.15 qui découledes résultats de Moshchevitin (théorème 1.22). ˚ µ n ( d | e ) e Commençons par mentionner le théorème 8 page 449 de [Sch67] :
Théorème 1.31
Soient n (cid:62) et d ∈ { , . . . , n − } , posons t = min( d, n − d ) ;soit A ∈ I n ( d, t ) t . Il existe des sous-espaces B ⊂ · · · ⊂ B t de R n (1) , . . . , R n ( t ) respectivement, tels que pour tout j ∈ { , . . . , t } , on a H ( B ) ψ j ( A, B j ) (cid:54) cH ( B j ) d/ ( j ( n − d )) où c > ne dépend uniquement de n , d et e .On peut alors remarquer – comme le fait Schmidt en conclusion de [Sch67] – qu’unsous-espace mal approché par les droites rationnelles est très bien approché par dessous-espaces rationnels de dimension supérieure. Explicitons ce que donne l’approchequ’il propose.Soient n (cid:62) , d, e ∈ { , . . . , n − } des entiers tels que e (cid:54) d (cid:54) n − e , et A ∈ I n ( d, e ) e .Supposons que pour tout ε > , il n’existe qu’un nombre fini droites rationnelles B telles que ψ ( A, B ) (cid:54) H ( B ) n/ ( n − d )+ ε . insi, pour tout ε > il existe une constante c > dépendant uniquement de A ,de n et de ε telle que ∀ B ∈ R n (1) , ψ ( A, B ) (cid:62) c H ( B ) n/ ( n − d )+ ε soit ∀ B ∈ R n (1) , H ( B ) (cid:54) c ψ ( A, B ) ( n − d ) / ( n + ε ( n − d )) avec c > ne dépendant que de A , de n et de ε . Le théorème 1.31 donne alors uneinfinité de sous-espaces B ⊂ · · · ⊂ B e de R n (1) , . . . , R n ( e ) respectivement, tels que ψ e ( A, B e ) (cid:54) H ( B ) · cH ( B e ) d/ ( e ( n − d )) (cid:54) c ψ ( A, B ) ( n − d ) / ( n + ε ( n − d )) H ( B e ) d/ ( e ( n − d )) avec c > ne dépendant que de A , de n , de e et de ε . Or d’après le lemme 2.24, ona ψ ( A, B ) (cid:54) ψ e ( A, B e ) , donc ψ e ( A, B e ) (cid:54) c H ( B e ) − de ( n − d ) · n + ε ( n − d ) d + ε ( n − d ) avec c > ne dépendant que de A , de n , de e et de ε . Finalement, en faisant tendre ε vers , on obtient µ n ( A | e ) e (cid:62) ne ( n − d ) . En comparant ce résultat avec le corollaire 1.26 qui donne ˚ µ n ( d | d ) d (cid:54) n/ ( d ( n − d )) ,on émet la conjecture suivante qui rejoint, lorsque d = e , la possibilité évoquée parSaxcé ([dS20] page 106) qu’on ait égalité dans le corollaire 1.26. De plus, d’après lethéorème 1.16, cette conjecture est vraie si n (cid:62) e ( n − d ) . Conjecture 1.32
Soient n (cid:62) , d, e ∈ { , . . . , n − } des entiers tels que e (cid:54) d (cid:54) n − e . On a ˚ µ n ( d | e ) e = ne ( n − d ) . On remarque aussi que le corollaire 1.25 donne que µ n ( A | d ) d = n/ ( d ( n − d )) pourpresque tout A ∈ I n ( d, d ) d .Enfin, Schmidt émet l’hypothèse que ˚ µ n ( d | e ) j soit une fonction symétrique de d et e ([Sch67] page 471). Dans ce cas, la conjecture 1.32 s’étend au cas e > d et devient ˚ µ n ( d | e ) min( d,e ) = n min( d, e )( n − max( d, e )) . hapitre 2Des outils Dans ce chapitre, après avoir développé les coordonnées de Plücker dans la sous-section 2.1.1, qui permettront d’énoncer des résultats utiles pour travailler avec lahauteur d’un sous-espace rationnel, il s’agira de donner quelques résultats sur lahauteur (sous-sections 2.1.2 et 2.1.3) et sur la proximité (section 2.2).On énonce aussi quelques théorèmes connus, d’approximation simultanée et de Going-up/Going-down dans les sections 2.3 et 2.4.
Les coordonnées de Plücker sont au cœur de la définition 1.5 de la hauteur d’unsous-espace rationnel. Cette sous-section rappelle quelques résultats sur ces coor-données, en s’appuyant sur le chapitre I du livre [CG15] de Caldero et Germoni,dans lequel tous les résultats énoncés ici sont démontrés.Soient m, n, r ∈ N ∗ tels que r (cid:54) min( m, n ) ; on note Λ( r, n ) l’ensemble des parties à r éléments de { , . . . , n } . Pour I ∈ Λ( r, m ) , J ∈ Λ( r, n ) et A une matrice de taille m × n , on note ∆ I,J ( A ) le mineur correspondant aux lignes de A indexées par I , etaux colonnes de A indexées par J .Si I et J sont deux parties de { , . . . , n } , on définit ι ( I, J ) le nombre d’inversionsde I à J par ι ( I, J ) = Card( { ( i, j ) ∈ I × J, i > j } ) . On note ¯ I le complémentaire de I dans { , . . . , n } , et (cid:96) ( I ) = ι ( I, ¯ I ) .Une formule qui sera utile par la suite est la suivante. Elle généralise le développe-ment par rapport à une ligne ou une colonne du déterminant d’une matrice. Proposition 2.1 (développement de Laplace)
Soient A ∈ M n ( R ) et J ∈ Λ( r, n ) .Alors det( A ) = (cid:88) I ∈ Λ( r,n ) ( − (cid:96) ( I )+ (cid:96) ( J ) ∆ I,J ( A )∆ ¯ I, ¯ J ( A ) . xemple 2.2 Comme le cas de A ∈ M ( R ) sera utilisé par la suite, illustrons ledéveloppement de Laplace en calculant le déterminant de A par rapport à ses deuxpremières colonnes ( J = { , } ). On a (cid:96) ( { , } ) = ι ( { , } , { , } ) = Card( { ( i, j ) ∈ { , } × { , } , i > j } ) = 0 , et de même (cid:96) ( { , } ) = 1 , (cid:96) ( { , } ) = 2 , (cid:96) ( { , } ) = 2 , (cid:96) ( { , } ) = 3 et (cid:96) ( { , } ) = 4 , donc det( A ) = ∆ { , } , { , } ( A )∆ { , } , { , } ( A ) − ∆ { , } , { , } ( A )∆ { , } , { , } ( A )+∆ { , } , { , } ( A )∆ { , } , { , } ( A )+∆ { , } , { , } ( A )∆ { , } , { , } ( A ) − ∆ { , } , { , } ( A )∆ { , } , { , } ( A )+∆ { , } , { , } ( A )∆ { , } , { , } ( A ) . Soient A ∈ M n,m ( R ) et r (cid:54) min( n, m ) . On utilise l’ordre lexicographique sur Λ( r, n ) et Λ( r, m ) , ce qui permet d’identifier Λ( r, n ) à { , . . . , N } et Λ r ( R n ) à R N , où N = (cid:0) nr (cid:1) . On définit la r -ième puissance extérieure de A , comme la matrice dont lescoefficients sont les mineurs extraits de taille r × r , i.e. Λ r ( A ) = (∆ I,J ( A )) I ∈ Λ( r,n ) ,J ∈ Λ( r,m ) . Ces quelques notations permettent d’arriver au théorème du plongement de Plücker.L’idée du plongement de Plücker est de voir les sous-espaces vectoriels de R n de di-mension d , comme des points d’un espace projectif. Autrement dit, de voir tous lessous-espaces vectoriels de R n comme des droites d’un espace plus grand.On note P ( R n ) l’ensemble des droites vectorielles de R n et Gr r,n l’ensemble dessous-espaces vectoriels de R n de dimension r , qui s’appelle la Grassmannienne. Théorème 2.3 (plongement de Plücker)
Soient n (cid:62) un entier et r ∈ { , . . . , n − } .Soient F un sous-espace vectoriel de dimension r de R n et A F ∈ M n,r ( R ) la matriced’une base de F dans la base canonique de R n .Alors la droite engendrée par Λ r ( A F ) ne dépend que de F . On note [Λ r ( A F )] lepoint correspondant dans l’espace projectif, et N = (cid:0) nr (cid:1) . On peut donc définir uneapplication ψ r,n par ψ r,n : Gr r,n (cid:44) −! P ( R N ) F [Λ r ( A F )] . De plus, cette application – appelée plongement de Plücker de Gr r,n – est injective.Arrive alors la définition clef de ce paragraphe. Définition 2.4
Soit F un sous-espace vectoriel de R n de dimension r ; on note A F la matrice d’une base de F dans la base canonique. Les (cid:0) nr (cid:1) coordonnées du vecteur Λ r ( A F ) sont appelées coordonnées de Plücker de F . ans toute la suite, les coordonnées de Plücker (qui sont les mineurs de taille maxi-male de A F ) seront donc ordonnées par l’ordre lexicographique. Remarque 2.5
Le théorème 2.3 assure que deux sous-espaces vectoriels différentsauront des coordonnées de Plücker associées non proportionnelles, et que les coor-données de Plücker d’un sous-espace donné sont uniques à multiplication par unscalaire près. Ce sont ces deux points cruciaux qui donnent tout leur intérêt auxcoordonnées de Plücker.Le théorème 2.3 construit un plongement ψ r,n de Gr r,n dans P ( R N ) , mais une ques-tion reste en suspens : quels sont les points de P ( R N ) qui ont un antécédent par ψ r,n ?Autrement dit, quels points de l’espace projectif sur R N correspondent effectivementà un sous-espace vectoriel ? Cette question est résolue dans le théorème suivant : Théorème 2.6 (relations de Plücker)
Soient n (cid:62) et r ∈ { , . . . , n − } ; posons N = (cid:0) nr (cid:1) . Soit ψ r,n : Gr r,n (cid:44) ! P ( R N ) le plongement de Plücker de Gr r,n .Alors l’image de ψ r,n est l’ensemble des points v = ( v K ) K ∈ Λ( r,n ) de P ( R N ) vérifiantle système d’équations suivant : (cid:88) (cid:54) k (cid:54) r +1 j k / ∈ I ( − k + ι ( I, { j k } ) v I ∪{ j k } v J \{ j k } = 0 pour tout I ∈ Λ( r − , n ) et pour tout J = { j < · · · < j r +1 } ∈ Λ( r + 1 , n ) .Ces équations sont appelées relations de Plücker .Maintenant que les coordonnées de Plücker ont été définies, on donne un corollairedu développement de Laplace (proposition 2.1) en termes de coordonnées de Plücker. Corollaire 2.7 (développement de Laplace)
Soient n (cid:62) , a, b ∈ { , . . . , n − } tels que a + b = n , M A ∈ M n,a ( R ) et M B ∈ M n,b ( R ) deux matrices de rangs a et b respectivement. Notons M la matrice carrée définie comme suit, par blocs : M = (cid:16) M A M B (cid:17) ∈ M n ( R ) . Notons A et B les sous-espaces vectoriels de R n engendrés par les colonnes de M A et M B respectivement. Posons N = (cid:0) na (cid:1) = (cid:0) nb (cid:1) , et notons ( ζ , . . . , ζ N ) les coordonnéesde Plücker de A associées à M A et classées par ordre lexicographique, et ( η , . . . , η N ) celles de B associées à M B et classées par ordre lexicographique.Alors il existe une fonction ε à valeurs dans {± } telle que det( M ) = N (cid:88) i =1 ε ( i ) ζ i η N +1 − i . On finit avec un lemme permettant de montrer qu’on peut trouver un représentantdes coordonnées de Plücker de n’importe quel sous-espace rationnel, tel que celles-cisoient entières et premières entre elles. On inclut une preuve de ce lemme, fauted’avoir trouvé une référence pour celui-ci. emme 2.8 Soient n (cid:62) un entier, e ∈ { , . . . , n } et B ∈ R n ( e ) . Il existe une base ( X , . . . , X e ) de B ∩ Z n telle qu’en notant η = ( η , . . . , η N ) , où N = (cid:0) ne (cid:1) , les coordon-nées de Plücker associées à ( X , . . . , X e ) et ordonnées selon l’ordre lexicographique,on ait η ∈ Z N et pgcd( η , . . . , η N ) = 1 . Preuve.
Comme B est un sous-espace rationnel, B ∩ Z n est un sous- Z -module du Z -modulelibre Z n . D’après le théorème de la base adaptée, il existe une base ( X , . . . , X n ) de Z n et des entiers d , . . . , d e (cid:62) tels que ( d X , . . . , d e X e ) soit une base de B ∩ Z n .Soit i ∈ { , . . . , e } . Comme d i X i ∈ B ∩ Z n et que X i ∈ Z n , on a X i ∈ B ∩ Z n , d’où d i = 1 .Finalement, ( X , . . . , X e ) est une base de B ∩ Z n .Notons M la matrice de M n ( Z ) dont les colonnes sont respectivement X , . . . , X n .Notons M la matrice de M n,e ( Z ) formée des e premières colonnes de M et M lamatrice de M n,n − e ( Z ) formée des n − e dernières colonnes de M .Remarquons que les mineurs de taille e × e de M donnent le représentant ( η , . . . , η N ) ∈ Z N ,des coordonnées de Plücker de B associées à sa base ( X , . . . , X e ) . Notons δ , . . . , δ N les mineurs de taille ( n − e ) × ( n − e ) de M dans l’ordre lexicographique.En appliquant la proposition 2.1 du développement de Laplace, on obtient | det M | = (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) N (cid:88) i =1 ε ( i ) η i δ N +1 − i (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) où ε est une fonction à valeurs dans {± } . Or | det M | = covol( Z n ) = 1 , donc (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) N (cid:88) i =1 ε ( i ) η i δ N +1 − i (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) = 1 , ce qui est une relation de Bézout généralisée. Finalement, pgcd( η , . . . , η N ) = 1 . (cid:3) .1.2 Déterminant généralisé Donnons ici plusieurs résultats montrés par Schmidt [Sch67] sur la complexité et laproximité des sous-espaces de R n , qui ont en commun la notion suivante qui n’estrien d’autre que la racine carrée du déterminant de Gram. Définition 2.9
Soit ( X , . . . , X (cid:96) ) une famille de vecteurs de R n . Notons M ∈ M n,(cid:96) ( R ) la matrice dont la j -ème colonne est X j pour tout j ∈ { , . . . , (cid:96) } . On définit le dé-terminant généralisé de la famille ( X , . . . , X (cid:96) ) comme D ( X , . . . , X (cid:96) ) = (cid:112) det( t M M ) = (cid:112)
Gram( X , . . . , X (cid:96) ) . Le déterminant généralisé possède les propriétés suivantes, données dans [Sch67]page 434.
Proposition 2.10
Soit X , . . . , X (cid:96) une famille de vecteurs de R n . On a ( i ) D ( X , . . . , X (cid:96) ) (cid:62) ; ( ii ) D ( X , . . . , X (cid:96) ) = 0 si, et seulement si, ( X , . . . , X (cid:96) ) est liée ; ( iii ) D ( X , . . . , X (cid:96) ) = D ( X σ (1) , . . . , X σ ( (cid:96) ) ) pour toute permutation σ ∈ S (cid:96) ; ( iv ) D ( ρ ( X ) , . . . , ρ ( X (cid:96) )) = D ( X , . . . , X (cid:96) ) si ρ est une transformation orthogonale ; ( v ) D ( X , . . . , tX k , . . . , X (cid:96) ) = | t | D ( X , . . . , X (cid:96) ) pour tout t ∈ R et pour tout k ∈ { , . . . , (cid:96) } ; ( vi ) D ( X , . . . , X (cid:96) ) = D ( X , . . . , X k + cX m , . . . , X (cid:96) ) pour tout c ∈ R et pour tout m (cid:54) = k .Schmidt définit dans l’équation (6) page 446 de son article une quantité qui regroupetous les angles canoniques entre deux sous-espaces A et B tels que min(dim A, dim B ) = t : ϕ ( A, B ) = t (cid:89) i =1 ψ i ( A, B ) . (2.1)Il démontre page 446 de [Sch67] le résultat suivant : Proposition 2.11
Soient ( X , . . . , X d ) une base de A et ( Y , . . . , Y e ) une base de B , alors ϕ ( A, B ) = D ( X , . . . , X d , Y , . . . , Y e ) D ( X , . . . , X d ) D ( Y , . . . , Y e ) . Ce résultat montre que la proximité de A et B s’exprime en fonction de détermi-nants généralisés. C’est en fait surtout celui du numérateur qui importe ici : on vavoir (remarque 2.15 ci-dessous) que le dénominateur est le produit des hauteurs de A et B , si les bases sont bien choisies.En effet, cette notion conduit à une définition équivalente de la hauteur d’un sous-espace rationnel (proposition 2.14). Pour relier déterminant généralisé et hauteur,fixons quelques notions de géométrie. éfinition 2.12 On appelle réseau de R n tout Z -module engendré par des vecteurs R -linéairement indépendants dans R n .Soit Γ un réseau de R n ; on appelle rang de Γ , noté rg(Γ) , le rang du Z -moduleassocié. Une base de Γ , est une base de ce Z -module. Définition 2.13
Soient Γ un réseau de R n de rang e ∈ { , . . . , n } et ( x , . . . , x e ) une base de Γ . Notons X ∈ M n,e ( R ) la matrice dont les colonnes sont respectivement x , . . . , x e . On définit le covolume de Γ , noté covol(Γ) , comme covol(Γ) = | det X | . Géométriquement, le covolume d’un réseau correspond à la mesure d’un parallélé-pipède minimal, i.e. de mesure minimale, de ce réseau (pour la mesure de Lebesguesur
Vect(Γ) ). Autrement dit, c’est le volume d’une maille de ce réseau, et celui duquotient
Vect(Γ) / Γ . Cette notion conduit à la proposition suivante (théorème 1 page435 de [Sch67]). Proposition 2.14
Soit B un sous-espace rationnel de R n . On a H ( B ) = covol( B ∩ Z n ) . Ainsi, la définition 1.5 et la proposition 2.14 fournissent deux points de vue équiva-lents sur la hauteur d’un sous-espace vectoriel. La définition 1.5 donne une visionalgébrique de la hauteur, quand la proposition 2.14 en propose une plus géométrique.Pour relier ceci au déterminant généralisé, on peut remarquer (voir page 298 de[Fis14]) que si X , . . . , X (cid:96) sont des vecteurs de R n , D ( X , . . . , X (cid:96) ) est le (cid:96) -volumedu parallélotope défini par X , . . . , X (cid:96) ( i.e. le volume de ce parallélotope vu dansl’espace euclidien Vect( X , . . . , X (cid:96) ) s’il est de dimension (cid:96) , sinon). On en déduit laremarque suivante : Remarque 2.15 Si B ∈ R n ( e ) et que ( X , . . . , X e ) est une Z -base de B ∩ Z n , alors H ( B ) = D ( X , . . . , X e ) . Cette sous-section s’inspire du résultat énoncé dans l’équation (6) page 433 de[Sch67], sur le comportement de la hauteur vis-à-vis d’une transformation linéaireinversible. On étend ici ce résultat à certains cas où le morphisme n’est pas inver-sible. La preuve est très similaire à celle page 433 de [Sch67].Ici et dans toute la suite, (cid:107)·(cid:107) désignera la norme euclidienne canonique.
Proposition 2.16
Soient n (cid:62) et e, p ∈ { , . . . , n } ; soient B ∈ R e ( n ) et F deuxsous-espaces vectoriels rationnels de R n tels que B ⊂ F ; soit ϕ : F ! R p un mor-phisme rationnel tel que im ϕ ( B ) = dim B. Alors il existe une constante c ( ϕ ) > , indépendante de B , telle que H ( ϕ ( B )) (cid:54) c ( ϕ ) H ( B ) . Preuve.
On prolonge ϕ en un endomorphisme rationnel de R n en étendant son espace d’ar-rivée de R p à R n et en posant ϕ ( x ) = x pour tout x ∈ F ⊥ .On commence par démontrer le résultat pour un sous-espace rationnel L de dimen-sion .Soit ξ = ( ξ , . . . , ξ n ) ∈ Z n tel que pgcd( ξ , . . . , ξ n ) = 1 et L = Vect( ξ ) . On a alors ϕ ( L ) = Vect( ϕ ( ξ )) , et il existe c ( ϕ ) > indépendante de ξ telle que (cid:107) ϕ ( ξ ) (cid:107) (cid:54) c ( ϕ ) (cid:107) ξ (cid:107) . Notons ( ζ , . . . , ζ n ) ∈ Q n les coordonnées de ϕ ( ξ ) .Comme ϕ ∈ M n ( Q ) , il existe k ∈ Z tel que kϕ ∈ M n ( Z ) . Alors kϕ ( ξ ) ∈ Z n , donc ∀ i ∈ { , . . . , n } , kζ i ∈ Z . En notant b l’idéal fractionnaire engendré par les ζ i , on a alors k b = k ( ζ Z + · · · + ζ n Z ) ⊂ Z , d’où kN ( b ) = N ( k b ) (cid:62) . Ceci donne en utilisant la remarque 1.6 que H ( ϕ ( L )) = N ( b ) − (cid:107) ϕ ( ξ ) (cid:107) (cid:54) kc ( ϕ ) (cid:107) ξ (cid:107) = c ( ϕ ) (cid:107) ξ (cid:107) = c ( ϕ ) H ( L ) en posant c ( ϕ ) = kc ( ϕ ) .Montrons maintenant le résultat pour un sous-espace rationnel B de dimension e . Onpose N = (cid:0) ne (cid:1) .On note B ∗ la droite rationnelle de R N engendrée par les coordonnées de Plücker de B . Comme par hypothèse dim ϕ ( B ) = dim B , la droite rationnelle ϕ ( B ) ∗ engendréepar les coordonnées de Plücker de ϕ ( B ) appartient elle aussi à R N .D’après la définition 1.5 de la hauteur, on a H ( B ) = H ( B ∗ ) et H ( ϕ ( B )) = H ( ϕ ( B ) ∗ ) . ar ailleurs, si S ∈ M n ( Q ) est la matrice de ϕ dans la base canonique de R n , alors Λ e ( S ) ∈ M N ( Q ) est la matrice de ϕ ( e ) , la e -ième puissance composée de ϕ , dans labase canonique de R N . D’après [Sch67] page 433, on a alors ϕ ( B ) ∗ = ϕ ( e ) ( B ∗ ) , donc H ( ϕ ( B ) ∗ ) = H ( ϕ ( e ) ( B ∗ )) . On est alors ramené au cas de la dimension dans R N , et il est possible d’appliquerle début de la preuve pour conclure.On remarque que la constante c ( ϕ ) ne dépend pas de e quitte à considérer c ( ϕ ) = max (cid:54) e (cid:54) n c ( e ) ( ϕ ) . (cid:3) Remarque 2.17
La proposition 2.16 s’applique à tout B ∈ R n ( e ) si ϕ est unautomorphisme de R n . Dans cette section sont exposés plusieurs outils sur les angles entre deux sous-espacesvectoriels. Un premier lemme permet de calculer la proximité entre un vecteur et sonprojeté orthogonal sur un sous-espace vectoriel. Ce lemme est illustré sur la figure2.1 ci-dessous.
Figure 2.1 – Illustration des lemmes 2.18 et 2.19 emme 2.18 Soient F un sous-espace vectoriel de R n , p ⊥ F la projection orthogonalesur F et X ∈ R n \ F ⊥ . Alors ψ ( X, p ⊥ F ( X )) = (cid:13)(cid:13) X − p ⊥ F ( X ) (cid:13)(cid:13) (cid:107) X (cid:107) . Preuve.
On utilise la définition géométrique du sinus dans le triangle rectangle formé par lesvecteurs X et p ⊥ F ( X ) . (cid:3) Le lemme suivant permet de majorer l’angle entre deux vecteurs en fonction de leursnormes. Il est aussi illustré sur la figure 2.1.
Lemme 2.19
Soient X et Y deux vecteurs non nuls. On a ψ ( X, Y ) (cid:54) (cid:107) X − Y (cid:107)(cid:107) X (cid:107) . Preuve.
On applique le lemme 2.18 avec F = Vect( Y ) . On note p ⊥ Vect( Y ) la projection ortho-gonale sur Vect( Y ) . D’après le théorème de Pythagore, on a (cid:107) X − Y (cid:107) = (cid:13)(cid:13) X − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) + (cid:13)(cid:13) Y − p ⊥ F ( X ) (cid:13)(cid:13) , donc (cid:13)(cid:13) X − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) (cid:54) (cid:107) X − Y (cid:107) et le résultat découle du lemme 2.18. (cid:3) À l’inverse du lemme 2.19, le prochain lemme permet de minorer l’angle entre deuxvecteurs en fonction de leurs normes. Celui-ci est illustré sur la figure 2.2. igure 2.2 – Illustration du lemme 2.20 Lemme 2.20
Soient X et Y deux vecteurs unitaires tels que X · Y (cid:62) . On a ψ ( X, Y ) (cid:62) √ (cid:107) X − Y (cid:107) . Preuve.
On note p ⊥ Vect( Y ) la projection orthogonale sur Vect( Y ) , ainsi que α = (cid:13)(cid:13) X − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) et β = (cid:13)(cid:13) Y − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) . D’après le théorème de Pythagore, on a (cid:107) X − Y (cid:107) = α + β . Or X est unitaire, donc d’après le lemme 2.18, on a ψ ( X, Y ) = ψ ( X, p ⊥ Vect( Y ) ( X )) = (cid:13)(cid:13) X − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) = α. De plus X · Y (cid:62) , donc en appliquant à nouveau le théorème de Pythagore, on a (cid:107) X (cid:107) = (1 − β ) + α . Il existe donc θ ∈ [0 , π/ tel que − β = cos θ et α = sin θ . Or ∀ θ ∈ [0 , π/ , − cos θ (cid:54) sin θ, onc β (cid:54) α = (cid:13)(cid:13) X − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) . Finalement, (cid:107) X − Y (cid:107) (cid:54) α = 2 ψ ( X, Y ) . (cid:3) Le lemme ci-dessous relie l’angle entre un vecteur et un sous-espace vectoriel, àl’angle entre le vecteur et son projeté orthogonal sur le sous-espace. Il est illustrésur la figure 2.3 ci-dessous.
Lemme 2.21
Soient X ∈ R n \ { } et F un sous-espace vectoriel de R n tel que dim F ∈ { , . . . , n − } . Notons p ⊥ F la projection orthogonale sur F . On a ψ (Vect( X ) , F ) = ψ ( X, p ⊥ F ( X )) . Preuve.
Sans perte de généralité, on peut supposer que X est unitaire ; soit Y ∈ F \ { } . Si X ∈ F le résultat est trivial. Sinon, on note p ⊥ Vect( Y ) la projection orthogonale sur Vect( Y ) , le triangle dont les sommets sont les vecteurs X , p ⊥ Vect( Y ) ( X ) et p ⊥ F ( X ) estrectangle en p ⊥ F ( X ) . Ainsi, (cid:13)(cid:13) X − p ⊥ F ( X ) (cid:13)(cid:13) (cid:54) (cid:13)(cid:13) X − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) . D’après le lemme 2.18 et comme X est un vecteur unitaire, on a ψ ( X, p ⊥ F ( X )) = (cid:13)(cid:13) X − p ⊥ F ( X ) (cid:13)(cid:13) donc toujours d’après le lemme 2.18 ψ ( X, Y ) = ψ ( X, p ⊥ Vect( Y ) ( X )) = (cid:13)(cid:13) X − p ⊥ Vect( Y ) ( X ) (cid:13)(cid:13) , donc ψ ( X, p ⊥ F ( X )) (cid:54) ψ ( X, Y ) . D’après l’équation (1.2) définissant ψ , on a donc ψ (Vect( X ) , F ) = min Z ∈ F \{ } ψ ( X, Z ) = ψ ( X, p ⊥ F ( X )) . (cid:3) igure 2.3 – Illustration du lemme 2.21Les deux résultats suivants correspondent respectivement au lemme 12 et à soncorollaire dans l’article [Sch67] page 444. Proposition 2.22 (Schmidt)
Soient A et B deux sous-espaces vectoriels de R n de dimensions respectives d et e . Alors pour tout j ∈ { , . . . , min( d, e ) } , ψ j ( A, B ) est le plus petit réel ψ (cid:62) tel qu’il existe un sous-espace A (cid:48) ⊂ A de dimension j telque ∀ X ∈ A (cid:48) \ { } , ∃ Y ∈ B \ { } , ψ ( X, Y ) (cid:54) ψ. Corollaire 2.23 (Schmidt)
Soient A (cid:48) ⊂ A et B (cid:48) ⊂ B quatre sous-espaces vecto-riels de R n . Alors ∀ j ∈ { , . . . , min( A (cid:48) , B (cid:48) ) } , ψ j ( A, B ) (cid:54) ψ j ( A (cid:48) , B (cid:48) ) . On déduit de la proposition 2.22 le lemme suivant.
Lemme 2.24
Soient A et B deux sous-espaces vectoriels non triviaux de R n telsque dim A (cid:54) dim B . Alors ∀ X ∈ A \ { } , ψ (Vect( X ) , B ) (cid:54) ψ dim A ( A, B ) . Preuve.
Soit X ∈ A \ { } . On a ψ (Vect( X ) , B ) = min Y ∈ B \{ } ψ ( X, Y ) (cid:54) max Z ∈ A \{ } min Y ∈ B \{ } ψ ( Z, Y )= min { ϕ, ∀ Z ∈ A \ { } , ∃ Y ∈ B \ { } , ψ ( Z, Y ) (cid:54) ϕ } = ψ dim A ( A, B ) d’après la proposition 2.22. (cid:3) entionnons une inégalité triangulaire entre les angles ([Sch67], équation (3) page446). Proposition 2.25 (Schmidt)
Pour tous
X, Y, Z ∈ R n non nuls, on a ψ ( X, Z ) (cid:54) ψ ( X, Y ) + ψ ( Y, Z ) . Finalement, énonçons une proposition sur la proximité entre deux sous-espaces trans-formés par une transformation rationnelle inversible. Celle-ci regroupe la fin du théo-rème 1.8 et le lemme 13 page 446 de l’article [Sch67].
Proposition 2.26 (Schmidt)
Soient A et B deux sous-espaces vectoriels de R n de dimensions respectives d et e , et ϕ ∈ GL n ( Q ) . Il existe une constante c ϕ > (indépendante de A et de B ) telle que ∀ j ∈ { , . . . , min( d, e ) } , ψ j ( ϕ ( A ) , ϕ ( B )) (cid:54) c ϕ ψ j ( A, B ) . De plus, si ϕ est une isométrie, alors ∀ j ∈ { , . . . , min( d, e ) } , ψ j ( ϕ ( A ) , ϕ ( B )) = ψ j ( A, B ) . Dans cette section, on énonce deux théorèmes d’approximation simultanée qui ser-viront dans les chapitres 3 et 4.Commençons par le théorème d’approximation simultanée de Dirichlet (voir [HW07]théorème 200 page 216).
Théorème 2.27 (Dirichlet)
Soient d (cid:62) entier et x ∈ R d \ Q d . Il existe uneinfinité de couples ( p, q ) ∈ Z d × N ∗ tels que pgcd( p , . . . , p d , q ) = 1 et (cid:13)(cid:13)(cid:13)(cid:13) x − pq (cid:13)(cid:13)(cid:13)(cid:13) ∞ (cid:54) q /d . Mentionnons aussi le corollaire du théorème 2 de l’article [Sch70] qui permet deminorer les valeurs entières d’une forme linéaire à coefficients algébriques.
Proposition 2.28 (Schmidt, 1970)
Soient α , . . . , α k des nombres algébriques telsque , α , . . . , α k soient linéairement indépendants sur Q . Alors pour tout ε > ,il existe une constante c > , telle que pour tous entiers q , . . . , q k , p tels que max( | q | , . . . , | q k | ) > , on ait (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) p + k (cid:88) i =1 q i α i (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) (cid:62) c max( | q | , . . . , | q k | ) − k − ε . .4 Théorèmes de Going-up et Going-down Ces théorèmes sont démontrés dans [Sch67] (théorèmes 9 et 10 page 453, en faisantattention, car il y a un " +1 " au lieu d’un " − " dans le théorème du Going-up, et unsigne " − " oublié dans le théorème du Going-down), et permettent de déduire desrésultats en changeant la dimension du sous-espace vectoriel approchant. Théorème 2.29 (Going-up, Schmidt, 1967)
Soient d, e ∈ N ∗ tels que d + e < n ;posons t = min( d, e ) . Soient A un sous-espace de R n de dimension d et B ∈ R n ( e ) .Soit H (cid:62) tel que H ( B ) (cid:54) H , et tel qu’il existe des x i , y i ∈ R tels que ∀ i ∈ { , . . . , t } , H ( B ) x i ψ i ( A, B ) (cid:54) c H − y i avec c > .Alors il existe une constante c > dépendant uniquement de n et de e , et uneconstante c > dépendant uniquement de n , e , x i et y i , telles qu’en posant H (cid:48) = c H ( n − e − / ( n − e ) , il existe C ∈ R n ( e + 1) tel que C ⊃ BH ( C ) (cid:54) H (cid:48) ∀ i ∈ { , . . . , t } , H ( C ) x i ( n − e ) / ( n − e − ψ i ( A, C ) (cid:54) c c H (cid:48)− y i ( n − e ) / ( n − e − . Théorème 2.30 (Going-down, Schmidt, 1967)
Soient d, e ∈ N ∗ tels que d + e (cid:54) n . Soient A un sous-espace de R n de dimension d et B ∈ R n ( e ) . Soit H (cid:62) telque H ( B ) (cid:54) H . Posons f = min( d, e − . Soient h ∈ { , . . . , f } , c (cid:62) et y (cid:62) · · · (cid:62) y h (cid:62) h tels que ∀ i ∈ { , . . . , h } , H ( B ) ψ i ( A, B ) (cid:54) c H − y i +1 . Alors il existe des constantes c , . . . , c , qui ne dépendent que de n, d, e, y , . . . , y h mais pas de A , B ou H , telles que les propriétés suivantes soient vérifiées.Posons y = y + · · · + y h et supposons que ∀ i ∈ { , . . . , h } , y (cid:48) i = y i ey + e − (cid:62) . Alors il existe C ∈ R n ( e − tel qu’en posant H (cid:48) = c H ( e + y − /e , on ait C ⊂ BH ( C ) (cid:54) H (cid:48) ∀ i ∈ { , . . . , t } , ψ i ( A, C ) (cid:54) c H ( C ) − y (cid:48) i . De plus, si ∀ i ∈ { , . . . , h } , ψ i ( A, B ) = 0 , alors on pose y (cid:48) = e/h , et pour tout H (cid:48) (cid:62) c H > , il existe C ∈ R n ( e − tel que C ⊂ BH ( C ) (cid:54) H (cid:48) ∀ i ∈ { , . . . , t } , ψ i ( A, C ) (cid:54) c H y (cid:48) H ( C ) − y (cid:48) . hapitre 3Différents cas particuliers Ce chapitre est découpé selon la dimension de l’espace ambiant dans lequel sonttraités les cas particuliers abordés ici.On commence à la section 3.1 par quelques lemmes qui serviront en toute dimension ;puis on étudie le cas de R en montrant que ˚ µ (2 | = 3 (section 3.2) et celui de R en majorant ˚ µ (3 | par (section 3.3). Après quelques commentaires (section3.4) on majore ˚ µ d ( d | d − dans R d (section 3.5). Il est possible de faire le lien entre proximité et hauteur grâce au lemme suivant,dans lequel ϕ ( A, B ) = min(dim A, dim B ) (cid:89) j =1 ψ j ( A, B ) (3.1)a été défini dans la sous-section 2.1.2 (équation (2.1)). Lemme 3.1
Soient n (cid:62) , A un sous-espace vectoriel de R n de dimension d et B ∈ R n ( e ) un sous-espace vectoriel rationnel de dimension e . On suppose que d + e = n . Notons ( X , . . . , X d ) une base de A et ( Y , . . . , Y e ) une base de B ∩ Z n , ainsi que M ∈ M n ( R ) la matrice dont les colonnes sont respectivement X , . . . , X d , Y , . . . , Y e .Alors il existe une constante c > ne dépendant que de A telle que ϕ ( A, B ) = c | det M | H ( B ) . Preuve.
D’après la proposition 2.11, on a ϕ ( A, B ) = D ( X , . . . , X d , Y , . . . , Y e ) D ( Y , . . . , Y e ) D ( X , . . . , X d ) . Comme ( Y , . . . , Y e ) est une base de B ∩ Z n , la remarque 2.15 découlant du point devue géométrique sur la hauteur permet d’obtenir39 ( A, B ) = D ( X , . . . , X d , Y , . . . , Y e ) cH ( B ) où c = D ( X , . . . , X d ) − > est une constante ne dépendant que de A .De plus, la matrice M est matrice carrée, donc la définition 2.9 donne D ( X , . . . , X d , Y , . . . , Y e ) = det( t M M ) = det( M ) . Ainsi, comme D ( X , . . . , X d , Y , . . . , Y e ) (cid:62) (proposition 2.10 (i)), on a ϕ ( A, B ) = c | det M | H ( B ) . (cid:3) Donnons un autre lemme, qui permet de minorer les angles canoniques en fonctionde ϕ . Lemme 3.2
Soient n (cid:62) , et A et B deux sous-espaces vectoriels de R n de dimen-sions respectives d et e . Alors ∀ j ∈ { , . . . , min( d, e ) } , ψ j ( A, B ) (cid:62) ϕ ( A, B ) /j . Preuve.
On pose t = min( d, e ) ; soit j ∈ { , . . . , t } . D’après la définition 1.7 et le théorème1.8, on a ψ ( A, B ) (cid:54) · · · (cid:54) ψ t ( A, B ) (cid:54) . Ainsi, le produit (3.1) peut se découper : ϕ ( A, B ) = j (cid:89) i =1 ψ i ( A, B ) (cid:124) (cid:123)(cid:122) (cid:125) (cid:54) ψ j ( A,B ) × t (cid:89) i = j +1 ψ i ( A, B ) (cid:124) (cid:123)(cid:122) (cid:125) (cid:54) (cid:54) ψ j ( A, B ) j ce qui conclut la preuve du lemme 3.2. (cid:3) R Comme mentionné en introduction de cette thèse, le cas le plus simple encore ouvertest le cas ( n, d, e, j ) = (4 , , , . En combinant les résultats de Schmidt et Moshchevitin, on a uniquement l’enca-drement (cid:54) ˚ µ (2 | (cid:54) . Schmidt mentionne d’ailleurs explicitement ce cas enconclusion de [Sch67] page 471, et c’est de plus le seul cas encore ouvert dans R .La question de déterminer ˚ µ (2 | se trouve complètement résolue grâce au théo-rème 3.3 : Théorème 3.3
On a ˚ µ (2 | = 3 . Ainsi, ce théorème clôture le problème 1.12 dans le cas n = 4 . .2.1 Construction de plans mal approchés de I (2 , Pour démontrer le théorème 3.3, on construit explicitement dans cette sous-sectiondes plans de R particulièrement mal approchés par les plans rationnels de R .Une famille de sous-espaces vectoriels particuliers sera centrale ici : définissons pour ξ ∈ ]0 , √ , le sous-espace vectoriel A ξ de R de dimension engendré par X (1) ξ = ξ (cid:112) − ξ et X (2) ξ = − (cid:112) − ξ ξ . (3.2)Différents résultats sont obtenus sur ces sous-espaces, dont les démonstrations setrouvent dans la sous-section 3.2.2.On montre que pour tout ξ ∈ ]0 , √ algébrique de degré au moins égal à , le plan A ξ : • vérifie la condition de (2 , -irrationalité, • est mal approché par les plans rationnels de R . Lemme 3.4
Pour tout ξ ∈ ]0 , √ algébrique de degré au moins égal à , on a A ξ ∈ I (2 , . (3.3)De plus, pour tous les nombres algébriques ξ vérifiant (3.3), on a ∀ ε > , ∃ c > , ∀ B ∈ R (2) , ϕ ( A ξ , B ) (cid:62) cH ( B ) ε . (3.4) A fortiori , la condition de (2 , -irrationalité étant plus faible, le lemme 3.4 montreaussi que pour tout ξ ∈ ]0 , √ algébrique de degré au moins égal à , on a A ξ ∈ I (2 , .De plus, le lemme 3.2 montre que le lemme 3.4 est aussi vrai en remplaçant ϕ ( A ξ , B ) par ψ ( A ξ , B ) .De ceci découle alors la proposition centrale suivante qui permet de démontrer lethéorème 3.3 et ainsi d’apporter une réponse au problème 1.12 pour n = 4 . Cetterésolution est de plus explicite. Proposition 3.5
Pour tout nombre algébrique ξ ∈ ]0 , √ de degré au moins égal à , on a µ ( A ξ | = 3 . emarque 3.6 La conclusion de la proposition 3.5 est encore vraie pour toutnombre algébrique ξ ∈ ]0 , √ de degré vérifiant dim Q Vect Q (1 , ξ, (cid:112) − ξ ) = 3 . En particulier pour ξ = √ , on a bien dim Q Vect Q (1 , ξ, (cid:112) − ξ ) = dim Q Vect Q (1 , √ , √
5) = 3 , donc µ ( A √ | = 3 . Remarque 3.7
On peut construire une infinité non dénombrable de sous-espaces A ξ vérifiant µ ( A ξ | = 3 grâce à un théorème de D. Y. Kleinbock et G. A. Margulis.En effet, pour Lebesgue-presque tout ξ ∈ ]0 , √ , on a dim Q Vect Q (1 , ξ, (cid:112) − ξ ) = 3 .On remplace alors l’utilisation page 45 de la proposition 2.28 dans la preuve dulemme 3.4 par le théorème A page 3 de l’article [KM98]. Celui-ci s’applique car lavariété de R M = (cid:110) (1 , ξ, (cid:112) − ξ ) , ξ ∈ ]0 , √ (cid:111) est non dégénérée ( i.e. aucun de ses points n’a de voisinage inclus dans un hyperplanaffine de R ), et l’inégalité (3.15) est obtenue cette fois-ci pour Lebesgue-presque tout ξ ∈ ]0 , √ . Cette sous-section apporte les preuves des résultats énoncés sans démonstration dansla sous-section 3.2.1 précédente. Notons déjà que le théorème 3.3 suit de la défini-tion de ˚ µ et de la proposition 3.5. Par ailleurs, compte tenu du lemme 3.2 (appliquéavec j = 1 ), le lemme 3.4 montre que µ ( A ξ | (cid:54) . Or le théorème 1.14 donne µ ( A ξ | (cid:62) ˚ µ (2 | (cid:62) , ce qui démontre la proposition 3.5.Il ne reste donc qu’à démontrer le lemme 3.4, qui montre simultanément la conditionde (2 , -irrationalité et établit l’inégalité cruciale pour la proposition 3.5. Preuve.
Soit B ∈ R (2) et ( Y , Y ) une base de B donnée par le lemme 2.8.Comme (cid:0) (cid:1) = 6 , notons ( η , . . . , η ) les coordonnées de Plücker de B associées à labase ( Y , Y ) . D’après le lemme 2.8, on a ( η , . . . , η ) ∈ Z et pgcd( η , . . . , η ) = 1 . (3.5)De plus, ce vecteur vérifie la relation de Plücker donnée par le théorème 2.6 : η η − η η + η η = 0 . (3.6) xplicitons d’où vient la relation (3.6). On reprend les notations du théorème 2.6 etde la sous-section 2.1.1. On note ( η K ) K ∈ Λ(2 , les coordonnées de Plücker de B . On ad’après le théorème 2.6 que pour tout I ∈ Λ(1 , et pour tout J = { j < j < j } ∈ Λ(3 , : (cid:88) (cid:54) k (cid:54) j k / ∈ I ( − k + ι ( I, { j k } ) η I ∪{ j k } η J \{ j k } = 0 . En particulier, pour I = { } et J = { , , } , on obtient ( − ι ( { } , { } ) η { , } η { , } + ( − ι ( { } , { } ) η { , } η { , } + ( − ι ( { } , { } ) η { , } η { , } = 0 , soit − η { , } η { , } + η { , } η { , } − η { , } η { , } = 0 , ce qui donne bien l’équation (3.6) en faisant correspondre les η { i,j } et les η k grâce àl’ordre lexicographique sur Λ(2 , : ( η { , } , η { , } , η { , } , η { , } , η { , } , η { , } ) = ( η , η , η , η , η , η ) . (3.7)Notons M ξ la matrice de M ( R ) dont les colonnes sont respectivement X (1) ξ , X (2) ξ , Y , Y .Remarquons que A ξ ∩ B = { } ⇐⇒ det M ξ (cid:54) = 0 . On calcule alors le déterminant de M ξ par un développement de Laplace par rapportaux deux premières colonnes (proposition 2.1 et exemple 2.2 avec la correspondance(3.7)), et on trouve : det M ξ = − η + η ξ − η (cid:112) − ξ − η (cid:112) − ξ − η ξ + 7 η = − η + 7 η + ( η − η ) ξ + ( − η − η ) (cid:112) − ξ . (3.8)Supposons par l’absurde que det M ξ = 0 , on a donc − η + 7 η + ( η − η ) ξ + ( − η − η ) (cid:112) − ξ = 0 . (3.9)Or pour tout nombre algébrique ξ ∈ ]0 , √ de degré au moins égal à , on a dim Q Vect Q (1 , ξ, (cid:112) − ξ ) = 3 . (3.10)En effet, supposons par l’absurde qu’il existe ( x, y, z ) ∈ Q \ { (0 , , } tel que x + yξ + z (cid:112) − ξ = 0 . (3.11)Comme ξ / ∈ Q , on peut supposer que z (cid:54) = 0 . En posant x (cid:48) = x/z et y (cid:48) = y/z ,l’équation (3.11) se réécrit ( y (cid:48) + 1) ξ + 2 x (cid:48) y (cid:48) ξ + x (cid:48) − . r ξ n’est pas un nombre algébrique de degré inférieur ou égal à , et donc ne peutannuler le polynôme ( y (cid:48) + 1) X + 2 x (cid:48) y (cid:48) X + x (cid:48) − de degré à coefficients rationnels, ce qui établit l’indépendance linéaire sur Q de , ξ, (cid:112) − ξ pour tout nombre algébrique ξ ∈ ]0 , √ de degré au moins égal à .Comme les η i sont entiers, l’équation (3.9) sur les coordonnées de Plücker de B com-binée avec l’indépendance linéaire (3.10), donne que pour tout ξ ∈ ]0 , √ algébriquede degré au moins , on a η = 7 η η = η η = − η . (3.12)Ainsi, la relation (3.6) de Plücker devient η + η = 7 η . On regarde cette équation modulo : η + η ≡ η (mod 4) . Or un carré est toujours congru à ou modulo , donc | η , donc | η . De plus, | η et | η , donc | η et | η . Avec les équations (3.12), on en déduit que divise tous les η i , ce qui est absurde car pgcd( η , . . . , η ) = 1 d’après (3.5).On a donc det M ξ (cid:54) = 0 , et ainsi A ξ ∩ B = { } pour tout nombre algébrique ξ ∈ ]0 , √ de degré au moins égal à , ce qui établit la condition de (2 , -irrationalité.Il reste à établir l’inégalité (3.4). Pour cela, les deux points de vue sur la hauteurseront utilisés de façon combinée grâce au lemme 3.1.Comme la base ( Y , Y ) de B donnée par le lemme 2.8 est aussi une Z -base de B ∩ Z ,on peut utiliser le lemme 3.1 qui donne ϕ ( A ξ , B ) = | det( M ξ ) | c H ( B ) (3.13)pour une certaine constante c > ne dépendant que de A ξ .Or d’après l’équation (3.8), on a | det( M ξ ) | = (cid:12)(cid:12)(cid:12) − η + 7 η + ( η − η ) ξ + ( − η − η ) (cid:112) − ξ (cid:12)(cid:12)(cid:12) , et il reste donc à minorer cette quantité en fonction de la hauteur de B . omme les coordonnées de Plücker η = ( η , . . . , η ) de B sont entières et premièresentre elles dans leur ensemble (équation (3.5)), on peut utiliser la définition 1.5 dela hauteur : H ( B ) = (cid:88) i =1 η i = (cid:107) η (cid:107) , (3.14)où (cid:107)·(cid:107) est la norme euclidienne canonique sur R , ce qui va permettre de minorer | det( M ξ ) | en fonction de H ( B ) .Soit ε > . Supposons désormais que ξ soit un nombre algébrique tel que le tripletde nombres algébriques (1 , ξ, (cid:112) − ξ ) soit Q -libre ( i.e. tel que la relation (3.10) soitvérifiée).Alors la proposition 2.28 s’applique, et donne une constante c > ne dépendantque de A ξ et de ε , telle que pour tout q = ( a, b, c ) ∈ Z \ { (0 , , } : (cid:12)(cid:12)(cid:12) a (cid:112) − ξ + bξ + c (cid:12)(cid:12)(cid:12) (cid:62) c (cid:107) q (cid:107) − − ε . (3.15)On remarque que pour q = ( − η − η , η − η , − η + 7 η ) , on a q (cid:54) = (0 , , sinon lesystème (3.12) serait vérifié, et on a vu que cela était impossible. De plus, (cid:107) q (cid:107) = (cid:12)(cid:12) η + η + 2 η η + η + η − η η + η + 49 η − η η (cid:12)(cid:12) (cid:54) η + · · · + η ) + 18 · max (cid:54) i (cid:54) ( | η i | ) (cid:54) (cid:107) η (cid:107) . La minoration (3.15) donne donc | det( M ξ ) | (cid:62) c (cid:107) η (cid:107) − − ε pour une certaine constante c > qui ne dépend que de A ξ et de ε .En combinant cette minoration avec (3.13) et (3.14), on obtient une constante c > (qui ne dépend que de A ξ et de ε ) telle que ϕ ( A ξ , B ) (cid:62) c H ( B ) ε , ce qui termine la preuve du lemme 3.4. (cid:3) Remarque 3.8
En appliquant le lemme 3.2 avec j = 2 , le lemme 3.4 permet demontrer de la même façon que ˚ µ (2 | (cid:54) , mais le théorème 1.17 donne déjà que ˚ µ (2 | = 1 . .3 Dans R Maintenant que le cas de R est complètement résolu, on s’intéresse au prochain casencore ouvert : ( n, d, e, j ) = (5 , , , . D’après les théorèmes 1.15 et 1.17, on sait déjà que (cid:54) ˚ µ (3 | (cid:54) . Sans déterminer complètement la valeur de ˚ µ (3 | , on améliore cet encadrementdans le théorème suivant : Théorème 3.9
On a ˚ µ (3 | (cid:54) . I (3 , Comme dans la section 3.2 sur R , construisons ici explicitement des sous-espacesde R de dimension vérifiant simultanément les deux conditions suivantes : • être (2 , -irrationnels, • être mal approchés par les plans rationnels de R .Soit ζ un nombre réel algébrique tel que [ Q ( ζ ) : Q ] (cid:62) . Considérons les quatre nombres algébriques suivants : ζ = − ζ − ζ − (cid:0) √ ζ − √ ζ + 13 √ ζ (cid:1) √ ζ − √ ζ − ζ − ζ + 64 (cid:0) ζ − ζ − (cid:0) √ ζ + 3 √ ζ + √ (cid:1) √ ζ − √ ζ − − ζ + 5 ζ − (cid:1) ,ζ = − ζ − ζ − (cid:0) √ ζ − √ ζ + 13 √ ζ − √ (cid:1) √ ζ − √ ζ − ζ − ζ + 184 (cid:0) ζ − ζ − (cid:0) √ ζ + 3 √ ζ + √ (cid:1) √ ζ − √ ζ − − ζ + 5 ζ − (cid:1) , ζ = − √ √ ζ − √ ζ − ζ − ζ + 3 ζ + 3 ζ ζ − ,ζ = − √ √ ζ − √ ζ − ζ − ζ + 3 ζ ζ − , en supposant ζ (cid:62) / de sorte à ce que toutes les racines soient bien définies, et ζ suffisamment grand de sorte à ce que les dénominateurs ne soient pas nuls (ceux-ci e s’annulent qu’en un nombre fini de valeurs). En étudiant les polynômes qui dé-finissent les dénominateurs, on pourrait montrer que ζ (cid:62) / suffit pour que lesdénominateurs soient non nuls, mais cela ne sera pas utile ici.On pose alors ξ = 1 ξ = ζ + ζ ξ = − ζ ξ = 1 + ζ + ζ ξ = ζ ξ = 2 ζ − ζ ξ = − ζ ξ = ζ ξ = ζ ξ = ζ . (3.16)et ξ = ( ξ , . . . , ξ ) . (3.17)Tout ceci permet de définir la famille de sous-espaces annoncée grâce au lemmesuivant (qui sera démontré, ainsi que les lemmes 3.11 et 3.12 et la proposition 3.13,dans la sous-section 3.3.2). Lemme 3.10
Il existe un sous-espace vectoriel A ξ de R de dimension dont levecteur ξ est un représentant des coordonnées de Plücker.Maintenant que les sous-espaces A ξ sont définis, il reste à montrer, comme dans lasection précédente, qu’ils vérifient la condition de (2 , -irrationalité et qu’ils sontmal approchés par les plans rationnels de R .Pour cela, on montre d’abord le lemme technique suivant. On rappelle que ζ (cid:62) / a été défini comme un nombre réel suffisamment grand, et algébrique de degré su-périeur à , ce qu’on utilise ici. Lemme 3.11
On a dim Q Vect Q (1 , ζ , ζ , ζ , ζ , ζ ) = 6 . Avec ce bagage, on peut alors énoncer des résultats qui ressemblent à ceux de lasection précédente dans R . Lemme 3.12
Pour tout ξ défini précédemment en (3.17), le sous-espace A ξ associéà ξ par le lemme 3.10 vérifie A ξ ∈ I (3 , . (3.18) e plus, ∀ ε > , ∃ c > , ∀ B ∈ R (2) , ϕ ( A ξ , B ) (cid:62) cH ( B ) ε . A fortiori , la condition de (2 , -irrationalité étant plus faible, le lemme 3.12 montreaussi que pour tout ξ , A ξ ∈ I (3 , . De plus, le lemme 3.2 (appliqué avec j = 1 )montre que le lemme 3.12 est aussi vrai en remplaçant ϕ ( A ξ , B ) par ψ ( A ξ , B ) .La proposition suivante permet de démontrer le théorème 3.9, et ainsi de s’approcherun peu plus d’une réponse au problème 1.12 dans R . Proposition 3.13
Pour tout ξ défini en (3.17), le sous-espace A ξ associé à ξ par lelemme 3.10 vérifie µ ( A ξ | (cid:54) . On démontre ici les résultats énoncés sans démonstration dans la sous-section 3.3.1.Comme dans R (voir sous-section 3.2.2), on déduit immédiatement la proposition3.13 et le théorème 3.9 du lemme 3.12.Commençons par démontrer le lemme 3.10 montrant que le sous-espace A ξ est biendéfini. Preuve.
On remarque que (cid:0) (cid:1) = 10 . Il existe un sous-espace ayant ξ pour coordonnées dePlücker si, et seulement si, les coordonnées de ξ vérifient les relations de Plücker(données par le théorème 2.6) pour un sous-espace de dimension de R , i.e. ξ ξ = ξ ξ + ξ ξ ξ ξ = ξ ξ + ξ ξ ξ ξ = ξ ξ + ξ ξ ξ ξ = ξ ξ + ξ ξ ξ ξ = ξ ξ + ξ ξ . (3.19)Explicitons d’où viennent les relations (3.19). On reprend les notations du théo-rème 2.6 et de la sous-section 2.1.1. On note ( ξ K ) K ∈ Λ(3 , les coordonnées de Plü-cker de B . On a d’après le théorème 2.6 que pour tout I ∈ Λ(2 , et pour tout J = { j < j < j < j } ∈ Λ(4 , : (cid:88) (cid:54) k (cid:54) j k / ∈ I ( − k + ι ( I, { j k } ) ξ I ∪{ j k } ξ J \{ j k } = 0 . Par exemple, pour I = { , } et J = { , , , } , on obtient ( − ι ( { , } , { } ) ξ { , , } ξ { , , } +( − ι ( { , } , { } ) ξ { , , } ξ { , , } +( − ι ( { , } , { } ) ξ { , , } ξ { , , } = 0 , oit ξ { , , } ξ { , , } − ξ { , , } ξ { , , } + ξ { , , } ξ { , , } = 0 , ce qui donne bien la deuxième équation de (3.19) en faisant correspondre les ξ { i,j,k } et les ξ (cid:96) avec l’ordre lexicographique sur Λ(3 , : ( ξ { , , } , ξ { , , } , ξ { , , } , ξ { , , } , ξ { , , } , ξ { , , } , ξ { , , } , ξ { , , } , ξ { , , } , ξ { , , } )= ( ξ , ξ , ξ , ξ , ξ , ξ , ξ , ξ , ξ , ξ ) . Les quatre autres équations de (3.19) s’obtiennent de façon similaire.On vérifie que ξ vérifie le système (3.19) grâce au logiciel de calcul formel SageMath,avec les commandes suivantes (les variables tmp_zi stockent les ζ i comme définis endébut de section) : E_1=xi_2*xi_5-xi_3*xi_4-xi_1*xi_6;E_1=calc(E_1 .subs(xi_1=1).subs(xi_2=zeta_2+zeta_5).subs(xi_3=-zeta_1).subs(xi_4=1+zeta_1+zeta_5).subs(xi_5=zeta_2).subs(xi_6=2*zeta_2-zeta_5).subs(xi_7=-zeta_3).subs(xi_8=zeta_3).subs(xi_9=zeta_4).subs(xi_10=zeta_5).subs(zeta_1=tmp_z1).subs(zeta_2=tmp_z2).subs(zeta_4=tmp_z4));E_2=xi_2*xi_8-xi_3*xi_7-xi_1*xi_9;E_2=calc(E_2 .subs(xi_1=1).subs(xi_2=zeta_2+zeta_5).subs(xi_3=-zeta_1).subs(xi_4=1+zeta_1+zeta_5).subs(xi_5=zeta_2).subs(xi_6=2*zeta_2-zeta_5).subs(xi_7=-zeta_3).subs(xi_8=zeta_3).subs(xi_9=zeta_4).subs(xi_10=zeta_5).subs(zeta_1=tmp_z1).subs(zeta_2=tmp_z2).subs(zeta_4=tmp_z4));E_3=xi_4*xi_8-xi_5*xi_7-xi_1*xi_10;E_3=calc(E_3 .subs(xi_1=1).subs(xi_2=zeta_2+zeta_5).subs(xi_3=-zeta_1).subs(xi_4=1+zeta_1+zeta_5).subs(xi_5=zeta_2).subs(xi_6=2*zeta_2-zeta_5).subs(xi_7=-zeta_3).subs(xi_8=zeta_3).subs(xi_9=zeta_4).subs(xi_10=zeta_5).subs(zeta_1=tmp_z1).subs(zeta_2=tmp_z2).subs(zeta_4=tmp_z4));E_4=xi_4*xi_9-xi_6*xi_7-xi_2*xi_10;E_4=calc(E_4 .subs(xi_1=1).subs(xi_2=zeta_2+zeta_5).subs(xi_3=-zeta_1).subs(xi_4=1+zeta_1+zeta_5).subs(xi_5=zeta_2).subs(xi_6=2*zeta_2-zeta_5).subs(xi_7=-zeta_3).subs(xi_8=zeta_3).subs(xi_9=zeta_4).subs(xi_10=zeta_5).subs(zeta_1=tmp_z1).subs(zeta_2=tmp_z2).subs(zeta_4=tmp_z4));E_5=xi_5*xi_9-xi_6*xi_8-xi_3*xi_10;E_5=calc(E_5 .subs(xi_1=1).subs(xi_2=zeta_2+zeta_5).subs(xi_3=-zeta_1).subs(xi_4=1+zeta_1+zeta_5).subs(xi_5=zeta_2).subs(xi_6=2*zeta_2-zeta_5).subs(xi_7=-zeta_3).subs(xi_8=zeta_3).subs(xi_9=zeta_4).subs(xi_10=zeta_5).subs(zeta_1=tmp_z1).subs(zeta_2=tmp_z2).subs(zeta_4=tmp_z4));[E_1,E_2,E_3,E_4,E_5] ui renvoie [ , , , , ] comme espéré. (cid:3) Les sous-espaces A ξ étant bien définis, on démontre le lemme technique 3.11. Preuve.
Soit ( a , . . . , a ) ∈ Q tel que (cid:88) i =0 a i ζ i = 0 où on a posé ζ := 1 . On veut montrer que les a i sont tous nuls. Pour cela, travaillonsl’expression grâce au logiciel SageMath. Après avoir écrit une fonction calc pouraider SageMath à simplifier les expressions, on chasse les dénominateurs avec leslignes de calculs suivantes : def calc(X):return (expand(numerator(expand(X)))/expand(denominator(expand(X)))).canonicalize_radical()D=calc(denominator(zeta_1)*denominator(zeta_2)*denominator(zeta_3)*denominator(zeta_4)*denominator(zeta_5));D_1=calc(denominator(zeta_2)*denominator(zeta_3)*denominator(zeta_4)*denominator(zeta_5));D_2=calc(denominator(zeta_1)*denominator(zeta_3)*denominator(zeta_4)*denominator(zeta_5));D_3=calc(denominator(zeta_1)*denominator(zeta_2)*denominator(zeta_4)*denominator(zeta_5));D_4=calc(denominator(zeta_1)*denominator(zeta_2)*denominator(zeta_3)*denominator(zeta_5));D_5=calc(denominator(zeta_1)*denominator(zeta_2)*denominator(zeta_3)*denominator(zeta_4));E=calc(a_0*D+a_1*(zeta_1)*D_1+a_2*(zeta_2)*D_2+a_3*(zeta_3)*D_3+a_4*(zeta_4)*D_4+a_5*(zeta_5)*D_5);E; Ceci donne (cid:88) i =0 a i ζ i = P ( ζ ) + P ( ζ ) (cid:112) P ( ζ )10 ζ + 7 ζ − − (4 ζ − ζ + 1) (cid:112) P ( ζ ) (3.20) vec P , P , P ∈ Q [ X ] : P = 77440 a X +64 (1210 a − a ) X −
32 (6254 a + 3263 a − a ) X −
16 (6526 a − a + 35080 a − a ) X + 16 (40479 a − a + 22640 a − a ) X − a − a − a + 76708 a − a − a ) X − a + 1942 a + 1246 a − a + 246351 a − a ) X + 2 (311792 a + 2308 a + 3337 a − a + 194376 a − a ) X − a − a − a + 158704 a − a − a ) X − a + 6646 a + 5797 a − a + 189576 a + 17808 a ) X + 2 (129152 a + 2335 a + 4786 a − a + 122274 a − a ) X − a − a + 337 a + 25192 a + 37696 a − a ) X − a + 2349 a + 2088 a − a − a + 65986 a ) X + 2 (24168 a + 1434 a + 1977 a − a + 3880 a + 24652 a ) X − a + 499 a + 970 a − a + 1468 a + 5516 a ) X + 8 (772 a + 29 a + 68 a − a + 102 a + 212 a ) X − a − a − a ,P = − a X −
64 (428 a − a ) X +32 (1246 a + 2546 a − a ) X + 16 (5092 a − a + 8149 a − a ) X − a + 6778 a − a − a ) X − a + 217 a + 97 a − a + 49453 a + 5626 a ) X + 4 (38960 a + 445 a + 331 a − a + 31708 a − a ) X − (46560 a − a + 873 a + 46752 a − a − a ) X − a + 683 a + 386 a − a + 16585 a + 9823 a ) X + (60000 a + 1611 a + 2367 a − a + 59236 a − a ) X − a − a + 369 a + 3392 a + 10088 a − a ) X − (6784 a + 845 a + 593 a − a − a + 30148 a ) X + 4 (2476 a + 176 a + 203 a − a + 469 a + 3221 a ) X − (6160 a + 255 a + 483 a − a + 664 a + 3008 a ) X + 2 (800 a + 31 a + 73 a − a + 132 a + 268 a ) X − a − a − a ,P = 8 X − X + 10 . Ainsi, on a P ( ζ ) + P ( ζ ) (cid:112) P ( ζ ) = 0 , et le nombre ζ est racine du polynôme P = P − P P ∈ Q [ X ] de degré au plus . r ζ a été défini comme un nombre réel algébrique tel que [ Q ( ζ ) : Q ] (cid:62) . Ainsi, comme les coefficients de P sont rationnels et que ζ est racine de P , on a P = 0 . Les équations données par les monômes de degrés , , et forment alorsun système échelonné qui donne a = a = a = a = 0 . Considérons enfin l’équation donnée par le monôme de degré : a + 4 a a − a = 0 , ce qui donne a = a − ± √ . Comme ( a , a ) ∈ Q , on a a = a = 0 , et finalement on a bien obtenu ∀ i ∈ { , . . . , } , a i = 0 , soit dim Q Vect Q (1 , ζ , ζ , ζ , ζ , ζ ) = 6 . (cid:3) On peut désormais démontrer le lemme 3.12.
Preuve.
Soient B ∈ R (2) et ( Y , Y ) une base de B donnée par le lemme 2.8. Comme (cid:0) (cid:1) = 10 , notons ( η , . . . , η ) les coordonnées de Plücker de B associées à la base ( Y , Y ) . D’après le lemme 2.8, on a ( η , . . . , η ) ∈ Z et pgcd( η , . . . , η ) = 1 . (3.21)De plus, ce vecteur vérifie les relations de Plücker données par le théorème 2.6 (déjàexplicitées page 48, en dessous du système (3.19)) : η η = η η + η η η η = η η + η η η η = η η + η η η η = η η + η η η η = η η + η η . (3.22) oit ( X (1) ξ , X (2) ξ , X (3) ξ ) une base de A ξ associée à ξ , le vecteur représentant de sescoordonnées de Plücker dont on s’est servi pour définir A ξ . Notons M ξ la matricede M ( R ) dont les colonnes sont respectivement X (1) ξ , X (2) ξ , X (3) ξ , Y , Y .Remarquons que A ξ ∩ B = { } ⇐⇒ det M ξ (cid:54) = { } . On calcule le déterminant de M par un développement de Laplace par rapport auxtrois premières colonnes (corollaire 2.7), et on trouve det M ξ = ξ η − ξ η + ξ η + ξ η − ξ η + ξ η − ξ η + ξ η − ξ η + ξ η . Supposons par l’absurde que det M ξ = 0 , i.e. supposons par l’absurde que A ξ ∩ B (cid:54) = { } .On a alors en utilisant les relations (3.16) entre les ξ i et les ζ i que M ξ )= η − ( ζ + ζ ) η − ζ η + (1 + ζ + ζ ) η − ζ η + (2 ζ − ζ ) η + ζ η + ζ η − ζ η + ζ η = η + η + ( − η + η ) ζ + ( − η − η + 2 η ) ζ + ( η + η ) ζ − η ζ + ( − η + η − η + η ) ζ . (3.23) Or d’après le lemme 3.11, dim Q Vect Q (1 , ζ , ζ , ζ , ζ , ζ ) = 6 , et les η i sont des nombres rationnels, donc η = − η η = η η = − η + 2 η η = − η η = 0 η = η − η + η . (3.24)Avec les relations (3.24) nouvellement établies, on réécrit les relations de Plückerpour les η i , qui de (3.22) deviennent η − η + 2 η η − η η − η η + η = 0 − η η − η η + η η − η = 0 − η η − η + η η = 0 − η η − η η + η η = 0 η η − η η + η η + η η = 0 . (3.25)Il reste à montrer qu’il n’existe pas de solution rationnelle non nulle ( η , η , η , η ) àce système polynomial. n appelle I l’idéal de Q [ η , η , η , η ] engendré par les équations du système (3.25).Avec la théorie des idéaux d’élimination (à laquelle une introduction peut être trou-vée page 392 de [Lan02]), on regarde l’idéal J dans lequel on a éliminé η , puis η .Autrement dit, J = I ∩ Q [ η , η ] . Pour cela on se sert encore une fois du logiciel de calcul formel SageMath, danslequel les instructions suivantes sont saisies :
L_1=eta_3^2-2*eta_5^2+2*eta_5*eta_7-eta_5*eta_9-eta_7*eta_9+eta_9^2;L_2=-eta_3*eta_7-eta_5*eta_9+eta_7*eta_9-eta_9^2;L_3=-eta_3*eta_7-eta_7^2+eta_7*eta_9;L_4=-2*eta_5*eta_7-eta_3*eta_9+eta_7*eta_9;L_5=eta_3*eta_7-2*eta_5*eta_7+eta_5*eta_9+eta_7*eta_9;R.
En appliquant le lemme 3.2 avec j = 2 , le lemme 3.12 permet demontrer de la même façon que ˚ µ (3 | (cid:54)
62 = 3 , mais on sait déjà grâce au théorème 1.17 que ˚ µ (3 | (cid:54) / . Il est probable que cette méthode s’adapte à d’autres cas particuliers et permette dediminuer certaines majorations de Schmidt. Cependant, dans chaque cas particulierdes calculs de plus en plus lourds semblent nécessaires. Dans le cas de R , toute ladifficulté était de construire un sous-espace A ξ suffisamment compliqué pour que lesystème (3.25) n’ait pas de solution rationnelle non triviale – ce qui implique que A ξ ∈ I (3 , – mais aussi suffisamment simple pour arriver à montrer effectivementque ce système n’a pas de solution rationnelle non triviale.Résumons l’idée globale des preuves développées dans les sections 3.2 et 3.3. Oncherche à construire un sous-espace A qui vérifie les deux conditions suivantes quis’opposent : avoir beaucoup de coordonnées de Plücker linéairement indépendantes sur Q pourque A soit ( e, -irrationnel ; • avoir peu de coordonnées de Plücker linéairement indépendantes sur Q pour ob-tenir le meilleur exposant possible grâce à la proposition 2.28.C’est tout l’équilibre entre ces deux conditions qui est au cœur de cette méthode.Pour montrer que le sous-espace A est ( e, -irrationnel, on suppose par l’absurdequ’il existe un sous-espace rationnel B ∈ R n ( e ) intersectant A de façon non tri-viale. Le fait que les coordonnées de Plücker ζ de B soient rationnelles, alors que lescoordonnées de Plücker ξ de A ne le sont pas, permet d’obtenir des équations entreles ζ i . Plus dim Q Vect Q ( ξ ) est grand, plus on obtient un grand nombre d’équationsentre les ζ i . On utilise alors les relations de Plücker entre les ζ i , qui forment un sys-tème ( S ) d’équations non linéaires. Les ζ i étant rationnels, des relations judicieusesentre eux peuvent permettre de montrer que ζ n’est pas solution de ( S ) . Ceci peutfonctionner même si le nombre de relations entre les ζ i est petit devant le nombred’équations de ( S ) , grâce à la non linéarité du système et au fait que les ζ i soientrationnels. Dans cette section, on déduit le résultat suivant du théorème 1.22 de Moshchevitin,grâce au théorème du Going-up (théorème 2.29).
Théorème 3.15 Si n = 2 d avec d (cid:62) , alors ˚ µ n ( d | d − (cid:54) d d + 1 . Preuve.
Posons n = 2 d et soit ε > . D’après le théorème 1.22 de Moshchevitin appliquéavec ω ( t ) = t − n − ε , il existe un sous-espace vectoriel A ε ∈ I n ( d, d ) et une constante c > dépendant uniquement de ε , tels que ∀ D ∈ R n ( d ) , ψ ( A ε , D ) (cid:62) c H ( D ) n + ε . (3.29)On a A ξ ∈ I n ( d, d ) ⊂ I n ( d, d − , notons α = µ n ( A ε | d − . Il existe une infinitéde sous-espaces rationnels B ∈ R n ( d − tels que ψ ( A ε , B ) (cid:54) H ( B ) α − ε . (3.30)Le théorème 2.29 du Going-up appliqué à A ε et B avec H = H ( B ) x = α − εy = 0 ∀ i ∈ { , . . . , d − } , x i = y i = 0 ontre l’existence de C ∈ R n ( d ) contenant B , tel que ψ ( A ε , C ) (cid:54) c H ( C ) ( α − ε )( n − ( d − / ( n − d ) = c H ( C ) ( α − ε )( d +1) /d (3.31)avec c > dépendant uniquement de ε (on rappelle que n = 2 d ).On a A ε ∈ I n ( d, d ) , donc pour tout C ∈ R n ( d ) , on a ψ ( A ε , C ) (cid:54) = 0 . Ainsi, s’iln’existait qu’un nombre fini de sous-espaces rationnels C vérifiant l’inégalité (3.31),on aurait une constante c > telle que ∀ C ∈ R n ( d ) , ψ ( A ε , C ) > c . (3.32)Or il existe une infinité de sous-espaces B ∈ R n ( d − vérifiant l’inégalité (3.30),donc il en existe de hauteur arbitrairement grande, si bien que ψ ( A ε , B ) (cid:54) c .D’après le corollaire 2.23, le sous-espace C obtenu à partir d’un tel B vérifie (3.31)avec ψ ( A ε , C ) (cid:54) ψ ( A ε , B ) (cid:54) c , ce qui contredit (3.32). Il existe donc une infinité de sous-espaces C ∈ R n ( d ) pourlesquels (3.31) est vérifiée.La hauteur de C pouvant être arbitrairement grande, et les constantes c et c dépendant uniquement de ε , les inégalités (3.29) et (3.31) imposent ( α − ε ) d + 1 d (cid:54) n + ε. Finalement, ˚ µ n ( d | d − (cid:54) µ n ( A ε | d − = α (cid:54) d d + 1 + ε (cid:18) d d + 1 + 1 (cid:19) , et ceci étant vrai pour tout ε > , on obtient ˚ µ n ( d | d − (cid:54) d d + 1 . (cid:3) Corollaire 3.16
On a (cid:40) ˚ µ (3 | (cid:54) / . µ (4 | (cid:54) / . . Remarque 3.17
Le corollaire 3.16 améliore les majorants de Schmidt (théorème1.17) : (cid:40) ˚ µ (3 | (cid:54) µ (4 | (cid:54) . a nouvelle majoration est même asymptotiquement meilleure que celle de Schmidt.En effet, on a obtenu un majorant équivalent quand n tend vers l’infini à d , alorsque le théorème 1.17 donne ˚ µ n ( d | d − (cid:54) (cid:22) d (cid:23) . hapitre 4Approximation de sommes directesde sous-espaces vectoriels Dans ce chapitre, l’objectif est de minorer ˚ µ n ( d | e ) j pour tout n (cid:62) . La stratégieconsiste à décomposer le sous-espace vectoriel A approché en une somme directede sous-espaces de dimensions plus petites (en l’occurence des droites). Il est alorspossible d’approcher simultanément ces droites (grâce au théorème d’approximationsimultanée de Dirichlet), et d’en déduire une approximation de A .Ceci permet d’améliorer la minoration connue de ˚ µ n ( d | e ) j : c’est le théorème 4.1,qui donne ˚ µ n ( d | e ) j (cid:62) ( n − j )( jn − jd + j / j/ j ( n − e )( n − d + j/ / . Le résultat principal de ce chapitre est le théorème suivant. Sa preuve consiste àconstruire un sous-espace vectoriel de dimension j de l’espace A qu’on cherche àapprocher. On décompose ce sous-espace en somme directe de droites. On approcheensuite simultanément ces droites par des droites rationnelles de hauteurs compa-rables entre elles, grâce au théorème d’approximation simultanée de Dirichlet. Onconclut enfin grâce au théorème du Going-up. Théorème 4.1
Soient n (cid:62) et d, e ∈ { , . . . , n − } tels que d + e (cid:54) n ; soit j ∈ { , . . . , min( d, e ) } . On a ˚ µ n ( d | e ) j (cid:62) ( n − j )( jn − jd + j / j/ j ( n − e )( n − d + j/ / . Remarque 4.2
La minoration de ˚ µ n ( d | e ) j obtenue dans le théorème 4.1 est équi-valente quand n tend vers l’infini (avec j , d et e fixés) à /j . Celle-ci est asymptoti-quement meilleure que celle de Schmidt (théorème 1.14) qui est équivalente quand n tend vers l’infini à 61 jn −−−−! n ! + ∞ . Le théorème 1.14 donne par exemple que pour tout n (cid:62) , ˚ µ n (2 | (cid:62) n − , ce qui est moins bon que la minoration ˚ µ n (2 | (cid:62) n n − donnée par le théorème 4.1.On en déduit immédiatement du théorème 4.1 le corollaire suivant. Corollaire 4.3
Soient n (cid:62) et d (cid:54) n/ un entier. On a ˚ µ n ( d | d ) d (cid:62) dn − d + d + 22 d n − d + d . De plus, en combinant le corollaire 4.3 et le corollaire 1.26 de Saxcé, on obtient pour n (cid:62) d l’encadrement dn − d + d + 22 d n − d + d (cid:54) ˚ µ n ( d | d ) d (cid:54) nd ( n − d ) , ce qui donne le corollaire suivant. Corollaire 4.4
On a lim n ! + ∞ ˚ µ n ( d | d ) d = 1 d . L’idée principale de la preuve du théorème 4.1 est de décomposer un sous-espace ensomme directe de sous-espaces plus petits. Il est donc utile de savoir comment secomporte la proximité par l’opération de somme directe.
Proposition 4.5
Soient n (cid:62) , et F , . . . , F (cid:96) , B , . . . , B (cid:96) , (cid:96) sous-espaces vectorielsde R n tels que pour tout i ∈ { , . . . , (cid:96) } , dim F i = dim B i = d i . Supposons que les F i engendrent un sous-espace de dimension k = d + · · · + d (cid:96) et de même pour les B i .Posons F = (cid:96) (cid:77) i =1 F i et B = (cid:96) (cid:77) i =1 B i . Alors on a ψ k ( F, B ) (cid:54) c F,n (cid:96) (cid:88) i =1 ψ d i ( F i , B i ) où c F,n > est une constante qui dépend uniquement de F , . . . , F (cid:96) et de n . Remarque 4.6
Intuitivement, cela signifie que si les sous-espaces F i et B i sontpresque confondus pour tout i , alors F et B sont presque confondus. .2 Les preuves Démontrons ici les résultats de la section 4.1.
On démontre la proposition 4.5.
Preuve.
L’idée de la preuve est de décomposer chaque F i et chaque B i en somme directe dedroites bien choisies. On commence par un bref lemme qui indiquera comment bienchoisir ces droites. Lemme 4.7
Soient D et E des sous-espaces vectoriels de R n de même dimension k . Il existe D , . . . , D k des droites de D et E , . . . , E k des droites de E , telles que D = k (cid:77) i =1 D i et E = k (cid:77) i =1 E i , et qui vérifient de plus : ψ k ( D, E ) (cid:54) k (cid:88) i =1 ψ ( D i , E i ) (cid:54) kψ k ( D, E ) . Preuve. (Lemme 4.7)
D’après le théorème 1.8, il existe des bases orthonormales ( X , . . . , X k ) de D et ( Y , . . . , Y k ) de E telles que ∀ i ∈ { , . . . , k } , ψ i ( D, E ) = ψ ( X i , Y i ) . Or, toujours d’après ce théorème, on a ∀ i ∈ { , . . . , k } , ψ i ( D, E ) (cid:54) ψ k ( D, E ) . Ainsi, on peut poser pour tout i ∈ { , . . . , k } D i = Vect( X i ) et E i = Vect( Y i ) . On a alors k (cid:88) i =1 ψ ( D i , E i ) = k (cid:88) i =1 ψ ( X i , Y i ) = k (cid:88) i =1 ψ i ( D, E ) (cid:54) kψ k ( D, E ) ce qui conclut la preuve de la majoration.Pour la minoration, on remarque que tous les ψ ( D i , E i ) sont positifs, et donc ψ k ( D, E ) = ψ ( D k , E k ) (cid:54) k (cid:88) i =1 ψ ( D i , E i ) . (cid:3) evenons à la preuve de la proposition 4.5.Soit i ∈ { , . . . , (cid:96) } . D’après le lemme 4.7, il existe des droites D i, , . . . , D i,d i de F i etdes droites E i, , . . . , E i,d i de B i telles que d i (cid:88) j =1 ψ ( E i,j , D i,j ) (cid:54) d i ψ d i ( F i , B i ) (cid:54) nψ d i ( F i , B i ) . (4.1)Soient e i, , . . . , e i,d i des vecteurs directeurs unitaires de D i, , . . . , D i,d i respectivementet b i, , . . . , b i,d i des vecteurs directeurs unitaires de E i, , . . . , E i,d i respectivement, telsque ∀ j ∈ { , . . . , d i } , e i,j · b i,j (cid:62) . (4.2)D’après le théorème 1.8, il existe des vecteurs unitaires X k ∈ F et Y k ∈ B tels que ψ k ( F, B ) = ψ ( X k , Y k ) . Soit Y = λ Y + · · · + λ k Y k un vecteur unitaire de B . D’après le théorème 1.8, on a | X k · Y | = (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) k (cid:88) i =1 λ i X k · Y i (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) (cid:54) k (cid:88) i =1 | λ i δ i,k cos( θ i ) | = | λ k | cos( θ k ) (cid:54) X k · Y k (4.3)car Y étant unitaire, | λ k | (cid:54) . L’inégalité (4.3) donne donc que pour tout Y ∈ B \ { } : ψ k ( F, B ) = ψ ( X k , Y k ) (cid:54) min Y ∈ B \{ } ψ ( X k , Y ) = ψ (Vect( X k ) , B ) . De plus,
Vect( Y k ) ⊂ B , donc d’après le corollaire 2.23, on a ψ k ( F, B ) = ψ ( X k , Y k ) (cid:62) ψ (Vect( X k ) , B ) . Finalement, ψ k ( F, B ) = ψ (Vect( X k ) , B ) . (4.4)Décomposons X k dans la base ( e , , . . . , e (cid:96),d (cid:96) ) : X k = (cid:96) (cid:88) i =1 d i (cid:88) j =1 x i,j e i,j , et posons Y = (cid:96) (cid:88) i =1 d i (cid:88) j =1 x i,j b i,j ∈ B. omme X k est unitaire, on a d’après le lemme 2.19 : ψ ( X k , Y ) (cid:54) (cid:107) X k − Y (cid:107) = (cid:13)(cid:13)(cid:13)(cid:13)(cid:13) (cid:96) (cid:88) i =1 d i (cid:88) j =1 x i,j ( e i,j − b i,j ) (cid:13)(cid:13)(cid:13)(cid:13)(cid:13) (cid:54) (cid:96) (cid:88) i =1 d i (cid:88) j =1 | x i,j | (cid:107) e i,j − b i,j (cid:107) , où (cid:107)·(cid:107) désigne – ici et dans toute la suite – la norme euclidienne canonique.Considérons maintenant pour i ∈ { , . . . , (cid:96) } et j ∈ { , . . . , d i } les applications coor-données : p i,j : F −! R (cid:96) (cid:88) i =1 d i (cid:88) j =1 x i,j e i,j x i,j . Ces applications sont continues sur le compact K = { x ∈ F, (cid:107) x (cid:107) = 1 } , elles sont donc bornées sur cet ensemble. Ainsi, il existe c (1) F,n une constante dépendantseulement de e , , . . . , e (cid:96),d (cid:96) telle que ∀ x = (cid:96) (cid:88) i =1 d i (cid:88) j =1 x i,j e i,j ∈ K, | x i,j | (cid:54) c (1) F,n . Revenons au calcul principal : comme pour tous i, j on a e i,j · b i,j (cid:62) d’après (4.2),on a en appliquant le lemme 2.20 que ψ ( X k , Y ) (cid:54) c (1) F,n (cid:96) (cid:88) i =1 d i (cid:88) j =1 (cid:107) e i,j − b i,j (cid:107) (cid:54) c (2) F,n (cid:96) (cid:88) i =1 d i (cid:88) j =1 ψ ( D i,j , E i,j ) car les e i,j et les b i,j sont des vecteurs unitaires, avec c (2) F,n = √ c (1) F,n .Finalement, avec l’inégalité (4.1), on a ψ ( X k , Y ) (cid:54) c (2) F,n n (cid:96) (cid:88) i =1 ψ d i ( F i , B i ) . (4.5)Or, l’équation (4.4) donne ψ k ( F, B ) (cid:54) ψ (Vect( X k ) , B ) (cid:54) ψ ( X k , Y ) , car Y ∈ B , et avec l’inégalité (4.5) on obtient ψ k ( F, B ) (cid:54) c F,n (cid:96) (cid:88) i =1 ψ d i ( F i , B i ) , ce qui termine la preuve de la proposition 4.5. (cid:3) .2.2 Majoration de ˚ µ n ( d | e ) j Démontrons le théorème 4.1.
Preuve.
Soit F ∈ I n ( d, e ) j un sous-espace ( e, j ) -irrationnel de R n .Montrons que F possède une famille orthonormale ( f , . . . , f j ) telle que pour tout (cid:96) ∈ { , . . . , j } , f (cid:96) ait au moins d − (cid:96) coordonnées nulles.Pour cela on construit les f (cid:96) par récurrence sur (cid:96) ∈ { , . . . , j } . Pour (cid:96) = 0 , il n’y arien à construire et le résultat est évident.On suppose désormais que les vecteurs f , . . . , f (cid:96) sont construits pour un certain (cid:96) ∈ { , . . . , j − } . On note G le supplémentaire orthogonal de Vect( f , . . . , f (cid:96) ) dans F . On a codim( R n − d + (cid:96) +1 × { } d − (cid:96) − ) = d − (cid:96) − < d − (cid:96) = dim F − (cid:96) = dim G, donc G ∩ ( R n − d + (cid:96) +1 × { } d − (cid:96) − ) (cid:54) = { } . On choisit f (cid:96) +1 ∈ G ∩ ( R n − d + (cid:96) +1 × { } d − (cid:96) − ) unitaire. Le vecteur f (cid:96) +1 a bien aumoins d − ( (cid:96) + 1) coordonnées nulles, et il est orthogonal à f , . . . , f (cid:96) , ce qui terminela récurrence.On fixe donc dans toute la suite une famille orthonormale ( f , . . . , f j ) de F telle quepour tout (cid:96) ∈ { , . . . , j } , le vecteur f (cid:96) ait au moins d − (cid:96) coordonnées nulles.Notons x le vecteur formé de toutes les coordonnées non nulles des f (cid:96) pour (cid:96) ∈ { , . . . , j } .Comme chaque f (cid:96) a au moins d − (cid:96) coordonnées nulles pour (cid:96) ∈ { , . . . , j } , x a auplus j (cid:88) (cid:96) =1 ( n − ( d − (cid:96) )) = jn − jd + 12 j + 12 j coordonnées. Notons N ∈ { , . . . , jn − jd + j / j/ } le nombre de coordonnées de x .On a x ∈ R N \ Q N , sinon ( f , . . . , f j ) serait une base rationnelle d’un sous-espacevectoriel de dimension j de F , ce qui contredirait l’hypothèse F ∈ I n ( d, e ) j .Donc d’après le théorème d’approximation simultanée de Dirichlet (théorème 2.27),il existe une infinité de couples ( p/q ) ∈ Z N × N ∗ tels que pgcd( p , . . . , p N , q ) = 1 et (cid:13)(cid:13)(cid:13)(cid:13) x − pq (cid:13)(cid:13)(cid:13)(cid:13) ∞ (cid:54) q /N . (4.6) n se donne un tel couple ( p, q ) .Rappelons que x est le vecteur formé par les coordonnées non nulles de f , . . . , f j .Pour i ∈ { , . . . , j } , notons p i le sous-vecteur de p correspondant aux coordonnéesapprochant celles de f i , complété avec des zéros de sorte que p i ∈ Z n soit proche de qf i . On a ∀ i ∈ { , . . . , j } , (cid:13)(cid:13)(cid:13)(cid:13) f i − p i q (cid:13)(cid:13)(cid:13)(cid:13) ∞ (cid:54) q /N . Posons B = Vect( p , . . . , p j ) , et notons p ⊥ ( f i ) le projeté orthogonal de f i sur Vect( p i /q ) . On peut alors mener lecalcul suivant, illustré sur la figure 4.1 (voir aussi le lemme 2.18) : ψ ( f i , p i /q ) = sin (cid:92) ( f i , p i /q ) = (cid:107) f i − p ⊥ ( f i ) (cid:107)(cid:107) f i (cid:107) (cid:54) (cid:13)(cid:13)(cid:13)(cid:13) f i − p i q (cid:13)(cid:13)(cid:13)(cid:13) (cid:54) c q /N (4.7)car (cid:107) f i (cid:107) = 1 , avec c > ne dépendant que de n . Figure 4.1 – Approximation de f i par p i /q Il reste alors à majorer la hauteur de B = Vect( p , . . . , p j ) .L’inégalité (4.6) donne (cid:107) p (cid:107) ∞ − (cid:107) qx (cid:107) ∞ (cid:54) (cid:107) qx − p (cid:107) ∞ (cid:54) q − /N (cid:54) , donc pour tout i ∈ { , . . . , j } : (cid:107) p i (cid:107) ∞ (cid:54) (cid:107) p (cid:107) ∞ (cid:54) (cid:107) qx (cid:107) ∞ (cid:54) c q vec c > qui ne dépend que de F .Pour E sous-espace vectoriel de R n et P une famille de vecteurs de E , notons vol E ( P ) le volume du parallélotope engendré par les vecteurs de P vus dans l’espace euclidien E . Comme ( p , . . . , p j ) est un sous-réseau de B ∩ Z n , on a d’après la proposition2.14 : H ( B ) (cid:54) vol B ( p , . . . , p j ) (cid:54) j (cid:89) i =1 (cid:107) p i (cid:107) (cid:54) c q j avec c > qui ne dépend que de F . Ainsi, il existe une constante c > telle que q (cid:54) c H ( B ) /j . (4.8)Rappelons qu’en posant B i = Vect( p i ) , la relation (4.7) donne ∀ i ∈ { , . . . , j } , ψ (Vect( f i ) , B i ) (cid:54) c q ( N +1) /N . Notons ˜ F j = Vect( f , . . . , f j ) qui est de dimension j car la famille ( f , . . . , f j ) est libre. Alors d’après la proposition4.5, on a ψ j ( ˜ F j , B ) = ψ j (cid:32) j (cid:77) i =1 Vect( f i ) , j (cid:77) i =1 B i (cid:33) (cid:54) c j (cid:88) i =1 ψ (Vect( f i ) , B i ) (cid:54) c q ( N +1) /N (4.9)avec c , c > ne dépendant que de n et de F .De plus, on a F ⊃ ˜ F j , donc d’après le corollaire 2.23 : ψ j ( F, B ) (cid:54) ψ j ( ˜ F j , B ) . Ainsi, avec (4.8) et (4.9), il existe une constante c > ne dépendant que de n etde F telle que ψ j ( F, B ) (cid:54) c q ( N +1) /N (cid:54) c H ( B ) ( N +1) / ( jN ) (cid:54) c H ( B ) ( jn − jd + j / j/ / ( j ( jn − jd + j / j/ , (4.10)car N (cid:54) jn − jd + j / j/ .Appliquons finalement le théorème du Going-up par récurrence sur (cid:96) ∈ { j, . . . , e } .Si (cid:96) = j , le sous-espace B construit convient. Soit (cid:96) ∈ { j, . . . , e − } , supposons par ypothèse de récurrence qu’il existe un sous-espace rationnel C (cid:96) ∈ R n ( (cid:96) ) tel que B ⊂ C (cid:96) et ψ j ( F, C (cid:96) ) (cid:54) c ( (cid:96) ) H ( C (cid:96) ) α ( n − j ) / ( n − (cid:96) ) avec c ( (cid:96) ) > dépendant uniquement de n et de F et α = ( jn − jd + j / j/ j ( n − d + j/ / . Alors d’après le théorème 2.29 du Going-up appliqué avec H = H ( C (cid:96) ) x j = α ( n − j ) / ( n − (cid:96) ) y j = 0 ∀ i ∈ { , . . . , min( d, e ) } \ { j } , x i = y i = 0 , il existe un sous-espace rationnel C (cid:96) +1 ∈ R n ( (cid:96) + 1) tel que C (cid:96) +1 ⊃ C (cid:96) ⊃ B , et ilexiste c ( (cid:96) +1) > dépendant uniquement de n et F , tels que ψ j ( F, C (cid:96) +1 ) (cid:54) c ( (cid:96) +1) H ( C (cid:96) +1 ) α ( n − (cid:96) )( n − j ) / (( n − (cid:96) )( n − (cid:96) − = c ( (cid:96) +1) H ( C (cid:96) +1 ) α ( n − j ) / ( n − (cid:96) − , ce qui conclut la récurrence.Posons C = C e , on a ainsi construit un sous-espace rationnel C ∈ R n ( e ) tel que C ⊃ B et ψ j ( F, C ) (cid:54) c H ( C ) β (4.11)avec c > ne dépendant que de n et de F , et β = ( n − j )( jn − jd + j / j/ j ( n − e )( n − d + j/ / . De plus, on a F ∈ I n ( d, e ) j , donc pour tout C ∈ R n ( e ) , on a ψ j ( F, C ) (cid:54) = 0 . Ainsi, s’iln’existait qu’un nombre fini de sous-espaces rationnels C vérifiant (4.11), on auraitune constante c > telle que ∀ C ∈ R n ( e ) , ψ j ( F, C ) > c. (4.12)Or l’inégalité (4.10) donne, compte tenu du corollaire 2.23 : ψ j ( F, C ) (cid:54) ψ j ( F, B ) −−−! q ! ∞ , ce qui contredit (4.12).Finalement, il existe une infinité de sous-espaces rationnels C ainsi construits ap-prochant F à l’exposant β . On a donc µ n ( F | e ) j (cid:62) β , d’où ˚ µ n ( d | e ) j (cid:62) β, ce qui termine la démonstration du théorème 4.1. (cid:3) hapitre 5Inclusion dans un sous-espacevectoriel rationnel On s’intéresse dans ce chapitre à un cas particulier : le cas où le sous-espace vectoriel A que l’on souhaite approcher est inclus dans un sous-espace rationnel de R n . Cetteétude sera notamment utile pour le chapitre 6.Le résultat principal est le théorème 5.1 ci-dessous. En le combinant notammentavec des résultats du chapitre 3, on obtient de nouvelles majorations de ˚ µ n ( d | d ) ,notamment ˚ µ (2 | (cid:54) . Ces corollaires sont énoncés et démontrés dans la section5.2, juste après l’énoncé du théorème 5.1 et l’esquisse de sa preuve (section 5.1).Enfin, les lemmes qui forment cette esquisse sont démontrés dans la section 5.3. L’énoncé principal de ce chapitre est le suivant.
Théorème 5.1
Soient n (cid:62) et k ∈ { , . . . , n } . Soient d, e ∈ { , . . . , k − } telsque d + e (cid:54) k , et j ∈ { , . . . , min( d, e ) } . Soit A un sous-espace vectoriel de R n dedimension d tel qu’il existe un sous-espace vectoriel rationnel F ∈ R n ( k ) vérifiant A ⊂ F .Notons ϕ un isomorphisme rationnel de F dans R k et ˜ A = ϕ ( A ) , qui est un sous-espace vectoriel de dimension d de R k .Supposons que pour tout sous-espace rationnel B (cid:48) de F de dimension e , on a dim( A ∩ B (cid:48) ) < j. (5.1)Alors A ∈ I n ( d, e ) j , ˜ A ∈ I k ( d, e ) j et µ n ( A | e ) j = µ k ( ˜ A | e ) j . On peut déjà remarquer que l’hypothèse (5.1), faite pour B (cid:48) ⊂ F rationnel de dimen-sion e , est a priori une version faible de l’hypothèse A ∈ I n ( d, e ) j ( i.e. dim( A ∩ B ) < j pour tout B ∈ R n ( e ) ). Le théorème 5.1 montre notamment que ces deux hypothèses71ont équivalentes.On se place dans toute la suite de cette sous-section dans le cadre des hypothèsesdu théorème 5.1. Des lemmes suivants découle directement le théorème 5.1. Lemme 5.2
On a A ∈ I n ( d, e ) j et ˜ A ∈ I k ( d, e ) j . On démontre ensuite, pour commencer, l’inégalité la plus facile : elle vient du faitque tout sous-espace vectoriel ˜ B de R k s’écrit ϕ ( B ) , avec B sous-espace vectoriel de R n (inclus dans F ). Lemme 5.3
On a µ n ( A | e ) j (cid:62) µ k ( ˜ A | e ) j . Pour démontrer l’inégalité inverse, on a besoin de savoir comment se comporte laproximité entre deux sous-espaces vis-à-vis d’une projection.
Lemme 5.4
Soit R une partie non vide de R n telle que R ∩ F ⊥ = ∅ et telle qu’ilexiste une constante c > vérifiant ∀ X ∈ R , (cid:13)(cid:13) p ⊥ F ( X ) (cid:13)(cid:13) (cid:62) c (cid:107) X (cid:107) (5.2)où p ⊥ F est la projection orthogonale sur F .Soit D un sous-espace vectoriel de R n tel que dim D (cid:62) j , et vérifiant D ⊂ R ∪ { } .Alors il existe une constante c (cid:48) > dépendant seulement de c telle que ψ j ( A, D ) (cid:62) c (cid:48) ψ j ( A, p F ( D )) . Il est alors possible de montrer l’inégalité inverse. L’idée est que si un sous-espacerationnel approche A , alors son projeté orthogonal sur le sous-espace rationnel F approche bien A lui-aussi ; via ϕ on obtient alors un sous-espace vectoriel de R k quiapproche bien ˜ A . Lemme 5.5
On a µ n ( A | e ) j (cid:54) µ k ( ˜ A | e ) j . Déduisons du théorème 5.1 une amélioration de la meilleure majoration connue de ˚ µ n ( d | e ) j dans quelques cas particuliers.Pour commencer, la proposition 5.6 améliore la majoration de Schmidt donnée parle théorème 1.17 : ˚ µ (2 | (cid:54) . roposition 5.6 On a ˚ µ (2 | (cid:54) . Preuve.
D’après la proposition 3.5, le sous-espace A √ défini dans la sous-section 3.2.1 vérifie µ ( A √ | = 3 . Soit ρ un isomorphisme rationnel de R dans R × { } ⊂ R . Posons A = ρ ( A √ ) .Comme A √ ∈ I (2 , , le sous-espace A √ vérifie l’hypothèse (5.1) du théorème5.1. Donc d’après le théorème 5.1, on a A ∈ I (2 , et µ ( A | = µ ( A √ | = 3 , ce qui conclut la preuve de la proposition 5.6. (cid:3) De façon similaire, on déduit la proposition suivante du résultat de Moshchevitinénoncé à la sous-section 1.3.3.
Proposition 5.7
Soit n (cid:62) et d ∈ { , . . . , (cid:98) n/ (cid:99)} , on a ˚ µ n ( d | d ) (cid:54) d. Preuve.
D’après le théorème 1.22, il existe un sous-espace ˜ A ∈ I d ( d, d ) tel que µ d ( ˜ A | d ) (cid:54) d. Soit ρ un isomorphisme rationnel de R d dans R d ×{ } n − d ⊂ R n . Posons A = ρ ( ˜ A ) .Alors d’après le théorème 5.1, on a A ∈ I n ( d, d ) et µ n ( A | d ) = µ d ( ˜ A | d ) (cid:54) d, ce qui conclut la preuve de la proposition 5.7. (cid:3) Remarque 5.8
D’après le théorème 1.17, on a ˚ µ n ( d | d ) (cid:54) (cid:24) dn − d + 1 n − d + 1 (cid:25) . La proposition 5.7 améliore cette majoration dans de nombreux cas où n est prochede d . Par exemple les majorants ˚ µ (3 | (cid:54) , ˚ µ (4 | (cid:54) et ˚ µ (4 | (cid:54) sontaméliorés respectivement par , et .De façon identique à la proposition 5.7, le théorème 3.15 permet d’obtenir grâce authéorème 5.1 la proposition suivante. Proposition 5.9
Soit n (cid:62) et d ∈ { , . . . , (cid:98) n/ (cid:99)} , on a ˚ µ n ( d | d − (cid:54) d d + 1 . Remarque 5.10
La proposition 5.9 améliore plusieurs majorations connues, no-tamment quand n est proche de d . Par exemple, les majorants ˚ µ (4 | (cid:54) , ˚ µ (5 | (cid:54) et ˚ µ (5 | (cid:54) sont améliorés respectivement par / , / et / . .3 Démonstration du théorème 5.1 Démontrons ici les lemmes énoncés dans la section 5.1.Commençons par la preuve du lemme 5.2 : A ∈ I n ( d, e ) j et ˜ A ∈ I k ( d, e ) j . Preuve.
Soit B ∈ R n ( e ) . On remarque que B (cid:48) = B ∩ F est un sous-espace rationnel dedimension e (cid:48) (cid:54) e (cid:54) dim F . Donc il existe un sous-espace rationnel B (cid:48)(cid:48) ⊂ F contenant B (cid:48) , avec dim B (cid:48)(cid:48) = e . L’hypothèse (5.1) montre que dim( A ∩ B (cid:48)(cid:48) ) < j , d’où dim( A ∩ B (cid:48) ) < j. Or on a A ∩ B = A ∩ F ∩ B = A ∩ B (cid:48) car A ⊂ F , donc dim( A ∩ B ) < j : on a A ∈ I n ( d, e ) j .Soit ˜ B ∈ R k ( e ) . Posons B = ϕ − ( ˜ B ) ∈ R n ( e ) . Or ϕ est un isomorphisme, donc dim( ˜ A ∩ ˜ B ) = dim( ϕ ( A ) ∩ ϕ ( B )) = dim( ϕ ( A ∩ B )) = dim( A ∩ B ) < j car B ∈ R n ( e ) et A ∈ I n ( d, e ) j . Cela montre que ˜ A ∈ I k ( d, e ) j et termine la preuvedu lemme 5.2. (cid:3) Démontrons maintenant l’inégalité du lemme 5.3 : µ n ( A | e ) j (cid:62) µ k ( ˜ A | e ) j . Preuve.
Soit α < µ k ( ˜ A | e ) j . Alors il existe une suite ( ˜ B N ) N (cid:62) de sous-espaces rationnels de R k de dimension e , deux à deux distincts, tels que pour tout N suffisamment grand : ψ j ( ˜ A, ˜ B N ) (cid:54) H ( ˜ B N ) α . Pour tout N ∈ N , on pose B N = ϕ − ( ˜ B N ) ∈ R n ( e ) car ϕ est un isomorphisme rationnel.D’après la proposition 2.16, il existe c ϕ − telle que pour tout N ∈ N , H ( B N ) = H ( ϕ − ( ˜ B N )) (cid:54) c ϕ − H ( ˜ B N ) . De plus, d’après la proposition 2.26, il existe une constante c (cid:48) ϕ − > telle que j ( A, B N ) = ψ j ( ϕ − ( ˜ A ) , ϕ − ( ˜ B N )) (cid:54) c (cid:48) ϕ − ψ j ( ˜ A, ˜ B N ) . Finalement, pour N assez grand, ψ j ( A, B N ) (cid:54) c (cid:48) ϕ − ψ j ( ˜ A, ˜ B N ) (cid:54) c (cid:48) ϕ − H ( ˜ B N ) α (cid:54) c H ( B N ) α , où c > ne dépend que de ϕ . Comme les B N sont encore deux à deux distincts, onen déduit µ n ( A | e ) j (cid:62) α. Ceci étant vrai pour tout α < µ k ( ˜ A | e ) j , on obtient µ n ( A | e ) j (cid:62) µ k ( ˜ A | e ) j , ce qui termine la preuve du lemme 5.3. (cid:3) Démontrons le lemme 5.4 donnant le comportement de la proximité vis-à-vis d’uneprojection. La preuve de ce lemme suit les idées de la preuve du lemme 13 page446 de l’article [Sch67]. Ce dernier démontre, sous des hypothèses plus faibles, unrésultat similaire avec une transformation inversible au lieu d’une projection.
Preuve.
En utilisant l’hypothèse (5.2) du lemme et le fait que p ⊥ F soit une projection ortho-gonale, il existe une constante c > telle que ∀ X ∈ R , c (cid:107) X (cid:107) (cid:54) (cid:13)(cid:13) p ⊥ F ( X ) (cid:13)(cid:13) (cid:54) (cid:107) X (cid:107) . (5.3)En particulier on a c (cid:54) car R (cid:54) = ∅ , donc on peut supposer que F \ { } ⊂ R puisque (cid:13)(cid:13) p ⊥ F ( X ) (cid:13)(cid:13) = (cid:107) X (cid:107) pour tout X ∈ F .Montrons qu’il existe une constante c > (qui dépend seulement de c > ) telleque ∀ X ∈ F \ { } , ∀ Y ∈ R , ψ ( X, p ⊥ F ( Y )) (cid:54) c ψ ( X, Y ) . (5.4)Soient X ∈ F \ { } et Y ∈ R . Comme ψ (cid:18) X (cid:107) X (cid:107) , Y (cid:107) Y (cid:107) (cid:19) = ψ ( X, Y ) et que la projection p ⊥ F est linéaire, on peut supposer que (cid:107) X (cid:107) = (cid:107) Y (cid:107) = 1 . De plus,on peut supposer X · Y (cid:62) quitte à remplacer Y par − Y . n a ψ ( X, p ⊥ F ( Y )) = 1 − cos (cid:92) ( X, p ⊥ F ( Y ))= 1 − ( X · p ⊥ F ( Y )) (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) = (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) − ( X · p ⊥ F ( Y )) (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) . Posons λ = (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) ; on remarque alors que (cid:54) ( X · p ⊥ F ( Y ) − λ ) ⇐⇒ (cid:54) ( X · p ⊥ F ( Y )) − λ ( X · p ⊥ F ( Y )) + λ ⇐⇒ λ − ( X · p ⊥ F ( Y )) (cid:54) λ − λ ( X · p ⊥ F ( Y ))) . Ainsi, ψ ( X, p ⊥ F ( Y )) (cid:54) λ − λ ( X · p ⊥ F ( Y ))) (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) = 2 (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) − (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) ( X · p ⊥ F ( Y )) (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) = 2 (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) − X · p ⊥ F ( Y ) (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) . Utilisons alors la première inégalité de (5.3) qui donne ψ ( X, p ⊥ F ( Y )) (cid:54) c (cid:0)(cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) − X · p ⊥ F ( Y ) (cid:1) . Or (cid:16)(cid:13)(cid:13) X − p ⊥ F ( Y ) (cid:13)(cid:13) − − (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) (cid:17) = − X · p ⊥ F ( Y ) , donc car X ∈ F et que p ⊥ F est une application linéaire : ψ ( X, p ⊥ F ( Y )) (cid:54) c (cid:16) (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) + (cid:13)(cid:13) X − p ⊥ F ( Y ) (cid:13)(cid:13) − − (cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) (cid:17) = 1 c (cid:13)(cid:13) p ⊥ F ( X − Y ) (cid:13)(cid:13) − c (cid:0)(cid:13)(cid:13) p ⊥ F ( Y ) (cid:13)(cid:13) − (cid:1) (cid:54) c (cid:13)(cid:13) p ⊥ F ( X − Y ) (cid:13)(cid:13) (cid:54) c (cid:107) X − Y (cid:107) . De plus, on a X · Y (cid:62) , donc d’après le lemme 2.20 : ψ ( X, Y ) (cid:62) √ (cid:107) X − Y (cid:107) , onc ψ ( X, p ⊥ F ( Y )) (cid:54) c (cid:107) X − Y (cid:107) (cid:54) c ψ ( X, Y ) soit ψ ( X, p ⊥ F ( Y )) (cid:54) c ψ ( X, Y ) ce qui est bien l’inégalité (5.4) voulue, avec c = (cid:112) /c .D’après la proposition 2.22, il existe A j un sous-espace de A de dimension j , tel que ∀ X ∈ A j \ { } , ∃ Y ∈ D \ { } , ψ ( X, Y ) (cid:54) ψ j ( A, D ) . Soit X ∈ A j \ { } . Il existe donc Y ∈ D tel que ψ ( X, Y ) (cid:54) ψ j ( A, D ) . Or X ∈ A j ⊂ A ⊂ F et Y ∈ D \ { } ⊂ R , on peut donc utiliser l’inégalité (5.4),qui donne ψ ( X, p ⊥ F ( Y )) (cid:54) c ψ ( X, Y ) (cid:54) c ψ j ( A, D ) . On a donc trouvé Y (cid:48) = p ⊥ F ( Y ) ∈ p ⊥ F ( D ) non nul (car Y ∈ R donc Y / ∈ F ⊥ ) tel que ψ ( X, Y (cid:48) ) (cid:54) c ψ j ( A, D ) . Autrement dit, on a montré que : ∀ X ∈ A \ { } , ∃ Y (cid:48) ∈ p ⊥ F ( D ) \ { } , ψ ( X, Y (cid:48) ) (cid:54) c ψ j ( A, D ) . D’après la proposition 2.22, ψ j ( A, p ⊥ F ( D )) est le plus petit réel ayant cette propriété,donc ψ j ( A, p ⊥ F ( D )) (cid:54) c ψ j ( A, D ) qui est l’inégalité cherchée. (cid:3) Démontrons maintenant le lemme 5.5, c’est-à-dire que µ n ( A | e ) j (cid:54) µ k ( ˜ A | e ) j . Pourcela on commence par un lemme. Lemme 5.11
Sous les hypothèses du théorème 5.1, pour tout α < µ n ( A | e ) j , ilexiste une suite ( B N ) N ∈ N de sous-espaces rationnels de R n de dimension e , deux àdeux distincts, tels que pour tout N suffisamment grand : B N ∩ F ⊥ = { } et ψ j ( A, B N ) (cid:54) H ( B N ) α . Soit α (cid:48) tel que α < α (cid:48) < µ n ( A | e ) j . Par définition de µ n ( A | e ) j , il existe une suite ( B N ) N ∈ N de sous-espaces rationnels de R n de dimension e , deux à deux distincts,tels que pour tout N suffisamment grand ψ j ( A, B N ) (cid:54) H ( B N ) α (cid:48) . La difficulté est que B N ∩ F ⊥ peut être non nul. Notons ( g , . . . , g n − k ) une famillelibre de vecteurs de Q n telle que R n = F ⊕ Vect( g , . . . , g n − k ) . (5.5)On va construire des vecteurs g n − k +1 , . . . , g n ∈ Q n pour compléter la famille ( g , . . . , g n − k ) .On pourra alors poser pour I ⊂ { , . . . , n } : G I = Vect { g i , i ∈ I } . Pour (cid:96) ∈ N ∗ , notons P m ( (cid:96) ) l’ensemble des parties à m éléments de { , . . . , (cid:96) } . Onmontre par récurrence finie sur (cid:96) ∈ { n − k, . . . , n } qu’il existe g n − k +1 , . . . , g (cid:96) desvecteurs de Q n tels que (cid:40) dim Vect( g , . . . , g (cid:96) ) = (cid:96) ∀ I ∈ P n − k ( (cid:96) ) , G I ∩ F = { } . (5.6)Comme dim F = k , la récurrence est initialisée pour (cid:96) = n − k avec (5.5).Soit (cid:96) ∈ { n − k, . . . , n − } , supposons que les g i pour i ∈ { n − k + 1 , . . . , (cid:96) } ont étéconstruits et vérifient (5.6). Posons G = Vect( g , . . . , g (cid:96) ) ∪ (cid:91) K ∈ P n − k − ( (cid:96) ) (cid:0) F ⊕ G K (cid:1) . L’ensemble G est une union d’un nombre fini de sous-espaces vectoriels de dimension n − , et d’un sous-espace de dimension (cid:96) (cid:54) n − . On peut donc se donner un vecteur g (cid:96) +1 ∈ Q n \ G. Montrons que ce vecteur vérifie bien (5.6). Comme g (cid:96) +1 / ∈ Vect( g , . . . , g (cid:96) ) , on a bien dim Vect( g , . . . , g (cid:96) +1 ) = (cid:96) + 1 . On suppose par l’absurde qu’il existe I ∈ P n − k ( (cid:96) + 1) tel que G I ∩ F (cid:54) = { } . Soit u ∈ G I ∩ F \ { } . Par hypothèse de récurrence, on a I / ∈ P n − k ( (cid:96) ) , donc (cid:96) + 1 ∈ I . Onpeut donc décomposer I sous la forme I = K ∪ { (cid:96) + 1 } avec K ∈ P n − k − ( (cid:96) ) . Comme u / ∈ F ∩ G K = { } , il existe α (cid:96) +1 (cid:54) = 0 et des α i ∈ R (pour i ∈ K ) tels que u = α (cid:96) +1 g (cid:96) +1 + (cid:88) i ∈ K α i g i . onc g (cid:96) +1 = 1 α (cid:96) +1 (cid:32) u − (cid:88) i ∈ K α i g i (cid:33) ∈ F ⊕ G K , ce qui est absurde par définition de G car g (cid:96) +1 / ∈ G . Donc g (cid:96) +1 vérifie (5.6), ce quitermine la récurrence.Finalement, on a construit des vecteurs g , . . . , g n vérifiant (5.6).Pour I ∈ P n − k ( n ) , on a dim G I = n − k = dim F ⊥ . Donc G I ⊕ F = R n : il existe un isomorphisme rationnel ρ I ∈ GL n ( Q ) tel que (cid:40) ρ I | F = id F ρ I ( G I ) = F ⊥ . Soit N ∈ N . Supposons par l’absurde que ∀ I ∈ P n − k ( n ) , ρ I ( B N ) ∩ F ⊥ (cid:54) = { } , soit ∀ I ∈ P n − k ( n ) , B N ∩ ρ − I ( F ⊥ ) (cid:54) = { } , i.e. par définition de ρ I : ∀ I ∈ P n − k ( n ) , B N ∩ G I (cid:54) = { } . Notons J = (cid:40) i ∈ { , . . . , n } , ∃ α (cid:54) = 0 , ∃ λ , . . . , λ i − ∈ R , αg i + i − (cid:88) (cid:96) =1 λ (cid:96) g (cid:96) ∈ B N (cid:41) . Supposons dans un premier temps que
Card( J ) (cid:54) k . Il existe donc I ∈ P n − k ( n ) telque I ∩ J = ∅ . Or B N ∩ G I (cid:54) = { } , donc il existe une famille de réels ( β i ) i ∈ I ∈ R I non tous nuls, tels que (cid:88) i ∈ I β i g i ∈ B N . Notons i le plus grand i ∈ I tel que β i (cid:54) = 0 . Alors (cid:88) i ∈ I β i g i = αg i + i − (cid:88) i =1 β i g i , n posant β i = 0 si i / ∈ I et α = β i (cid:54) = 0 . Donc i ∈ J ∩ I , ce qui est absurde.On a donc Card( J ) > k . Les éléments de J donnent au moins k + 1 vecteurs linéai-rement indépendants de B N , ce qui est absurde car dim B N (cid:54) k .Finalement, on a montré que ∃ I ∈ P n − k ( n ) , ρ I ( B N ) ∩ F ⊥ = { } , (5.7)et on se donne un tel I ∈ P n − k ( n ) .On a ρ I ∈ GL n ( Q ) , donc d’après la proposition 2.26, il existe une constante c ( ρ I ) > telle que ψ j ( A, ρ I ( B N )) = ψ j ( ρ I ( A ) , ρ I ( B N )) (cid:54) c ( ρ I ) ψ j ( A, B N ) ; en effet ρ I ( A ) = A puisque ρ I | F = id F .Alors en posant c = max I ∈ P n − k ( n ) c ( ρ I ) > , on a une constante indépendante de B N telle que ψ j ( A, ρ I ( B N )) (cid:54) c ψ j ( A, B N ) . De plus dim( ρ I ( B N )) = dim( B N ) = e car ρ I est un isomorphisme. On peut donc appliquer la proposition 2.16, qui donneune constante c (cid:48) ( ρ I ) > telle que H ( ρ I ( B N )) (cid:54) c (cid:48) ( ρ I ) H ( B N ) , et en posant c = max I ∈ P n − k ( n ) c (cid:48) ( ρ I ) > , on a donc une constante indépendante de B N telle que H ( ρ I ( B N )) (cid:54) c H ( B N ) . On a donc, si N est suffisamment grand : ψ j ( A, ρ I ( B N )) (cid:54) c ψ j ( A, B N ) (cid:54) c H ( B N ) α (cid:48) (cid:54) c c − α (cid:48) H ( ρ I ( B N )) α (cid:48) (cid:54) H ( ρ I ( B N )) α ce qui termine la preuve du lemme 5.11. (cid:3) Soit α < µ n ( A | e ) j . Le lemme 5.11 fournit une suite ( B N ) N ∈ N de sous-espaces ration-nels de R n de dimension e , deux à deux distincts, tels que pour tout N suffisammentgrand : B N ∩ F ⊥ = { } et ψ j ( A, B N ) (cid:54) H ( B N ) α . (5.8)Soit N ∈ N suffisamment grand. On note p ⊥ F la projection orthogonale sur F . Comme F ∈ R n ( k ) , p ⊥ F est un endomorphisme rationnel de R n .Posons B (cid:48) N = p ⊥ F ( B N ) le projeté orthogonal de B N sur F . Comme B N est un sous-espace vectoriel rationnel, B (cid:48) N est aussi un sous-espace vectoriel rationnel.On cherche à appliquer le lemme 5.4. Pour cela, il faut choisir convenablement unensemble R vérifiant l’hypothèse du lemme.Posons R – représenté sur la figure 5.1 – l’ensemble des vecteurs non nuls de R n formant un angle strictement inférieur à π/ avec le sous-espace F , i.e. R = (cid:40) X ∈ R n \ { } , ψ ( F, Vect( X )) < √ (cid:41) . (5.9)On a bien R ∩ F ⊥ = ∅ . Figure 5.1 – Le cône C faisant un angle π/ avec le sous-espace F Sur la figure 5.1, on a représenté le cône = { } ∪ (cid:40) X ∈ R n \ { } , ψ ( F, Vect( X )) = √ (cid:41) , l’ensemble R défini en (5.9) est alors la portion d’espace comprise entre F et C .Soit X ∈ R . En posant Y = X − p ⊥ F ( X ) (représenté sur la figure 5.1), on a (cid:13)(cid:13) p ⊥ F ( X ) (cid:13)(cid:13) + (cid:107) Y (cid:107) = (cid:107) X (cid:107) . Or X ∈ R , donc d’après les lemmes 2.21 et 2.18 respectivement, on a ψ ( X, F ) = ψ ( X, p ⊥ F ( X )) = (cid:107) Y (cid:107)(cid:107) X (cid:107) < √ , donc (cid:107) Y (cid:107) (cid:54) √ (cid:107) X (cid:107) . Ainsi, (cid:13)(cid:13) p ⊥ F ( X ) (cid:13)(cid:13) = (cid:107) X (cid:107) − (cid:107) Y (cid:107) (cid:62) (cid:107) X (cid:107) − (cid:107) X (cid:107) = 12 (cid:107) X (cid:107) , et la partie R construite vérifie bien les hypothèses du lemme 5.4 avec c = √ .Notons B N,j le sous-espace vectoriel de B N de dimension j donné par la proposition2.22. Comme N est supposé suffisamment grand, on peut supposer que ψ j ( A, B N ) (cid:54) . La proposition 2.22 donne que pour tout Y ∈ B N,j \ { } , il existe X ∈ A ⊂ F nonnul tel que ψ ( X, Y ) (cid:54) ψ j ( A, B N ) (cid:54) . On a donc ψ ( F, Vect( Y )) (cid:54) < √ , d’où Y ∈ R .Donc pour N suffisamment grand, B N,j \ { } ⊂ R . n peut ainsi appliquer le lemme 5.4, qui donne l’existence d’une constante c > ne dépendant ni de A ni des B N , telle que ψ j ( A, B N ) = ψ j ( A, B
N,j ) (cid:62) c ψ j ( A, p ⊥ F ( B N,j )) (cid:62) c ψ j ( A, B (cid:48) N ) (5.10)en appliquant le corollaire 2.23 car B (cid:48) N = p ⊥ F ( B N ) ⊃ p ⊥ F ( B N,j ) .Comme B N ∩ F ⊥ = { } on a dim B (cid:48) N = e ; puisque B (cid:48) N ⊂ F , on peut poser ˜ B N = ϕ ( B (cid:48) N ) ∈ R k ( e ) . D’après la proposition 2.26, il existe une constante c ϕ > telle que ψ j ( ϕ ( A ) , ϕ ( B (cid:48) N )) (cid:54) c ϕ ψ j ( A, B (cid:48) N ) . Soit β > µ k ( ˜ A | e ) j ; on a ainsi en utilisant la minoration (5.10) que pour N suffisam-ment grand (en fonction de β ) : ψ j ( A, B N ) (cid:62) c ψ j ( A, B (cid:48) N ) (cid:62) c c − ϕ ψ j ( ϕ ( A ) , ϕ ( B (cid:48) N )) = c c − ϕ ψ j ( ˜ A, ˜ B N ) (cid:62) c H ( ˜ B N ) β avec c > .Or d’après la proposition 2.16, il existe c > telle que H ( ˜ B N ) = H ( ϕ ( B (cid:48) N )) (cid:54) c H ( B (cid:48) N ) , donc ψ j ( A, B N ) (cid:62) c H ( B (cid:48) N ) β avec c > .Comme B N ∩ F ⊥ = { } , on a dim( p ⊥ F ( B N )) = dim( B N ) . On peut donc appliquer la proposition 2.16 qui fournit une constante c > telleque H ( B (cid:48) N ) = H ( p ⊥ F ( B N )) (cid:54) c H ( B N ) , donc, compte tenu de (5.8), H ( B N ) α (cid:62) ψ j ( A, B N ) (cid:62) c H ( B N ) β avec c > . Comme H ( B N ) tend vers l’infini quand N ! + ∞ , on en déduit α (cid:54) β .Ceci étant valable pour tout α < µ n ( A | e ) j et pour tout β > µ k ( ˜ A | e ) j on obtient µ n ( A | e ) j (cid:54) µ k ( ˜ A | e ) j . (cid:3) hapitre 6Le spectre de µ n ( •| (cid:96) ) (cid:96) Dans ce chapitre, on apporte une réponse partielle au problème 1.13.On s’intéresse ici au spectre de µ n ( •| (cid:96) ) (cid:96) sur I n ( (cid:96), (cid:96) ) , autrement dit à l’ensemble µ n ( I n ( (cid:96), (cid:96) ) (cid:96) | (cid:96) ) (cid:96) . Le résultat obtenu est le suivant : Théorème 6.1
Soient n (cid:62) et (cid:96) ∈ { , . . . , (cid:98) n/ (cid:99)} .Alors (cid:34) (cid:96) + (cid:114) (cid:96) , + ∞ (cid:35) ⊂ (cid:110) µ n ( A | (cid:96) ) (cid:96) , A ∈ I n ( (cid:96), (cid:96) ) (cid:96) (cid:111) . Remarquons que (cid:96) + (cid:114) (cid:96) −−−! (cid:96) ! ∞ . Remarque 6.2
Il serait intéressant de pouvoir remplacer la borne / (2 (cid:96) ) + (cid:112) / (4 (cid:96) ) par l’exposant de Saxcé (voir sous-section 1.3.4), autrement dit demontrer que (cid:20) n(cid:96) ( n − (cid:96) ) , + ∞ (cid:21) ⊂ (cid:110) µ n ( A | (cid:96) ) (cid:96) , A ∈ I n ( (cid:96), (cid:96) ) (cid:96) (cid:111) . Dans la section 6.1 on esquisse la preuve du théorème 6.1. On commence par supposerque n = 2 (cid:96) , et on fixe β < + ∞ dans l’intervalle du théorème 6.1. On cherche alors àconstruire un sous-espace vectoriel d’exposant β . Le lemme 6.3 permet de construireun sous-espace A ∈ I (cid:96) ( (cid:96), (cid:96) ) (cid:96) . Le lemme 6.6 donne µ (cid:96) ( A | (cid:96) ) (cid:96) (cid:62) β , tandis que leslemmes 6.7 et 6.8 donnent à eux deux µ (cid:96) ( A | (cid:96) ) (cid:96) (cid:54) β . Finalement, µ (cid:96) ( A | (cid:96) ) (cid:96) = β . Tousces lemmes sont ensuite démontrés dans la section 6.2.Le résultat est alors étendu au cas n > (cid:96) grâce au théorème 5.1, et au cas β = + ∞ dans la preuve du théorème 6.1 page 104.85 .1 Construction d’un sous-espace d’exposant pres-crit Soit (cid:96) (cid:62) un entier ; posons n = 2 (cid:96) .On se donne un réel β tel que β (cid:62) (cid:96) + (cid:114) (cid:96) , (6.1)et on va construire A ∈ I n ( (cid:96), (cid:96) ) (cid:96) , un sous-espace vectoriel ( (cid:96), (cid:96) ) -irrationnel de R n telque µ n ( A | (cid:96) ) (cid:96) = β. Posons α = (cid:96)β , et pour tous i, j ∈ { , . . . , (cid:96) } ξ i,j = ∞ (cid:88) k =0 e ( i,j ) k θ (cid:98) α k (cid:99) où les ( e ( i,j ) k ) k ∈ N sont des suites à déterminer, à valeurs dans { , } si i (cid:54) = j et àvaleurs dans { (cid:96), (cid:96) + 1 } si i = j , et où θ est le plus petit nombre premier tel que θ > ( n + 1) n/ (cid:16) n (cid:17) ! = (cid:96) ! (2 (cid:96) + 1) (cid:96) . (6.2)Le fait de choisir ici le plus petit tel θ n’a pas d’autre intérêt que de permettre auxconstantes de ne pas dépendre de θ . En pratique, tout nombre premier θ vérifiant(6.2) conviendrait.L’hypothèse (6.2) sur θ et le fait que les e ( i,j ) k appartiennent à { , } ou à { (cid:96), (cid:96) + 1 } seront utilisés dans la preuve du lemme 6.12 pour minorer la hauteur des sous-espaces rationnels construits ci-dessous.Notons I (cid:96) la matrice identité de M (cid:96) ( R ) . Posons M ξ = ( ξ i,j ) ( i,j ) ∈{ ,...,(cid:96) } ∈ M (cid:96) ( R ) lamatrice des ξ i,j et M A la matrice définie par blocs : M A = (cid:32) I (cid:96) M ξ (cid:33) ∈ M (cid:96),(cid:96) ( R ) . (6.3)On appelle Y , . . . , Y (cid:96) ∈ R (cid:96) les colonnes de M A , et on note A le sous-espace vectorielde R (cid:96) engendré par les Y i : A = Vect( Y , . . . , Y (cid:96) ) . Remarquons que rg( M A ) = (cid:96) , donc la famille ( Y , . . . , Y (cid:96) ) est libre et dim A = (cid:96). Énonçons un premier lemme montrant que le sous-espace A vérifie bien la conditionde ( (cid:96), (cid:96) ) -irrationalité. emme 6.3 Il existe des suites ( e ( i,j ) k ) k ∈ N à valeurs dans { , } si i (cid:54) = j et à valeursdans { (cid:96), (cid:96) + 1 } si i = j , telles que A ∈ I n ( (cid:96), (cid:96) ) . A fortiori , on a A ∈ I n ( (cid:96), (cid:96) ) (cid:96) puisque I n ( (cid:96), (cid:96) ) ⊂ I n ( (cid:96), (cid:96) ) (cid:96) .Dans toute la suite, on fixe des suites ( e ( i,j ) k ) k ∈ N vérifiant le lemme 6.3.Le sous-espace A étant alors construit, on va désormais construire des sous-espacesrationnels B N pour N (cid:62) approchant A jusqu’au (cid:96) -ième angle à l’exposant exacte-ment β . Enfin, on montrera que ces sous-espaces B N sont ceux approchant le mieux A , ce qui donnera finalement µ n ( A | (cid:96) ) (cid:96) = β .Posons pour ( i, j ) ∈ { , . . . , (cid:96) } et N (cid:62) , f ( i,j ) N = θ (cid:98) α N (cid:99) N (cid:88) k =0 e ( i,j ) k θ (cid:98) α k (cid:99) ∈ Z ainsi que M B N la matrice par blocs M B N = (cid:32) θ (cid:98) α N (cid:99) I (cid:96) F N (cid:33) ∈ M (cid:96),(cid:96) ( Z ) où F N est la matrice ( f ( i,j ) N ) ( i,j ) ∈{ ,...,(cid:96) } ∈ M (cid:96) ( Z ) .Notons de plus X (1) N , . . . , X ( (cid:96) ) N les colonnes de M B N , et posons B N = Vect( X (1) N , . . . , X ( (cid:96) ) N ) ∈ R (cid:96) ( (cid:96) ) . On peut remarquer que pour tous i, j ∈ { , . . . , (cid:96) } , on a ∞ (cid:88) k = N +1 e ( i,j ) k θ (cid:98) α k (cid:99) (cid:54) (2 (cid:96) + 1) ∞ (cid:88) j = (cid:98) α N +1 (cid:99) θ j = 2 (cid:96) + 1 θ (cid:98) α N +1 (cid:99) · − /θ = 2 (cid:96) + 1 θ (cid:98) α N +1 (cid:99) · θθ − < (cid:96) + 2 θ (cid:98) α N +1 (cid:99) car θ > , donc < ξ i,j − f ( i,j ) N θ (cid:98) α N (cid:99) = ∞ (cid:88) k = N +1 e ( i,j ) k θ (cid:98) α k (cid:99) < (cid:96) + 2 θ (cid:98) α N +1 (cid:99) . (6.4) Remarque 6.4
Comme (cid:96) (cid:62) et comme β vérifie (6.1), on a α = (cid:96)β (cid:62) (cid:96) + 12 + (cid:114) (cid:96) + 14 (cid:62) √ . Dans le cas (cid:96) = 1 , on obtiendra donc comme cas particulier de la proposition 6.9 lerésultat connu sur l’exposant d’irrationalité de ξ , : (cid:32) ∞ (cid:88) k =0 e (1 , k θ (cid:98) α k (cid:99) (cid:33) = α avec ( e (1 , k ) k ∈ N une suite à valeurs dans { , } , θ un nombre premier strictementsupérieur à et α un réel supérieur à (3 + √ / . Les arguments de la section 8 de[LSV06] permettent de montrer facilement ce résultat, mais la méthode développéeici est différente (et celle-ci ne traite pas le cas θ = 3 ). Si (cid:54) α < (3 + √ / , on aencore µ ( ξ , ) = α grâce au théorème 2 de [Bug08]. Remarque 6.5
De façon similaire au cas (cid:96) = 1 , on peut se demander si on a encore µ (cid:96) ( A | (cid:96) ) (cid:96) = β lorsque β est plus petit que / (2 (cid:96) ) + (cid:112) / (4 (cid:96) ) .On montre dans le lemme suivant que les sous-espaces rationnels B N approchent A à l’exposant α/(cid:96) : Lemme 6.6
Il existe une constante c > dépendant uniquement de A telle que ∀ N (cid:62) , ψ (cid:96) ( A, B N ) (cid:54) c H ( B N ) α/(cid:96) . Ce lemme donne µ (cid:96) ( A | (cid:96) ) (cid:96) (cid:62) α/(cid:96). Le lemme suivant montre que pour tout ε > , les B N sont les seuls sous-espacesrationnels de dimension (cid:96) approchant A à l’exposant α/(cid:96) + ε , ce qui implique que lemeilleur exposant possible est déterminé par les B N . Lemme 6.7
Supposons qu’il existe ε > et C ∈ R (cid:96) ( (cid:96) ) tels que ψ (cid:96) ( A, C ) (cid:54) H ( C ) α/(cid:96) + ε . (6.5)Alors si H ( C ) est suffisamment grand (en fonction de (cid:96) et de ε ), il existe N ∈ N ∗ tel que C = B N .Maintenant qu’on sait que si N ∈ N ∗ est suffisamment grand, les sous-espaces ra-tionnels B N sont ceux réalisant la meilleure approximation de A , on va montrerqu’ils approchent le sous-espace A à l’exposant au plus α/(cid:96) . Lemme 6.8
Pour N suffisamment grand, on a ψ (cid:96) ( A, B N ) (cid:62) cH ( B N ) α/(cid:96) avec c > dépendant uniquement de A .Les lemmes 6.7 et 6.8 combinés donnent µ (cid:96) ( A | (cid:96) ) (cid:96) (cid:54) α/(cid:96). En comparant avec le lemme 6.6, on a ainsi obtenu la proposition suivante :
Proposition 6.9
Soit (cid:96) (cid:62) . Il existe A ∈ I (cid:96) ( (cid:96), (cid:96) ) (cid:96) un sous-espace vectoriel ( (cid:96), (cid:96) ) -irrationnel de R (cid:96) tel que µ (cid:96) ( A | (cid:96) ) (cid:96) = β. .2 Les preuves Dans cette section, on prouve les résultats énoncés sans démonstration dans la sec-tion 6.1 précédente. On démontre aussi le théorème 6.1.Soit β ∈ (cid:34) (cid:96) + (cid:114) (cid:96) , + ∞ (cid:34) . On reprend les notations de la section 6.1.Commençons par démontrer le lemme 6.3, qui affirme que le sous-espace A construitdans la section 6.1 est un sous-espace vectoriel ( (cid:96), -irrationnel de R n . Preuve.
On réindexe pour plus de clarté les ξ i,j pour i, j ∈ { , . . . , (cid:96) } , en ξ , . . . , ξ (cid:96) par ordrelexicographique. On réindexe de la même façon les suites ( e ( i,j ) k ) k ∈ N en ( e (1) k ) k ∈ N , . . . , ( e ( (cid:96) ) k ) k ∈ N .Montrons qu’on peut choisir des suites ( e (1) k ) k ∈ N , . . . , ( e ( (cid:96) ) k ) k ∈ N telles que ξ , . . . , ξ (cid:96) soient algébriquement indépendants sur Q . On raisonne pour cela par récurrencefinie sur t ∈ { , . . . , (cid:96) } .L’exposant d’irrationalité de ξ est minoré par α > (et même égal à α d’après lasection 8 de [LSV06]), donc d’après le théorème de Roth, ξ est transcendant.Soit t ∈ { , . . . , (cid:96) − } ; supposons que les réels ξ , . . . , ξ t sont algébriquement indé-pendants sur Q . L’ensemble des réels algébriques sur Q ( ξ , . . . , ξ t ) est dénombrable,tandis que l’ensemble des suites ( e ( t +1) k ) k ∈ N ne l’est pas. On peut donc choisir unesuite ( e ( t +1) k ) k ∈ N à valeurs dans { , } ou { (cid:96), (cid:96) + 1 } (selon que t correspond à uncouple ( i, j ) avec i (cid:54) = j ou i = j ) telle que ξ , . . . , ξ t +1 soient algébriquement indé-pendants sur Q , ce qui conclut la récurrence.Vérifions que le sous-espace A ainsi construit appartient à I n ( (cid:96), (cid:96) ) . Supposons parl’absurde qu’il existe un sous-espace rationnel B de R (cid:96) de dimension (cid:96) intersec-tant non trivialement A . Soit M B une matrice dont les colonnes forment une baserationnelle de B . Comme A ∩ B (cid:54) = { } , on a det (cid:16) M A M B (cid:17) = 0 où M A est la matrice définie à l’équation (6.3). Comme M B ∈ M (cid:96),(cid:96) ( Q ) , en dévelop-pant ce déterminant par rapport aux (cid:96) premières colonnes grâce à un développementde Laplace (corollaire 2.7), on obtient un polynôme P ∈ Q [ X , . . . , X (cid:96) ] tel que det (cid:16) M A M B (cid:17) = P ( ξ , . . . , ξ (cid:96) ) = 0 . Or ξ , . . . , ξ (cid:96) sont algébriquement indépendants sur Q , donc P = 0 . omme M A = (cid:32) I (cid:96) M ξ (cid:33) , en décomposant M B ∈ M (cid:96),(cid:96) ( Q ) sous la forme M B = (cid:32) B B (cid:33) avec B , B ∈ M (cid:96),(cid:96) ( R ) , l’égalité P = 0 montre que ∀ Q ∈ M (cid:96) ( R ) , ∆ Q = det (cid:32) I (cid:96) B Q B (cid:33) = 0 . (6.6)Énonçons un lemme sur les déterminants qui sera utile dans la suite de cette preuve. Lemme 6.10
Soient A , A , A , A ∈ M (cid:96) ( R ) telles que A A = A A . Alors det (cid:32) A A A A (cid:33) = det( A A − A A ) . Preuve. (Lemme 6.10)
Supposons que A est inversible. On peut alors remarquer que (cid:32) A A A A (cid:33) (cid:32) I (cid:96) − A A − I (cid:96) (cid:33) = (cid:32) A − A A A − + A A − A A A − + A (cid:33) = (cid:32) A A − A A A − + A (cid:33) car A et A commutent, donc det (cid:32) A A A A (cid:33) = det( − A A A − + A ) det( A ) = det( A A − A A ) . (6.7)Si on ne suppose plus A inversible, par densité de GL (cid:96) ( R ) dans M (cid:96) ( R ) , on peuttrouver une suite de matrices ( ˜ A N ) N ∈ N de GL (cid:96) ( R ) qui converge vers A . Alors parcontinuité du déterminant, l’égalité (6.7) est encore vraie. (cid:3) Comme I (cid:96) commute avec B , on peut appliquer le lemme 6.10 ci-dessus, pour obtenir ∀ Q ∈ M (cid:96) ( R ) , ∆ Q = det( B − QB ) = 0 . (6.8)Soit λ ∈ R . En prenant Q = λI (cid:96) , on a det( B − λB ) = 0 . Supposons par l’absurdeque B est inversible, on a alors Q = det(( B B − − λI (cid:96) ) B ) = det( B B − − λI (cid:96) ) det( B ) onc car det( B ) (cid:54) = 0 , ∀ λ ∈ R , det( B B − − λI (cid:96) ) = 0 . On a montré que pour tout λ ∈ R , λ est valeur propre de B B − ce qui est absurde.Ainsi, det( B ) = 0 . Notons r = rg( B ) < (cid:96). Soient
U, V ∈ GL (cid:96) ( R ) deux matrices inversibles telles que U B V = (cid:32) I r
00 0 (cid:33) = (cid:16) J r (cid:17) ∈ M (cid:96) ( R ) , où on a noté J r = (cid:32) I r (cid:33) ∈ M (cid:96),r ( R ) . On décompose
U B V = (cid:16) C C (cid:17) ∈ M (cid:96) ( R ) où la matrice C ∈ M (cid:96),r ( R ) est constituée des r premières colonnes de U B V , et lamatrice C ∈ M (cid:96),(cid:96) − r ( R ) est constituée des (cid:96) − r dernières colonnes de U B V . Ainsi,on a des matrices équivalentes : (cid:32) J r C C (cid:33) = (cid:32) U U (cid:33) (cid:32) B B (cid:33) V ∈ M (cid:96),(cid:96) ( R ) . (6.9)Comme I (cid:96) commute avec U B V , on a d’après le lemme 6.10 que pour tout Q ∈ M (cid:96) ( R ) : det (cid:32) I (cid:96) U B VU QU − U B V (cid:33) = det( U B V − U QU − U B V )= det( U ( B − QB ) V )= det( U )∆ Q det( V )= 0 d’après (6.8). Ceci étant vrai pour tout Q ∈ M (cid:96) ( R ) , quitte à poser Q (cid:48) = U QU − , ona aussi ∀ Q (cid:48) ∈ M (cid:96) ( R ) , ∆ (cid:48) Q (cid:48) = det (cid:32) I (cid:96) U B VQ (cid:48) U B V (cid:33) = 0 . (6.10) oit R ∈ M (cid:96),r ( R ) . Définissons une matrice Q (cid:48) par blocs : Q (cid:48) = (cid:16) C − R (cid:17) ∈ M (cid:96) ( R ) . On obtient, encore d’après le lemme 6.10 car I (cid:96) et U B V commutent, que (cid:48) Q (cid:48) = det( U B V − Q (cid:48) U B V )= det (cid:32)(cid:16) C C (cid:17) − (cid:16) C − R (cid:17) (cid:32) I r
00 0 (cid:33)(cid:33) = det (cid:16) C − C + R C (cid:17) = det (cid:16) R C (cid:17) . Si on avait rg( C ) = (cid:96) − r , alors d’après le théorème de la base incomplète, onpourrait trouver R telle que rg (cid:16) R C (cid:17) = (cid:96) , ce qui est absurde car son déterminant ∆ (cid:48) Q (cid:48) serait alors non nul. Donc rg( C ) < (cid:96) − r . Or avec (6.9), on en déduit rg( M B ) = rg (cid:32) B B (cid:33) = rg (cid:32) J r C C (cid:33) = r + rg( C ) < r + (cid:96) − r = (cid:96), ce qui est absurde car dim B = (cid:96) = rg( M B ) .Finalement, A intersecte trivialement tous les sous-espaces rationnels de R (cid:96) dedimension (cid:96) , c’est-à-dire A ∈ I (cid:96) ( (cid:96), (cid:96) ) . Cela termine la preuve du lemme 6.3. (cid:3) On fixe désormais dans toute la suite, des suites ( e ( i,j ) k ) k ∈ N vérifiant le lemme 6.3.Avant de démontrer le lemme 6.6, montrons un lemme qui majore la hauteur des B N . On verra plus loin (grâce au lemme 6.12) que cette majoration est optimale, àconstante multiplicative près. Lemme 6.11
Pour tout N (cid:62) , on a H ( B N ) (cid:54) c ( θ (cid:98) α N (cid:99) ) (cid:96) où c > dépend uniquement de (cid:96) . Preuve.
On a (cid:12)(cid:12)(cid:12) f ( i,j ) N (cid:12)(cid:12)(cid:12) (cid:54) (2 (cid:96) + 1) θ (cid:98) α N (cid:99) N (cid:88) k =0 θ (cid:98) α k (cid:99) (cid:54) (cid:96) + 1) θ (cid:98) α N (cid:99) (6.11)car la minoration θ (cid:62) donne (cid:88) k =0 θ (cid:98) α k (cid:99) (cid:54) ∞ (cid:88) k =0 θ k = θθ − (cid:54) . On a donc H ( B N ) (cid:54) (cid:13)(cid:13)(cid:13) X (1) N ∧ · · · ∧ X ( (cid:96) ) N (cid:13)(cid:13)(cid:13) (cid:54) (cid:96) (cid:89) j =1 (cid:13)(cid:13)(cid:13) X ( j ) N (cid:13)(cid:13)(cid:13) (cid:54) (2(2 (cid:96) + 1) · √ (cid:96) ) (cid:96) ( θ (cid:98) α N (cid:99) ) (cid:96) car les (cid:96) coefficients de chaque X ( j ) N sont inférieurs à (cid:96) + 1) · θ (cid:98) α N (cid:99) . (cid:3) Démontrons maintenant le lemme 6.6, selon lequel ψ (cid:96) ( A, B N ) (cid:54) c H ( B N ) α/(cid:96) pour tout N (cid:62) , avec une constante c > qui dépend uniquement de A . Preuve.
Pour i ∈ { , . . . , (cid:96) } , notons Z ( i ) N = θ −(cid:98) α N (cid:99) X ( i ) N . On a (cid:107) Y i (cid:107) (cid:62) , ce qui donne enappliquant le lemme 2.19 que ψ ( X ( i ) N , Y i ) = ψ ( Z ( i ) N , Y i ) (cid:54) (cid:13)(cid:13)(cid:13) Z ( i ) N − Y i (cid:13)(cid:13)(cid:13) (cid:107) Y i (cid:107) (cid:54) c ( θ (cid:98) α N (cid:99) ) − α (6.12)avec c > ne dépendant que de (cid:96) , en utilisant (6.4). D’après la proposition 4.5, ilexiste des constantes c , c > ne dépendant que de A , telles que ψ (cid:96) ( A, B N ) (cid:54) c (cid:96) (cid:88) i =1 ψ ( X ( i ) N , Y i ) (cid:54) c ( θ (cid:98) α N (cid:99) ) α . (6.13)D’après le lemme 6.11 qui donne H ( B N ) (cid:54) c ( θ (cid:98) α N (cid:99) ) (cid:96) , on a donc ψ (cid:96) ( A, B N ) (cid:54) c H ( B N ) α/(cid:96) avec c > ne dépendant que de A . Ceci termine la preuve du lemme 6.6. (cid:3) Montrons maintenant que les B N sont les seuls sous-espaces rationnels de dimension (cid:96) approchant aussi bien A ( i.e. à l’exposant α/(cid:96) ). Ceci montrera que le meilleurexposant possible est déterminé par les B N . Précisément, on démontre ici le lemme6.7 : si ε > et C ∈ R (cid:96) ( (cid:96) ) sont tels que ψ (cid:96) ( A, C ) (cid:54) H ( C ) α/(cid:96) + ε et si H ( C ) est suffisamment grand (en fonction de (cid:96) et de ε ), alors il existe N (cid:62) tel que C = B N . Soient ε > et C ∈ R (cid:96) ( (cid:96) ) tels que ψ (cid:96) ( A, C ) (cid:54) H ( C ) α/(cid:96) + ε . (6.14)Montrons que si H ( C ) est suffisamment grand, alors il existe un entier N (cid:62) telque C = B N . Commençons par travailler avec N ∈ N ∗ quelconque, on le fixera parla suite.Le sous-espace C est un sous-espace rationnel de dimension (cid:96) : il existe donc v , . . . , v (cid:96) ∈ Z (cid:96) tels que ( v , . . . , v (cid:96) ) soit une Z -base de C ∩ Z (cid:96) . On a alors H ( C ) = (cid:107) v ∧ · · · ∧ v (cid:96) (cid:107) . Pour montrer que C = B N pour un certain entier N , montrons que tous les X ( i ) N pour i ∈ { , . . . , (cid:96) } sont dans C = Vect( v , . . . , v (cid:96) ) . Par égalité des dimensions, onpourra conclure que C = B N . Soit i ∈ { , . . . , (cid:96) } ; considérons les (cid:96) + 1 vecteurs X ( i ) N , v , . . . , v (cid:96) , et posons Q = (cid:16) X ( i ) N v · · · v (cid:96) (cid:17) ∈ M (cid:96),(cid:96) +1 ( Z ) . Comme la famille ( v , . . . , v (cid:96) ) est libre, pour montrer que X ( i ) N ∈ Vect( v , . . . , v (cid:96) ) , ilsuffit de montrer que rg( Q ) < (cid:96) + 1 , i.e. que tous les mineurs ( (cid:96) + 1) × ( (cid:96) + 1) de Q sont nuls. Pour cela, on montre que D = (cid:13)(cid:13)(cid:13) X ( i ) N ∧ v ∧ · · · ∧ v (cid:96) (cid:13)(cid:13)(cid:13) = 0 . Notons p ⊥ C la projection orthogonale sur le sous-espace C (les notations introduitesici sont illustrées sur la figure 6.1), et h le vecteur h = p ⊥ C ( X ( i ) N ) − X ( i ) N . Alors il existe λ , . . . , λ (cid:96) ∈ R tels que le vecteur X ( i ) N s’écrive sous la forme X ( i ) N = (cid:96) (cid:88) j =1 λ j v j − h. igure 6.1 – Projection de X ( i ) N sur C Or h ∈ C ⊥ , donc D = (cid:13)(cid:13)(cid:13) X ( i ) N ∧ v ∧ · · · ∧ v (cid:96) (cid:13)(cid:13)(cid:13) = (cid:13)(cid:13)(cid:13)(cid:13)(cid:13)(cid:32) (cid:96) (cid:88) j =1 λ j v j − h (cid:33) ∧ v ∧ · · · ∧ v (cid:96) (cid:13)(cid:13)(cid:13)(cid:13)(cid:13) = (cid:107) h (cid:107) · (cid:107) v ∧ · · · ∧ v (cid:96) (cid:107) = (cid:107) h (cid:107) H ( C ) . De plus d’après le lemme 2.18, on a (cid:107) h (cid:107) = (cid:13)(cid:13)(cid:13) X ( i ) N (cid:13)(cid:13)(cid:13) ψ ( X ( i ) N , C ) , donc D = (cid:13)(cid:13)(cid:13) X ( i ) N (cid:13)(cid:13)(cid:13) ψ ( X ( i ) N , C ) H ( C ) (cid:54) c θ (cid:98) α N (cid:99) ( ψ ( X ( i ) N , Y i ) + ψ (Vect( Y i ) , C )) H ( C ) avec c > ne dépendant que de (cid:96) , d’après l’équation (6.11) et en utilisant la pro-position 2.25.Or d’après le lemme 2.24, on a ψ (Vect( Y i ) , C ) (cid:54) ψ (cid:96) ( A, C ) . En utilisant alors la majoration (6.12) de la preuve du lemme 6.6 pour majorer ψ ( Y i , X ( i ) N ) , ainsi que la majoration (6.14) pour majorer ψ (cid:96) ( A, C ) , on trouve (cid:54) c θ (cid:98) α N (cid:99) H ( C ) (cid:18) c ( θ (cid:98) α N (cid:99) ) α + 1 H ( C ) α/(cid:96) + ε (cid:19) (cid:54) c (cid:32) H ( C ) θ (cid:98) α N (cid:99) ( α − + θ (cid:98) α N (cid:99) H ( C ) α/(cid:96) − ε (cid:33) (6.15)où c > ne dépend que de (cid:96) .On va désormais choisir N : notons N le plus grand entier tel que θ α N (cid:54) H ( C ) α/(cid:96) − ε/ . Alors θ (cid:98) α N (cid:99) (cid:54) H ( C ) α/(cid:96) − ε/ . (6.16)De plus, par maximalité de N , on a (cid:16) θ α N (cid:17) α = θ α N +1 > H ( C ) α/(cid:96) − ε/ , donc θ α N > H ( C ) ( α/(cid:96) − ε/ /α . Or α = (cid:96)β (cid:62) (cid:96) + 12 + (cid:114) (cid:96) + 14 = 2 (cid:96) + 1 + √ (cid:96) , donc α − (2 (cid:96) + 1) α + (cid:96) (cid:62) , soit ( α − (cid:96) )( α − (cid:62) (cid:96)α, donc α/(cid:96) − α (cid:62) α − . Ainsi, θ α N > H ( C ) / ( α − ε/ (2 α ) , d’où θ (cid:98) α N (cid:99) > θ H ( C ) / ( α − ε/ (2 α ) . (6.17) n utilisant la majoration (6.16) et la minoration (6.17), revenons à la majoration(6.15) de D : D (cid:54) c (cid:32) H ( C ) θ (cid:98) α N (cid:99) ( α − + θ (cid:98) α N (cid:99) H ( C ) α/(cid:96) − ε (cid:33) (cid:54) c (cid:18) c H ( C ) H ( C ) (1 / ( α − ε/ (2 α ))( α − + H ( C ) α/(cid:96) − ε/ H ( C ) α/(cid:96) − ε (cid:19) (cid:54) c (cid:18) H ( C ) ( α − ε/ (2 α ) + 1 H ( C ) ε/ (cid:19) −−−−−−! H ( C ) ! + ∞ avec c , c , c > dépendant uniquement de (cid:96) .Si H ( C ) est suffisamment grand (en fonction de (cid:96) et de ε , puisque ( α − / (2 α ) (cid:62) ( (cid:96) − / (2 (cid:96) ) ), on a D < . Or E = (cid:13)(cid:13)(cid:13) X ( i ) N ∧ v · · · ∧ v (cid:96) (cid:13)(cid:13)(cid:13) ∞ est un entier naturel tel que E (cid:54) D , donc E = 0 , c’est-à-dire X ( i ) N ∧ v ∧ · · · ∧ v (cid:96) = 0 . Finalement, si H ( C ) est suffisamment grand, on a montré que C = B N pour N leplus grand entier tel que θ α N (cid:54) H ( C ) α/(cid:96) − ε/ . Ceci termine la preuve du lemme6.6. (cid:3) Avant de démontrer le lemme 6.8, commençons par minorer la hauteur des B N (cequi montre que le lemme 6.11 est optimal à constante multiplicative près). Lemme 6.12
Pour tout N suffisamment grand, on a H ( B N ) (cid:62) ˜ c ( θ (cid:98) α N (cid:99) ) (cid:96) avec ˜ c > ne dépendant que de A . Preuve. (Lemme 6.12)
Soit N (cid:62) . Pour montrer la minoration voulue sur la hauteur de B N , on va d’abordmontrer que la famille ( X (1) N , . . . , X ( (cid:96) ) N ) est une Z -base de B N ∩ Z (cid:96) . Pour cela, notons P le parallélotope engendré par X (1) N , . . . , X ( (cid:96) ) N , i.e. P = (cid:40) (cid:96) (cid:88) i =1 λ i X ( i ) N , ( λ , . . . , λ (cid:96) ) ∈ [0 , (cid:96) (cid:41) , et montrons que les (cid:96) sommets de P sont ses seuls points entiers. Notons S l’en-semble des (cid:96) sommets de P , i.e. S = (cid:40) (cid:96) (cid:88) i =1 δ i X ( i ) N , ( δ , . . . , δ (cid:96) ) ∈ { , } (cid:96) (cid:41) . upposons par l’absurde qu’il existe X ∈ ( P \ S ) ∩ Z (cid:96) . On a alors ( λ , . . . , λ (cid:96) ) ∈ [0 , (cid:96) \ { , } (cid:96) tel que X = (cid:96) (cid:88) i =1 λ i X ( i ) N ∈ Z (cid:96) . Les (cid:96) premières coordonnées de X donnent ∀ i ∈ { , . . . , (cid:96) } , λ i θ (cid:98) α N (cid:99) ∈ Z . Il existe donc des entiers γ , . . . , γ (cid:96) ∈ { , . . . , θ (cid:98) α N (cid:99) } tels que ∀ i ∈ { , . . . , (cid:96) } , λ i = γ i θ (cid:98) α N (cid:99) car les λ i sont dans [0 , pour tout i ∈ { , . . . , (cid:96) } . De plus, les (cid:96) dernières coordonnéesde X donnent ∀ i ∈ { , . . . , (cid:96) } , (cid:96) (cid:88) j =1 λ j f ( i,j ) N ∈ Z , soit ∀ i ∈ { , . . . , (cid:96) } , (cid:96) (cid:88) j =1 γ j θ (cid:98) α N (cid:99) · θ (cid:98) α N (cid:99) N (cid:88) k =0 e ( i,j ) k θ (cid:98) α k (cid:99) = N (cid:88) k =0 θ (cid:98) α k (cid:99) (cid:96) (cid:88) j =1 γ j e ( i,j ) k ∈ Z . (6.18)Pour k ∈ { , . . . , N } , notons E k la matrice ( e ( i,j ) k ) ( i,j ) ∈{ ,...,(cid:96) } ∈ M (cid:96) ( Z ) , et Γ le vecteurcolonne t ( γ , . . . , γ (cid:96) ) . Ainsi, on peut réécrire sous forme matricielle les (cid:96) équationsdonnées par (6.18) : N (cid:88) k =0 e (1 , k θ (cid:98) α k (cid:99) · · · N (cid:88) k =0 e (1 ,(cid:96) ) k θ (cid:98) α k (cid:99) ... ... N (cid:88) k =0 e ( (cid:96), k θ (cid:98) α k (cid:99) · · · N (cid:88) k =0 e ( (cid:96),(cid:96) ) k θ (cid:98) α k (cid:99) γ ...... γ (cid:96) ∈ Z (cid:96) , soit N (cid:88) k =0 θ (cid:98) α k (cid:99) E k Γ ∈ Z (cid:96) , ou encore, car on va s’intéresser plus particulièrement au dernier terme de la somme, − (cid:88) k =0 θ (cid:98) α N (cid:99)−(cid:98) α k (cid:99) E k Γ + E N Γ ∈ θ (cid:98) α N (cid:99) Z (cid:96) . Comme E N ∈ M (cid:96) ( Z ) , la transposée de sa comatrice appartient aussi à M (cid:96) ( Z ) , etdonc N − (cid:88) k =0 θ (cid:98) α N (cid:99)−(cid:98) α k (cid:99) t com( E N ) E k Γ + t com( E N ) E N Γ ∈ θ (cid:98) α N (cid:99) Z (cid:96) , soit N − (cid:88) k =0 θ (cid:98) α N (cid:99)−(cid:98) α k (cid:99) t com( E N ) E k Γ + det( E N )Γ ∈ θ (cid:98) α N (cid:99) Z (cid:96) . Pour i ∈ { , . . . (cid:96) } et k ∈ { , . . . , N − } , notons L k,i ∈ M ,(cid:96) ( Z ) la i -ème ligne duproduit t com( E N ) E k . Ainsi, ∀ i ∈ { , . . . , (cid:96) } , N − (cid:88) k =0 ( L k,i Γ) θ (cid:98) α N (cid:99)−(cid:98) α k (cid:99) + det( E N ) γ i ∈ θ (cid:98) α N (cid:99) Z . (6.19)Soit j ∈ { , . . . , (cid:96) } . On peut commencer par remarquer que e ( j,j ) N (cid:62) (cid:96) > (cid:96) − (cid:62) (cid:88) i (cid:54) = j e ( i,j ) N , donc E N est une matrice à diagonale strictement dominante (le cas (cid:96) = 1 étanttrivial car la somme de droite est alors vide – la matrice E N est une matrice de M ( Z ) dans ce cas). Elle est donc inversible, i.e. det( E N ) (cid:54) = 0 . (6.20)De plus, on a (cid:12)(cid:12)(cid:12) e ( i,j ) N (cid:12)(cid:12)(cid:12) (cid:54) si i (cid:54) = j et (cid:12)(cid:12)(cid:12) e ( i,i ) N (cid:12)(cid:12)(cid:12) (cid:54) (cid:96) + 1 . Donc | det( E N ) | = (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) (cid:88) σ ∈ S (cid:96) ε ( σ ) (cid:96) (cid:89) i =1 e ( i,σ ( i )) N (cid:12)(cid:12)(cid:12)(cid:12)(cid:12) (cid:54) (cid:88) σ ∈ S (cid:96) (cid:96) (cid:89) i =1 (cid:12)(cid:12)(cid:12) e ( i,σ ( i )) N (cid:12)(cid:12)(cid:12) (cid:54) (cid:96) ! (2 (cid:96) + 1) (cid:96) < θ par définition de θ (qui est le plus petit nombre premier vérifiant la minoration(6.2)). Ainsi, comme < | det( E N ) | < θ , on a v θ (det( E N )) = 0 , donc v θ (det( E N ) γ i ) = v θ (det( E N )) + v θ ( γ i ) = v θ ( γ i ) . On définit u (cid:62) et i ∈ { , . . . , (cid:96) } tels que u = min( v θ ( γ ) , . . . , v θ ( γ (cid:96) )) = v θ ( γ i ) . evenons alors à l’équation (6.19), qui s’écrit ∀ i ∈ { , . . . , (cid:96) } , v θ (cid:32) N − (cid:88) k =0 ( L k,i Γ) θ (cid:98) α N (cid:99)−(cid:98) α k (cid:99) + det( E N ) γ i (cid:33) (cid:62) (cid:98) α N (cid:99) , avec par convention v θ (0) = + ∞ .On a pour tout k ∈ { , . . . , N − } , v θ ( θ (cid:98) α N (cid:99)−(cid:98) α k (cid:99) ) (cid:62) (cid:98) α N (cid:99) − (cid:98) α N − (cid:99) > , et L k,i Γ est une combinaison Z -linéaire des γ i , donc v θ ( L k,i Γ) (cid:62) min( v θ ( γ ) , . . . , v θ ( γ (cid:96) )) = u. Or si v θ ( a ) (cid:54) = v θ ( b ) , alors v θ ( a + b ) = min( v θ ( a ) , v θ ( b )) . Donc pour i = i , on a v θ (cid:32) N − (cid:88) k =0 ( L k,i Γ) θ (cid:98) α N (cid:99)−(cid:98) α k (cid:99) + det( E N ) γ i (cid:33) = u (cid:62) (cid:98) α N (cid:99) car la valuation θ -adique du premier terme est strictement plus grande que u et quecelle du second est égale à u . Finalement, par définition de u , on a ∀ i ∈ { , . . . , (cid:96) } , v θ ( γ i ) (cid:62) (cid:98) α N (cid:99) . Or tous les γ i sont dans { , . . . , θ (cid:98) α N (cid:99) } , donc ∀ i ∈ { , . . . , (cid:96) } , γ i ∈ (cid:8) , θ (cid:98) α N (cid:99) (cid:9) , soit X ∈ S ce qui est absurde.On a donc montré que les seuls points entiers de P sont les points de S , ce quimontre que la famille ( X (1) N , . . . , X ( (cid:96) ) N ) est une Z -base de B N ∩ Z (cid:96) .Ainsi, d’après la proposition 2.14, on a H ( B N ) = (cid:13)(cid:13)(cid:13) X (1) N ∧ · · · ∧ X ( (cid:96) ) N (cid:13)(cid:13)(cid:13) . Or ∀ i ∈ { , . . . , (cid:96) } , θ −(cid:98) α N (cid:99) X ( i ) N −−−! N ! ∞ Y i , donc (cid:13)(cid:13)(cid:13) θ −(cid:98) α N (cid:99) X (1) N ∧ · · · ∧ θ −(cid:98) α N (cid:99) X ( (cid:96) ) N (cid:13)(cid:13)(cid:13) −−−! N ! ∞ (cid:107) Y ∧ · · · ∧ Y (cid:96) (cid:107) , donc pour N suffisamment grand, (cid:13)(cid:13)(cid:13) θ −(cid:98) α N (cid:99) X (1) N ∧ · · · ∧ θ −(cid:98) α N (cid:99) X ( (cid:96) ) N (cid:13)(cid:13)(cid:13) (cid:62) (cid:107) Y ∧ · · · ∧ Y (cid:96) (cid:107) . Finalement, pour N suffisamment grand, on a H ( B N ) = (cid:16) θ (cid:98) α N (cid:99) (cid:17) (cid:96) (cid:13)(cid:13)(cid:13) θ −(cid:98) α N (cid:99) X (1) N ∧ · · · ∧ θ −(cid:98) α N (cid:99) X ( (cid:96) ) N (cid:13)(cid:13)(cid:13) (cid:62) ˜ c (cid:16) θ (cid:98) α N (cid:99) (cid:17) (cid:96) avec ˜ c > ne dépendant que de A , ce qui termine la preuve du lemme 6.12. (cid:3) n peut désormais démontrer le lemme 6.8, selon lequel ψ (cid:96) ( A, B N ) (cid:62) cH ( B N ) α/(cid:96) pour tout N suffisamment grand, où la constante c dépend seulement de A . Preuve. (Lemme 6.8)
Posons Z (1) N = θ −(cid:98) α N (cid:99) X (1) N et notons p ⊥ A la projection orthogonale sur A . D’après lelemme 2.21, on a ψ (Vect( Z (1) N ) , A ) = ψ ( Z (1) N , p ⊥ A ( Z (1) N )) . Avec le lemme 2.24, on a donc ψ (cid:96) ( A, B N ) (cid:62) ψ (Vect( Z (1) N ) , A ) = ψ ( Z (1) N , p ⊥ A ( Z (1) N )) . (6.21)Posons ∆ = p ⊥ A ( Z (1) N ) − Y , ainsi que ω = (cid:13)(cid:13)(cid:13) p ⊥ A ( Z (1) N ) − Z (1) N (cid:13)(cid:13)(cid:13) . On décompose p ⊥ A ( Z (1) N ) dans la base ( Y , . . . , Y (cid:96) ) : p ⊥ A ( Z (1) N ) = (cid:96) (cid:88) i =1 λ i Y i = t (cid:16) λ · · · λ (cid:96) (cid:63) · · · (cid:63) (cid:17) où les (cid:63) sont des coefficients non précisés, car pour tout i ∈ { , . . . , (cid:96) } , Y i = t (cid:16) δ i, · · · δ i,(cid:96) (cid:63) · · · (cid:63) (cid:17) en notant δ le symbole de Kronecker. On a aussi pour tout i ∈ { , . . . , (cid:96) } , Z ( i ) N = t (cid:16) δ i, · · · δ i,(cid:96) (cid:63) · · · (cid:63) (cid:17) , donc ω = (cid:13)(cid:13)(cid:13) p ⊥ A ( Z (1) N ) − Z (1) N (cid:13)(cid:13)(cid:13) (cid:62) ( λ − + (cid:96) (cid:88) i =2 λ i , donc (cid:40) | λ − | (cid:54) ω ∀ i ∈ { , . . . , (cid:96) } , | λ i | (cid:54) ω. (6.22)Soit j ∈ { , . . . , (cid:96) } . On a Y j (cid:107) = 1 + (cid:96) (cid:88) i =1 (cid:32) ∞ (cid:88) k =0 e ( i,j ) k θ (cid:98) α k (cid:99) (cid:33) . Or α > , θ (cid:62) et (cid:96) + 1 (cid:54) θ d’après la condition (6.2) sur θ , donc ∞ (cid:88) k =0 e ( i,j ) k θ (cid:98) α k (cid:99) (cid:54) ∞ (cid:88) k =1 e ( i,j ) k θ k (cid:54) (cid:96) + 1 θ · − /θ (cid:54) θθ − (cid:54) . Donc (cid:107) Y j (cid:107) (cid:54) √ (cid:96) = c . (6.23)Or ∆ = p ⊥ A ( Z (1) N ) − Y = ( λ − Y + (cid:96) (cid:88) i =2 λ i Y i , donc avec les deux majorations de (6.22), on a (cid:107) ∆ (cid:107) (cid:54) c ω (6.24)avec c > ne dépendant que de (cid:96) .On a (cid:13)(cid:13)(cid:13) Z (1) N ∧ p ⊥ A ( Z (1) N ) (cid:13)(cid:13)(cid:13) = (cid:13)(cid:13)(cid:13) Z (1) N ∧ ( Y + p ⊥ A ( Z (1) N ) − Y ) (cid:13)(cid:13)(cid:13) = (cid:13)(cid:13)(cid:13) Z (1) N ∧ Y + Z (1) N ∧ ∆ (cid:13)(cid:13)(cid:13) (cid:62) (cid:13)(cid:13)(cid:13) Z (1) N ∧ Y (cid:13)(cid:13)(cid:13) − (cid:13)(cid:13)(cid:13) Z (1) N ∧ ∆ (cid:13)(cid:13)(cid:13) . (6.25)Or (cid:16) Z (1) N Y (cid:17) ∈ M (cid:96), ( R ) , donc en notant η i,j le mineur × correspondant aux lignes i et j avec i < j , on a (cid:13)(cid:13)(cid:13) Z (1) N ∧ Y (cid:13)(cid:13)(cid:13) = (cid:115) (cid:88) (cid:54) i
Preuve.
Supposons dans un premier temps que n = 2 (cid:96) . Si β ∈ (cid:34) (cid:96) + (cid:114) (cid:96) , + ∞ (cid:34) , la proposition 6.9 donne un sous-espace A ∈ I n ( (cid:96), (cid:96) ) (cid:96) tel que µ n ( A | (cid:96) ) (cid:96) = β . Simaintenant β = + ∞ , posons pour i, j ∈ { , . . . , (cid:96) } ξ i,j = ∞ (cid:88) k =0 e ( i,j ) k k k où les ( e ( i,j ) k ) k ∈ N sont des suites à déterminer, à valeurs dans { , } . En reprenant lesnotations de la section 6.1, posons M ξ = ( ξ i,j ) ( i,j ) ∈{ ,...,(cid:96) } ∈ M (cid:96) ( R ) et notons A ∞ lesous-espace vectoriel engendré par les colonnes de la matrice (cid:32) I (cid:96) M ξ (cid:33) ∈ M (cid:96),(cid:96) ( R ) . De façon similaire au lemme 6.3, on peut choisir des suites ( e ( i,j ) k ) k ∈ N pour i, j ∈ { , . . . , (cid:96) } telles que A ∞ ∈ I n ( (cid:96), (cid:96) ) (cid:96) . Posons pour i, j ∈ { , . . . , (cid:96) } et N (cid:62) , f ( i,j ) N = 3 N N N (cid:88) k =0 e ( i,j ) k k k , et notons B N ∈ R (cid:96) ( (cid:96) ) le sous-espace vectoriel rationnel engendré par les colonnesde (cid:32) N N I (cid:96) F N (cid:33) ∈ M (cid:96),(cid:96) ( R ) ù F N = ( f ( i,j ) N ) i,j ∈{ ,...,(cid:96) } . De façon en tout point similaire au lemme 6.6, on peutmontrer qu’il existe une constante c > dépendant uniquement de A telle que ∀ N (cid:62) , ψ (cid:96) ( A ∞ , B N ) (cid:54) cH ( B N ) N/(cid:96) . Ainsi, ∀ κ > , ∀ N (cid:62) κ(cid:96), ψ (cid:96) ( A ∞ , B N ) (cid:54) cH ( B N ) κ , donc ∀ κ > , µ n ( A ∞ | (cid:96) ) (cid:96) (cid:62) κ, car en suivant la preuve du lemme 6.7 (plus précisément l’inégalité (6.13) page 93)on voit que ψ (cid:96) ( A ∞ , B N ) tend vers quand N ! ∞ , donc il y a une infinité desous-espaces B N deux à deux distincts.Finalement, µ n ( A ∞ | (cid:96) ) (cid:96) = + ∞ . Considérons enfin le cas où n > (cid:96) . Notons φ un isomorphisme rationnel de R (cid:96) dans R (cid:96) × { } n − (cid:96) . Posons A (cid:48) = φ ( A ) . D’après le théorème 5.1, on a A (cid:48) ∈ I n ( (cid:96), (cid:96) ) (cid:96) et µ n ( A (cid:48) | (cid:96) ) (cid:96) = µ (cid:96) ( A | (cid:96) ) (cid:96) = β, ce qui permet d’étendre le résultat aux entiers n > (cid:96) . (cid:3) ibliographie [BL05a] Y. Bugeaud et M.
Laurent : Exponents of Diophantine Approximationand Sturmian Continued Fractions.
Annales de l’Institut Fourier , 55(3):773–804, 2005.[BL05b] Y.
Bugeaud et M.
Laurent : On exponents of homogeneous and in-homogeneous Diophantine approximation.
Moscow Mathematical Journal ,5(4):747–766, 2005.[BL10] Y.
Bugeaud et M.
Laurent : On transfer inequalities in Diophantineapproximation, II.
Mathematische Zeitschrift , 265:249–262, 2010.[Bug08] Y.
Bugeaud : Diophantine approximation and Cantor sets.
Mathema-tische Annalen , 341:677–684, 2008.[Cas57] J. W. S.
Cassels : An Introduction to Diophantine Approximation . Cam-bridge University Press, 1957.[CG15] P.
Caldero et J.
Germoni : Histoires hédonistes de groupes et de géo-métries , volume 2. Calvage & MounetMounet, 2015.[Chu82] G. V.
Chudnovsky : Hermite-Padé Approximations to Exponential Func-tions and Elementary Estimates of the Measure of Irrationality of π . Lec-ture Notes in Mathematics , 925, 1982.[dS20] N. de
Saxcé : Groupes arithmétiques et approximation diophantienne .Habilitation à diriger des recherches, Université Sorbonne Paris Nord, 2020.[Fis14] G.
Fischer : Lineare Algebra . Grundkurs Mathematik. Springer Spek-trum, 18 ème édition, 2014.[Gro38] A. V.
Groshev : Un théorème sur les systèmes des formes linéaires.
Doklady Akademii Nauk SSSR , 19:151–152, 1938.[Hat93] M.
Hata : A Lower Bound for Rational Approximations to π . Journal ofNumber Theory , 43:51–67, 1993.[HW07] G. H.
Hardy et E. M.
Wright : Introduction à la Théorie des Nombres .Springer, 5 ème édition, 2007.[Jar29] V.
Jarník : Diophantische Approximationen und Hausdorffsches Mass.
Matematicheskii Sbornik , 36(3-4):371–382, 1929.[KM98] D. Y.
Kleinbock et G. A.
Margulis : Flows on homogeneous spacesand Diophantine approximation on manifolds.
Annals of Mathematics ,148(1):339–360, 1998.[Lan02] S.
Lang : Algebra . Springer-Verlag, 3 ème édition, 2002.107Lau09] M.
Laurent : On transfer inequalities in Diophantine approximation.
Cambridge University Press , Analytic number theory, Essays in honour ofKlaus Roth:306–314, 2009.[Lio44] J.
Liouville : Nouvelle démonstration d’un théorème sur les irrationnelsalgébriques.
Comptes Rendus hedbomadaires des séances de l’Académie dessciences , 18:910–911, 1844.[LSV06] J.
Levesley , C.
Salp et S. L.
Velani : On a problem of K. Mah-ler : Diophantine approximation and Cantor sets.
Mathematische Annalen ,338(1):97–118, 2006.[Mah53] K.
Mahler : On the approximation of π . Indag Math. , 15(1), 1953.[Mar18] A.
Marnat : Note on the spectrum of classical and uniform exponents ofDiophantine approximation.
Acta Arithmetica , 185(1-8), 2018.[Mig74] M.
Mignotte : Approximation rationnelle de π et quelques autresnombres. Bull. Soc. math. France , 37:121–132, 1974.[Mos20] N.
Moshchevitin : Über die Winkel zwischen Unterräumen.
ColloquiumMathematicum , 2020.[Niv63] I.
Niven : Diophantine Approximations . Interscience Publishers, 1963.[Rot55] K. F.
Roth : Rational Approximations to Algebraic Numbers.
Mathema-tika , 2, 1955.[Sal08] V. K.
Salikhov : On the irrationality measure of π . Uspekhi Mat. Nauk ,63:163–164, 2008.[Sch67] W. M.
Schmidt : On Heights of Algebraic Subspaces and DiophantineApproximations.
Annals of Mathematics , 85(3):430–472, 1967.[Sch70] W. M.
Schmidt : Simultaneous Approximation To Algebraic NumbersBy Rationals.
Acta Math , 125:189–201, 1970.[Sch80] W. M.
Schmidt : Diophantine Approximation , volume 785 de
LectureNotes in Mathematics . Springer-Verlag, 1980.[Sei55] J. J.
Seidel : Angles and distances in n -dimensional euclidean and no-neuclidean geometry. Indag Math. , 17, 1955.[TT96] G. N.
Ten Have et R.
Tijdeman : Diophantine Approximation of Ma-trices.
Journal of Mathematics , 26(3), 1996.[ZZ20] D.
Zeilberger et W.
Zudilin : The irrationality measure of π is at most . ... arXiv :1406.3669v , 2020., 2020.