samedi 7 novembre 2015

Les aventures du plan affin et euclidien

[Cet article n'est pas terminé, mais comme j'en ai déjà écrit une grande partie, je le publie déjà ; vous pouvez vous amuser à le lire tel quel, en sachant qu'il est appelé à évoluer.]   

Il est temps maintenant de vous initier à la construction du plan affin et euclidien à partir du plan projectif, qui est un peu le but de ma démarche depuis le début. Pour bien comprendre ce qui va suivre, il est donc nécessaire d'avoir présents à l'esprit les développements contenus dans l'article fondateur de ce site, Bereshit, ou les passionnantes aventures du plan projectif arguésien

Le plan affin, définition

Une fois que nous avons le plan projectif réel avec ses points, ses droites, ses birapports et ses coordonnées homogènes, nous allons d'abord construire un plan affin complété de la façon suivante : nous choisissons une droite d, que nous appellerons "droite à l'infini" ou "de l'infini", et à laquelle nous attribuerons désormais un rôle particulier : elle sera "l'horizon", la limite du plan. Ses points seront appelés "points à l'infini", les autres, ceux qui n'appartiennent pas à d, seront dits "points usuels". Des droites qui se coupent sur d, c'est-à-dire, dont l'intersection appartient à d, seront dites parallèles. Parmi tous les faisceaux de droites convergentes, il y en a donc qui se distinguent des autres par le fait que leur point de convergence est "à l'infini". Le plan n'est donc plus homogène en ses faisceaux de droites.
Si l'on "exclut" carrément la droite à l'infini, c'est-à-dire, si l'on considère la structure formée uniquement par les points usuels, on a un plan affin tout court. Dans ce plan, toutes les droites ont un point en moins par rapport au plan projectif ou affin complété, leur point à l'infini. Des droites parallèles, qui se coupent à l'infini, n'ont désormais plus de points d'intersection, leur intersection est l'ensemble vide, elles ne se coupent pas. On voit donc pourquoi, en géométrie euclidienne classique, il y a un "postulat" qui dit que "par tout point extérieur à une droite passe une et une seule parallèle à cette droite" : c'est une simple conséquence du troisième axiome du plan projectif (dans notre énumération) : par deux points passe une et une seule droite ; par un point extérieur à une droite et le point à l'infini de cette droite passe une seule droite, l'unique parallèle à cette droite passant par ce point, c'est clair. Dans cette perspective (c'est le cas de le dire), le "postulat des parallèles", qui a tenu en haleine les mathématiciens pendant des siècles (ils essayaient de le démontrer mais n'y arrivaient pas), se réduit à une application de l'axiome d'incidence : deux points déterminent une droite. C'est un progrès notable.
Le plan affin et le plan affin complété ne doivent pas être confondu, l'une est une partie de l'autre, toutefois considérer les points à l'infini ou non ne change pas grand-chose du point de vue des développements géométriques que l'on peut faire par la suite ; les deux plans, affin et affin complété, ont essentiellement les mêmes propriétés ; simplement, elles s'interprètent différemment : dans le premier, le parallélisme s'interprète comme intersection vide, non convergence, dans le second il s'interprète comme "convergence à l'infini". Mais toute propriété du plan affin peut se traduire en termes affins complétés en rajoutant les points à l'infini. 

Desargues dans le plan affin

Si le théorème de Desargues est valable dans notre plan projectif, il le reste dans le plan affin correspondant. Il y a donc des plans affins arguésiens et non arguésiens comme les plans projectifs. Intéressons-nous spécialement aux plans affins arguésiens. Dans le plan projectif, le théorème de Desargues peut prendre deux formes, selon que chacune des dix droites comprend exactement trois des dix points, ou qu'une des droites comprend quatre des points. Le premier cas correspond aux perspectivités générales - on se souvient que le théorème de Desargues équivaut à l'existence de perspectivités - le second cas correspond aux transvections, quand le centre de la perspectivité est sur l'axe. Dans le plan affin, ces deux cas se scindent en sept (ou huit), selon que certains de ces points ou de ces droites sont à l'infini ou non. On a donc, en plus du cas général où aucun point n'est à l'infini - et le théorème reste naturellement valable dans ces cas - les possibilités suivantes :

- L'axe de la perspectivité n'est pas à l'infini, mais son centre bien ; aucun autre point n'est à l'infini ; dans ce cas le théorème s'énonce

étant donnés six points A, B, C, A', B', C' en position générale (trois à trois non alignés), tels que les droites AA', BB' et CC' soient parallèles, si les droites AB et A'B' se rencontrent en un point P et les droites BC et B'C' en un point Q, alors les droites AC et A'C' se rencontrent également en un point R et les points P, Q, R sont alignés ;



On distingue en fait ici deux cas, selon que la droite PQ est parallèle aux droites AA', etc. ou non. Dans le premier cas on a une transvection dont le centre (mais pas l'axe) est à l'infini, qu'on appellera un cisaillement ; dans le second, une perspectivité générale dont le centre est à l'infini et l'axe non : on l'appellera un étirement. Cette forme du théorème équivaut à l'existence de cisaillements et d'étirements. 

- L'axe de la perspectivité est à l'infini : dans ce cas, le théorème prend la forme suivante :

étant donnés six points A, B, C, A', B', C' en position générale, si les droites AA', BB', CC' sont parallèles ou concourantes, et si les droites AB et A'B' d'une part, BC et B'C' d'autre part, sont parallèles, alors les droites AC et A'C' sont également parallèles ;



Noter que dans le premier cas (les droites AA', etc. sont parallèles) on a une translation (entre les triangles ABC et A'B'C'), dans le second (droite concourantes), une homothétie ; cette forme du théorème de Desargues équivaut donc à l'existence de translations et d'homothéties.

- L'axe n'est pas à l'infini, mais un seul des trois points P, Q, R est à l'infini ; on a alors la forme suivante :

étant donnés six points A, B, C, A', B', C' en position générale, si les droites AA', BB' et CC' sont parallèles ou concourantes, si les droites AB et A'B' sont parallèles et que les droites BC et B'C' se rencontrent en un point Q, alors les droites AC et A'C' se rencontrent en un point R et la droite QR est parallèle à AB et A'B' ;

Cette forme n'est pas fondamentalement différente du cas général, et les perspectivités qu'elle décrit ne portent pas de nom spécial ; simplement, un des côtés des triangles est parallèle à l'axe. En fait, dans le cas où les droites AA' etc. sont concourantes, on pourrait encore distinguer deux cas, selon que leur point d'intersection - le centre - appartient ou non à l'axe, avec les droites AB et A'B' parallèles à cet axe. Dans ce cas, on aurait neuf cas distincts pour le théorème de Desargues... contre seulement deux dans le plan projectif.
Noter que, puisqu'il suffit que le théorème de Desargues soit vrai pour un axe et un centre fixés pour qu'il soit toujours vrai, chacune de ces quatre formes - le cas général et les trois que nous avons énumérées par un tiret, avec chaque fois deux cas distincts selon que le centre appartienne ou non à l'axe - implique tous les autres. Ainsi, par exemple, l'existence d'homothéties et de translations implique l'existence de cisaillements, d'étirements et de perspectivités quelconques (qui cependant ne sont pas des transformations affines !). De même, l'existence de cisaillements et d'étirements implique celle de toutes les autres transformations. 

Coordonnées affines

Si le plan projectif est rapporté à un repère OIJK, avec des coordonnées homogènes (X, Y, Z), il est commode de choisir comme droite à l'infini la droite JK, d'équation Z = 0, c'est-à-dire que les points à l'infini sont les points de la forme (X, Y, 0). Ce choix est tellement la norme que certaines personnes, qui croient avoir tout compris sur le plan affin et le plan projectif, pensent qu'il n'y en a pas d'autre possible. Or c'est faux, on peut construire un plan affin en prenant n'importe quelle droite du plan projectif comme droite à l'infini, ça ne change rien. De toute façon, par un changement de repère, on peut toujours se ramener au cas précédent, ou à n'importe quel autre. Si l'on intervertit les points J et O par exemple, la droite à l'infini deviendra la droite OK, d'équation X = 0, et les points à l'infini seront les points de la forme (0, Y, Z). C'est un choix moins courant mais aussi commode. Mais à l'avenir, puisque c'est la convention, on supposera sauf mention contraire que la droite à l'infini a pour équation Z = 0.
Maintenant, à chaque droite passant par O - ou par n'importe quel point - correspond un et un seul point à l'infini, qui détermine sa direction. Les points à l'infini s'identifient donc aux "directions de droites", et on peut d'ailleurs les définir comme ça ; c'est ce qui a été fait historiquement. Ainsi, vu que les points J et K sont à l'infini, ils s'identifient à deux directions de droites fixées ; un repère affin est donc constituer d'un point origine O, de deux directions de droites (deux "axes"), et d'un point unité I, qui détermine sur chaque axe (par une projection parallèle) "l'unité de mesure" propre à cet axe. 
Puisque les points usuels ont tous leur troisième coordonnée non nulle, on peut déshomogénéiser les coordonnées, en posant que Z = 1 pour tous les points non à l'infini, ou encore en divisant par Z. En posant x = X/Z, y = Y/Z, un point usuel (X, Y, Z) devient un point de coordonnées non homogènes (x, y), tandis qu'un point à l'infini devient un couple homogène (X, Y) qui correspond à une direction de droites. Les points projectifs se scindent donc en points affins avec un couple de coordonnées non homogènes, et en directions de droites définies par deux coordonnées homogènes (en fait, des coordonnées homogènes à une dimension sur la droite Z = 0 qui conserve une structure de droite projective). On voit que le simple fait de fixer une droite entre les droites du plan projectif a des conséquences importantes sur la structure. On notera aussi qu'on peut toujours "remonter" des coordonnées affines non homogènes aux coordonnées homogènes, en remplaçant un couple (x, y) par un triplet (x, y, 1) et une direction (X, Y) par un triplet (X, Y, 0), puis en multipliant par une constante arbitraire. 
Tout cela a des conséquences sur les droites. Nous avions vu en effet qu'étant donnés deux points P, Q de coordonnées (X1, Y1, Z1) et (X2, Y2, Z2), la droite joignant ces deux points a pour coordonnées (dans la base duale) le triplet (Y1Z2 - Y2Z1, X2Z1 - X1Z2, X1Y2 - X2Y1), c'est-à-dire qu'elle a pour équation

(Y1Z2 - Y2Z1)X + (X2Z1 - X1Z2)Y + (X1Y2 - X2Y1)Z = 0.

Si P et Q sont des points usuels, on peut faire Z1 = Z2 = 1 et remplacer les coordonnées homogènes par les coordonnées non homogènes, pour les points du plan affin ; l'équation de la droite devient donc

(y1 - y2)x + (x2 - x1)y + x1y2 - x2y1 = 0

et l'on notera que le point à l'infini de cette droite, obtenant en ré-homogénéisant les coordonnées et en faisant Z = 0, a pour coordonnées (x2 - x1, y2 - y1, 0). Des coordonnées non homogènes de deux points, on peut donc déduire immédiatement les coordonnées du point à l'infini de la droite qu'ils déterminent, qui n'est autre que le "vecteur directeur" de cette droite en géométrie affine "classique".
Maintenant, supposons que Q soit un point à l'infini et P un point usuel ; on a alors Z2 = 0, et l'on peut remplacer les coordonnées homogènes par les coordonnées non homogènes avec Z1 = 1, et aussi Z = 1 si l'on ne considère que les points usuels de cette droite. Donc, l'équation de cette droite dans le plan affin sera

(-y2)x + x2y + x1y2 - x2y1 = 0.

Si l'on cherche l'intersection de cette droite avec la droite à l'infini comme précédemment, on trouve bien (x2, y2, 0), c'est-à-dire les coordonnées du point Q. L'identification entre directions de droites ou "vecteurs directeurs" et points à l'infini fonctionne donc parfaitement. Et l'on constate que l'homogénéisation des coordonnées permet de traiter comme un même problème les deux problèmes suivants : trouver l'équation de la droite passant par deux points du plan, et trouver l'équation de la droite passant par un point donné et de vecteur directeur donné. En géométrie affine, ce sont deux problèmes bien différents ; en géométrie affine complétée-projective, grâce aux coordonnées homogènes, c'est kif-kif et bourricot. Un autre problème de géométrie affine classique se résout par une méthode proche : trouver l'équation d'une droite passant par un point donné et parallèle à une droite donnée ; on peut calculer d'abord le vecteur directeur de cette droite en déterminant les coordonnées de son point à l'infini, puis on détermine par la formule connue les coordonnées de la droite passant par ce point et le point usuel donné dans le problème. Enfin on déshomogénéise et cela nous donne l'équation de la droite cherchée. 

Rapport de section

En géométrie affine, on définit une nouvelle notion numérique, le rapport de section, qui est en fait un birapport. Si A, B, C, D sont quatre points alignés, A étant à l'infini, le birapport (A B C D) sera nommé "rapport" ou "rapport de section" des trois points B, C, D et se notera désormais DB/CB ou BD/BC, comme une fraction, sauf qu'à ce stade le numérateur et le dénominateur ne sont pas encore définis : seule à un sens l'expression globale DB/CB, qui équivaut à (A B C D), A étant le point à l'infini de la droite BC (ou DB ou DC). Donc si B, C, D sont trois points alignés, on peut toujours définir leur rapport de section, puisque leur droite comporte un seul point à l'infini. On voit que le rapport de section a comme propriété de se conserver par une projection centrale dont le centre est à l'infini, ce qui s'appelle une projection parallèle : c'est le "théorème de Thalès", qui n'est qu'une conséquence de la proposition plus générale : les projections centrales conservent le birapport. 
Enfin, la propriété (A B C D)(B E C D) = (A E C D) se traduit, si A est à l'infini, par (B E C D) = (DE/CE)/(DB/CB) = (DE/CE)(CB/DB), ce qui permet de calculer un birapport comme un "rapport de rapports", et donne (enfin !) une justification au nom "birapport" donné à ce nombre, qui à l'origine caractérise les perspectivités fixant deux points A et B et appliquant C sur D.
Dans le cas particulier où le birapport vaut -1, donc où les quatre points sont conjugués harmoniquement, on voit tout de suite que le point B est le milieu du segment [CD]. Dans notre façon de procéder, toutefois, ceci constitue la définition du milieu d'un segment. Mais on voit que la signification géométrique du conjugué harmonique se précise : si le point A est à l'infini, son conjugué harmonique est le milieu du segment formé par les deux derniers points.

Affinités

Nous avons déjà un peu vu, avec le théorème de Desargues, ce que devenaient les perspectivités dans le plan affin. Nous allons revenir sur la question de façon plus détaillée. Désormais, on appellera transformations affines ou affinités les projectivités qui conservent (globalement) la droite à l'infini. Ce sont donc les transformations qui préservent la structure affine, c'est-à-dire à la fois la structure projective et la droite à l'infini, donc le parallélisme. On peut aussi les définir comme les projectivités qui transforment les droites parallèles en droites parallèles. En particulier, considérons les perspectivités ayant pour axe la droite à l'infini ; ce sont évidemment des affinités (mais pas les seules). On a vu qu'elles étaient de deux types : les transvections d'axe la droite à l'infini, que nous appelons translations, et les perspectivités générales d'axe à l'infini, que nous nommons homothéties. On notera que ces transformations sont les seuls qui préservent non seulement le parallélisme, mais encore les directions de droites, c'est-à-dire qu'elles changent toute droite en une droite de même direction, parallèle donc à la droite d'origine. Ces deux types de transformations forment un groupe, le groupe des homothéties-translations. Il joue dans le plan affin le même rôle que le groupe des perspectivités d'axe donné dans le plan projectif.
Une translation est caractérisée par une direction de droites qui restent globalement invariantes, c'est-à-dire qu'elles "glissent sur elles-mêmes" lors de cette transformation. Le point à l'infini de ces droites n'est autre que le centre de la translation, vue comme perspectivité. En géométrie affine complétée, les translations sont donc des transformations ayant un axe et un centre, ce qui est toujours amusant à dire quand on a en tête leur définition en géométrie affine, car ce sont alors des transformations n'ayant aucun point fixe. D'autre part, les homothéties sont des transformations ayant non seulement un centre, mais aussi un axe (la droite à l'infini), ce qui est aussi amusant à dire, car cela les rend symétriques d'un autre type de transformations affines complètement différent en apparence, les étirements et les symétries axiales. Un étirement est une perspectivité dont l'axe n'est pas à l'infini, c'est donc une droite ordinaire, mais dont le centre est un point à l'infini. Puisque la droite à l'infini passe par le centre, elle est globalement invariante, donc c'est bien une affinité. D'un point de vue affin, les étirements sont caractérisés par une droite fixe, l'axe, et une direction de droites qui glissent sur elles-mêmes, comme dans le cas des translations. Homothéties et étirements ont beaucoup en commun (ce sont des perspectivités qui sont en plus des affinités, donc ayant un élément, centre ou axe, à l'infini), mais cela ne se voit que d'un point de vue projectif (ou affin complété). Enfin, homothéties et étirements sont caractérisés par un rapport, qui est un nombre réel non nul, positif ou négatif ; c'est le rapport de la perspectivité en question. Dans une homothétie de centre O, si P' est l'image de P (les trois points sont donc alignés), on voit tout de suite que le rapport d'homothétie n'est autre que OP'/OP, et c'est le même quel que soit P. Une homothétie se voit donc comme un "agrandissement" (ou une réduction) de rapport donné, conservant les directions, et accompagné d'un mouvement de glissement autour du point fixe O. Dans un étirement d'axe a, si P' est l'image de P, et Q l'intersection de la droite PP' avec a, le rapport d'étirement est P'Q/PQ, et c'est aussi, forcément, le même quel que soit Q. C'est comme si on "tirait" (ou poussait) sur les points, dans la direction de la droite PP', et dans un rapport donné. En particulier, un étirement de rapport -1 (il est donc son propre inverse) s'appelle une réflexion ou symétrie axiale d'axe a dans la direction de l'étirement. Une homothétie de rapport -1 (aussi auto-inverse donc) s'appelle symétrie centrale.
Il existe enfin un dernier type d'affinités qui sont aussi des perspectivités, mais qui sont plus difficiles à décrire : ce sont les cisaillements. Ce sont les transvections dont l'axe n'est pas à l'infini, mais dont le centre est le point à l'infini de l'axe. Les cisaillements sont donc aux étirements ce que les translations sont aux homothéties. Ce sont des transformations assez bizarres : chaque droite fait comme un mouvement de ciseaux autour d'un point fixe qui est son intersection avec l'axe, d'où le nom cisaillement ; chaque point, en même temps, se déplace sur une droite - la "trace" par ce point - parallèle à l'axe. Cisaillements et étirements sont les seuls affinités ayant un axe de points usuels, mais dans le premier cas, les traces sont parallèles à l'axe, tandis que dans le second, elles ne le sont jamais. C'est une façon de caractériser ces deux types de transformations.

Vecteurs libres

En géométrie affine, il peut être utile de définir les "vecteurs libres" ; ce sont les couples de points (A, B), A et B étant des points usuels, modulo une relation d'équivalence : on décide que deux couples (A, B) et (A', B') définissent le même vecteur  si les droites AB et A'B' sont parallèles, ainsi que les droites AA' et BB'. Autrement dit si les quatre points forment une figure appelée "parallélogramme". Tout couple de points appartient ainsi à une seule "classe d'équivalence" - c'est en fait une conséquence du théorème de Desargues - et ce sont ces classes qui sont appelées "vecteurs (libres)". Une définition alternative est : deux couples de points (A, B) et (A', B') sont équivalents, déterminent le même vecteur, si la translation qui applique A sur B applique également A' sur B'. En effet, si les droites AB et A'B' d'une part, AA' et BB' d'autre part, se rejoignent à l'infini, il existe donc une perspectivité ayant pour axe la droite de l'infini, pour centre le point à l'infini des droites AB et A'B', et qui envoie A sur B et A' sur B' ; cette perspectivité est une translation de centre, c'est-à-dire de direction, le point à l'infini de la droite AB. Une translation définit donc un vecteur libre, et de même qu'on peut multiplier une translation par un scalaire (un nombre réel) et additionner deux translations (souvenons-nous que nous avons vu cela quand nous avons construit le corps des perspectivités d'axe d et de centre O), on peut additionner deux vecteurs et les multiplier par un scalaire, de telle sorte que cette multiplication soit distributive par rapport à l'addition vectorielle. L'addition vectorielle et la multiplication par un scalaire caractérisent les vecteurs. 
Remarquons que si (A, B) et (A', B') représentent le même vecteur libre, il existe aussi une translation unique qui envoie A sur A' et B sur B' ; elle a pour centre le point à l'infini des droites AA' et BB'. 
Il est facile de voir que si une translation t envoie le point O, de coordonnées non homogènes (0, 0), sur le point A de coordonnées (x_A, y_A), elle envoie le point P(x, y) sur le point P' de coordonnées (x + x_A, y + y_A). Une translation agit donc comme l'ajout d'un point constant. Deux couples de points représentant un même vecteur diffèrent donc par une translation. Dès lors, un vecteur peut également être représenté par un couple de nombres (x, y), non homogènes, et le vecteur défini par les points A : (x_A, y_A) et B : (x_B, y_B) est représenté par le couple (x_B - x_A, y_B - y_A). Ces nombres, en effet, ne dépendent pas du choix du couple (A, B) utilisé pour représenter ce vecteur, puisqu'un autre couple représentant le même vecteur n'en diffère que par une translation constante (identique pour les deux points). On peut donc identifier un point P au vecteur (O, P) et écrire Q = P + (P, Q) : (x_Q, y_Q) = (x_P, y_P) + (x_Q - x_P, y_Q - y_P). La somme ou la différence de deux vecteurs peut se faire terme à terme sur leurs coordonnées. Un couple non homogène (x, y) représente donc, au choix, un point, un vecteur ou une translation. 
L'intérêt est que jusqu'ici, une translation était une transformation linéaire, matricielle, en coordonnées homogènes ; maintenant nous pouvons la décrire comme l'application qui au point P fait correspondre le point P' = P + u, où u représente un vecteur constant. Naturellement, les nombres représentant ce vecteur dépendent du système de coordonnées.
Une droite de vecteur directeur u et passant par le point P peut se voir aussi comme l'ensemble des points dont les coordonnées sont de la forme P + ku, c'est-à-dire 

x  = x_P + kx_u, y = y_P + ky_u

où k est un paramètre variable ; ce sont les équations paramétriques de la droite. En éliminant k, on retrouve la forme connue, avec (x_u, y_u) comme point à l'infini, ce qu'on peut voir aussi (de façon moins rigoureuse mais plus intuitive) en faisant tendre k vers l'infini.

On a maintenant un espace vectoriel de dimension 2, un plan vectoriel ; ses éléments, les vecteurs, s'identifient aux couples (x, y) munis de l'addition terme à terme et de la multiplication par un scalaire. Notons qu'à partir de là, on peut reconstituer un espace affin et un espace projectif. Pour construire un plan affin à partir du plan vectoriel, il suffit de définir les droites affines, comme les ensemble de points-vecteurs de la forme u + kv, où u et v sont deux vecteurs fixes et k un paramètre variable ; on complète ensuite ce plan affin par les points à l'infini, c'est-à-dire les directions de droites, et on le plan affin complété ; enfin on décide d'"oublier" la différence entre points à l'infini et points usuels, et on a le plan projectif. Mais d'autre part, on constate aussi que l'ensemble des droites vectorielles, c'est-à-dire des points-vecteurs de la forme kv, où v est fixe et k variable, est un ensemble de couples de coordonnées homogènes, c'est-à-dire une droite projective. Résumons : l'ensemble des droites vectorielles - qui sont les droites affines passant par le point O - est une droite projective. Cela reste valable en dimension supérieure à 2, comme nous le verrons mieux dans un autre article : à partir d'un espace vectoriel de dimension 3, on peut construire soit un espace projectif de dimension 3 en rajoutant les droites affines et les points à l'infini, soit un espace projectif de dimension 2 (un plan projectif), en considérant les droites vectorielles - droites par l'origine O dans l'espace affin tridimensionnel - comme des points, repérés par trois coordonnées homogènes.

Toute affinité fixant le point O peut s'écrire matriciellement, avec une matrice 2 sur 2 agissant sur les coordonnées non homogènes. Par exemple, une homothétie de centre O, de rapport k, correspond simplement à la transformation (x, y) -> (kx, ky). Un étirement d'axe x, dans la direction y, de rapport k correspond à la transformation (x, y) -> (x, ky) ; un étirement d'axe y dans la direction x, à la transformation (x, y) -> (kx, y), etc. Ces transformations-là ont toutes une matrice diagonale parce qu'elles conservent les deux axes. Une transformation centrée générale ne les conserve pas forcément, et correspond à une matrice régulière quelconque.
L'affinité la plus générale peut donc s'écrire comme la composée d'une translation et d'une transformation fixant O (matricielle) : P' = MP + u, où u est un vecteur constant et M une matrice 2 sur 2 régulière. Remarquons qu'elle peut aussi s'écrire P' = M(P + u') où u' = (M^-1)u ; on peut faire la translation avant ou après la transformation matricielle. C'est aussi, bien sûr, la forme générale d'un changement de coordonnées. Si le nouveau système de coordonnées a la même origine O, la transformation est simplement matricielle (changement d'axes). Si en plus l'origine est différente, disons un point O', le vecteur u représente la translation appliquant O' sur O (et non O sur O' ! car le point O' doit avoir pour nouvelles coordonnées (0, 0)), exprimée dans les nouveaux axes ou dans les anciens, selon qu'on fasse d'abord le changement d'axes et puis le changement d'origine, ou l'inverse.

Coniques

Venons-en aux coniques maintenant. Rappelons que les coniques projectives sont, dans le plan projectif, des ensembles de points satisfaisant une équation du second degré (quadratique) ; on peut également les voir comme l'ensemble des points auto-conjugués d'une polarité, c'est-à-dire une transformation qui intervertit points et droites en conservant les relations d'incidence : à trois points alignés correspondent trois droites concourantes et vice-versa. L'image d'un point par une polarité est sa polaire, l'image d'une droite est son pôle. Un point (resp. une droite) est auto-conjugué(e) s'il appartient à sa polaire (resp. si elle passe par son pôle). Un point auto-conjugué est un point d'une conique, et sa polaire est une tangente ; une droite auto-conjuguée est donc une tangente. Par tout point du plan passe 0, 1 ou 2 tangentes. S'il en passe exactement une, c'est un point auto-conjugué, un point de la conique. S'il en passe 2, c'est un point extérieur à la conique, sa polaire rencontre celle-ci en deux points, les points de contact des deux tangentes. S'il passe 0 tangente, le point est un point intérieur ; sa polaire ne rencontre pas la conique. Tout ceci est vrai pour les coniques non dégénérées, c'est-à-dire, celles qui ne se réduisent pas à un point et ne contiennent pas de droite. On les appelle aussi coniques ovales. Toutes les coniques ovales sont projectivement équivalentes : on peut toujours trouver une projectivité qui les transforment l'une dans l'autre. Mais dans le plan affin, c'est différent : il y a trois types de coniques ovales, suivant qu'elles rencontrent la droite de l'infini en 0, 1 ou 2 points.

- Une conique qui ne rencontre la droite de l'infini en aucun point est une ellipse ;
- Une conique qui est tangente à la droite de l'infini, c'est-à-dire, qui la rencontre en un seul point, est une parabole ;
- Une conique qui rencontre la droite de l'infini en deux points est une hyperbole.

Le pôle de la droite de l'infini par rapport à une conique s'appelle son centre. Les définitions ci-dessus équivalent donc aux suivantes :

- Une conique dont le centre est un point intérieur est une ellipse ;
- Une conique dont le centre est un point auto-conjugué (un point de la conique même) est une parabole ;
- Une conique dont le centre est un point extérieur (par lequel passent deux tangentes) est une hyperbole.

Les tangentes passant par le centre d'une hyperbole, tangentes à l'infini, sont appelées asymptotes.

Deux coniques du même type sont équivalentes d'un point de vue affin : il existe toujours une affinité qui les transforment l'une dans l'autre. Deux coniques de type différent ne sont pas équivalentes : il n'existe aucune affinité les transformant l'une dans l'autre. Une ellipse ne peut jamais devenir une parabole, etc. Elle peut toujours le devenir par une projectivité, mais ce n'est pas une transformation affine. Un des points de départs de la géométrie projective est justement le constat historique qu'une ellipse peut devenir une parabole ou une hyperbole par projection centrale sur un plan non parallèle au plan de l'ellipse, ce qui équivaut à une projectivité. On a donc imaginé une structure géométrique abstraite, le plan projectif, dans lequel ces trois types de coniques seraient équivalentes modulo une transformation qui préserve cette structure, les projectivités. La géométrie projective est la structure adaptée à l'étude des projections (et de leurs invariants), et l'étude des projections se justifie entre autres par la recherche des propriétés communes à tous les types de coniques (ce sont précisément celles qui se conservent par projection !).

L'équation affine d'une conique est une équation du second degré non homogène, c'est-à-dire, contenant des termes linéaires et constants :

Ax^2 + By^2 + Cxy + Dx + Ey + F = 0.

Pour déterminer le type de cette conique par les méthodes de la géométrie affine, il faudrait l'écrire sous forme matricielle et diagonaliser sa matrice (si possible, ou au moins la jordaniser), ce qui équivaut à la recherche du centre et d'un système d'axes conjugués ou auto-conjugués par rapport à la conique. C'est assez compliqué. Les coordonnées homogènes permettent de faire plus simple. D'abord on homogénéise l'équation ci-dessus, ce qui donne

AX^2 + BY^2 + CXY + DXZ + EYZ + FZ^2 = 0 ;

ensuite, on cherche les intersections avec la droite à l'infini en posant Z = 0, d'où

AX^2 + BY^2 + CXY = 0.

C'est une équation facile à résoudre, qui donne tout de suite les points à l'infini s'il y en a. Le centre est le pôle de la droite de l'infini, il a pour équation

DX + EY + 2F = 0.

Une fois qu'on a déterminé le centre de la conique, si c'est un point usuel, on peut par une translation le ramener à l'origine des coordonnées ; ensuite, il est facile de choisir pour axes deux droites conjuguées, ou deux droites auto-conjuguées (les asymptotes) s'il s'agit d'une hyperbole, de sorte que l'équation prenne la forme simple (on dit parfois "canonique") :

x^2 + y^2 - 1 = 0 (ellipse)

ou

x^2 - y^2 - 1 = 0 (hyperbole, axes conjugués)

ou

xy - 1 = 0 (hyperbole, repère asymptotique)

pour une parabole, on ne peut pas ramener le centre à l'origine par une translation vu qu'il est à l'infini, mais on peut choisir comme axes une droite passant par le centre et une droite conjuguée qui soit en même temps tangente à la parabole, de sorte que l'équation prendra la forme

x^2 - y = 0

on peut d'ailleurs déduire immédiatement cette forme de l'équation d'une hyperbole en axes asymptotiques, qui s'écrit en coordonnées homogènes XY - Z^2 = 0 (la forme de la matrice permet de voir du premier coup d'oeil que la droite à l'infini a comme pôle l'origine, tandis que les points J et K ont comme polaires les droites OJ et OK) ; si l'on intervertit les droites JK et OJ, on permute les coordonnées X et Z, ce qui donnt YZ - X^2 = 0 ou X^2 - YZ = 0 ; en  déshomogénéisant, on obtient la forme ci-dessus. Et voilà comment la réduction de la parabole se déduit de celle de l'hyperbole ; encore un exemple de la façon dont les coordonnées homogènes et le plan projectif permettent de traiter plus facilement des problèmes de géométrie affine.

Il n'y a pas grand-chose de plus à dire sur la géométrie affine ; c'est une géométrie qui a encore relativement peu de structure, puisqu'on ne peut ni mesurer la distance entre deux points, ni les angles. Pour avoir une géométrie vraiment riche de structure - mais peu homogène - il faut encore doter le plan d'une métrique, et ce sont les coniques qui vont nous permettre d'y arriver. Il y a essentiellement deux types de métrique : euclidienne ou hyperbolique. Cette dernière est celle du plan de Minkowski, dont les "cercles" sont des hyperboles, et c'est aussi celle de la relativité restreinte, avec les transformations de Lorentz comme équivalent des rotations. Nous allons maintenant définir la métrique euclidienne, en posant les bases du plan euclidien à partir du plan affin, complété ou non. Ce sera la dernière étape du périple que nous avons entamé dans l'article "Bereshit, etc.", depuis les fondements du plan projectif jusqu'aux structures métriques du plan euclidien.

Le plan euclidien

Il y a une certaine symétrie entre la construction du plan affin et celle du plan euclidien. Le plan affin est un plan projectif dans lequel une droite particulière, arbitrairement choisie, joue un rôle particulier. Le plan euclidien est un plan affin dans lequel, en plus, une classe particulière de coniques joue un rôle particulier.

Concrètement, pour définir le plan euclidien (réel), on choisit une ellipse de référence, nommons-la c, qui sera le "cercle unité centré à l'origine" ; en effet, nous choisirons dans un premier temps un système de coordonnées ayant pour origine le centre de c, qui est le pôle de la droite de l'infini par rapport à cette ellipse. Les axes sont deux droites conjuguées passant par O, et le point unité I est choisi de telle sorte que ses projections sur les axes appartiennent à c (elles coïncident avec les intersections de c avec ces axes). Le "cercle unité centré à l'origine" a donc pour équation

x^2 + y^2 = 1

par définition, dans ce système de coordonnées. Mais le choix de l'ellipse de référence est complètement arbitraire, c'est le système de coordonnées qui est choisi en fonction de c et non l'inverse.

Il faut maintenant définir la classe des cercles en général ; les cercles sont les ellipses qui peuvent se déduire de c par une affinité qui conserve les directions de droites, c'est-à-dire par une perspectivité d'axe la droite à l'infini, c'est-à-dire une homothétie ou une translation ; plus particulièrement, on définira les cercles comme les ellipses qui peuvent se déduire de c - ou se ramener à c - par la composée d'une homothétie de centre O et d'une translation. C'est donc une classe d'ellipse invariante par le groupe des homothéties (de centre O)-translations.

On démontre sans difficulté la propriété suivante : si deux droites sont conjuguées par rapport à un cercle centré en leur point d'intersection - par exemple c - elles le sont par rapport à tous les cercles de même centre ; et des parallèles à ces deux droites passant par rapport à un point quelconque sont conjuguées par rapport à tous les cercles centrés en ce point. On peut donc définir une nouvelle relation entre droites : l'orthogonalité ou perpendicularité. On dira que deux droites sont orthogonales ou perpendiculaires si elles sont conjuguées par rapport à un cercle ayant pour centre leur point d'intersection, ou encore, si des parallèles à ces droites passant par O sont conjuguées par rapport à c, et aux cercles de centre O.
On démontre qu'une affinité qui conserve la droite à l'infini, ou les directions de droites, c'est-à-dire une homothétie ou une translation, transforme deux droites orthogonales en deux droites orthogonales. Toute transformation qui conserve les directions de droites conserve l'orthogonalité ; on comprend donc intuitivement comment cette nouvelle structure nous permettra de mesurer des angles, c'est-à-dire l'écart relatif entre deux directions de droites.
Notons la distinction entre orthogonalité et perpendicularité : perpendiculaires se dit exclusivement de deux droites, tandis qu'orthogonales peut se dire également de deux directions de droites, de deux faisceaux de droites, ou encore de deux vecteurs.  Deux vecteurs sont orthogonaux, évidemment, si les directions de droites qu'ils définissent le sont.
On démontre aussi que deux droites perpendiculaires à une même troisième sont parallèles entre elles et vice-versa (si deux droites sont parallèles, toute perpendiculaire à l'une l'est aussi à l'autre). Cela résulte immédiatement de la propriété fondamentale des polarités : si un nombre quelconque de points sont alignés, leurs polaires sont concourantes.
On démontre enfin la propriété la plus importante : toute affinité qui conserve un cercle, par exemple c, transforme tous les cercles en cercles, et conserve l'orthogonalité (les deux propriétés sont équivalentes). On appellera de telles transformations : isométries. Les isométries forment un groupe, le groupe orthogonal, qui est le groupe fondamental du plan euclidien, comme le groupe projectif (les projectivités) est le groupe fondamental du plan projectif, et le groupe affin (affinités), celui du plan affin (logique). Chacune de ces géométries peut donc être vue comme l'étude des invariants du groupe correspondant, c'est-à-dire, des propriétés invariantes sous l'action de ce groupe. Cette approche de la géométrie a été formalisée à la fin du XIXe siècle par des mathématiciens comme Hilbert et Klein (auteur du "programme d'Erlängen", qui définit pour la première fois la géométrie projective de la façon dont nous l'avons exposée). Rendons ici hommage à ces génies qui ont mis au point l'approche la plus puissante de la géométrie.

Repères orthogonaux et orthonormés, produit scalaire, distance

Un repère affin dont les axes sont orthogonaux sera nommé "repère orthogonal" ; en géométrie euclidienne, les repères orthogonaux jouent évidemment un rôle particulier. Ils sont caractéristiques de cette géométrie. Si, de surcroît, le point unité - ou ses projections sur les axes, qui définissent l'échelle propre à chaque axe - est choisi de telle sorte que le cercle unité centré à l'origine des coordonnées ait pour équation x^2 + y^2 = 1, autrement dit, qu'il passe par les projections du point unité sur les axes ; autrement dit encore, que les deux points qui représentent les vecteurs de base dans ce système de coordonnées appartiennent au cercle unité, alors le repère est dit orthonormé (ou orthonormal). C'est presque toujours ce type de repères qu'on utilise, tout simplement parce que c'est le plus commode. Une transformation qui transforme un repère orthonormé en un repère orthonormé est une isométrie. L'étude des isométrie revient donc à peu près à celle des changements de repères orthonormés.
Si deux droites a et b ont pour vecteurs directeurs, respectivement, les couples (x, y) et (x', y'), on montre facilement qu'elles sont orthogonales si et seulement si l'on a

xx' + yy' = 0.

Il est commode d'appeler "produit scalaire" de deux vecteurs cette quantité qui est nulle s'ils sont orthogonaux. Remarquons que cette façon de procéder est exactement l'inverse de la présentation moderne la plus courante, dans l'enseignement supérieur, où l'on définit l'orthogonalité à partir du produit scalaire. Notre approche, au contraire, mène à définir l'orthogonalité indépendamment, par une propriété géométrique, et de démontrer ensuite qu'elle correspond à un produit scalaire nul ; c'est une conséquence logique du choix initial de définir axiomatiquement le plan projectif, et de construire le plan euclidien par le choix d'une droite de l'infini et d'une ellipse de référence. On ne perd rien dans cette approche, parce qu'elle permet de voir que la façon moderne de définir l'orthogonalité, en fixant une forme quadratique définie positive dans un plan vectoriel, correspond géométriquement au choix d'une conique particulière comme cercle. En choisissant cette conique comme cercle, on choisit aussi la matrice qui la représente dans un système de coordonnées comme forme quadratique fondamentale, c'est-à-dire comme "produit scalaire". Les deux approches sont essentiellement identiques, sauf que dans la nôtre, la signification géométrique du choix - on fixe une classe de coniques - apparaît explicitement.
La racine carrée du produit scalaire d'un vecteur par lui-même, x^2 + y^2, sera appelée la norme de ce vecteur. C'est une quantité nécessairement positive et qui se conserve par isométrie. C'est aussi le rapport d'homothétie d'une homothétie qui envoie le cercle unité sur le cercle centré à l'origine qui passe par le point représentant ce vecteur ; on appellera cette grandeur "rayon" du cercle en question. Le rayon d'un cercle est donc, à l'origine, un rapport d'homothétie. On définit aussi la distance entre deux points comme la norme du vecteur joignant ces deux points. Elle se conserve évidemment par isométrie.

Nous sommes maintenant prêts à étudier plus finement les isométries ou les changements de repères orthonormés. Commençons par ces derniers, et mettons de côté les translations, qui sont évidemment des isométries et qui n'ont plus rien à nous apprendre. Nous nous intéressons aux changements d'axes orthonormés. Ils sont définis par une matrice 2 sur 2 possédant certaines propriétés que nous devons maintenant définir. Notons d'abord que la matrice d'une forme quadratique - une conique centrée en l'origine, comme le cercle unité - se transforme, dans un changement d'axes de matrice M, en multipliant à droite et à gauche par l'inverse de M et par sa transposée, respectivement. On dit qu'une forme quadratique est deux fois contravariante : elle se transforme deux fois, à droite et à gauche, selon l'inverse de la matrice de changement de base.
Si M représente une isométrie centrée en O, qui applique les vecteurs de base u, v sur deux nouveaux vecteurs u', v', la matrice de changement de base faisant passer de la première à la seconde est l'inverse de M ; la forme quadratique fondamentale se transforme donc selon M. L'étude de la forme des matrices de changement de base orthonormés inverses est donc identique à celles des isométries.
Une telle matrice doit laisser invariants le produit scalaire et la norme de deux vecteurs ; il revient au même de dire qu'elle doit laisser invariante - lorsqu'on multiplie à droite par M et à gauche par sa transposée - la matrice de la forme quadratique fondamentale, c'est-à-dire du cercle unité, qui, dans un repère orthonormé, est représenté tout simplement par la matrice identité. Tout cela pour dire que M représente une isométrie centrée en O si, et seulement si, son produit par sa transposée à gauche donne la matrice identité.
Supposons que les lignes de M soient (a, b) et (c, d). Cette condition se traduit par trois relations entre les nombres a, b, c, d :

a^2 + c^2 = 1
b^2 + d^2 = 1
ab + cd = 0.

On doit également avoir, puisque le déterminant du produit de deux matrices (M et sa transposée) est le produit des déterminants, que le carré du déterminant de M vaut 1. Par conséquent, le déterminant de M vaut 1 ou -1, ce qui donne une quatrième relation entre ces quatre nombres :

ad - bc = 1 ou -1.

Il y a deux types d'isométries, selon que l'on choisit la valeur 1 ou -1. Mais, puisque le déterminant d'un produit de matrices est égal au produit des déterminants, on voit que les isométries dont le déterminant vaut 1 forment un sous-groupe du groupe des isométrie (centrées en O), tandis que celles dont le déterminant vaut -1, non. En effet, le produit de deux matrices de déterminant -1 est une matrice de déterminant 1. Nous appellerons les isométries centrées du premier type, celles qui forment un sous-groupe, les rotations, et les autres, antirotations. Nous allons dorénavant nous concentrer sur l'étude des rotations (de centre O), qui constituent le groupe des rotations (de centre O), sous-groupe des isométries (centrées en O).
Quand on a fixé la valeur du déterminant, les quatre équations ci-dessus permettent d'exprimer toutes les composantes de la matrice en fonction d'une seule, par exemple a ; cela signifie que les isométrie centrées en O dépendent d'un seul paramètre. En particulier, pour une rotation, les quatre équations peuvent se réduire à

d = a, c = -b, a^2 + b^2 = 1.

Si t est une rotation, il existe donc deux fonctions a(t) et b(t), dont la somme des carrés vaut 1, et telles que toutes les composantes de la matrice de t, M(t), s'expriment au moyen de ces deux fonctions. Ce sont les fonctions sinus et cosinus ; nous voyons ici comment les définir rigoureusement, c'est-à-dire, à partir des matrices de rotation, et non à partir du rapport des côtés d'un triangle rectangle à l'hypoténuse pour un angle donné, comme on le fait dans l'enseignement secondaire ; cette définition n'est pas rigoureuse, car pour démontrer que ce rapport est invariant par isométrie, on a besoin de connaître la forme analytique (matricielle) des isométries, qui fait justement intervenir les fonctions sinus et cosinus ! La seule bonne méthode, qui n'est pas triviale, est de faire comme nous faisons ici ; nous avons démontré l'existence de deux fonctions sinus et cosinus, intervenant dans les matrices de rotation, et dont la somme des carrés vaut 1. D'autre propriétés de ces fonctions, que l'on peut déduire de celles des matrices, vont nous permettre de déduire des formules de récurrence pour calculer la valeur de ces fonctions, en fonction de leur valeur pour quelques rotations connues. C'est comme ça que, depuis toujours, se calculent les fonctions sinus et cosinus, à partir de leurs valeurs connues pour quelques angles donnés (0 et pi en fait). Les formules analytiques plus complexes que l'on possède aujourd'hui pour calculer la valeur de ces fonctions à autant de décimales près - formule de Taylor - procèdent de là.
Considérons deux rotations t et t' ; le produit des deux matrices montre que l'on doit avoir

a(t + t') = a(t)a(t') - b(t)b(t')
b(t + t') = a(t')b(t) + a(t)b(t').

Par convention, une rotation qui applique un vecteur sur un vecteur orthogonal au premier sera dite d'angle pi/2 ; pi désigne la valeur de l'angle entre deux vecteurs de même direction, mais d'orientation inverse. Comme l'effet de deux rotations d'angle pi est nul (identité), on voit que les deux fonctions doivent être périodiques de périodes pi, et en outre on doit avoir

a(0) = b(pi/2) = 1
a(pi/2) = b(0) = 0.

Avec ces quatre relations, on peut calculer, par récurrence, la valeur des fonctions a (cosinus) et b (sinus) pour toute fraction de pi, et, par passage à la limite, pour toute valeur réelle de l'"angle", c'est-à-dire de l'écart relatif entre deux directions de droite, identifié modulo pi à la rotation qui envoie une droite sur l'autre. Ceci définit à la fois les rotations, les angles, les mesures d'angles et les fonctions trigonométriques. On voit que toutes ces notions sont intimement liées ; leurs définitions dépendent les unes des autres.
Maintenant, nous avons les fonctions trigonométriques sinus et cosinus, la méthode pour les calculer, et nous pouvons préciser entièrement la forme des matrices d'isométries.

Nous pouvons maintenant spécifier toutes les isométries, et aussi les isogonies, transformations affines qui conservent les angles : les isométries sont engendrées par les translations, les rotations, les antirotations, et les symétries orthogonales, c'est-à-dire les étirements de rapport -1 dans la directions conjuguée de l'axe (orthogonale). Notons qu'une antirotation d'angle t apparaît comme la composée d'une rotation d'angle t et d'une symétrie orthogonale autour de l'axe x, représentée par une matrice diagonale de composantes (1, -1). De plus, une translation ou une symétrie dans une direction donnée, faisant avec la direction x un angle t, s'obtiennent par l'action d'une rotation d'angle t sur la translation de même longueur ou la symétrie dans la direction x, c'est-à-dire en faisant successivement la rotation d'angle -t, puis la translation ou la symétrie selon x, puis la rotation d'angle t. De même, une rotation ou antirotation de centre donné s'obtient par l'action d'une translation appropriée sur une rotation ou antirotation de centre O. Ainsi, le groupe des isométries a pour générateurs : les translations dans une direction fixée, les rotations de centre fixé, et une seule symétrie orthogonale fixée. On obtient toutes les isométries possibles par composition de ces trois-là. Pour les isogonies, c'est presque la même chose, il suffit de rajouter les homothéties de centre O.

Circonférences et surfaces

Notons que tel que nous l'avons défini, pi n'est pas un nombre : c'est la valeur conventionnelle d'un angle plat. Mais le fait que la distance entre deux points corresponde à une mesure du segment de droite compris entre ces deux points donne l'idée qu'on pourrait associer de même une mesure à d'autres types de courbes, en particulier aux coniques. Les cercles par exemple : considérons un cercle de rayon R. Nous voulons associer une mesure à une portion de ce cercle comprise entre deux points, qui déterminent par rapport au centre un angle t. Cette mesure doit évidemment être proportionnelle à l'angle. De plus, il est évident que dans une homothétie, qui correspond à un "changement d'échelle", elle doit se transformer comme le rayon, donc elle doit être proportionnelle au rayon : l = aRt, a étant un coefficient dépendant du système d'unité choisi. Il est invariant par isométrie, donc le même pour tous les cercles. C'est une "constante universelle" dont la valeur dépend du système d'unités. C'est-à-dire, concrètement, de la façon dont on mesure les angles. Décidons alors que les angles sont mesurés de façon que ce coefficient vaille 1, dans ce cas, la mesure d'une circonférence complète vaut exactement 2Rpi. De sorte que pour calculer la valeur de pi dans ce système d'unités, il suffit de mesurer la longueur de la circonférence d'un cercle dont le diamètre (double du rayon) vaut 1. Ce nombre étant connu, nous disposons d'un système d'unités de mesure dans lesquels l'angle plat vaut pi. On dit alors que les angles sont mesurés en radians. On en déduit la mesure d'une "corde" de cercle de rayon R correspondant à un angle t radians : l = Rt. Si les angles sont mesurés en degrés, la valeur d'une circonférence complète étant fixée conventionnellement à 360, la formule devient l = 2Rpi/360.
Pour une ellipse quelconque, on peut montrer qu'il existe toujours un couple d'axes orthonormés, dans lesquels son équation prend la forme x^2/a^2 + y^2/b^2 = 1. Les nombres a et b sont les mesures de ses "demi-axes", intersections de l'ellipse avec les axes de coordonnées. Pour une hyperbole c'est la même chose, en remplaçant le signe + par un - dans l'équation. On peut également attribuer à un arc d'ellipse compris entre deux points une mesure dépendant uniquement des valeurs de a et b et de l'angle formé par les deux points et le centre de la conique. Elle vaut l = rt, où t est l'angle en question mesuré en radians et r la racine carrée de ab. On voit que pour un cercle, ellipse ayant ses deux axes égaux (et valant R, le rayon du cercle), on retrouve l = Rt.


vendredi 23 octobre 2015

Les aventures du paraboloïde elliptique (et de sa structure naturelle de plan euclidien)

Une des merveilles de la géométrie projective réelle est que, dans un espace affin complété de dimension 3, la surface d'un paraboloïde elliptique possède une structure naturelle de plan euclidien. Comme un paraboloïde elliptique n'est essentiellement rien d'autre qu'une quadrique ovale projective sur laquelle on a fixé un point à l'infini, n'est-il pas fascinant de constater que toute la structure du plan euclidien, avec ses parallèles et ses perpendiculaires, ses rotations et antirotations, est en quelque sorte comprise dans celle, beaucoup plus élémentaire, d'une quadrique ovale, et que toute la construction du plan euclidien revient alors simplement à fixer sur cette quadrique un point "à l'infini" ?

Pour bien comprendre cela, quelques explications s'imposent. Un plan euclidien réel est essentiellement  un plan projectif réel (basé sur le corps des réels) dans lequel on a fixé une "droite à l'infini" (ce qui en fait un plan affin réel) et une conique ovale de référence qu'on appelle "cercle unité" (ou "cercle" simplement). Les coniques sont des courbes algébriques du deuxième degré ; elles doivent leur nom au fait qu'on les obtient toutes comme sections d'un cône par un plan. Les cercles, les ellipses, les paraboles, les hyperboles, dans un plan euclidien, sont des coniques. Dans un plan projectif, ces quatre types de coniques se réduisent à un seul, les coniques ovales, ce qui simplifie leur étude. Un couple de droites est aussi une conique, mais dégénérée. Une conique est dégénérée si elle contient des droites. Dans le plan projectif, les coniques non dégénérées sont les ovales.
Voir l'article "Bereshit ou les passionnantes aventures du plan projectif" pour plus de précisions sur ce dernier. En fixant dans le plan projectif une droite "à l'infini", on obtient un plan affin complété : deux droites qui se coupent "à l'infini", c'est-à-dire en un point de la droite à l'infini, sont dites parallèles. Le parallélisme est une structure fondamentale du plan affin. Une conique qui ne rencontre pas la droite à l'infini est appelée une ellipse.
Si dans le plan affin on fixe une ellipse de référence et qu'on l'appelle "cercle", on peut définir une nouvelle structure, l'orthogonalité, et l'on obtient alors un plan euclidien. Les grandes étapes sont les suivantes :

1. Fixer l'ellipse de référence (le "cercle unité de référence").
2. Toute ellipse qui s'obtient à partir de l'ellipse de référence par une affinité qui fixe les points à l'infini, c'est-à-dire un couple homothétie-translation (les homothéties et les translations sont en effet les deux seuls types d'affinités, c'est-à-dire de transformations automorphiques du plan affin, qui fixent tous les points à l'infini) sont appelées des cercles ; les cercles sont donc par définition une classe d'ellipses stable par le groupe des homothéties-translations et qui comprend l'ellipse de référence.
3. Maintenant qu'on a défini les cercles, on peut définir l'orthogonalité : deux droites sécantes sont orthogonales si elles sont conjuguées par rapport à un cercle ayant pour centre leur point d'intersection, c'est-à-dire si le pôle de l'une par rapport à un tel cercle est compris dans l'autre et vice-versa (pour la notion de pôle, voir l'article "Bereshit").
4. On peut enfin définir une rotation ou une antirotation : c'est une affinité qui fixe un point et conserve l'orthogonalité, ou encore, conserve les cercles centrés en ce point. Les rotations et antirotations de centre fixé forment un groupe, avec les rotations comme sous-groupe propre : le produit de deux rotations ou antirotations est toujours une rotation, le produit d'une rotation et d'une antirotation est toujours une antirotation. Une antirotation peut se voir comme la composée d'une rotation et d'une symétrie orthogonale par rapport à un axe passant par le centre de rotation. Finalement, on démontre facilement que l'image d'un cercle par une rotation ou antirotation est toujours un cercle.

On a défini ainsi toutes les caractéristiques de la structure euclidienne (en dimension deux). On voit ainsi qu'un plan euclidien est essentiellement un plan projectif dans lequel on a fixé une droite et une conique extérieure à cette droite (qui ne la rencontre en aucun point). En étudiant les transformations du plan affin qui conservent la conique fixée, on décrit les deux structures caractéristiques du plan euclidien : l'orthogonalité entre droites et la distinction entre cercles et ellipses ordinaires. On peut ensuite peaufiner et définir des mesures d'angles et de distances, basées sur les cercles. Tout ceci en langage géométrique ; cela se traduit aisément aussi en langage algébrique : fixer une conique est la même chose, algébriquement, que fixer une forme quadratique définie positive, le "produit scalaire".

Pour ceux à qui toutes ces notions ne sont pas familières, rassurez-vous, ce n'est pas aussi compliqué que ça en a l'air : dans un plan euclidien, il y a des droites parallèles - qui se coupent à l'infini - et des droites perpendiculaires ou orthogonales. La notion  de droites orthogonales est la structure fondamentale du plan euclidien (en plus de la structure d'incidence qui dérive du plan projectif qui le sous-tend). Les droites perpendiculaires ont plein de propriétés intéressantes, elles permettent de définir des distances grâce au "théorème de Pythagore", mais elles sont juste un cas particulier de droites conjuguées par rapport à une conique. Dans un plan projectif (ou affin d'ailleurs), la conjugaison est une relation définie entre deux droites par rapport à une conique. Elle signifie que le pôle d'une de ces droites, par rapport à une conique ayant pour centre leur point d'intersection, est situé sur l'autre et vice-versa. Toute conique associe en effet à une droite un point qui est son "pôle" par rapport à cette conique, et pour comprendre bien cette notion, reportez-vous à l'article "Bereshit" où tout cela est expliqué en long et en large. Donc, quand on fixe une conique sans point à l'infini, c'est-à-dire une ellipse, dans le plan affin, les droites conjuguées par rapport à cette conique, ou à une autre qui s'obtient à partir de celle-là par une homothétie-translation, sont appelées "orthogonales" ou "perpendiculaires", et on a alors un plan euclidien, avec des triangles rectangles qui vérifient le théorème de Pythagore, et des distances mesurables. Voilà toute l'affaire. On ne comprend bien l'orthogonalité que si l'on comprend d'abord les pôles et polaires et les droites conjuguées par rapport à une conique.

 Maintenant, nous n'avons pas encore parlé sur ce site de l'espace projectif tridimensionnel ; bon, disons que c'est un espace tridimensionnel, avec des points, des droites et des plans, régi par des axiomes similaires à ceux du plan projectif : par deux points passe une et une seule droite, par trois points passe un et un seul plan, deux plans ont toujours une droite en commun et chaque plan est un plan projectif. Nous verrons cela plus en détail dans un autre article s'il plaît à Dieu. Et un espace affin tridimensionnel complété est un espace projectif dans lequel on a fixé un "plan à l'infini", ce qui permet de voir inversement l'espace projectif comme un espace affin complété par les "points à l'infini" des faisceaux de droites parallèles et homogénéisé. 
Une quadrique est une surface du deuxième degré, c'est-à-dire dont l'intersection avec un plan est toujours une conique, en gros. Dans un espace affin, les différents types de quadriques sont :  les ellipsoïdes, les paraboloïdes elliptiques, les paraboloïdes hyperboliques, les hyperboloïdes à une nappe et les hyperboloïdes à deux nappes. Dans un espace projectif, ces cinq types de résument à deux  : les quadriques ovales (qui ne contiennent pas de droites) et les quadriques réglées (qui en contiennent). Ce sont les quadriques non dégénérées, c'est-à-dire qui n'ont pas de points doubles ; un point double est un point comme le sommet d'un cône, où la surface se "recoupe" elle-même. Les cônes ont un point double, c'est un exemple de quadrique dégénérées. Deux plans sécants ont une droite de points doubles, leur intersection ; c'est un exemple de quadrique encore plus dégénérée !
Concentrons-nous sur les quadriques non dégénérées, et surtout sur les ovales.
Dans un espace affin, il y a trois types d'ovales, selon la façon dont elles rencontrent le plan à l'infini.

Si elle ne le rencontre pas : c'est un ellipsoïde.
Si elle le rencontre en un point : c'est un paraboloïde elliptique.
Si elle le rencontre selon une conique ovale : c'est un hyperboloïde à deux nappes.

Voici à quoi ressemble une quadrique ovale dans un espace projectif, ou un ellipsoïde dans un espace affin :


Imaginez maintenant que le pôle supérieur de cette surface - ou n'importe quel point, mais c'est plus facile à imaginer avec celui-là - soit rejeté à l'infini, vous obtenez ceci :


C'est-à-dire un superbe paraboloïde elliptique ; dans l'espace projectif, ces deux surfaces sont donc strictement équivalentes : elles se distinguent seulement dans l'espace affin, par le fait que la seconde possède un point à l'infini, elle est tangente au plan à l'infini, tandis que la première n'a aucun point à l'infini.
Mais ce qui est vraiment magique, c'est que la seconde de ces surfaces porte une structure naturelle de plan euclidien ; elle est un plan euclidien, comme nous allons le montrer. Les droites de ce plan sont les paraboles comprises à la surface du paraboloïde, les cercles sont ses ellipses. En effet, tout plan qui passe par le point à l'infini du paraboloïde, hormis le plan à l'infini lui-même qui lui est tangent, coupe le paraboloïde selon une parabole (c'est-à-dire une conique ovale avec un point à l'infini). Toute autre plan qui coupe le paraboloïde le rencontre suivant une ellipse. Ellipses et paraboles sont donc les deux seuls types de coniques présentes à la surface du paraboloïde elliptique. Et nous allons montrer qu'elles vérifient toutes les propriétés caractéristiques des cercles (pour les ellipses) et des droites (pour les paraboles) d'un plan euclidien.
Notons dès à présent, pour éviter toute confusion, que ce plan euclidien comprend évidemment, à part les cercles, des ellipses ordinaires, qui sont des courbes du paraboloïde ; mais ces courbes, qui sont des ellipses dans le plan euclidien ayant pour "droites" les paraboles, ne sont pas des ellipses dans l'espace affin ou projectif d'origine : ce sont des courbes gauches, qui ne sont pas des sections du paraboloïde par un plan. 
Il faudra donc bien distinguer entre : les "ellipses du paraboloïde", qui sont les cercles du plan euclidien défini sur sa surface ; 
et les ellipses du plan euclidien formé par les points du paraboloïde et ses paraboles (comme droites), qui, elles, sont des courbes gauches de l'espace tridimensionnel.
Plus précisément, nous montrerons que ce sont les intersections du paraboloïde avec tous les cônes ayant pour sommet son point à l'infini.

Ceci étant clarifié, voici comment on procède pour montrer que la surface d'un paraboloïde elliptique possède une structure de plan euclidien, avec comme droites les paraboles et comme cercles les ellipses (du paraboloïde) :

1. La surface du paraboloïde elliptique (moins un point) a une structure de plan affin, dont les droites sont les paraboles du paraboloïde. En effet, un paraboloïde elliptique dans l'espace affin complété réel 3D est une quadrique ovale tangent au plan de l'infini en un point O. Tout plan passant par O coupe le paraboloïde selon une conique tangente en O à la droite de l'infini de ce plan, c'est-à-dire une parabole. D'autre part, dans l'espace 3D, l'ensemble des droites par O a une structure de plan affin complété dont les points sont les droites par O et les droites les plans par O (avec le plan à l'infini comme droite à l'infini). On peut vérifier facilement que les points et droites ainsi définis vérifient les axiomes d'un plan projectif réel (voir l'article "Bereshit"), avec une droite fixée jouant le rôle de droite à l'infini, donc on a un plan affin complété réel. Or chaque droite par O, dans l'espace 3D, rencontre le paraboloïde en un et un seul point en plus de O (sauf les droites à l'infini), et chaque plan par O (sauf le plan à l'infini) rencontre le paraboloïde en une et une seule parabole ; si deux plans a et b par O ont leur droite intersection comprise dans le plan à l'infini, les deux paraboles correspondantes sont non sécantes (tangentes en O), sinon elles sont sécantes ; à trois plans (par O) passant par une même droite correspondent trois paraboles se coupant en un même point. Donc : il y a une correspondance biunivoque entre les points du plan affin et les points du paraboloïde, et entre les droites du plan affin et les paraboles du paraboloïde, telle qu'à trois droites concourantes ou parallèles (qui se coupent à l'infini) correspondent trois paraboles "concourantes" ou non sécantes, et de même à trois points alignés (qui sont trois droites coplanaires par O dans l'espace 3D) correspondent trois points appartenant à une même parabole ; ainsi, les points et les paraboles du paraboloïde vérifient les axiomes d'incidence d'un plan affin, avec les paraboles non sécantes comme droites parallèles. On peut aussi considérer le plan affin complété formé par le paraboloïde plus son plan tangent en O (le plan à l'infini de l'espace affin) : les points de ce plan sont les points du paraboloïde, moins O, plus les droites tangentes au paraboloïde en O. Ses droites sont les paraboles, complétées par leur tangente en O, plus le plan à l'infini (ou plutôt, le faisceau des droites à l'infini passant par O) J'espère que c'est assez clair jusque là.

Pour rendre cela plus limpide, voici un petit tableau reprenant les divers objets que nous venons d'énumérer, et indiquant leur nature dans les deux espaces différents où nous pouvons les considérer, l'espace affin 3D et le plan affin complété formé par la surface du paraboloïde plus le plan à l'infini.

Espace affin 3D
Plan affin complété associé au paraboloïde elliptique
Un point du paraboloïde
Un point
Une droite à l'infini passant par O ou une tangente au paraboloïde en O
Un point
Une parabole du paraboloïde avec sa tangente en O
Une droite
L'ensemble des droites à l'infini passant par O ou des tangentes au paraboloïde en O
Une droite (la droite à l'infini)
Une ellipse du paraboloïde
Un cercle

Il ne serait pas beaucoup plus difficile de montrer que les théorèmes de Desargues et de Pappus sont vérifiés, ne serait-ce que parce qu'à partir des droites coplanaires par O on peut définir univoquement le birapport (réel) de quatre points alignés du paraboloïde.
En résumé, ceci n'est pas une vraie démonstration mais on peut voir assez facilement que les points du paraboloïde moins O, avec les paraboles comme droites, forment un plan affin arguésien réel.

N.B. Pour rendre les choses aussi claires que possible, rappelons que dans le développement qui suit, nous allons travailler en alternance dans trois espaces différents quoique intimement reliés ; il y a :

- l'espace affin complété 3D, avec son plan à l'infini ; c'est un espace projectif 3D dans lequel on a fixé un plan, appelé "plan à l'infini" et qui joue désormais un rôle particulier ;
- le plan affin formé par les droites de l'espace affin 3D passant par le point (à l'infini) O ; les points de ce plan sont les droites de l'espace passant par O, ses droites sont les plans de l'espace passant par O, et sa droite à l'infini est le plan à l'infini de l'espace 3D ;
- le plan affin formé par la surface d'un paraboloïde elliptique passant par O, c'est-à-dire une quadrique ovale de l'espace projectif 3D, tangente en O au "plan à l'infini".

Nous serons amenés à considérer un même objet (point, droite, application...) successivement dans les trois espaces, il faudra donc suivre. Nous tâcheron de préciser le plus clairement possible dans quel espace nous nous situons à chaque instant, mais pour bien comprendre ces raisonnements typiquement projectifs, il est nécessaire de pouvoir "jongler" facilement avec ces espaces ; c'est une petite gymnastique mentale à laquelle on s'habitue très vite quand on fait de la géométrie projective. (Tout ceci reste essentiellement de la géométrie projective même s'il est question d'espaces affins et euclidiens ; ici un espace affin complété est envisagé comme un espace projectif dont un sous-espace maximal propre, droite ou plan, a été désigné comme sous-espace "à l'infini" afin de pouvoir définir une notion de parallélisme ; c'est le point de vue projectif.)
 
2. Concentrons-nous maintenant sur le plan affin formé par les points du paraboloïde ; nous n'avons pas besoin de considérer les points à l'infini qui sont les tangentes en O : ils servent uniquement à définir les parallèles, mais dans la structure euclidienne seuls importent les points "usuels", c'est-à-dire les points du paraboloïde. Ce plan est "naturellement" euclidien, en ce sens que les ellipses du paraboloïde - ses sections par des plans ne passant pas par O - constituent les cercles d'un plan euclidien.
On définit (géométriquement) un plan euclidien réel à partir d'un plan affin réel en fixant une ellipse e. Si C est le centre de cette ellipse, une rotation est une transformation affine du plan, fixant le point C, qui conserve globalement e (il y a aussi les antirotations, négligeons-les pour le moment). Un cercle est soit e, soit une ellipse image de e par la composée d'une homothétie de centre C et d'une translation (seules transformations affines qui fixent point par point la droite à l'infini). On montre qu'une rotation transforme un cercle en un cercle (du fait que sa restriction à la droite de l'infini commute avec les homothéties-translations, puisque celles-ci sont l'identité sur la droite à l'infini).
Il s'agit donc de montrer que les ellipses du paraboloïde sont toutes images les unes des autres par une homothétie-translation, autrement dit le groupe des homothéties-translations (sur la surface du paraboloïde) est transitif sur les ellipses (du paraboloïde) et qu'une rotation, définie à partir d'une ellipse fixée - c'est-à-dire une transformation affine de la surface du paraboloïde considérée comme plan affin, qui conserve une ellipse - change les ellipses en ellipses. De sorte que la surface du paraboloïde (moins O) est un plan euclidien, avec les ellipses du paraboloïde comme cercles.

3. Si vous avez suivi jusqu'ici, voici les grandes étapes de ma démonstration.
a) D'abord, étant donnée une ellipse du paraboloïde, où est son centre, dans son plan et sur le paraboloïde ? Le plan de cette ellipse coupe le plan à l'infini en une droite d ; le pôle de d par rapport à l'ellipse est son centre dans son plan, appelons-le C. Un autre plan passant par d coupe le paraboloïde selon une autre ellipse, dont le centre dans son plan est l'intersection de ce plan avec la droite OC. Autrement dit, toutes les ellipses appartenant à des plans passant par d ont leurs centres alignés sur une même droite passant par O. Très important : le centre de toutes ces ellipses sur le paraboloïde est l'intersection de celui-ci avec la droite OC (démonstration facile). Ne confondons pas leur centre sur le paraboloïde, en tant qu'ellipses du plan affin formé par celui-ci, et leurs centres dans leurs plans respectifs.
On sait donc maintenant comment définir le centre d'une ellipse sur le paraboloïde.
b) Montrons donc d'abord que deux ellipses concentriques (de même centre C) sur le paraboloïde sont transformées l'une dans l'autre par une homothétie de centre C. D'abord définissons une telle transformation. Dans le plan affin complété formé des droites par O (dans l'espace 3D), une homothétie c'est : une transformation affine, c'est-à-dire une bijection de l'ensemble des droites par O dans lui-même qui conserve la coplanarité, qui, de plus, fixe chaque droite à l'infini passant par O, et fixe globalement les plans passant par une droite a donnée passant par O, non à l'infini. Cette droite (de l'espace), qui est un point du plan affin complété, est le centre de l'homothétie. Dans un plan affin en effet, une homothétie n'est rien d'autre qu'une transformation affine qui fixe tout point à l'infini et les droites par un point non à l'infini donné. Là nous avons donc défini une homothétie dans le plan affin des droites par O ; on en déduit une homothétie dans le plan affin formé par la surface du paraboloïde : étant donné un point P du paraboloïde, on lui associe le point P', intersection de celui-ci avec la droite OP' qui est l'image de la droite OP par l'homothétie de "centre" la droite a ; le centre A de cette homothétie, sur le paraboloïde, est son intersection avec a ; on peut vérifier que cette transformation conserve l'incidence, et fixe globalement les paraboles passant par A, donc c'est bien une homothétie dans le plan affin formé par les points du paraboloïde. Reste à montrer qu'elle transforme un "cercle" de centre A en la même chose, c'est-à-dire une ellipse du paraboloïde en une ellipse de même centre A.
Deux telles ellipses sont les sections du paraboloïde par deux plans parallèles, c'est-à-dire qui se coupent sur le plan à l'infini, dont les centres dans leurs plans appartiennent à la droite OA. Par conséquent, elles sont l'image l'une de l'autre par une homothétie de l'espace affin 3D dont le centre appartient à OA. Or une telle transformation est évidemment bijective sur les droites, préserve la coplanarité (de trois droites), fixe le plan à l'infini point par point et fixe globalement chaque plan contenant OA ; donc c'est aussi une homothétie du plan affin des droites par O, de centre OA, et sa trace sur le paraboloïde est de même une homothétie du plan affin des points de ce dernier.

c) Reste à démontrer que, étant données deux ellipses quelconques du paraboloïde – non forcément concentriques – on peut amener leurs centres à coïncider au moyen d'une translation.
Dans le plan affin des droites par O, une translation est une transformation affine, donc qui fixe les droites à l'infini passant par O, et fixe globalement les plans passant par l'une d'elles (par une droite à l'infini par O donnée, qui est la direction de la translation). La trace d'une telle transformation sur le paraboloïde est une translation dans le plan affin de ses points.
Or, une translation t de centre un point à l'infini M, dans l'espace affin 3D, transforme une droite par O en une droite par O, trois droites coplanaires en trois droites coplanaires, et en outre elle conserve globalement tous les plans passant par M, donc en particulier ceux passant par la droite OM ; la restriction de t à l'ensemble des droites et plans par O est donc une translation du plan affin des droites par O. Si a et b sont des droites par O, il existe toujours une telle translation qui envoie a sur b. Sa trace sur le paraboloïde est une translation du plan affin de ses points qui envoie un point A donné sur un point B donné ; comme t est une translation de l'espace affin, elle transforme un plan en un plan ; sa trace sur le paraboloïde transforme donc une ellipse en une ellipse, et une ellipse de centre A en une ellipse de centre B. On sait déjà que ces deux ellipses sont homothétiques en tant que coniques du plan affin des points du paraboloïde. Il est donc possible de faire coïncider deux ellipses quelconques du paraboloïde par une translation suivie d'une homothétie.
4. Pour finir, étudions l'effet des rotations ; étant donnée une ellipse c du paraboloïde, de centre A, appelons rotation une transformation affine qui fixe A et qui conserve cette ellipse (on néglige ici la distinction entre rotations et antirotations). Montrons qu'une rotation r ainsi définie transforme une ellipse en une ellipse. Supposons que r transforme un point B de c en un point B' de c. Dans l'espace affin complété 3D, il existe une perspectivité axiale d'axe OA – c'est-à-dire une transformation affine qui fixe OA et fixe globalement les plans passant par une droite à l'infini donnée – qui fixe globalement toute ellipse centrée en A sur le paraboloïde et qui envoie B sur B' par exemple ; sa trace sur le paraboloïde est une affinité centrée en A et qui envoie B sur B', et comme cette affinité est unique, elle coïncide avec r. Mais comme elle est la trace d'une affinité de l'espace 3D, elle transforme toute ellipse du paraboloïde en une autre. Par conséquent, dans le plan affin formé par les points du paraboloïde avec les paraboles pour droites, les coniques qui sont des ellipses du paraboloïde forment un ensemble globalement invariant par homothétie, translation et rotation.
Tout ceci montre que la surface du paraboloïde possède une structure de plan euclidien, avec pour droites les paraboles et pour cercles les ellipses du paraboloïde (c'est-à-dire ses sections par des plans de l'espace). Cette structure est « naturelle » en ce sens que les paraboles et les ellipses du paraboloïde se distinguent « naturellement » des autres courbes que l'ont peut tracer sur sa surface parce que ce sont les seules qui sont des sections par des plans de l'espace ; et ces courbes sont respectivement les droites et les cercles d'un plan euclidien.
On peut évidemment aussi définir une structure de plan euclidien sur les points du paraboloïde en choisissant comme « cercle » une conique quelconque du plan affin formé par ces points, qui n'est pas forcément une section plane. Mais si l'on choisit une section plane, toutes les sections planes qui ne sont pas des paraboles deviennent des cercles ; l'ensemble des cercles ne dépend pas du choix d'une section plane particulière.

Notons qu'un plan euclidien réel peut être complété par un unique point à l'infini commun à toutes ses droites ; les cercles et les droites ne se distinguent plus dès lors que par le fait que les "droites" passent par O ; les "droites" sont en fait des cercles passant par O. Cette opération est appelée "complétion conforme", car le plan euclidien réel complété par un seul point à l'infini est appelé "plan conforme réel" : c'est un plan dans lequel la distinction entre cercles et droites est abolie. On le rencontre en cartographie : c'est le plan de la projection stéréographique. Dans ce plan, les transformations linéaires involutives correspondent à des inversions euclidiennes, transformations qui échangent les droites et les cercles passant par un point donné (le pôle d'inversion), raison pour laquelle on  l'appelle aussi plan inversif ; le plan conforme est donc la structure géométrique invariante par inversion euclidienne, tout comme le plan projectif est la structure invariante par projectivité (homographie). Or le plan conforme réel est isomorphe à une droite projective complexe ; c'est en fait une droite projective complexe. Le point à l'infini (réel) du plan conforme réel n'est autre que le point à l'infini (complexe) de la droite projective complexe. L'étude du paraboloïde elliptique telle que nous venons de la faire permet de mieux comprendre cette opération : si le plan euclidien en question est la surface du paraboloïde, son point de complétion conforme O est justement le point de contact du paraboloïde avec le plan à l'infini. Et l'on comprend dès lors pourquoi le fait de rajouter ce point rend les droites identiques à des cercles : c'est qu'en effet, les droites ne sont autres que les coniques planes du paraboloïde passant par O, tandis que les cercles sont ses coniques planes ne passant pas par O. La différence ne tient qu'à un point.

Toute cette construction, en fait, n'est pas absolument propre au paraboloïde elliptique ; un hyperboloïde à deux nappes possède également une structure de plan euclidien.

Hyperboloïde à deux nappes

Un hyperboloïde à deux nappes est une quadrique ovale coupée par le plan à l'infini selon une conique ovale c, sa conique à l'infini. Chacune des deux nappes possède une structure de plan affin avec comme droites les branches d'hyperboles intersections de l'hyperboloïde avec les plans de l'espace affin passant par un point à l'infini O donné, intérieur à la conique à l'infini. Sa droite à l'infini est bien sûr... la conique à l'infini ; il faut toutefois identifier les points de c appartenant à une même droite par O, c'est-à-dire que chaque couple (P, P') où P et P' sont deux points de c alignés avec O, sera compté comme un seul point (on peut aussi considérer l'ensemble de la surface comme un seul plan affin, en identifiant les points opposés par le point O). Il possède de plus une structure de plan euclidien avec les mêmes droites, et pour cercles, évidemment, ses ellipses appartenant à des plans ne passant pas par O. Par un raisonnement identique à celui exposé ci-dessus, on peut montrer que la classe de ces ellipses est invariante par le groupe des homothéties-translations, donc elles jouent le rôle des cercles d'un plan euclidien.
Maintenant, imaginons que nous faisons "glisser" progressivement le plan à l'infini (ou l'hyperboloïde, en  maintenant fixe le plan à l'infini, cela revient au même). Il y aura un moment où l'hyperboloïde sera tangent au plan à l'infini, de sorte qu'il deviendra un paraboloïde elliptique. Pendant ce mouvement, sa structure de plan euclidien n'a pas beaucoup changé ; les constructions que nous avons faites ci-dessus restent valables pour n'importe quelle position du plan à l'infini. L'hyperboloïde est toujours un plan euclidien - plus exactement un double plan euclidien, puisque chacune des deux nappes possède une structure identique - ; sauf qu'à un moment, l'hyperboloïde devient un paraboloïde, avec toujours la même structure de plan euclidien, mais un seul point à l'infini au lien d'une droite à l'infini (sauf si l'on considère le paraboloïde avec son plan tangent). Au cours de ce mouvement, nous voyons donc la droite à l'infini du plan euclidien complété se "contracter" en un point à l'infini, et c'est cette contraction qui le rend identique à une droite projective complexe.
Si l'on réfléchit bien, c'est le même processus de contraction qu'exprime le fait de remplacer les trois coordonnées homogènes réelles (X, Y, Z) par deux coordonnées homogènes complexes (X, Y), qui "transforme" un plan euclidien complété en une droite projective complexe ; car ce qu'on fait alors, concrètement, c'est qu'on décide que tous les points (à l'infini) de la forme (X, Y, 0) constituent un seul point, un point de coordonnées complexes (X + iY, 0). Mais cela veut juste dire que, dans l'espace vectoriel réel (dont les droites sont les points d'un plan projectif - cet espace vectoriel n'est lui-même rien d'autre que l'espace projectif 3D moins un "plan à l'infini" et fixé en un point), les droites du plan XY passant par l'origine, chacune définie par un vecteur directeur (X, Y), sont identifiées modulo une rotation arbitraire, car la multiplication ou la division par un complexe de module 1 quelconque représente une rotation autour de l'origine. On déclare en quelque sorte qu'une rotation dans le plan XY ne change pas la nature d'un "point à l'infini", c'est-à-dire d'une droite vectorielle de ce plan ; cela équivaut à contracter ces droites sur l'origine de ce plan, et le passage de l'hyperboloïde au paraboloïde est juste une autre manière de visualiser cette contraction, c'est-à-dire, soulignons-le encore une fois, le fait que les points à l'infini deviennent invariants par une rotation arbitraire (se réduisant ainsi à un seul point).


lundi 28 septembre 2015

Variations sur la notion d'incidence

Dans l'article Bereshit, ou les passionnantes aventures du plan projectif arguésien, nous avons formulé les axiomes du plan projectif à la manière "classique" : le  plan projectif est un ensemble d'éléments appelés "points", muni d'une famille de sous-ensembles appelés "droites", vérifiant les axiomes :

1. Toute droite comporte au moins trois points
2. Il existe trois points non compris dans une même droite
3. Si A et B sont deux points distincts, il existe une et une seule droite contenant A et B
4. Si a et b sont deux droites distinctes, il existe un et un seul point compris dans a et b

Les axiomes 1 et 2 sont des axiomes d'existence, les axiomes 3, 4 sont les axiomes d'incidence, ils définissent la structure d'incidence. Mais ce n'est pas la manière la plus profonde de les formuler ; ils cachent en effet le fait que l'on peut modifier la structure d'incidence sans modifier fondamentalement la structure du plan projectif. C'est-à-dire que, lorsque l'on introduit le théorème de Desargues et ce qui en résulte, les coordonnées homogènes, la relation d'incidence entre un point P et une droite d - qui veut dire que P "appartient" à d - est représentée par l'équation

(d).(P) = 0

où d est une matrice-ligne représentant les coordonnées de la droite d, (P) une matrice-colonne représentant les coordonnées du point P. Mais cette équation devrait en réalité s'écrire

(d)I(P) = 0

où I est la matrice identité 3 fois 3, qui représente les relations d'incidence lorsque le plan dual - formé des droites - est rapporté à un système de coordonnées couplé à celui du plan direct (ponctuel) - formé par les points - , c'est-à-dire lorsque les droites de base, dans le plan dual, sont les droites reliant les points de base O, I, J, K dans le plan direct. Nous avons implicitement supposé qu'il en allait toujours ainsi. Mais en fait, rien n'interdit de découpler les deux systèmes de coordonnées, c'est-à-dire de rapporter le plan dual à un système de droites de base o, i, j, k qui n'ont aucun lien avec les points de base O, I, J, K du plan direct. Dans ce cas, l'effet sur les relations d'incidence est qu'elles seront représentées par une matrice régulière quelconque qui n'est plus forcément la matrice identité :

(d)I'(P) = 0.

Pour tenir compte d'emblée de cette possibilité, on pourrait formuler les axiomes du plan projectif en postulant l'existence de deux familles d'objets, les points et les droites, reliés par une relation I que l'on notera I(d, P) : le point P est incident à la droite d ou vice-versa, et vérifiant les axiomes suivants :

1. Toute droite est incidente à au moins trois points
2. Il existe trois points non incidents à une même droite
3. Si A, B sont deux points distincts, il existe une et une seule droite d tels que l'on ait I(d, A) et I(d, B)
4. Si a, b sont deux droites distinctes, il existe un et une seul point P tel que I(a, P) et I(b, P)

Ensuite on introduit le théorème de Desargues, les coordonnées, et alors la relation I est représentée par une matrice d'incidence, qui sera la matrice identité si les coordonnées dans le plan dual sont couplées à celles du plan ponctuel, ce qui sera généralement le cas. Mais remarquons aussi que si f est une projectivité, la relation I' définie par

I'(d, P) ssi I(d, fP)

est une relation entre points et droites vérifiant les mêmes propriétés que I ; donc, en appliquant une projectivité aux points, on peut toujours remplacer la relation d'incidence initiale par une autre dans laquelle la matrice d'incidence sera la matrice identité, donc dans laquelle les deux systèmes de coordonnées, dual et direct, seront couplés. L'effet d'une projectivité est donc le même que celui d'une modification de la relation d'incidence. Ce que montre tout ceci, c'est que la relation "un point appartient à une droite" est très relative, le couplage points-droites est une question de point de vue.

Ensuite, quand on fait l'étude des coniques et des polarités, on s'aperçoit que les relations d'incidence elles-mêmes cachent une polarité. Les polarités sont donc inscrites dans la structure fondamentale du plan projectif arguésien, et l'on peut reformuler les axiomes d'une manière qui le fasse ressortir. Remarquons en effet tout d'abord que l'on peut très bien formuler ces axiomes sans du tout faire référence aux "droites" : on postulera qu'il existe entre les points une relation R à trois arguments qui s'écrit R(A, B, C) et se lit "les points A, B, C sont alignés", vérifiant les axiomes suivants :

1. Il existe trois points A, B, C ne vérifiant pas R(A, B, C)
2. Soient deux points A, B distincts, il existe au moins un point C tel que R(A, B, C)
3. R(A, B, C) entraîne R(C, A, B) et R(A, C, B)
4. Si A, B, C, D sont quatre points distincts, R(A, B, C) et R(A, B, D) entraînent R(A, C, D)
5. Si A, B, C, D sont quatre points distincts trois à trois non alignés, il existe un et un seul point E tel que R(A, B, E) et R(C, D, E)

Il y a plus d'axiomes, mais maintenant ils n'impliquent que des points et une relation entre points ; on peut alors définir les droites comme l'ensemble des points P vérifiant R(A, B, P) pour A, B fixés, et démontrer comme des théorèmes les relations d'incidence points-droites et tout ce qui en résulte. Mais cette façon de procéder ne fait pas encore ressortir la relativité de la notion d'incidence et la polarité cachée. Pour cela, nous allons encore introduire une modification. On définit maintenant une relation à deux arguments entre points, notée I(A, B) qui se lit "les points A et B sont conjugués", et vérifie les axiomes suivants :

[N.B. Il est probable que cette formulation implique le théorème de Desargues ; ce ne serait donc pas exactement un équivalent des axiomes d'incidence mais une axiomatique du plan projectif arguésien, mais je n'en suis pas sûr. Il faut vérifier mais je n'ai pas le temps maintenant.]

1. I(A, B) entraîne I(B, A)
2. Si A, B sont deux points distincts, il existe un seul point C tel que l'on ait à la fois I(A, C) et I(B, C)
3. Si A est un point, il existe au moins trois points B, C, D vérifiant I(A, B), I(A, C) et I(A, D)
4. Il existe au moins trois points B, C, D ne vérifiant simultanément ces relations pour aucun point A

Cela peut paraître étrange, mais oui, vous pouvez vérifier que ces relations impliquent bien les axiomes classiques, si l'on définit une droite comme l'ensemble des points conjugués à un même point A ; les axiomes 1 et 2 impliquent alors que par deux points passe une et une seule droite et que deux droites se rencontrent en un et un seul point. 
Démontrons cette dernière proposition : soient deux droites a et b, constituées respectivement des points conjugués à un point A et des points conjugués à un point B ; par 2, il existe un et un seul point C conjugué simultanément à A et B, donc appartenant à la fois aux droites a et b. On retrouve bien les axiomes classiques.
Mais de plus, nous voyons bien que la relation I ainsi définie est identique à la relation de conjugaison de deux points dans une polarité ; elle définit en fait une polarité fondamentale. L'ensemble des points conjugués à un même point A est la polaire de A, A est son pôle, on a donc défini à la fois les droites, l'incidence et les polarités, preuve que celles-ci sont incluses dans la structure fondamentale du plan projectif ! 
Comme précédemment, on introduit alors le théorème de Desargues, les coordonnées, à ce moment la relation d'incidence

(d)I(P) = 0

se lit comme "P est incident à d, polaire de D" ou "P est conjugué à D, pôle de d" dans la polarité fondamentale I, représentée par la matrice identité quand les systèmes de coordonnées sont couplés.
Une polarité quelconque I' sera définie comme une relation entre points vérifiant les axiomes 1 et 2 avec en plus la condition 

2'. trois points B, C, D sont conjugués à un même point A' sous I' ssi ils sont conjugués à un même point A sous I ; 

c'est donc un "isomorphisme de relations de conjugaison". Un tel isomorphisme définit à la fois une projectivité, qui associe au point A le point A' tel que I(A, B) et I(A, C) entraîne I'(A', B) et I'(A', C ) - la condition 2' implique l'unicité de A' et la conservation des droites - et une polarité, qui associe au point A l'ensemble des points P tels que l'on ait I'(A, P), et la condition 2' entraîne alors qu'une polarité quelconque associe à trois points alignés trois droites concourantes. Avec cette formulation, il apparaît clairement que les relations d'incidence équivalent juste à définir une polarité fondamentale, et l'on comprend pourquoi une matrice 3 fois 3 régulières définit à la fois une projectivité et une polarité ; en fait, on peut dire qu'une projectivité équivaut indifféremment à un changement de relation d'incidence ou de polarité fondamentale, ou encore à découpler les coordonnées duales et directes (tangentielles et ponctuelles). 
Avec cette formulation des axiomes du plan projectif, l'isomorphisme "canonique" entre le plan ponctuel et le plan tangentiel apparaît comme ce qu'il est, une polarité particulière à laquelle on assigne un rôle particulier, avec la possibilité d'en changer sans modifier fondamentalement la structure. Les coordonnées tangentielles d'une droite sont juste les coordonnées ponctuelles de son pôle dans la polarité fondamentale I. 
N.B. Naturellement, dans cette perspective, quand on étudie l'effet d'un changement de base projective, il faut considérer qu'un changement de base dans le plan ponctuel n'implique pas forcément le changement dual dans le plan tangentiel, puisque les deux systèmes de coordonnées ne sont plus forcément couplés, et les relations d'incidence ne sont plus forcément représentées par la matrice identité.