samedi 7 novembre 2015

Les aventures du plan affin et euclidien

[Cet article n'est pas terminé, mais comme j'en ai déjà écrit une grande partie, je le publie déjà ; vous pouvez vous amuser à le lire tel quel, en sachant qu'il est appelé à évoluer.]   

Il est temps maintenant de vous initier à la construction du plan affin et euclidien à partir du plan projectif, qui est un peu le but de ma démarche depuis le début. Pour bien comprendre ce qui va suivre, il est donc nécessaire d'avoir présents à l'esprit les développements contenus dans l'article fondateur de ce site, Bereshit, ou les passionnantes aventures du plan projectif arguésien

Le plan affin, définition

Une fois que nous avons le plan projectif réel avec ses points, ses droites, ses birapports et ses coordonnées homogènes, nous allons d'abord construire un plan affin complété de la façon suivante : nous choisissons une droite d, que nous appellerons "droite à l'infini" ou "de l'infini", et à laquelle nous attribuerons désormais un rôle particulier : elle sera "l'horizon", la limite du plan. Ses points seront appelés "points à l'infini", les autres, ceux qui n'appartiennent pas à d, seront dits "points usuels". Des droites qui se coupent sur d, c'est-à-dire, dont l'intersection appartient à d, seront dites parallèles. Parmi tous les faisceaux de droites convergentes, il y en a donc qui se distinguent des autres par le fait que leur point de convergence est "à l'infini". Le plan n'est donc plus homogène en ses faisceaux de droites.
Si l'on "exclut" carrément la droite à l'infini, c'est-à-dire, si l'on considère la structure formée uniquement par les points usuels, on a un plan affin tout court. Dans ce plan, toutes les droites ont un point en moins par rapport au plan projectif ou affin complété, leur point à l'infini. Des droites parallèles, qui se coupent à l'infini, n'ont désormais plus de points d'intersection, leur intersection est l'ensemble vide, elles ne se coupent pas. On voit donc pourquoi, en géométrie euclidienne classique, il y a un "postulat" qui dit que "par tout point extérieur à une droite passe une et une seule parallèle à cette droite" : c'est une simple conséquence du troisième axiome du plan projectif (dans notre énumération) : par deux points passe une et une seule droite ; par un point extérieur à une droite et le point à l'infini de cette droite passe une seule droite, l'unique parallèle à cette droite passant par ce point, c'est clair. Dans cette perspective (c'est le cas de le dire), le "postulat des parallèles", qui a tenu en haleine les mathématiciens pendant des siècles (ils essayaient de le démontrer mais n'y arrivaient pas), se réduit à une application de l'axiome d'incidence : deux points déterminent une droite. C'est un progrès notable.
Le plan affin et le plan affin complété ne doivent pas être confondu, l'une est une partie de l'autre, toutefois considérer les points à l'infini ou non ne change pas grand-chose du point de vue des développements géométriques que l'on peut faire par la suite ; les deux plans, affin et affin complété, ont essentiellement les mêmes propriétés ; simplement, elles s'interprètent différemment : dans le premier, le parallélisme s'interprète comme intersection vide, non convergence, dans le second il s'interprète comme "convergence à l'infini". Mais toute propriété du plan affin peut se traduire en termes affins complétés en rajoutant les points à l'infini. 

Desargues dans le plan affin

Si le théorème de Desargues est valable dans notre plan projectif, il le reste dans le plan affin correspondant. Il y a donc des plans affins arguésiens et non arguésiens comme les plans projectifs. Intéressons-nous spécialement aux plans affins arguésiens. Dans le plan projectif, le théorème de Desargues peut prendre deux formes, selon que chacune des dix droites comprend exactement trois des dix points, ou qu'une des droites comprend quatre des points. Le premier cas correspond aux perspectivités générales - on se souvient que le théorème de Desargues équivaut à l'existence de perspectivités - le second cas correspond aux transvections, quand le centre de la perspectivité est sur l'axe. Dans le plan affin, ces deux cas se scindent en sept (ou huit), selon que certains de ces points ou de ces droites sont à l'infini ou non. On a donc, en plus du cas général où aucun point n'est à l'infini - et le théorème reste naturellement valable dans ces cas - les possibilités suivantes :

- L'axe de la perspectivité n'est pas à l'infini, mais son centre bien ; aucun autre point n'est à l'infini ; dans ce cas le théorème s'énonce

étant donnés six points A, B, C, A', B', C' en position générale (trois à trois non alignés), tels que les droites AA', BB' et CC' soient parallèles, si les droites AB et A'B' se rencontrent en un point P et les droites BC et B'C' en un point Q, alors les droites AC et A'C' se rencontrent également en un point R et les points P, Q, R sont alignés ;



On distingue en fait ici deux cas, selon que la droite PQ est parallèle aux droites AA', etc. ou non. Dans le premier cas on a une transvection dont le centre (mais pas l'axe) est à l'infini, qu'on appellera un cisaillement ; dans le second, une perspectivité générale dont le centre est à l'infini et l'axe non : on l'appellera un étirement. Cette forme du théorème équivaut à l'existence de cisaillements et d'étirements. 

- L'axe de la perspectivité est à l'infini : dans ce cas, le théorème prend la forme suivante :

étant donnés six points A, B, C, A', B', C' en position générale, si les droites AA', BB', CC' sont parallèles ou concourantes, et si les droites AB et A'B' d'une part, BC et B'C' d'autre part, sont parallèles, alors les droites AC et A'C' sont également parallèles ;



Noter que dans le premier cas (les droites AA', etc. sont parallèles) on a une translation (entre les triangles ABC et A'B'C'), dans le second (droite concourantes), une homothétie ; cette forme du théorème de Desargues équivaut donc à l'existence de translations et d'homothéties.

- L'axe n'est pas à l'infini, mais un seul des trois points P, Q, R est à l'infini ; on a alors la forme suivante :

étant donnés six points A, B, C, A', B', C' en position générale, si les droites AA', BB' et CC' sont parallèles ou concourantes, si les droites AB et A'B' sont parallèles et que les droites BC et B'C' se rencontrent en un point Q, alors les droites AC et A'C' se rencontrent en un point R et la droite QR est parallèle à AB et A'B' ;

Cette forme n'est pas fondamentalement différente du cas général, et les perspectivités qu'elle décrit ne portent pas de nom spécial ; simplement, un des côtés des triangles est parallèle à l'axe. En fait, dans le cas où les droites AA' etc. sont concourantes, on pourrait encore distinguer deux cas, selon que leur point d'intersection - le centre - appartient ou non à l'axe, avec les droites AB et A'B' parallèles à cet axe. Dans ce cas, on aurait neuf cas distincts pour le théorème de Desargues... contre seulement deux dans le plan projectif.
Noter que, puisqu'il suffit que le théorème de Desargues soit vrai pour un axe et un centre fixés pour qu'il soit toujours vrai, chacune de ces quatre formes - le cas général et les trois que nous avons énumérées par un tiret, avec chaque fois deux cas distincts selon que le centre appartienne ou non à l'axe - implique tous les autres. Ainsi, par exemple, l'existence d'homothéties et de translations implique l'existence de cisaillements, d'étirements et de perspectivités quelconques (qui cependant ne sont pas des transformations affines !). De même, l'existence de cisaillements et d'étirements implique celle de toutes les autres transformations. 

Coordonnées affines

Si le plan projectif est rapporté à un repère OIJK, avec des coordonnées homogènes (X, Y, Z), il est commode de choisir comme droite à l'infini la droite JK, d'équation Z = 0, c'est-à-dire que les points à l'infini sont les points de la forme (X, Y, 0). Ce choix est tellement la norme que certaines personnes, qui croient avoir tout compris sur le plan affin et le plan projectif, pensent qu'il n'y en a pas d'autre possible. Or c'est faux, on peut construire un plan affin en prenant n'importe quelle droite du plan projectif comme droite à l'infini, ça ne change rien. De toute façon, par un changement de repère, on peut toujours se ramener au cas précédent, ou à n'importe quel autre. Si l'on intervertit les points J et O par exemple, la droite à l'infini deviendra la droite OK, d'équation X = 0, et les points à l'infini seront les points de la forme (0, Y, Z). C'est un choix moins courant mais aussi commode. Mais à l'avenir, puisque c'est la convention, on supposera sauf mention contraire que la droite à l'infini a pour équation Z = 0.
Maintenant, à chaque droite passant par O - ou par n'importe quel point - correspond un et un seul point à l'infini, qui détermine sa direction. Les points à l'infini s'identifient donc aux "directions de droites", et on peut d'ailleurs les définir comme ça ; c'est ce qui a été fait historiquement. Ainsi, vu que les points J et K sont à l'infini, ils s'identifient à deux directions de droites fixées ; un repère affin est donc constituer d'un point origine O, de deux directions de droites (deux "axes"), et d'un point unité I, qui détermine sur chaque axe (par une projection parallèle) "l'unité de mesure" propre à cet axe. 
Puisque les points usuels ont tous leur troisième coordonnée non nulle, on peut déshomogénéiser les coordonnées, en posant que Z = 1 pour tous les points non à l'infini, ou encore en divisant par Z. En posant x = X/Z, y = Y/Z, un point usuel (X, Y, Z) devient un point de coordonnées non homogènes (x, y), tandis qu'un point à l'infini devient un couple homogène (X, Y) qui correspond à une direction de droites. Les points projectifs se scindent donc en points affins avec un couple de coordonnées non homogènes, et en directions de droites définies par deux coordonnées homogènes (en fait, des coordonnées homogènes à une dimension sur la droite Z = 0 qui conserve une structure de droite projective). On voit que le simple fait de fixer une droite entre les droites du plan projectif a des conséquences importantes sur la structure. On notera aussi qu'on peut toujours "remonter" des coordonnées affines non homogènes aux coordonnées homogènes, en remplaçant un couple (x, y) par un triplet (x, y, 1) et une direction (X, Y) par un triplet (X, Y, 0), puis en multipliant par une constante arbitraire. 
Tout cela a des conséquences sur les droites. Nous avions vu en effet qu'étant donnés deux points P, Q de coordonnées (X1, Y1, Z1) et (X2, Y2, Z2), la droite joignant ces deux points a pour coordonnées (dans la base duale) le triplet (Y1Z2 - Y2Z1, X2Z1 - X1Z2, X1Y2 - X2Y1), c'est-à-dire qu'elle a pour équation

(Y1Z2 - Y2Z1)X + (X2Z1 - X1Z2)Y + (X1Y2 - X2Y1)Z = 0.

Si P et Q sont des points usuels, on peut faire Z1 = Z2 = 1 et remplacer les coordonnées homogènes par les coordonnées non homogènes, pour les points du plan affin ; l'équation de la droite devient donc

(y1 - y2)x + (x2 - x1)y + x1y2 - x2y1 = 0

et l'on notera que le point à l'infini de cette droite, obtenant en ré-homogénéisant les coordonnées et en faisant Z = 0, a pour coordonnées (x2 - x1, y2 - y1, 0). Des coordonnées non homogènes de deux points, on peut donc déduire immédiatement les coordonnées du point à l'infini de la droite qu'ils déterminent, qui n'est autre que le "vecteur directeur" de cette droite en géométrie affine "classique".
Maintenant, supposons que Q soit un point à l'infini et P un point usuel ; on a alors Z2 = 0, et l'on peut remplacer les coordonnées homogènes par les coordonnées non homogènes avec Z1 = 1, et aussi Z = 1 si l'on ne considère que les points usuels de cette droite. Donc, l'équation de cette droite dans le plan affin sera

(-y2)x + x2y + x1y2 - x2y1 = 0.

Si l'on cherche l'intersection de cette droite avec la droite à l'infini comme précédemment, on trouve bien (x2, y2, 0), c'est-à-dire les coordonnées du point Q. L'identification entre directions de droites ou "vecteurs directeurs" et points à l'infini fonctionne donc parfaitement. Et l'on constate que l'homogénéisation des coordonnées permet de traiter comme un même problème les deux problèmes suivants : trouver l'équation de la droite passant par deux points du plan, et trouver l'équation de la droite passant par un point donné et de vecteur directeur donné. En géométrie affine, ce sont deux problèmes bien différents ; en géométrie affine complétée-projective, grâce aux coordonnées homogènes, c'est kif-kif et bourricot. Un autre problème de géométrie affine classique se résout par une méthode proche : trouver l'équation d'une droite passant par un point donné et parallèle à une droite donnée ; on peut calculer d'abord le vecteur directeur de cette droite en déterminant les coordonnées de son point à l'infini, puis on détermine par la formule connue les coordonnées de la droite passant par ce point et le point usuel donné dans le problème. Enfin on déshomogénéise et cela nous donne l'équation de la droite cherchée. 

Rapport de section

En géométrie affine, on définit une nouvelle notion numérique, le rapport de section, qui est en fait un birapport. Si A, B, C, D sont quatre points alignés, A étant à l'infini, le birapport (A B C D) sera nommé "rapport" ou "rapport de section" des trois points B, C, D et se notera désormais DB/CB ou BD/BC, comme une fraction, sauf qu'à ce stade le numérateur et le dénominateur ne sont pas encore définis : seule à un sens l'expression globale DB/CB, qui équivaut à (A B C D), A étant le point à l'infini de la droite BC (ou DB ou DC). Donc si B, C, D sont trois points alignés, on peut toujours définir leur rapport de section, puisque leur droite comporte un seul point à l'infini. On voit que le rapport de section a comme propriété de se conserver par une projection centrale dont le centre est à l'infini, ce qui s'appelle une projection parallèle : c'est le "théorème de Thalès", qui n'est qu'une conséquence de la proposition plus générale : les projections centrales conservent le birapport. 
Enfin, la propriété (A B C D)(B E C D) = (A E C D) se traduit, si A est à l'infini, par (B E C D) = (DE/CE)/(DB/CB) = (DE/CE)(CB/DB), ce qui permet de calculer un birapport comme un "rapport de rapports", et donne (enfin !) une justification au nom "birapport" donné à ce nombre, qui à l'origine caractérise les perspectivités fixant deux points A et B et appliquant C sur D.
Dans le cas particulier où le birapport vaut -1, donc où les quatre points sont conjugués harmoniquement, on voit tout de suite que le point B est le milieu du segment [CD]. Dans notre façon de procéder, toutefois, ceci constitue la définition du milieu d'un segment. Mais on voit que la signification géométrique du conjugué harmonique se précise : si le point A est à l'infini, son conjugué harmonique est le milieu du segment formé par les deux derniers points.

Affinités

Nous avons déjà un peu vu, avec le théorème de Desargues, ce que devenaient les perspectivités dans le plan affin. Nous allons revenir sur la question de façon plus détaillée. Désormais, on appellera transformations affines ou affinités les projectivités qui conservent (globalement) la droite à l'infini. Ce sont donc les transformations qui préservent la structure affine, c'est-à-dire à la fois la structure projective et la droite à l'infini, donc le parallélisme. On peut aussi les définir comme les projectivités qui transforment les droites parallèles en droites parallèles. En particulier, considérons les perspectivités ayant pour axe la droite à l'infini ; ce sont évidemment des affinités (mais pas les seules). On a vu qu'elles étaient de deux types : les transvections d'axe la droite à l'infini, que nous appelons translations, et les perspectivités générales d'axe à l'infini, que nous nommons homothéties. On notera que ces transformations sont les seuls qui préservent non seulement le parallélisme, mais encore les directions de droites, c'est-à-dire qu'elles changent toute droite en une droite de même direction, parallèle donc à la droite d'origine. Ces deux types de transformations forment un groupe, le groupe des homothéties-translations. Il joue dans le plan affin le même rôle que le groupe des perspectivités d'axe donné dans le plan projectif.
Une translation est caractérisée par une direction de droites qui restent globalement invariantes, c'est-à-dire qu'elles "glissent sur elles-mêmes" lors de cette transformation. Le point à l'infini de ces droites n'est autre que le centre de la translation, vue comme perspectivité. En géométrie affine complétée, les translations sont donc des transformations ayant un axe et un centre, ce qui est toujours amusant à dire quand on a en tête leur définition en géométrie affine, car ce sont alors des transformations n'ayant aucun point fixe. D'autre part, les homothéties sont des transformations ayant non seulement un centre, mais aussi un axe (la droite à l'infini), ce qui est aussi amusant à dire, car cela les rend symétriques d'un autre type de transformations affines complètement différent en apparence, les étirements et les symétries axiales. Un étirement est une perspectivité dont l'axe n'est pas à l'infini, c'est donc une droite ordinaire, mais dont le centre est un point à l'infini. Puisque la droite à l'infini passe par le centre, elle est globalement invariante, donc c'est bien une affinité. D'un point de vue affin, les étirements sont caractérisés par une droite fixe, l'axe, et une direction de droites qui glissent sur elles-mêmes, comme dans le cas des translations. Homothéties et étirements ont beaucoup en commun (ce sont des perspectivités qui sont en plus des affinités, donc ayant un élément, centre ou axe, à l'infini), mais cela ne se voit que d'un point de vue projectif (ou affin complété). Enfin, homothéties et étirements sont caractérisés par un rapport, qui est un nombre réel non nul, positif ou négatif ; c'est le rapport de la perspectivité en question. Dans une homothétie de centre O, si P' est l'image de P (les trois points sont donc alignés), on voit tout de suite que le rapport d'homothétie n'est autre que OP'/OP, et c'est le même quel que soit P. Une homothétie se voit donc comme un "agrandissement" (ou une réduction) de rapport donné, conservant les directions, et accompagné d'un mouvement de glissement autour du point fixe O. Dans un étirement d'axe a, si P' est l'image de P, et Q l'intersection de la droite PP' avec a, le rapport d'étirement est P'Q/PQ, et c'est aussi, forcément, le même quel que soit Q. C'est comme si on "tirait" (ou poussait) sur les points, dans la direction de la droite PP', et dans un rapport donné. En particulier, un étirement de rapport -1 (il est donc son propre inverse) s'appelle une réflexion ou symétrie axiale d'axe a dans la direction de l'étirement. Une homothétie de rapport -1 (aussi auto-inverse donc) s'appelle symétrie centrale.
Il existe enfin un dernier type d'affinités qui sont aussi des perspectivités, mais qui sont plus difficiles à décrire : ce sont les cisaillements. Ce sont les transvections dont l'axe n'est pas à l'infini, mais dont le centre est le point à l'infini de l'axe. Les cisaillements sont donc aux étirements ce que les translations sont aux homothéties. Ce sont des transformations assez bizarres : chaque droite fait comme un mouvement de ciseaux autour d'un point fixe qui est son intersection avec l'axe, d'où le nom cisaillement ; chaque point, en même temps, se déplace sur une droite - la "trace" par ce point - parallèle à l'axe. Cisaillements et étirements sont les seuls affinités ayant un axe de points usuels, mais dans le premier cas, les traces sont parallèles à l'axe, tandis que dans le second, elles ne le sont jamais. C'est une façon de caractériser ces deux types de transformations.

Vecteurs libres

En géométrie affine, il peut être utile de définir les "vecteurs libres" ; ce sont les couples de points (A, B), A et B étant des points usuels, modulo une relation d'équivalence : on décide que deux couples (A, B) et (A', B') définissent le même vecteur  si les droites AB et A'B' sont parallèles, ainsi que les droites AA' et BB'. Autrement dit si les quatre points forment une figure appelée "parallélogramme". Tout couple de points appartient ainsi à une seule "classe d'équivalence" - c'est en fait une conséquence du théorème de Desargues - et ce sont ces classes qui sont appelées "vecteurs (libres)". Une définition alternative est : deux couples de points (A, B) et (A', B') sont équivalents, déterminent le même vecteur, si la translation qui applique A sur B applique également A' sur B'. En effet, si les droites AB et A'B' d'une part, AA' et BB' d'autre part, se rejoignent à l'infini, il existe donc une perspectivité ayant pour axe la droite de l'infini, pour centre le point à l'infini des droites AB et A'B', et qui envoie A sur B et A' sur B' ; cette perspectivité est une translation de centre, c'est-à-dire de direction, le point à l'infini de la droite AB. Une translation définit donc un vecteur libre, et de même qu'on peut multiplier une translation par un scalaire (un nombre réel) et additionner deux translations (souvenons-nous que nous avons vu cela quand nous avons construit le corps des perspectivités d'axe d et de centre O), on peut additionner deux vecteurs et les multiplier par un scalaire, de telle sorte que cette multiplication soit distributive par rapport à l'addition vectorielle. L'addition vectorielle et la multiplication par un scalaire caractérisent les vecteurs. 
Remarquons que si (A, B) et (A', B') représentent le même vecteur libre, il existe aussi une translation unique qui envoie A sur A' et B sur B' ; elle a pour centre le point à l'infini des droites AA' et BB'. 
Il est facile de voir que si une translation t envoie le point O, de coordonnées non homogènes (0, 0), sur le point A de coordonnées (x_A, y_A), elle envoie le point P(x, y) sur le point P' de coordonnées (x + x_A, y + y_A). Une translation agit donc comme l'ajout d'un point constant. Deux couples de points représentant un même vecteur diffèrent donc par une translation. Dès lors, un vecteur peut également être représenté par un couple de nombres (x, y), non homogènes, et le vecteur défini par les points A : (x_A, y_A) et B : (x_B, y_B) est représenté par le couple (x_B - x_A, y_B - y_A). Ces nombres, en effet, ne dépendent pas du choix du couple (A, B) utilisé pour représenter ce vecteur, puisqu'un autre couple représentant le même vecteur n'en diffère que par une translation constante (identique pour les deux points). On peut donc identifier un point P au vecteur (O, P) et écrire Q = P + (P, Q) : (x_Q, y_Q) = (x_P, y_P) + (x_Q - x_P, y_Q - y_P). La somme ou la différence de deux vecteurs peut se faire terme à terme sur leurs coordonnées. Un couple non homogène (x, y) représente donc, au choix, un point, un vecteur ou une translation. 
L'intérêt est que jusqu'ici, une translation était une transformation linéaire, matricielle, en coordonnées homogènes ; maintenant nous pouvons la décrire comme l'application qui au point P fait correspondre le point P' = P + u, où u représente un vecteur constant. Naturellement, les nombres représentant ce vecteur dépendent du système de coordonnées.
Une droite de vecteur directeur u et passant par le point P peut se voir aussi comme l'ensemble des points dont les coordonnées sont de la forme P + ku, c'est-à-dire 

x  = x_P + kx_u, y = y_P + ky_u

où k est un paramètre variable ; ce sont les équations paramétriques de la droite. En éliminant k, on retrouve la forme connue, avec (x_u, y_u) comme point à l'infini, ce qu'on peut voir aussi (de façon moins rigoureuse mais plus intuitive) en faisant tendre k vers l'infini.

On a maintenant un espace vectoriel de dimension 2, un plan vectoriel ; ses éléments, les vecteurs, s'identifient aux couples (x, y) munis de l'addition terme à terme et de la multiplication par un scalaire. Notons qu'à partir de là, on peut reconstituer un espace affin et un espace projectif. Pour construire un plan affin à partir du plan vectoriel, il suffit de définir les droites affines, comme les ensemble de points-vecteurs de la forme u + kv, où u et v sont deux vecteurs fixes et k un paramètre variable ; on complète ensuite ce plan affin par les points à l'infini, c'est-à-dire les directions de droites, et on le plan affin complété ; enfin on décide d'"oublier" la différence entre points à l'infini et points usuels, et on a le plan projectif. Mais d'autre part, on constate aussi que l'ensemble des droites vectorielles, c'est-à-dire des points-vecteurs de la forme kv, où v est fixe et k variable, est un ensemble de couples de coordonnées homogènes, c'est-à-dire une droite projective. Résumons : l'ensemble des droites vectorielles - qui sont les droites affines passant par le point O - est une droite projective. Cela reste valable en dimension supérieure à 2, comme nous le verrons mieux dans un autre article : à partir d'un espace vectoriel de dimension 3, on peut construire soit un espace projectif de dimension 3 en rajoutant les droites affines et les points à l'infini, soit un espace projectif de dimension 2 (un plan projectif), en considérant les droites vectorielles - droites par l'origine O dans l'espace affin tridimensionnel - comme des points, repérés par trois coordonnées homogènes.

Toute affinité fixant le point O peut s'écrire matriciellement, avec une matrice 2 sur 2 agissant sur les coordonnées non homogènes. Par exemple, une homothétie de centre O, de rapport k, correspond simplement à la transformation (x, y) -> (kx, ky). Un étirement d'axe x, dans la direction y, de rapport k correspond à la transformation (x, y) -> (x, ky) ; un étirement d'axe y dans la direction x, à la transformation (x, y) -> (kx, y), etc. Ces transformations-là ont toutes une matrice diagonale parce qu'elles conservent les deux axes. Une transformation centrée générale ne les conserve pas forcément, et correspond à une matrice régulière quelconque.
L'affinité la plus générale peut donc s'écrire comme la composée d'une translation et d'une transformation fixant O (matricielle) : P' = MP + u, où u est un vecteur constant et M une matrice 2 sur 2 régulière. Remarquons qu'elle peut aussi s'écrire P' = M(P + u') où u' = (M^-1)u ; on peut faire la translation avant ou après la transformation matricielle. C'est aussi, bien sûr, la forme générale d'un changement de coordonnées. Si le nouveau système de coordonnées a la même origine O, la transformation est simplement matricielle (changement d'axes). Si en plus l'origine est différente, disons un point O', le vecteur u représente la translation appliquant O' sur O (et non O sur O' ! car le point O' doit avoir pour nouvelles coordonnées (0, 0)), exprimée dans les nouveaux axes ou dans les anciens, selon qu'on fasse d'abord le changement d'axes et puis le changement d'origine, ou l'inverse.

Coniques

Venons-en aux coniques maintenant. Rappelons que les coniques projectives sont, dans le plan projectif, des ensembles de points satisfaisant une équation du second degré (quadratique) ; on peut également les voir comme l'ensemble des points auto-conjugués d'une polarité, c'est-à-dire une transformation qui intervertit points et droites en conservant les relations d'incidence : à trois points alignés correspondent trois droites concourantes et vice-versa. L'image d'un point par une polarité est sa polaire, l'image d'une droite est son pôle. Un point (resp. une droite) est auto-conjugué(e) s'il appartient à sa polaire (resp. si elle passe par son pôle). Un point auto-conjugué est un point d'une conique, et sa polaire est une tangente ; une droite auto-conjuguée est donc une tangente. Par tout point du plan passe 0, 1 ou 2 tangentes. S'il en passe exactement une, c'est un point auto-conjugué, un point de la conique. S'il en passe 2, c'est un point extérieur à la conique, sa polaire rencontre celle-ci en deux points, les points de contact des deux tangentes. S'il passe 0 tangente, le point est un point intérieur ; sa polaire ne rencontre pas la conique. Tout ceci est vrai pour les coniques non dégénérées, c'est-à-dire, celles qui ne se réduisent pas à un point et ne contiennent pas de droite. On les appelle aussi coniques ovales. Toutes les coniques ovales sont projectivement équivalentes : on peut toujours trouver une projectivité qui les transforment l'une dans l'autre. Mais dans le plan affin, c'est différent : il y a trois types de coniques ovales, suivant qu'elles rencontrent la droite de l'infini en 0, 1 ou 2 points.

- Une conique qui ne rencontre la droite de l'infini en aucun point est une ellipse ;
- Une conique qui est tangente à la droite de l'infini, c'est-à-dire, qui la rencontre en un seul point, est une parabole ;
- Une conique qui rencontre la droite de l'infini en deux points est une hyperbole.

Le pôle de la droite de l'infini par rapport à une conique s'appelle son centre. Les définitions ci-dessus équivalent donc aux suivantes :

- Une conique dont le centre est un point intérieur est une ellipse ;
- Une conique dont le centre est un point auto-conjugué (un point de la conique même) est une parabole ;
- Une conique dont le centre est un point extérieur (par lequel passent deux tangentes) est une hyperbole.

Les tangentes passant par le centre d'une hyperbole, tangentes à l'infini, sont appelées asymptotes.

Deux coniques du même type sont équivalentes d'un point de vue affin : il existe toujours une affinité qui les transforment l'une dans l'autre. Deux coniques de type différent ne sont pas équivalentes : il n'existe aucune affinité les transformant l'une dans l'autre. Une ellipse ne peut jamais devenir une parabole, etc. Elle peut toujours le devenir par une projectivité, mais ce n'est pas une transformation affine. Un des points de départs de la géométrie projective est justement le constat historique qu'une ellipse peut devenir une parabole ou une hyperbole par projection centrale sur un plan non parallèle au plan de l'ellipse, ce qui équivaut à une projectivité. On a donc imaginé une structure géométrique abstraite, le plan projectif, dans lequel ces trois types de coniques seraient équivalentes modulo une transformation qui préserve cette structure, les projectivités. La géométrie projective est la structure adaptée à l'étude des projections (et de leurs invariants), et l'étude des projections se justifie entre autres par la recherche des propriétés communes à tous les types de coniques (ce sont précisément celles qui se conservent par projection !).

L'équation affine d'une conique est une équation du second degré non homogène, c'est-à-dire, contenant des termes linéaires et constants :

Ax^2 + By^2 + Cxy + Dx + Ey + F = 0.

Pour déterminer le type de cette conique par les méthodes de la géométrie affine, il faudrait l'écrire sous forme matricielle et diagonaliser sa matrice (si possible, ou au moins la jordaniser), ce qui équivaut à la recherche du centre et d'un système d'axes conjugués ou auto-conjugués par rapport à la conique. C'est assez compliqué. Les coordonnées homogènes permettent de faire plus simple. D'abord on homogénéise l'équation ci-dessus, ce qui donne

AX^2 + BY^2 + CXY + DXZ + EYZ + FZ^2 = 0 ;

ensuite, on cherche les intersections avec la droite à l'infini en posant Z = 0, d'où

AX^2 + BY^2 + CXY = 0.

C'est une équation facile à résoudre, qui donne tout de suite les points à l'infini s'il y en a. Le centre est le pôle de la droite de l'infini, il a pour équation

DX + EY + 2F = 0.

Une fois qu'on a déterminé le centre de la conique, si c'est un point usuel, on peut par une translation le ramener à l'origine des coordonnées ; ensuite, il est facile de choisir pour axes deux droites conjuguées, ou deux droites auto-conjuguées (les asymptotes) s'il s'agit d'une hyperbole, de sorte que l'équation prenne la forme simple (on dit parfois "canonique") :

x^2 + y^2 - 1 = 0 (ellipse)

ou

x^2 - y^2 - 1 = 0 (hyperbole, axes conjugués)

ou

xy - 1 = 0 (hyperbole, repère asymptotique)

pour une parabole, on ne peut pas ramener le centre à l'origine par une translation vu qu'il est à l'infini, mais on peut choisir comme axes une droite passant par le centre et une droite conjuguée qui soit en même temps tangente à la parabole, de sorte que l'équation prendra la forme

x^2 - y = 0

on peut d'ailleurs déduire immédiatement cette forme de l'équation d'une hyperbole en axes asymptotiques, qui s'écrit en coordonnées homogènes XY - Z^2 = 0 (la forme de la matrice permet de voir du premier coup d'oeil que la droite à l'infini a comme pôle l'origine, tandis que les points J et K ont comme polaires les droites OJ et OK) ; si l'on intervertit les droites JK et OJ, on permute les coordonnées X et Z, ce qui donnt YZ - X^2 = 0 ou X^2 - YZ = 0 ; en  déshomogénéisant, on obtient la forme ci-dessus. Et voilà comment la réduction de la parabole se déduit de celle de l'hyperbole ; encore un exemple de la façon dont les coordonnées homogènes et le plan projectif permettent de traiter plus facilement des problèmes de géométrie affine.

Il n'y a pas grand-chose de plus à dire sur la géométrie affine ; c'est une géométrie qui a encore relativement peu de structure, puisqu'on ne peut ni mesurer la distance entre deux points, ni les angles. Pour avoir une géométrie vraiment riche de structure - mais peu homogène - il faut encore doter le plan d'une métrique, et ce sont les coniques qui vont nous permettre d'y arriver. Il y a essentiellement deux types de métrique : euclidienne ou hyperbolique. Cette dernière est celle du plan de Minkowski, dont les "cercles" sont des hyperboles, et c'est aussi celle de la relativité restreinte, avec les transformations de Lorentz comme équivalent des rotations. Nous allons maintenant définir la métrique euclidienne, en posant les bases du plan euclidien à partir du plan affin, complété ou non. Ce sera la dernière étape du périple que nous avons entamé dans l'article "Bereshit, etc.", depuis les fondements du plan projectif jusqu'aux structures métriques du plan euclidien.

Le plan euclidien

Il y a une certaine symétrie entre la construction du plan affin et celle du plan euclidien. Le plan affin est un plan projectif dans lequel une droite particulière, arbitrairement choisie, joue un rôle particulier. Le plan euclidien est un plan affin dans lequel, en plus, une classe particulière de coniques joue un rôle particulier.

Concrètement, pour définir le plan euclidien (réel), on choisit une ellipse de référence, nommons-la c, qui sera le "cercle unité centré à l'origine" ; en effet, nous choisirons dans un premier temps un système de coordonnées ayant pour origine le centre de c, qui est le pôle de la droite de l'infini par rapport à cette ellipse. Les axes sont deux droites conjuguées passant par O, et le point unité I est choisi de telle sorte que ses projections sur les axes appartiennent à c (elles coïncident avec les intersections de c avec ces axes). Le "cercle unité centré à l'origine" a donc pour équation

x^2 + y^2 = 1

par définition, dans ce système de coordonnées. Mais le choix de l'ellipse de référence est complètement arbitraire, c'est le système de coordonnées qui est choisi en fonction de c et non l'inverse.

Il faut maintenant définir la classe des cercles en général ; les cercles sont les ellipses qui peuvent se déduire de c par une affinité qui conserve les directions de droites, c'est-à-dire par une perspectivité d'axe la droite à l'infini, c'est-à-dire une homothétie ou une translation ; plus particulièrement, on définira les cercles comme les ellipses qui peuvent se déduire de c - ou se ramener à c - par la composée d'une homothétie de centre O et d'une translation. C'est donc une classe d'ellipse invariante par le groupe des homothéties (de centre O)-translations.

On démontre sans difficulté la propriété suivante : si deux droites sont conjuguées par rapport à un cercle centré en leur point d'intersection - par exemple c - elles le sont par rapport à tous les cercles de même centre ; et des parallèles à ces deux droites passant par rapport à un point quelconque sont conjuguées par rapport à tous les cercles centrés en ce point. On peut donc définir une nouvelle relation entre droites : l'orthogonalité ou perpendicularité. On dira que deux droites sont orthogonales ou perpendiculaires si elles sont conjuguées par rapport à un cercle ayant pour centre leur point d'intersection, ou encore, si des parallèles à ces droites passant par O sont conjuguées par rapport à c, et aux cercles de centre O.
On démontre qu'une affinité qui conserve la droite à l'infini, ou les directions de droites, c'est-à-dire une homothétie ou une translation, transforme deux droites orthogonales en deux droites orthogonales. Toute transformation qui conserve les directions de droites conserve l'orthogonalité ; on comprend donc intuitivement comment cette nouvelle structure nous permettra de mesurer des angles, c'est-à-dire l'écart relatif entre deux directions de droites.
Notons la distinction entre orthogonalité et perpendicularité : perpendiculaires se dit exclusivement de deux droites, tandis qu'orthogonales peut se dire également de deux directions de droites, de deux faisceaux de droites, ou encore de deux vecteurs.  Deux vecteurs sont orthogonaux, évidemment, si les directions de droites qu'ils définissent le sont.
On démontre aussi que deux droites perpendiculaires à une même troisième sont parallèles entre elles et vice-versa (si deux droites sont parallèles, toute perpendiculaire à l'une l'est aussi à l'autre). Cela résulte immédiatement de la propriété fondamentale des polarités : si un nombre quelconque de points sont alignés, leurs polaires sont concourantes.
On démontre enfin la propriété la plus importante : toute affinité qui conserve un cercle, par exemple c, transforme tous les cercles en cercles, et conserve l'orthogonalité (les deux propriétés sont équivalentes). On appellera de telles transformations : isométries. Les isométries forment un groupe, le groupe orthogonal, qui est le groupe fondamental du plan euclidien, comme le groupe projectif (les projectivités) est le groupe fondamental du plan projectif, et le groupe affin (affinités), celui du plan affin (logique). Chacune de ces géométries peut donc être vue comme l'étude des invariants du groupe correspondant, c'est-à-dire, des propriétés invariantes sous l'action de ce groupe. Cette approche de la géométrie a été formalisée à la fin du XIXe siècle par des mathématiciens comme Hilbert et Klein (auteur du "programme d'Erlängen", qui définit pour la première fois la géométrie projective de la façon dont nous l'avons exposée). Rendons ici hommage à ces génies qui ont mis au point l'approche la plus puissante de la géométrie.

Repères orthogonaux et orthonormés, produit scalaire, distance

Un repère affin dont les axes sont orthogonaux sera nommé "repère orthogonal" ; en géométrie euclidienne, les repères orthogonaux jouent évidemment un rôle particulier. Ils sont caractéristiques de cette géométrie. Si, de surcroît, le point unité - ou ses projections sur les axes, qui définissent l'échelle propre à chaque axe - est choisi de telle sorte que le cercle unité centré à l'origine des coordonnées ait pour équation x^2 + y^2 = 1, autrement dit, qu'il passe par les projections du point unité sur les axes ; autrement dit encore, que les deux points qui représentent les vecteurs de base dans ce système de coordonnées appartiennent au cercle unité, alors le repère est dit orthonormé (ou orthonormal). C'est presque toujours ce type de repères qu'on utilise, tout simplement parce que c'est le plus commode. Une transformation qui transforme un repère orthonormé en un repère orthonormé est une isométrie. L'étude des isométrie revient donc à peu près à celle des changements de repères orthonormés.
Si deux droites a et b ont pour vecteurs directeurs, respectivement, les couples (x, y) et (x', y'), on montre facilement qu'elles sont orthogonales si et seulement si l'on a

xx' + yy' = 0.

Il est commode d'appeler "produit scalaire" de deux vecteurs cette quantité qui est nulle s'ils sont orthogonaux. Remarquons que cette façon de procéder est exactement l'inverse de la présentation moderne la plus courante, dans l'enseignement supérieur, où l'on définit l'orthogonalité à partir du produit scalaire. Notre approche, au contraire, mène à définir l'orthogonalité indépendamment, par une propriété géométrique, et de démontrer ensuite qu'elle correspond à un produit scalaire nul ; c'est une conséquence logique du choix initial de définir axiomatiquement le plan projectif, et de construire le plan euclidien par le choix d'une droite de l'infini et d'une ellipse de référence. On ne perd rien dans cette approche, parce qu'elle permet de voir que la façon moderne de définir l'orthogonalité, en fixant une forme quadratique définie positive dans un plan vectoriel, correspond géométriquement au choix d'une conique particulière comme cercle. En choisissant cette conique comme cercle, on choisit aussi la matrice qui la représente dans un système de coordonnées comme forme quadratique fondamentale, c'est-à-dire comme "produit scalaire". Les deux approches sont essentiellement identiques, sauf que dans la nôtre, la signification géométrique du choix - on fixe une classe de coniques - apparaît explicitement.
La racine carrée du produit scalaire d'un vecteur par lui-même, x^2 + y^2, sera appelée la norme de ce vecteur. C'est une quantité nécessairement positive et qui se conserve par isométrie. C'est aussi le rapport d'homothétie d'une homothétie qui envoie le cercle unité sur le cercle centré à l'origine qui passe par le point représentant ce vecteur ; on appellera cette grandeur "rayon" du cercle en question. Le rayon d'un cercle est donc, à l'origine, un rapport d'homothétie. On définit aussi la distance entre deux points comme la norme du vecteur joignant ces deux points. Elle se conserve évidemment par isométrie.

Nous sommes maintenant prêts à étudier plus finement les isométries ou les changements de repères orthonormés. Commençons par ces derniers, et mettons de côté les translations, qui sont évidemment des isométries et qui n'ont plus rien à nous apprendre. Nous nous intéressons aux changements d'axes orthonormés. Ils sont définis par une matrice 2 sur 2 possédant certaines propriétés que nous devons maintenant définir. Notons d'abord que la matrice d'une forme quadratique - une conique centrée en l'origine, comme le cercle unité - se transforme, dans un changement d'axes de matrice M, en multipliant à droite et à gauche par l'inverse de M et par sa transposée, respectivement. On dit qu'une forme quadratique est deux fois contravariante : elle se transforme deux fois, à droite et à gauche, selon l'inverse de la matrice de changement de base.
Si M représente une isométrie centrée en O, qui applique les vecteurs de base u, v sur deux nouveaux vecteurs u', v', la matrice de changement de base faisant passer de la première à la seconde est l'inverse de M ; la forme quadratique fondamentale se transforme donc selon M. L'étude de la forme des matrices de changement de base orthonormés inverses est donc identique à celles des isométries.
Une telle matrice doit laisser invariants le produit scalaire et la norme de deux vecteurs ; il revient au même de dire qu'elle doit laisser invariante - lorsqu'on multiplie à droite par M et à gauche par sa transposée - la matrice de la forme quadratique fondamentale, c'est-à-dire du cercle unité, qui, dans un repère orthonormé, est représenté tout simplement par la matrice identité. Tout cela pour dire que M représente une isométrie centrée en O si, et seulement si, son produit par sa transposée à gauche donne la matrice identité.
Supposons que les lignes de M soient (a, b) et (c, d). Cette condition se traduit par trois relations entre les nombres a, b, c, d :

a^2 + c^2 = 1
b^2 + d^2 = 1
ab + cd = 0.

On doit également avoir, puisque le déterminant du produit de deux matrices (M et sa transposée) est le produit des déterminants, que le carré du déterminant de M vaut 1. Par conséquent, le déterminant de M vaut 1 ou -1, ce qui donne une quatrième relation entre ces quatre nombres :

ad - bc = 1 ou -1.

Il y a deux types d'isométries, selon que l'on choisit la valeur 1 ou -1. Mais, puisque le déterminant d'un produit de matrices est égal au produit des déterminants, on voit que les isométries dont le déterminant vaut 1 forment un sous-groupe du groupe des isométrie (centrées en O), tandis que celles dont le déterminant vaut -1, non. En effet, le produit de deux matrices de déterminant -1 est une matrice de déterminant 1. Nous appellerons les isométries centrées du premier type, celles qui forment un sous-groupe, les rotations, et les autres, antirotations. Nous allons dorénavant nous concentrer sur l'étude des rotations (de centre O), qui constituent le groupe des rotations (de centre O), sous-groupe des isométries (centrées en O).
Quand on a fixé la valeur du déterminant, les quatre équations ci-dessus permettent d'exprimer toutes les composantes de la matrice en fonction d'une seule, par exemple a ; cela signifie que les isométrie centrées en O dépendent d'un seul paramètre. En particulier, pour une rotation, les quatre équations peuvent se réduire à

d = a, c = -b, a^2 + b^2 = 1.

Si t est une rotation, il existe donc deux fonctions a(t) et b(t), dont la somme des carrés vaut 1, et telles que toutes les composantes de la matrice de t, M(t), s'expriment au moyen de ces deux fonctions. Ce sont les fonctions sinus et cosinus ; nous voyons ici comment les définir rigoureusement, c'est-à-dire, à partir des matrices de rotation, et non à partir du rapport des côtés d'un triangle rectangle à l'hypoténuse pour un angle donné, comme on le fait dans l'enseignement secondaire ; cette définition n'est pas rigoureuse, car pour démontrer que ce rapport est invariant par isométrie, on a besoin de connaître la forme analytique (matricielle) des isométries, qui fait justement intervenir les fonctions sinus et cosinus ! La seule bonne méthode, qui n'est pas triviale, est de faire comme nous faisons ici ; nous avons démontré l'existence de deux fonctions sinus et cosinus, intervenant dans les matrices de rotation, et dont la somme des carrés vaut 1. D'autre propriétés de ces fonctions, que l'on peut déduire de celles des matrices, vont nous permettre de déduire des formules de récurrence pour calculer la valeur de ces fonctions, en fonction de leur valeur pour quelques rotations connues. C'est comme ça que, depuis toujours, se calculent les fonctions sinus et cosinus, à partir de leurs valeurs connues pour quelques angles donnés (0 et pi en fait). Les formules analytiques plus complexes que l'on possède aujourd'hui pour calculer la valeur de ces fonctions à autant de décimales près - formule de Taylor - procèdent de là.
Considérons deux rotations t et t' ; le produit des deux matrices montre que l'on doit avoir

a(t + t') = a(t)a(t') - b(t)b(t')
b(t + t') = a(t')b(t) + a(t)b(t').

Par convention, une rotation qui applique un vecteur sur un vecteur orthogonal au premier sera dite d'angle pi/2 ; pi désigne la valeur de l'angle entre deux vecteurs de même direction, mais d'orientation inverse. Comme l'effet de deux rotations d'angle pi est nul (identité), on voit que les deux fonctions doivent être périodiques de périodes pi, et en outre on doit avoir

a(0) = b(pi/2) = 1
a(pi/2) = b(0) = 0.

Avec ces quatre relations, on peut calculer, par récurrence, la valeur des fonctions a (cosinus) et b (sinus) pour toute fraction de pi, et, par passage à la limite, pour toute valeur réelle de l'"angle", c'est-à-dire de l'écart relatif entre deux directions de droite, identifié modulo pi à la rotation qui envoie une droite sur l'autre. Ceci définit à la fois les rotations, les angles, les mesures d'angles et les fonctions trigonométriques. On voit que toutes ces notions sont intimement liées ; leurs définitions dépendent les unes des autres.
Maintenant, nous avons les fonctions trigonométriques sinus et cosinus, la méthode pour les calculer, et nous pouvons préciser entièrement la forme des matrices d'isométries.

Nous pouvons maintenant spécifier toutes les isométries, et aussi les isogonies, transformations affines qui conservent les angles : les isométries sont engendrées par les translations, les rotations, les antirotations, et les symétries orthogonales, c'est-à-dire les étirements de rapport -1 dans la directions conjuguée de l'axe (orthogonale). Notons qu'une antirotation d'angle t apparaît comme la composée d'une rotation d'angle t et d'une symétrie orthogonale autour de l'axe x, représentée par une matrice diagonale de composantes (1, -1). De plus, une translation ou une symétrie dans une direction donnée, faisant avec la direction x un angle t, s'obtiennent par l'action d'une rotation d'angle t sur la translation de même longueur ou la symétrie dans la direction x, c'est-à-dire en faisant successivement la rotation d'angle -t, puis la translation ou la symétrie selon x, puis la rotation d'angle t. De même, une rotation ou antirotation de centre donné s'obtient par l'action d'une translation appropriée sur une rotation ou antirotation de centre O. Ainsi, le groupe des isométries a pour générateurs : les translations dans une direction fixée, les rotations de centre fixé, et une seule symétrie orthogonale fixée. On obtient toutes les isométries possibles par composition de ces trois-là. Pour les isogonies, c'est presque la même chose, il suffit de rajouter les homothéties de centre O.

Circonférences et surfaces

Notons que tel que nous l'avons défini, pi n'est pas un nombre : c'est la valeur conventionnelle d'un angle plat. Mais le fait que la distance entre deux points corresponde à une mesure du segment de droite compris entre ces deux points donne l'idée qu'on pourrait associer de même une mesure à d'autres types de courbes, en particulier aux coniques. Les cercles par exemple : considérons un cercle de rayon R. Nous voulons associer une mesure à une portion de ce cercle comprise entre deux points, qui déterminent par rapport au centre un angle t. Cette mesure doit évidemment être proportionnelle à l'angle. De plus, il est évident que dans une homothétie, qui correspond à un "changement d'échelle", elle doit se transformer comme le rayon, donc elle doit être proportionnelle au rayon : l = aRt, a étant un coefficient dépendant du système d'unité choisi. Il est invariant par isométrie, donc le même pour tous les cercles. C'est une "constante universelle" dont la valeur dépend du système d'unités. C'est-à-dire, concrètement, de la façon dont on mesure les angles. Décidons alors que les angles sont mesurés de façon que ce coefficient vaille 1, dans ce cas, la mesure d'une circonférence complète vaut exactement 2Rpi. De sorte que pour calculer la valeur de pi dans ce système d'unités, il suffit de mesurer la longueur de la circonférence d'un cercle dont le diamètre (double du rayon) vaut 1. Ce nombre étant connu, nous disposons d'un système d'unités de mesure dans lesquels l'angle plat vaut pi. On dit alors que les angles sont mesurés en radians. On en déduit la mesure d'une "corde" de cercle de rayon R correspondant à un angle t radians : l = Rt. Si les angles sont mesurés en degrés, la valeur d'une circonférence complète étant fixée conventionnellement à 360, la formule devient l = 2Rpi/360.
Pour une ellipse quelconque, on peut montrer qu'il existe toujours un couple d'axes orthonormés, dans lesquels son équation prend la forme x^2/a^2 + y^2/b^2 = 1. Les nombres a et b sont les mesures de ses "demi-axes", intersections de l'ellipse avec les axes de coordonnées. Pour une hyperbole c'est la même chose, en remplaçant le signe + par un - dans l'équation. On peut également attribuer à un arc d'ellipse compris entre deux points une mesure dépendant uniquement des valeurs de a et b et de l'angle formé par les deux points et le centre de la conique. Elle vaut l = rt, où t est l'angle en question mesuré en radians et r la racine carrée de ab. On voit que pour un cercle, ellipse ayant ses deux axes égaux (et valant R, le rayon du cercle), on retrouve l = Rt.