Spline — Wikipédia

Exemple de spline quadratique.

En mathématiques appliquées et en analyse numérique, une spline est une fonction définie par morceaux par des polynômes.

Spline est un terme anglais qui, lorsqu'il est utilisé en français, est généralement prononcé [splin], à la française. Il désigne une réglette de bois souple appelée cerce en français. Toutefois, dans l'usage des mathématiques appliquées, le terme anglais spline est généralisé et le mot français cerce ignoré.

Dans les problèmes d'interpolation, la méthode des splines est très souvent préférée à l'interpolation polynomiale. Les splines sont également utilisées dans les problèmes de lissage de données expérimentales ou de statistiques.

Les splines sont utilisées pour représenter numériquement des contours complexes. Leur mise en œuvre est simple. Elles sont fréquemment employées dans les logiciels de dessin ou de conception graphique ; leur usage y a été généralisé par Pierre Bézier avec les B-splines.

Historique[modifier | modifier le code]

L'origine historique des splines se trouve dans la conception industrielle.

Spline ou cerce.
Autrefois, avant l'existence des outils numériques, la conception industrielle était fondée sur la géométrie et le dessin. Les concepteurs d'une pièce de machine, par exemple, définissaient graphiquement les quelques points, ou nœuds, par lesquels devait nécessairement passer le contour de la pièce (dessin technique). Le travail du dessinateur industriel consistait à relier ces nœuds par des courbes aussi lisses que possible afin d'éviter les discontinuités, sources de faiblesses mécaniques et de ruptures. Ces courbes devaient être « agréables à l'œil » : il y a un rapport direct entre la notion subjective d'« agrément » et la notion mathématique de classe de régularité d'une fonction, c'est-à-dire de ses propriétés de continuité et de dérivation.

Pour le tracé graphique des contours, on utilisait une réglette de bois élastique, appelée spline en anglais et cerce en français. À l'aide de tenons, on faisait passer la réglette par les nœuds et on traçait entre ceux-ci la courbe prise par la réglette. Les propriétés mécanique d'une réglette de bois sont telles que celle-ci prend, sous déformation, une forme qui a des dérivées continues à un ordre élevé (la dérivée première est continue, la dérivée seconde aussi, etc.)

Sur le terme spline[modifier | modifier le code]

Prononciation[modifier | modifier le code]

Spline est un mot anglais qui, dans cette langue, se prononce [splaɪn], ce qui le distingue de « spleen » [spli:n]. En français, on prononce le mot tel qu'il s'écrit : [splin].

Étymologie[modifier | modifier le code]

Pierre Bézier écrit[1] :

« Le mot anglais spline a malencontreusement prévalu, alors qu'il se traduit en français par les substantifs latte ou baguette. »

The Oxford English Dictionnary 1989 donne les définitions suivantes pour le mot spline :

« A long narrow, and relatively thin piece or strip of wood, metal, etc.; a slat. A flexible strip of wood or hard rubber used by draftsmen in laying out broad sweeping curves, especially in railroad work. »

« Une pièce longue, étroite et relativement mince de bois, de métal, etc., une latte. Une bande flexible de bois ou de caoutchouc dur utilisée par les dessinateurs industriels dans le tracé de larges courbes, en particulier dans les travaux ferroviaires. »

Les menuisiers, charpentiers et escaliéteurs nommaient cet outil cerce, latte souple de bois bien de fil servant à tracer des courbes « quelconques » (courbes harmonieuses passant par un certain nombre de points et qui ne peuvent être tracées à l'aide du compas).

Approximation mathématique des splines[modifier | modifier le code]

La description de la forme prise par la réglette de bois, fondée sur les lois de l'élasticité, est mathématiquement compliquée. On obtient toutefois une approximation acceptable pour les usages pratiques en représentant la forme de la réglette par une spline, c'est-à-dire une fonction définie par morceaux par un polynôme sur chaque intervalle entre nœuds.

Ces polynômes peuvent être calculés en posant des conditions de continuité : ils passent par les nœuds, la pente du contour est continue, c'est-à-dire que les polynômes à droite et à gauche du nœud ont même dérivée première ; de même, en chaque nœud, la courbure est continue, c'est-à-dire que les polynômes à droite et à gauche ont même dérivée seconde. Une solution est donnée par des morceaux de polynômes du troisième degré. C'est le degré minimum des polynômes pour que la fonction, sa pente et sa courbure soient continues à chaque nœud. Cette courbe par morceaux s'appelle spline.

Les splines cubiques sont les plus utilisées dans la pratique. Elles sont plus faciles à utiliser que l'interpolation polynomiale et n'ont pas en général de comportements aberrants. Dans quelques cas particuliers, on peut être conduit à utiliser des polynômes du quatrième degré ; toutefois cet usage résulte de la pratique des analystes mais nullement de considérations théoriques.

D'autres familles de fonctions splines (obtenues par minimisation d'une fonctionnelle d'énergie) ont également été développées dans le cadre de l'approximation de données.

Définition[modifier | modifier le code]

Soit une série de points de donnée, ou nœuds, de coordonnées (Xi, Yi). On appelle spline d'interpolation la fonction par morceaux constituée d'un polynôme sur chaque intervalle entre nœuds.

Le degré de la spline est défini par le polynôme de plus haut degré utilisé : si on joint simplement les nœuds par des droites, c'est-à-dire si la spline est constituée de polynômes du premier degré, la spline est de degré 1, etc. Si tous les polynômes ont même degré, on parle de spline uniforme. Si tous les polynômes sont du troisième degré, on parle de spline cubique.

Exemples[modifier | modifier le code]

Voici l'exemple de splines d'interpolation de degré 1, d'une part, et de degré 3, d'autre part, fondées sur les quatre mêmes nœuds (les points rouges des graphiques ci-dessous.

À gauche, la spline de degré 1 relie les quatre nœuds par des polynômes de degré 1, c'est-à-dire par des droites. La spline est continue, mais la pente n'est pas continue (elle passe brutalement d'une valeur à une autre). Les polynômes, des fonctions linéaires, permettent, entre les nœuds, des interpolations linéaires.

À droite, une spline cubique dans laquelle les nœuds sont reliés par des polynômes du 3e degré auxquels on a imposé des conditions pour rendre la spline continue au premier degré (les pentes varient de façon continue) et au second degré (la courbure de la spline, plus précisément sa dérivée seconde, varie de façon continue).

Continuité de la spline[modifier | modifier le code]

Comme les polynômes sont continus, indéfiniment dérivables et que leurs dérivées successives sont continues, la continuité de la spline dépend des conditions de continuité qu'on impose en chaque nœud. La continuité définit les caractéristiques de la jonction entre chaque intervalle. Cela correspond au degré de correspondance entre deux polynômes successifs aux points de jonction.

  • C0 est la continuité minimum : les polynômes successifs passent bien par les points de jonction ;
  • C1 est la continuité des tangentes : les polynômes successifs ont des dérivées premières (c'est-à-dire des pentes) égales aux points jonction ;
  • C2 est la continuité de la courbure : les polynômes successifs ont de plus des dérivées secondes (des courbures) égales aux points jonction ;
L'application des conditions C0, C1 et C2 conduit aux splines cubiques.

Spline d'interpolation[modifier | modifier le code]

Lorsqu'on a déterminé les éléments de la spline, c'est-à-dire les paramètres des polynômes qui joignent chacun des points donnés (les nœuds), on peut calculer l'ordonnée d'un point situé entre deux nœuds : c'est la valeur du polynôme pour l'abscisse correspondante. La spline permet donc d'interpoler les valeurs comprises entre les nœuds.

Inconvénients des splines[modifier | modifier le code]

Quoiqu'elles soient plus stables que d'autres méthodes d'interpolation, les splines n'en présentent pas moins quelques inconvénients:

  • l'évaluation des paramètres de la spline peuvent diverger si la pente entre deux nœuds varie fortement d'un intervalle au suivant ;
  • la spline dépend du choix du système de coordonnées, elle ne possède donc pas de propriété d’invariance géométrique (cas d'une rotation par exemple) ; toutefois, elle reste insensible à une homothétie sur l'un des axes ;
  • on ne peut utiliser l'interpolation par spline si la courbe à représenter n'est pas une fonction, c'est-à-dire s'il y a plus d'une valeur pour une abscisse donnée (courbes qui « reviennent en arrière » comme les ellipses, les cercles, etc.) Dans ce cas, on utilise des généralisations des splines (B-splines, NURBS).

Calcul des éléments d'une spline cubique[modifier | modifier le code]

Considérons n nœuds de coordonnées (X1, Y1), ..., (Xn, Yn). Il y a n-1 intervalles. Nous voulons donc déterminer les paramètres de n-1 polynômes du troisième degré, S1, ..., Sn–1.

Chaque polynôme S a une équation de la forme :

Il faut donc déterminer quatre coefficients par polynôme, soit au total 4n-4 inconnues, pour lesquelles on doit poser autant de conditions.

Les conditions C0, C1 et C2 s'expriment de la façon suivante :

  • C0 : chacun des n-1 polynômes passe par deux nœuds, soit 2n-2 conditions ;
  • C1 : les polynômes ont les mêmes dérivées premières aux n-2 nœuds de jonction, soit n-2 conditions ;
  • C2 : et ces polynômes ont la même dérivée seconde aux n-2 nœuds de jonction, soit n-2 conditions.

Au total on a ainsi 4n-6 conditions. Il manque donc deux conditions pour déterminer les 4n-4 inconnues. On adjoint deux conditions supplémentaires en imposant la valeur des dérivées secondes à chaque nœud extrême. Si on impose que les dérivées secondes soient nulles à chaque extrémité, on obtient une spline cubique naturelle. On peut disposer toutefois d'informations supplémentaires qui permettent de fixer de façon plus précise la dérivée seconde aux extrémités.

On obtient ainsi un système de 4n-4 équations linéaires à 4n-4 inconnues.

Algorithme de calcul[modifier | modifier le code]

On trouvera ci-dessous un algorithme de calcul d'une spline cubique d'interpolation, naturelle ou non. Cet algorithme est présenté en langage naturel et mathématique, sans référence à quelque langage de programmation que ce soit. Il peut être mis en œuvre avec un simple tableur.

Forme explicite d'une spline cubique[modifier | modifier le code]

Pour une fonction dont on connaît les valeurs aux nœuds , l'expression générale pour la spline cubique de classe C2 en un point dans est la suivante :

  • est la valeur de au nœud i,
  • ,
  • est la dérivée seconde de au nœud i.

On vérifie facilement que et .

Mise en œuvre dans des logiciels[modifier | modifier le code]

B-splines (courbes de Bézier) utilisées dans Inkscape.

Les splines sont souvent intégrées dans des logiciels de dessin, que ce soient des logiciels généralistes, comme les fonctions de dessin des suites de logiciels de bureautique (Microsoft Office, LibreOffice…), des logiciels de dessin et de traitement d'image (Inkscape, GIMP…) ou bien des logiciels de dessin ou de conception assistés par ordinateur. Ces logiciels utilisent le plus souvent des B-splines.

Spline de lissage[modifier | modifier le code]

Utilisation de splines pour le lissage[modifier | modifier le code]

Les données de mesure sont généralement affectées d'aléas, que ce soit dans les sciences physiques ou dans les sciences humaines (économie, démographie, sociologie, etc.) Pour approcher empiriquement une fonction inconnue dont les mesures sont perturbées par des aléas, on pratique souvent le lissage. L'idée heuristique sous-jacente est que les fonctions qui représentent les phénomènes physique ou en sciences humaines sont généralement très continues : le lissage a donc pour objet de substituer des valeurs continues à des valeurs de mesure dispersées à cause des aléas. Ce problème se pose en particulier pour des mesures d'une grandeur évoluant dans le temps (série chronologique).

Principe du lissage par spline : des ressorts lient les nœuds à la réglette qui décrit la courbe lissée ; la forme de celle-ci minimise l'énergie totale de déformation.

Il existe de nombreuses méthodes empiriques de lissage, telles que les moyennes mobiles, le lissage exponentiel simple ou double, etc. Les splines de lissage font partie de ces méthodes empiriques.

Considérons des données de mesure dont les abscisses sont strictement croissantes (ce sont souvent des données chronologiques).

L'idée conduisant aux splines de lissage repose sur l'utilisation de la même réglette flexible que celle qui est à l'origine des splines d'interpolation (voir : Conception industrielle ci-avant). Toutefois, au lieu d'imposer à la réglette de passer par les nœuds (les valeurs de mesure), on suppose qu'on relie ceux-ci à la cerce par des ressorts. La réglette décrit alors une fonction très continue qui minimise l'énergie totale de déformation des ressorts et de la réglette.

Forme d'équilibre d'une fonction de lissage[modifier | modifier le code]

Soit n valeurs connues (nœuds), dont les abscisses sont strictement croissantes, que l'on souhaite lisser. On relie ces n nœuds à une réglette flexible de raideur r par des ressorts ayant tous la même raideur k. La forme d'équilibre est celle qui minimise l'énergie totale d'allongement des ressorts et de courbure de la réglette.

Énergie d'allongement des ressorts[modifier | modifier le code]

Chaque ressort i s'allonge d'une longueur ei. L'énergie d'allongement d'un ressort élastique est proportionnelle au carré de l'allongement ; l'énergie d'allongement du ressort no i vaut :

k est la raideur du ressort.

L'énergie totale d'allongement des ressorts est la somme des énergies d'allongement des n ressorts :

(en supposant que la raideur de tous les ressorts est identique et égale à k).

Énergie de déformation de la réglette[modifier | modifier le code]

L'énergie élastique de courbure d'une cerce élastique est proportionnelle en tout point au carré de la courbure en ce point. On approxime la courbure par la dérivée seconde de la fonction s(x) représentant la forme de la réglette. Cette approximation est admissible en pratique si la pente de la fonction n'est pas trop grande (>>1). Alors l'énergie de courbure entre x et x + dx vaut :

r est la raideur de courbure élastique de la cerce.

L'énergie de déformation pour toute la réglette vaut :

si l'on suppose qu'elle présente une raideur constante sur toute sa longueur.

Condition sur la forme prise par la réglette[modifier | modifier le code]

La forme prise par la réglette est celle qui minimise l'énergie totale de déformation, c'est-à-dire l'énergie d'allongement des ressorts et l'énergie de courbure de la réglette. C'est la fonction qui minimise l'expression :

λ est le rapport entre la raideur r de la réglette et la raideur k des ressorts.

Spline cubique de lissage[modifier | modifier le code]

Trouver la fonction s qui minimise W(s,λ) pour λ donné se simplifie si l'on suppose que cette fonction est une spline cubique : courbe par morceaux constituée de polynômes du troisième degré. Si l'on doit lisser n valeurs (ou nœuds), il y a n–1 intervalles et donc n–1 polynômes du troisième degré définis chacun par quatre paramètres, soit au total 4n–4 paramètres à déterminer.

On impose à ces fonctions polynomiales d'être continues à chaque jonction, d'y avoir une pente (dérivée première) et une dérivée seconde continue, soit :

  • C0 : chacun des n–1 polynôme est jointif au suivant, soit n–2 conditions ;
  • C1 : les polynômes ont même dérivée première aux n–2 jonctions, soit n–2 conditions ;
  • C2 : et ces polynômes ont même dérivée seconde aux n–2 jonctions, soit n–2 conditions.

Soit 3n–6 conditions.

La minimisation de W(s,λ), où λ est fixé, correspond à n conditions. Soit donc au total 4n–6 conditions. Il manque deux conditions pour déterminer les 4n–4 inconnues. On impose que les dérivées secondes aux extrémités soient nulles. L'ensemble de ces conditions conduit à 4n–4 équations linéaires à 4n–4 inconnues. (Si l'on dispose d'informations supplémentaires pour les courbures aux points extrêmes, on peut utiliser ces valeurs connues au lieu de la valeur 0.)

Algorithme de calcul[modifier | modifier le code]

On trouvera ci-dessous un algorithme de calcul d'une spline cubique de lissage. Cet algorithme est présenté en langage naturel et mathématique, sans référence à quelque langage de programmation que ce soit. Il peut être mis en œuvre avec un simple tableur.

Paramètre de lissage[modifier | modifier le code]

On suppose généralement que les ressorts qui tirent la cerce ont tous la même raideur k. Leur donner des raideurs différentes revient à pondérer les nœuds en considérant que certains sont plus ou moins importants, ou plus ou moins "attractifs" que d'autres. C'est l'expérience des analystes qui permet d'établir ces pondérations.

Si tous les ressorts ont même coefficient de raideur k, Le paramètre de lissage, noté souvent λ, exprime le rapport entre la raideur élastique de la réglette et celle des ressorts. λ peut varier entre 0 et +∞ :

  • si λ = 0, les ressorts sont "infiniment" durs par rapport à la cerce. Dans ce cas, la spline passe par les nœuds et l'on obtient une spline naturelle ;
  • si λ tend vers +∞, cela revient à supposer que la cerce devient "infiniment" raide par rapport aux ressorts. Dans ce cas, la spline de lissage tend vers la droite de régression des nœuds.

Pour mieux apprécier l'intensité du lissage, on utilise souvent le paramètre p, tel que :

, c'est-à-dire :
, où p varie entre 0 (exclu) et 1.
p = 1 correspond à λ = 0 : on obtient la spline naturelle passant par les nœuds ;
p→ 0+ correspond à λ → +∞ : la spline obtenue tend vers la droite de régression.

Optimisation du paramètre de lissage[modifier | modifier le code]

Lorsqu'on étudie de nombreuses données de mesure bruitées, l'objectif du lissage est de fournir une estimation non bruitée de la mesure. Si l'on peut estimer la variance du bruit, la variance des écarts entre données brutes et les données lissées comparée à la variance du bruit peut guider le choix du paramètre de lissage.

On applique ce procédé de façon plus systématique de la façon suivante :

Le paramètre de lissage étant donné, supprimons le nœud no i de la série des mesures et déterminons la spline de lissage de paramètre λ avec ce nœud exclu du calcul. L'écart εi pour le nœud no i entre la valeur brute et la valeur de la spline de lissage mesure l'erreur de prévision pour ce nœud. Réitérons cette opération, avec le même paramètre λ, pour les n nœuds :

l'indicateur

est une approximation de la variance de la prévision par spline de lissage sous condition du paramètre λ. On appelle cet indicateur score de validation croisée CV(λ).

En réitérant cette procédure pour plusieurs valeurs de λ, on peut rechercher la valeur du paramètre de lissage qui minimise ce score de validation croisée. Il n'est pas garanti que CV n'aie pas des minimums locaux. Les calculs nécessaires peuvent donc être volumineux et la recherche laborieuse. Heureusement, on dispose d'un algorithme qui permet de déterminer CV(λ) sans effectuer le calcul des splines cubiques de lissage.

Calcul pratique des splines[modifier | modifier le code]

Que ce soit pour l'interpolation ou le lissage, le calcul met en jeu, si les nœuds sont nombreux, de très grosses matrices qui peuvent poser problème lors de la mise en œuvre du calcul. Les matrices utilisées sont très creuses, c'est-à-dire que tous leurs éléments, sauf ceux de trois diagonales principales, sont nuls. Il existe des logiciels mettant en œuvre des méthodes efficaces de stockage de matrices creuses. Néanmoins, les calculs peuvent être longs.

Reinsch (de) donne un algorithme qui utilise la factorisation de Cholesky pour réduire la taille des calculs.

Notes et références[modifier | modifier le code]

  1. Pierre Bézier, « Courbes et surfaces pour la CFAO », Techniques de l'ingénieur Applications des mathématiques, vol. TIB102DUO, no a1440,‎ (lire en ligne, consulté le ).
  2. E. Moulines, « Étude de cas de régression non paramétrique » [PDF].

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :

Articles connexes[modifier | modifier le code]

Bibliographie (splines, B-splines, Dm-splines...)[modifier | modifier le code]

  • Outre les travaux initiaux de De Casteljau et Bézier, les ouvrages de références sont ceux de Pierre Jean Laurent (Approximation et optimisation, Hermann, Paris, 1972), Carl de Boor (A Practical Guide to Splines, Springer Verlag, Berlin-Heidelberg, 1978).
  • D.G. Schweikert, An interpolation curve using a spline in tension, J. Math. and Phys., vol 45, pp. 312-317, 1966.
  • L.L. Schumaker, Fitting surfaces to scattered data, Approximation Théorie II, G.G. Lorentz, C.K. Chui et L.L. Schumaker (éditeurs), Academic Press, 203-269, (1976).
  • M. Atteia, Fonctions "spline" définies sur un ensemble convexe, Numer. Math., 12, 192-210, 1968.
  • R. Arcangéli, Some Applications of Discrete D^{m} Splines, Mathematical Methods in Computer Aided Geometric Design, T. Lyche et L.L. Schumaker (Editeurs), Academic Press, 35-44, 1989.
  • R. Arcangéli, M. C. López-de-Silanes, and J. J. Torrens, Multidimensional minimizing splines. Theory and applications, Grenoble Sciences, pp.1-4020, 2004.
  • J. Duchon, Splines Minimizing Rotation- Invariant Semi- Norms in Sobolev Spaces, Lecture Notes in Math., 571, 85-100, Springer, 1977.
  • C. Gout, Z. Lambert and D. Apprato, Data approximation : mathematical modelling and numerical simulations, (ISBN 978-2-7598-2367-3), EDP Sciences, 2019.
  • G. Demengel et J. P. Pouget, Modèles de Bézier, des B-splines et des NURBS, Ellipses, , 286 p. (ISBN 978-2-7298-9806-9)
  • Michelle Schatzman, Analyse numérique : : Approche mathématique, Paris, Dunod, coll. « Sciences Sup », , 480 p. (ISBN 978-2-10-048732-5).

Liens externes[modifier | modifier le code]