Lemme de Cousin — Wikipédia

En mathématiques, le lemme de Cousin (du nom du mathématicien français^[1] Pierre Cousin) est une propriété de la droite réelle équivalente à l'existence de la borne supérieure pour les parties non vides et majorées de ℝ. Il joue un rôle important dans l'intégrale de Kurzweil-Henstock, mais permet également de démontrer directement des théorèmes d'analyse.

Historique[modifier | modifier le code]

En 1894, Pierre Cousin^[2], alors élève de Henri Poincaré^{[réf. souhaitée]}, démontra une variante du théorème de Borel-Lebesgue^[3], connue parfois à présent sous le nom de théorème de Cousin^{[N 1]}, mais ce travail fut pour l'essentiel ignoré, et fut redécouvert indépendamment par Borel et Lebesgue quelques années plus tard. Le lemme de Cousin en est une simple conséquence dans le cas d'un intervalle réel ; ce nom lui fut donné par Kurzweil et Henstock en raison de l'importance de cette forme du théorème de Borel dans la définition de leur intégrale.

Énoncé[modifier | modifier le code]

Le lemme de Cousin s'énonce comme suit^[4] :

Soit un segment réel $[a, b]$ et soit une fonction $δ$ définie sur $[a, b]$ à valeurs strictement positives (appelée jauge). Alors il existe une subdivision $a = x 0 < x 1 < \dots < x n = b$ et des nombres $t 1, t 2, \dots , t n$ tels que, pour tout $i \in {1, 2, \dots, n}$ , $t i \in [x i -1, x i]$ et $x i - x i -1 \leq δ (t i)$ .

On dit que $t i$ marque le segment $[x i -1, x i]$ , et que la subdivision $(x i)$ marquée par les points $t i$ est $δ$ -fine^[4]^,^[5]. On utilisera souvent le fait qu'alors, $[x i -1, x i]$ est inclus dans $[t i - δ (t i), t i + δ (t i)]$ .

Démonstrations

Ces deux démonstrations s'appuient (directement pour la première^{[N 2]}) sur la propriété de la borne supérieure.

Première méthode^{[réf. souhaitée]}: Considérons l'ensemble C des réels y éléments de [a, b] tels que le segment [a, y] possède une subdivision marquée δ-fine. L'ensemble C est non vide (il contient l'élément y = a) et majoré (par b). Il admet donc une borne supérieure c. Comme c – δ(c) est strictement inférieur à c, il minore un élément d de C. Le segment [a, d] possède alors une subdivision marquée δ-fine. Si d < c, on joint à cette subdivision l'intervalle [d, c] marqué par c ; si d = c, on ne fait rien. Dans les deux cas, on obtient une subdivision marquée δ-fine de [a, c], ce qui prouve que c est élément de C. Il en résulte que c = b : sinon, en choisissant dans [a, b] un élément e > c tel que e – c ≤ δ(c), on pourrait rajouter également l'intervalle [c, e] marqué par c, ce qui donnerait une subdivision marquée δ-fine de [a, e], impliquant que e appartient à C et contredisant la maximalité de c.
Seconde méthode^[4]^,^[5]^,^[6]: Raisonnons par l'absurde en supposant que $[a, b]$ n'a pas de subdivision marquée $δ$ -fine (donc $a < b$ ), puis par dichotomie. Si les deux segments $[a, a + b / 2]$ et $[a + b / 2, b]$ en avaient chacun une, en les juxtaposant, on en aurait une pour $[a, b]$ . Donc l'un au moins des deux n'en a pas. On peut ainsi définir par récurrence deux suites dans $[a, b]$ , $(a n)$ croissante et $(b n)$ décroissante, telles que $b n - a n = (b - a)/2 n$ et qu'aucun des segments $[a n, b n]$ n'ait de subdivision marquée $δ$ -fine. Soit $c$ la limite commune de ces deux suites adjacentes. En considérant $[a n, b n]$ marqué par $c$ , avec $n$ assez grand pour que $(b - a)/2 n \leq δ (c)$ , on obtient une contradiction.

L'intégrale de Kurzweil-Henstock[modifier | modifier le code]

Article détaillé : Intégrale de Kurzweil-Henstock.

L'intégrale de Riemann est une définition de l'intégrale généralement accessible aux étudiants de premier cycle universitaire, mais elle présente plusieurs inconvénients. Un certain nombre de fonctions relativement simples ne possèdent pas d'intégrale au sens de Riemann, par exemple la fonction de Dirichlet. Par ailleurs, cette théorie de l'intégration rend malaisées les démonstrations et l'utilisation des théorèmes puissants d'intégration, tels que le théorème de convergence dominée, le théorème de convergence monotone ou le théorème d'interversion série-intégrale. Ces lacunes sont comblées par l'intégrale de Lebesgue mais celle-ci est plus complexe et difficilement accessible dans les premières années du supérieur.

Kurzweil et Henstock ont proposé une théorie de l'intégration, guère plus difficile que la théorie de Riemann, mais aussi puissante que la théorie de Lebesgue, en posant^[7] :

Une fonction $f$ bornée ou non sur un segment $[a, b]$ est intégrable au sens de Kurzweil-Henstock, d'intégrale $I$ , si, pour tout $ε > 0$ , il existe une fonction jauge $δ$ telle que, pour toute subdivision marquée $((x i), (t i))$ $δ$ -fine :
$\left|\sum _{i=1}^{n}(x_{i}-x_{i-1})f(t_{i})-I\right|\leq \varepsilon .$

Si l'on prend des jauges constantes, on retrouve l'intégrale de Riemann.

Dans cette théorie, le lemme de Cousin joue un rôle essentiel.

Quelques applications en analyse[modifier | modifier le code]

Nous donnons ci-dessous quelques exemples de propriétés susceptibles d'être directement démontrées au moyen du lemme de Cousin. Dans chacun des cas, il suffit de choisir une jauge adéquate.

Existence de la borne supérieure[modifier | modifier le code]

La propriété de la borne supérieure, qui a permis de démontrer le lemme de Cousin pour ℝ, lui est en fait équivalente (pour tout corps totalement ordonné K)^[8].

En effet, si A est une partie de K sans borne supérieure, contenant un élément $a$ et majorée par un élément $b$ , montrons que le lemme de Cousin n'est pas satisfait pour la jauge suivante sur $[a, b]$ :

si $t$ ne majore pas A, il existe $c$ dans A tel que $t < c$ . On prend alors $δ (t)$ dans $]0, c - t [$ .
si $t$ est un majorant de A, il existe un majorant $c$ de A tel que $c < t$ (puisque par hypothèse, $t$ n'est pas une borne supérieure de A). On pose alors $δ (t) = t - c$ .

Si $[a, b]$ possédait une subdivision marquée $((x i), (t i))$ $δ$ -fine, on aurait :

si $t i$ ne majore pas A alors $x i$ non plus (car $x i - t i \leq x i - x i -1 \leq δ (t i) < c - t i$ pour un certain $c$ dans A), donc si $x i$ majore A alors $t i$ aussi ;
si $t i$ majore A alors $x i -1$ aussi (car $t i - x i -1 \leq x i - x i -1 \leq δ (t i) = t i - c$ pour un certain majorant $c$ de A).

Par conséquent, de proche en proche (à partir de $b$ ) tous les $x i$ et les $t i$ majoreraient A, ce qui contredirait l'hypothèse initiale ( $a = x 0$ serait le plus grand élément de A).

Le théorème des bornes[modifier | modifier le code]

Soit $f$ continue sur un segment $[a, b]$ . Supposons que $f$ n'admet pas de maximum et montrons qu'alors, le lemme de Cousin n'est pas satisfait pour la jauge suivante sur $[a, b]$ : pour tout $t$ dans $[a, b]$ , puisque $f (t)$ n'est pas maximum, il existe $y$ tel que $f (t) < f (y)$ ; l'application $f$ étant continue, il existe $δ (t) > 0$ tel que $f ([t - δ (t), t + δ (t)]) < f (y)$ . Si $[a, b]$ possédait une subdivision marquée $((x i), (t i))$ $δ$ -fine, on aurait : pour chaque $i$ , il existe $y i$ tel que $f (t i) < f (y i)$ . Soit $k$ tel que $f (y k)$ soit le plus grand des $f (y i)$ . L'élément $y k$ est dans l'un des intervalles $[x i -1, x i]$ de la subdivision, mais il doit alors vérifier, comme les autres éléments de cet intervalle : $f (y k) < f (y i)$ , ce qui est contradictoire avec la maximalité de $f (y k)$ .

Le théorème des valeurs intermédiaires[modifier | modifier le code]

Soit $f$ continue sur $[a, b]$ et ne s'annulant pas. Montrons que $f$ est de signe constant, en appliquant le lemme de Cousin à la jauge suivante sur $[a, b]$ :

si $f (t) < 0$ , on prend $δ (t) > 0$ tel que $f ([t - δ (t), t + δ (t)]) < 0$ ;
si $f (t) > 0$ , on prend $δ (t) > 0$ tel que $f ([t - δ (t), t + δ (t)]) > 0$ .

Soit $((x i), (t i))$ une subdivision marquée $δ$ -fine, alors $f$ est de signe constant sur chaque intervalle $[x i -1, x i]$ donc sur tout l'intervalle $[a, b]$ .

Le théorème de Heine dans le cas réel[modifier | modifier le code]

Soit $f$ continue sur $[a, b]$ , et soit $ε > 0$ . Pour tout $t$ , il existe $δ (t) > 0$ tel que $f ([t - δ (t), t + δ (t)])$ est inclus dans $] f (t) - ε /2, f (t) + ε /2[$ .

Soient $((x i), (t i))$ une subdivision marquée $δ /2$ -fine, puis $η$ le plus petit des $δ (t i)/2$ . Si $x$ et $y$ sont tels que $| x - y | \leq η$ , et si $x$ est dans l'intervalle $[x i -1, x i]$ , alors $| x - t i | \leq δ (t i)/2$ et $| y - t i | \leq δ (t i)/2 + η \leq δ (t i)$ , de sorte que $f (x)$ et $f (y)$ sont tous deux dans $f ([t i - δ (t i), t i + δ (t i)])$ donc dans $] f (t i) - ε /2, f (t i) + ε /2[$ . Il en résulte que $| f (x) - f (y)| < ε$ . On a ainsi montré que $f$ est uniformément continue^[9].

Approximation d'une fonction continue par des fonctions en escalier[modifier | modifier le code]

Soit $f$ continue sur $[a, b]$ , et soit $ε > 0$ . L'application $f$ étant continue, pour tout $t$ de $[a, b]$ , il existe $δ (t) > 0$ tel que $f (] t - δ (t), t + δ (t)[)$ est inclus dans $] f (t) - ε, f (t) + ε [$ . Soient $((x i), (t i))$ une subdivision marquée $δ$ -fine, puis $φ$ la fonction en escalier définie comme suit :

$φ (x i) = f (x i)$ ;
pour tout élément $x$ de $] x i -1, x i [$ , $φ (x) = f (t i)$ .

Alors, $φ$ approche $f$ uniformément à $ε$ près.

Le théorème de relèvement[modifier | modifier le code]

Soit $f$ continue sur $[a, b]$ et à valeurs dans le cercle unité 𝕌 du plan complexe. Pour tout $t$ , il existe $δ (t) > 0$ tel que $f ([t - δ (t), t + δ (t)])$ soit inclus dans 𝕌 privé d'un point. L'application $f$ possède alors un relèvement local sur $[t - δ (t), t + δ (t)]$ . Par exemple, si $f ([t - δ (t), t + δ (t)])$ est inclus dans 𝕌\{–1}, on prendra comme relèvement (à un multiple de $2π$ près) la fonction $θ$ égale à $arccos (Re (f))$ si $Im (f) \geq 0$ et à $-arccos(Re(f))$ si $Im(f) \leq 0$ . Si l'on considère une subdivision marquée $δ$ -fine $((x i), (t i))$ de $[a, b]$ , on obtient un relèvement local $θ i$ sur chaque sous-intervalle $[x i -1, x i]$ de la subdivision. On obtiendra un relèvement global continu en ajoutant au besoin à la fonction $θ i +1$ le nombre $θ i (x i) - θ i +1 (x i)$ , de façon à obtenir la continuité au point $x i$ .

Le théorème de Bolzano-Weierstrass dans le cas réel[modifier | modifier le code]

Soit une suite réelle bornée, donc à valeurs dans un segment $[a, b]$ .

(i) Si

t

est une valeur d'adhérence de la suite, on prend

δ (t)

quelconque strictement positif.

(ii) Sinon, il existe

δ (t) > 0

tel que l'intervalle

[t - δ (t), t + δ (t)]

ne contienne qu'un nombre fini de termes de la suite.

Le lemme de Cousin affirme l'existence d'une subdivision marquée $δ$ -fine. Cela impose nécessairement au moins un marqueur du type (i), car si tous les marqueurs étaient du type (ii), la suite n'aurait qu'un nombre fini de termes.

Le théorème de Borel-Lebesgue dans le cas réel[modifier | modifier le code]

Soit (O_i) une famille d'ouverts recouvrant un segment [a,b]. Pour tout $t$ de [a,b], $t$ est dans l'un des O_i. Ce dernier étant ouvert, il existe $δ (t) > 0$ tel que l'intervalle $[t - δ (t), t + δ (t)]$ soit inclus dans O_i. Le lemme de Cousin affirme l'existence d'une subdivision marquée $δ$ -fine. Chaque intervalle de cette subdivision est inclus dans l'un des O_i, ce qui définit un recouvrement de [a,b] par un nombre fini d'ouverts O_i^[10].

Fonction continue à dérivée nulle sauf sur un ensemble dénombrable[modifier | modifier le code]

Soit $f$ une fonction continue définie sur un intervalle réel $I$ et dont la dérivée $f '$ est définie et nulle, sauf en un nombre dénombrable de points. Alors $f$ est constante^[11]. En effet, soit $ε > 0$ . Posons :

(i) Si

t

est égal à l'un des points

t n

,

n

entier, en lesquels la dérivée n'est pas définie ou n'est pas nulle, utilisant la continuité de

f

, choisissons

δ (t n) > 0

tel que, pour tout

x

dans

[t n - δ (t n), t n + δ (t n)]

,

| f (x) - f (t n)| < ε / 2 n +1

. Puisque la variation de

f

sur l'intervalle

[t n - δ (t n), t n + δ (t n)]

est au plus

ε / 2 n

, la somme de ces variations sur tous ces intervalles, lorsque

n

décrit l'ensemble des entiers, est majorée par

2 ε

.

(ii) Sinon,

f ' (t) = 0

donc il existe

δ (t) > 0

tel que, pour tout

x

dans

[t - δ (t), t + δ (t)]

, on ait

| f (x) - f (t)| < ε | x - t |

. Puisque la variation de

f

sur l'intervalle

[t - δ (t), t + δ (t)]

est au plus

2 ε

fois la longueur de l'intervalle, la somme de ces variations sur une réunion de tels intervalles est majorée par

2 ε

fois la somme des longueurs des intervalles.

Pour tout $[a, b]$ dans $I$ , le lemme de Cousin fournit une subdivision marquée $δ$ -fine. En distinguant les marqueurs du type (i) et du type (ii), on obtient $| f (b) - f (a)| < 2 ε + 2 ε (b - a)$ , car $b - a$ est un majorant de la somme des longueurs des intervalles de la subdivision du type (ii). L'inégalité étant vraie pour tout $ε > 0$ , il en résulte que $f (a) = f (b)$ .

Fonction lipschitzienne à dérivée nulle presque partout[modifier | modifier le code]

Soit $f$ une fonction $M$ -lipschitzienne sur un intervalle réel $I$ et dont la dérivée $f '$ est définie et nulle presque partout. Alors $f$ est constante^[12]. En effet, soit $ε > 0$ et soit $U$ un ouvert de mesure inférieure à $ε$ contenant les points où la dérivée de $f$ est non nulle ou non définie.

(i) Si

t

est un point de

U

, choisissons

δ (t) > 0

tel que tel que

[t - δ (t), t + δ (t)]

soit inclus dans

U

. Pour tout

x

et tout

y

dans cet intervalle,

| f (x) - f (y)| \leq M | x - t |

. Remarquons que la variation de

f

sur cet intervalle est au plus

M

fois la longueur de l'intervalle, et que la somme des longueurs de tels intervalles disjoints (sauf en leur extrémité) est inférieure à la mesure de

U

.

(ii) Sinon,

f ' (t) = 0

donc il existe

δ (t) > 0

tel que, pour tout pour tout

x

dans

[t - δ (t), t + δ (t)]

, on ait

| f (x) - f (t)| < ε | x - t |

. Puisque la variation de

f

sur l'intervalle

[t - δ (t), t + δ (t)]

est au plus

2 ε

fois la longueur de l'intervalle, la somme de ces variations sur une réunion de tels intervalles est majorée par

2 ε

fois la somme des longueurs des intervalles.

Pour tout $[a, b]$ dans $I$ , le lemme de Cousin fournit une subdivision marquée $δ$ -fine. En distinguant les marqueurs du type (i) et du type (ii), on obtient $| f (b) - f (a)| < M ε + 2 ε (b - a)$ , car $b - a$ est un majorant de la somme des longueurs des intervalles de la subdivision du type (ii). L'inégalité étant vraie pour tout $ε > 0$ , il en résulte que $f (a) = f (b)$ .

Une démonstration analogue s'applique aux fonctions absolument continues^[12].

Le théorème fondamental de l'analyse[modifier | modifier le code]

Article détaillé : Second théorème fondamental de l'analyse.

Soit $F$ dérivable sur $[a, b]$ de dérivée $f$ . Alors $f$ , bien que non nécessairement continue, est KH-intégrable et $\int _{a}^{b}f(t)\,{\rm {d}}t=F(b)-F(a)$ ^[13].

En effet, soit $ε > 0$ . Pour tout $t$ de $[a, b]$ , il existe $δ (t) > 0$ tel que, pour tout $x$ dans $[a, b]$ tel que $0 < | x - t | \leq δ (t)$ , on ait :

\left|{\frac {F(x)-F(t)}{x-t}}-f(t)\right|\leq \varepsilon

ou encore : pour tout $x$ dans $[a, b]$ tel que $| x - t | \leq δ (t)$ ,

\left|F(x)-F(t)-(x-t)f(t)\right|\leq \varepsilon |x-t|.

Pour toute subdivision marquée $((x i), (t i))$ $δ$ -fine, on aura donc :

{\begin{aligned}\left|F(x_{i})-F(x_{i-1})-(x_{i}-x_{i-1})f(t_{i})\right|&\leq \left|F(x_{i})-F(t_{i})-(x_{i}-t_{i})f(t_{i})\right|+\left|F(t_{i})-F(x_{i-1})-(t_{i}-x_{i-1})f(t_{i})\right|\\&\leq \varepsilon (x_{i}-t_{i})+\varepsilon (t_{i}-x_{i-1})\\&=\varepsilon (x_{i}-x_{i-1})\end{aligned}}

et en sommant ces inégalités :

\left|F(b)-F(a)-\sum _{i=1}^{n}(x_{i}-x_{i-1})f(t_{i})\right|\leq \varepsilon (b-a).

Or cette inégalité signifie que $f$ est KH-intégrable et que son intégrale vaut $F (b) - F (a)$ .

On peut montrer que la conclusion reste vraie si $F$ est dérivable sauf en un nombre dénombrable de points^[14].

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

↑ Le théorème de Cousin dit que si une jauge $δ$ est définie sur une partie E fermée et bornée du plan (le résultat est en fait vrai pour un espace métrique compact quelconque), il existe une suite finie de points de E, $t 1, t 2, \dots , t n$ , telle que E est recouvert par la réunion des disques de centre $t i$ et de rayon $δ (t i)$ .
↑ Proche de celle du théorème de Borel-Lebesgue.

Références[modifier | modifier le code]

↑ Curieusement, (en) Brian S. Thomson, « Rethinking the elementary real analysis course », Amer. Math. Monthly, vol. 114,‎ 2007, p. 469-490 (lire en ligne) le dit belge (p. 472).
↑ Pierre Cousin, « Sur les fonctions de n variables complexes », Acta Math., vol. 19,‎ 1895, p. 1-62 (DOI 10.1007/BF02402869).
↑ Bernard Maurey et Jean-Pierre Tacchi, « La genèse du théorème de recouvrement de Borel », Rev. Hist. Math., vol. 11, n^o 2,‎ 2005, p. 163-204 (lire en ligne) (p. 172-173). Voir aussi Bernard Maurey, « Théorèmes d'Ascoli, de Peano et de Schauder », prépa agreg, sur IMJ-PRG, février 2007, p. 8.
↑ ^{a b et c} Jean-Pierre Ramis, André Warusfel et al., Mathématiques Tout-en-un pour la Licence 2, Dunod, 2014, 2^e éd. (lire en ligne), p. 591.
↑ ^{a et b} Jean-Pierre Demailly, Théorie élémentaire de l'intégration : l'intégrale de Kurzweil-Henstock, 2011 (lire en ligne), p. 11-12.
↑ (en) Lee Peng Yee et Rudolf Výborný, The Integral : An Easy Approach after Kurzweil and Henstock, Cambridge University Press, 2000, 311 p. (ISBN 978-0-521-77968-5, présentation en ligne, lire en ligne), p. 25, avec une légère variante (p. 23) dans la définition de la $δ$ -finesse.
↑ J.-P. Ramis, A. Warusfel et al., Mathématiques Tout-en-un pour la Licence 3, Dunod, 2015 (lire en ligne), p. 202.
↑ Yee et Výborný 2000, p. 28.
↑ Thomson 2007, Example 3.
↑ Thomson 2007, Example 1.
↑ Thomson 2007, Example 4.
↑ ^{a et b} Thomson 2007, Example 5.
↑ Ramis, Warusfel et al. 2015, p. 218.
↑ Thomson 2007, Lemma 4.

Portail de l'analyse

[4] Le théorème de Cousin dit que si une jauge $δ$ est définie sur une partie E fermée et bornée du plan (le résultat est en fait vrai pour un espace métrique compact quelconque), il existe une suite finie de points de E, $t 1, t 2, \dots , t n$ , telle que E est recouvert par la réunion des disques de centre $t i$ et de rayon $δ (t i)$ .

[7] Proche de celle du théorème de Borel-Lebesgue.

[1] Curieusement, (en) Brian S. Thomson, « Rethinking the elementary real analysis course », Amer. Math. Monthly, vol. 114,‎ 2007, p. 469-490 (lire en ligne) le dit belge (p. 472).

[2] Pierre Cousin, « Sur les fonctions de n variables complexes », Acta Math., vol. 19,‎ 1895, p. 1-62 (DOI 10.1007/BF02402869).

[3] Bernard Maurey et Jean-Pierre Tacchi, « La genèse du théorème de recouvrement de Borel », Rev. Hist. Math., vol. 11, n^o 2,‎ 2005, p. 163-204 (lire en ligne) (p. 172-173). Voir aussi Bernard Maurey, « Théorèmes d'Ascoli, de Peano et de Schauder », prépa agreg, sur IMJ-PRG, février 2007, p. 8.

[RW-5] {a b et c} Jean-Pierre Ramis, André Warusfel et al., Mathématiques Tout-en-un pour la Licence 2, Dunod, 2014, 2^e éd. (lire en ligne), p. 591.

[D-6] {a et b} Jean-Pierre Demailly, Théorie élémentaire de l'intégration : l'intégrale de Kurzweil-Henstock, 2011 (lire en ligne), p. 11-12.

[8] (en) Lee Peng Yee et Rudolf Výborný, The Integral : An Easy Approach after Kurzweil and Henstock, Cambridge University Press, 2000, 311 p. (ISBN 978-0-521-77968-5, présentation en ligne, lire en ligne), p. 25, avec une légère variante (p. 23) dans la définition de la $δ$ -finesse.

[9] J.-P. Ramis, A. Warusfel et al., Mathématiques Tout-en-un pour la Licence 3, Dunod, 2015 (lire en ligne), p. 202.

[10] Yee et Výborný 2000, p. 28.

[11] Thomson 2007, Example 3.

[12] Thomson 2007, Example 1.

[13] Thomson 2007, Example 4.

[ThomsonExample5-14] {a et b} Thomson 2007, Example 5.

[15] Ramis, Warusfel et al. 2015, p. 218.

[16] Thomson 2007, Lemma 4.

[1]

[2]

[3]

[N 1]

[4]

[5]

[N 2]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]