Avertissement

Ce contenu a été généré par une intelligence artificielle (LLM) et peut contenir des imprécisions ou des erreurs malgré notre relecture attentive. Il s'agit d'un outil d'apprentissage et non d'une référence académique.

Si vous constatez des erreurs, merci de nous les signaler via la page "À propos".

Fonctions différentiables - fiches de révision (A)

Qu'est-ce qu'une dérivée partielle ?

Solution

Une dérivée partielle d'une fonction de plusieurs variables est sa dérivée par rapport à l'une de ces variables, en considérant les autres variables comme des constantes.

Soit ff une fonction définie sur un ouvert URnU \subset \mathbb{R}^n et aUa \in U. La dérivée partielle de ff par rapport à sa kk-ième variable xkx_k au point aa est la limite, si elle existe :

fxk(a)=limt0f(a1,,ak+t,,an)f(a1,,an)t\frac{\partial f}{\partial x_k}(a) = \lim_{t \to 0} \frac{f(a_1, \dots, a_k+t, \dots, a_n) - f(a_1, \dots, a_n)}{t}

En pratique, pour calculer fxk\frac{\partial f}{\partial x_k}, on dérive ff par rapport à xkx_k en utilisant les règles de dérivation usuelles, comme si toutes les autres variables (x1,,xk1,xk+1,,xnx_1, \dots, x_{k-1}, x_{k+1}, \dots, x_n) étaient des constantes.

Exemple:

Pour f(x,y)=x2y+3y2f(x,y) = x^2y + 3y^2, la dérivée partielle par rapport à xx est :

fx(x,y)=2xy\frac{\partial f}{\partial x}(x,y) = 2xy

(on traite yy comme une constante).

La dérivée partielle par rapport à yy est :

fy(x,y)=x2+6y\frac{\partial f}{\partial y}(x,y) = x^2 + 6y

(on traite xx comme une constante).

Qu'est-ce qu'une fonction différentiable en un point ?

Solution

Une fonction f:URnRpf : U \subset \mathbb{R}^n \to \mathbb{R}^p est dite différentiable en un point aUa \in U si sa variation locale peut être approchée par une application linéaire.

Formellement, il doit exister une application linéaire La:RnRpL_a : \mathbb{R}^n \to \mathbb{R}^p telle que :

f(a+h)=f(a)+La(h)+o(h)f(a+h) = f(a) + L_a(h) + o(\|h\|)

Cela signifie que l'erreur commise en approchant f(a+h)f(a)f(a+h) - f(a) par La(h)L_a(h) tend vers zéro plus vite que h\|h\| lorsque hh tend vers 00.

limh0f(a+h)f(a)La(h)h=0\lim_{h \to 0} \frac{\|f(a+h) - f(a) - L_a(h)\|}{\|h\|} = 0

L'application linéaire LaL_a, si elle existe, est unique et s'appelle la différentielle de ff en aa, notée dfadf_a.

Intuition:

Tout comme une fonction dérivable d'une variable peut être approchée par sa tangente, une fonction différentiable de plusieurs variables peut être approchée localement par une application affine xf(a)+dfa(xa)x \mapsto f(a) + df_a(x-a). La différentielle dfadf_a est la généralisation de la dérivée pour les fonctions de plusieurs variables.

Comment calculer les dérivées partielles de la fonction f(x,y,z)=x2y3+5yz2cos(x)f(x,y,z) = x^2 y^3 + 5yz^2 - \cos(x) ?

Solution

Pour calculer chaque dérivée partielle, on traite les autres variables comme des constantes et on applique les règles de dérivation habituelles.

1. Dérivée partielle par rapport à xx (f/x\partial f / \partial x):

On considère yy et zz comme des constantes.

fx(x,y,z)=x(x2y3)+x(5yz2)x(cos(x))\frac{\partial f}{\partial x}(x,y,z) = \frac{\partial}{\partial x}(x^2 y^3) + \frac{\partial}{\partial x}(5yz^2) - \frac{\partial}{\partial x}(\cos(x))

=(2x)y3+0(sin(x))= (2x) \cdot y^3 + 0 - (-\sin(x))

=2xy3+sin(x)= 2xy^3 + \sin(x)

2. Dérivée partielle par rapport à yy (f/y\partial f / \partial y):

On considère xx et zz comme des constantes.

fy(x,y,z)=y(x2y3)+y(5yz2)y(cos(x))\frac{\partial f}{\partial y}(x,y,z) = \frac{\partial}{\partial y}(x^2 y^3) + \frac{\partial}{\partial y}(5yz^2) - \frac{\partial}{\partial y}(\cos(x))

=x2(3y2)+5z2(1)0= x^2 \cdot (3y^2) + 5z^2 \cdot (1) - 0

=3x2y2+5z2= 3x^2y^2 + 5z^2

3. Dérivée partielle par rapport à zz (f/z\partial f / \partial z):

On considère xx et yy comme des constantes.

fz(x,y,z)=z(x2y3)+z(5yz2)z(cos(x))\frac{\partial f}{\partial z}(x,y,z) = \frac{\partial}{\partial z}(x^2 y^3) + \frac{\partial}{\partial z}(5yz^2) - \frac{\partial}{\partial z}(\cos(x))

=0+5y(2z)0= 0 + 5y \cdot (2z) - 0

=10yz= 10yz

Quel est le lien entre la différentiabilité et la continuité d'une fonction en un point ?

Solution

Le lien est une implication à sens unique :

Différentiable     \implies Continue

Si une fonction ff est différentiable en un point aa, alors elle est nécessairement continue en ce point aa.

Preuve rapide :

Si ff est différentiable en aa, on a f(a+h)=f(a)+dfa(h)+o(h)f(a+h) = f(a) + df_a(h) + o(\|h\|). Quand h0h \to 0, dfa(h)df_a(h) tend vers 00 (car dfadf_a est linéaire et continue) et o(h)o(\|h\|) tend vers 00. Donc limh0f(a+h)=f(a)\lim_{h \to 0} f(a+h) = f(a), ce qui est la définition de la continuité en aa.

La réciproque est fausse : Continue ̸    \not\implies Différentiable

Une fonction peut être continue en un point sans y être différentiable. Les "coins" ou les "pointes" sont des exemples classiques.

Contre-exemple :

La fonction f:R2Rf: \mathbb{R}^2 \to \mathbb{R} définie par f(x,y)=x+yf(x,y) = |x| + |y| est continue en (0,0)(0,0). Cependant, elle n'est pas différentiable en (0,0)(0,0) car elle possède un "coin" à l'origine qui ne peut pas être approché par un plan (une application affine).

Qu'est-ce que la matrice jacobienne d'une fonction f:RnRpf: \mathbb{R}^n \to \mathbb{R}^p ?

Solution

La matrice jacobienne d'une fonction ff en un point aa, notée Jf(a)J_f(a), est la matrice qui contient toutes les dérivées partielles de premier ordre des fonctions composantes de ff. C'est une matrice de taille p×np \times n.

Si f(x1,,xn)=(f1(x1,,xn),,fp(x1,,xn))f(x_1, \dots, x_n) = (f_1(x_1, \dots, x_n), \dots, f_p(x_1, \dots, x_n)), alors sa matrice jacobienne est :

Jf(a)=(f1x1(a)f1x2(a)f1xn(a)f2x1(a)f2x2(a)f2xn(a)fpx1(a)fpx2(a)fpxn(a)) J_f(a) = \begin{pmatrix} \frac{\partial f_1}{\partial x_1}(a) & \frac{\partial f_1}{\partial x_2}(a) & \cdots & \frac{\partial f_1}{\partial x_n}(a) \\ \frac{\partial f_2}{\partial x_1}(a) & \frac{\partial f_2}{\partial x_2}(a) & \cdots & \frac{\partial f_2}{\partial x_n}(a) \\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial f_p}{\partial x_1}(a) & \frac{\partial f_p}{\partial x_2}(a) & \cdots & \frac{\partial f_p}{\partial x_n}(a) \end{pmatrix}

Structure :

  • Le nombre de lignes (pp) est la dimension de l'espace d'arrivée. La ligne ii correspond aux dérivées partielles de la ii-ème composante fif_i.
  • Le nombre de colonnes (nn) est la dimension de l'espace de départ. La colonne jj correspond aux dérivées par rapport à la jj-ème variable xjx_j.

Comment la matrice jacobienne est-elle liée à la différentielle d'une fonction ?

Solution

La matrice jacobienne est la représentation matricielle de la différentielle dans les bases canoniques.

Si une fonction f:RnRpf: \mathbb{R}^n \to \mathbb{R}^p est différentiable en un point aa, sa différentielle dfadf_a est une application linéaire de Rn\mathbb{R}^n dans Rp\mathbb{R}^p. La matrice jacobienne Jf(a)J_f(a) est la matrice qui représente cette application linéaire.

Pour tout vecteur hRnh \in \mathbb{R}^n (vu comme un vecteur colonne), l'action de la différentielle peut être calculée par une multiplication matricielle :

dfa(h)=Jf(a)hdf_a(h) = J_f(a) \cdot h

Le développement limité d'ordre 1 s'écrit alors de manière très pratique :

f(a+h)=f(a)+Jf(a)h+o(h)f(a+h) = f(a) + J_f(a)h + o(\|h\|)

Cette relation est fondamentale car elle connecte le concept abstrait de la différentielle à un objet concret et calculable, la matrice jacobienne.

Qu'est-ce qu'une fonction de classe C1\mathcal{C}^1 sur un ouvert UU ?

Solution

Une fonction f:URnRpf : U \subset \mathbb{R}^n \to \mathbb{R}^p est dite de classe C1\mathcal{C}^1 sur l'ouvert UU si elle satisfait deux conditions :

  1. Existence des dérivées partielles : Toutes les dérivées partielles fixj\frac{\partial f_i}{\partial x_j} existent en tout point de UU.

  2. Continuité des dérivées partielles : Chacune des fonctions (x1,,xn)fixj(x1,,xn)(x_1, \dots, x_n) \mapsto \frac{\partial f_i}{\partial x_j}(x_1, \dots, x_n) est une fonction continue sur UU.

Être de classe C1\mathcal{C}^1 est une condition de régularité forte. Cela signifie non seulement que la fonction a des dérivées partielles, mais que ces dérivées varient de manière continue.

Hiérarchie de la régularité :

Classe C1    Diffeˊrentiable    Continue\text{Classe } \mathcal{C}^1 \implies \text{Différentiable} \implies \text{Continue}

L'existence de toutes les dérivées partielles en un point garantit-elle que la fonction est continue en ce point ?

Solution

Non, absolument pas. C'est une idée fausse courante. Une fonction peut avoir toutes ses dérivées partielles en un point sans même y être continue.

Contre-exemple classique :

Soit la fonction f:R2Rf : \mathbb{R}^2 \rightarrow \mathbb{R} définie par :

f(x,y)={xyx2+y2si (x,y)(0,0)0si (x,y)=(0,0)f(x,y) = \begin{cases} \frac{xy}{x^2+y^2} & \text{si } (x,y) \neq (0,0) \\ 0 & \text{si } (x,y) = (0,0) \end{cases}

  1. Existence des dérivées partielles en (0,0) :

    On utilise la définition :

    fx(0,0)=limt0f(t,0)f(0,0)t=limt000t=0\frac{\partial f}{\partial x}(0,0) = \lim_{t \to 0} \frac{f(t,0) - f(0,0)}{t} = \lim_{t \to 0} \frac{0 - 0}{t} = 0

    fy(0,0)=limt0f(0,t)f(0,0)t=limt000t=0\frac{\partial f}{\partial y}(0,0) = \lim_{t \to 0} \frac{f(0,t) - f(0,0)}{t} = \lim_{t \to 0} \frac{0 - 0}{t} = 0

    Les deux dérivées partielles existent et sont nulles à l'origine.

  2. Non-continuité en (0,0) :

    Si on s'approche de l'origine le long de la droite y=xy=x, on a :

    limx0f(x,x)=limx0xxx2+x2=limx0x22x2=12\lim_{x \to 0} f(x,x) = \lim_{x \to 0} \frac{x \cdot x}{x^2+x^2} = \lim_{x \to 0} \frac{x^2}{2x^2} = \frac{1}{2}

    Comme la limite (1/2) est différente de la valeur de la fonction en ce point (f(0,0)=0f(0,0)=0), la fonction n'est pas continue en (0,0)(0,0).

Puisqu'elle n'est pas continue, elle ne peut pas non plus être différentiable en (0,0)(0,0).

Quel est le principal avantage de savoir qu'une fonction est de classe C1\mathcal{C}^1 ?

Solution

Le principal avantage est un théorème fondamental qui fournit un critère simple et puissant pour prouver la différentiabilité.

Théorème :

Si une fonction f:URnRpf: U \subset \mathbb{R}^n \to \mathbb{R}^p est de classe C1\mathcal{C}^1 sur un ouvert UU, alors ff est différentiable en tout point de UU.

Pourquoi est-ce si utile ?

Vérifier la différentiabilité d'une fonction en utilisant la définition (avec la limite et le o(h)o(\|h\|)) peut être très long et complexe.

Le théorème offre une méthode beaucoup plus directe en pratique :

  1. Calculer toutes les dérivées partielles de la fonction.
  2. Étudier la continuité de ces dérivées partielles. Si elles sont toutes continues (ce qui est souvent le cas pour les fonctions construites à partir de fonctions usuelles comme les polynômes, sin, cos, exp...), alors on peut directement conclure que la fonction est différentiable.

Quelle est la formule de la règle de la chaîne pour la composition de fonctions gfg \circ f en termes de matrices jacobiennes ?

Solution

La règle de la chaîne (ou "chain rule") permet de calculer la jacobienne d'une fonction composée.

Formule :

Soient f:URnVRmf: U \subset \mathbb{R}^n \to V \subset \mathbb{R}^m et g:VRpg: V \to \mathbb{R}^p deux fonctions différentiables. La jacobienne de la composée h=gfh = g \circ f au point aUa \in U est donnée par le produit des matrices jacobiennes :

Jgf(a)=Jg(f(a))Jf(a)J_{g \circ f}(a) = J_g(f(a)) \cdot J_f(a)

Explication des termes :

  • Jgf(a)J_{g \circ f}(a) : La jacobienne de la fonction composée hh en aa. C'est une matrice p×np \times n.
  • Jg(f(a))J_g(f(a)) : La jacobienne de gg, évaluée au point image f(a)f(a). C'est une matrice p×mp \times m.
  • Jf(a)J_f(a) : La jacobienne de ff, évaluée en aa. C'est une matrice m×nm \times n.

Attention à l'ordre !

L'ordre de la multiplication matricielle est crucial et non commutatif. Il suit l'ordre de la composition des fonctions : la jacobienne de la fonction "extérieure" (gg) est à gauche, et celle de la fonction "intérieure" (ff) est à droite. La multiplication est bien définie : (p×m)(m×n)(p×n)(p \times m) \cdot (m \times n) \to (p \times n).

Qu'est-ce que le gradient d'une fonction numérique f:RnRf: \mathbb{R}^n \to \mathbb{R} ?

Solution

Le gradient d'une fonction numérique (ou champ scalaire) f:URnRf: U \subset \mathbb{R}^n \to \mathbb{R} en un point aa est le vecteur de Rn\mathbb{R}^n dont les composantes sont les dérivées partielles de ff en ce point.

Il est noté f(a)\nabla f(a) (lire "nabla f de a") et est défini par :

\frac{\partial f}{\partial x_1}(a) \\ \frac{\partial f}{\partial x_2}(a) \\ \vdots \\ \frac{\partial f}{\partial x_n}(a) \end{pmatrix} $$ **Relation avec la Jacobienne :** Pour une fonction numérique ($p=1$), la jacobienne $J_f(a)$ est une matrice ligne $1 \times n$. Le gradient est simplement la transposée de cette matrice jacobienne : $$ \nabla f(a) = (J_f(a))^T $$ Le gradient est un concept fondamental en optimisation et en physique, car il pointe dans la direction où la fonction augmente le plus rapidement.

Quelle est l'interprétation géométrique du vecteur gradient f(a)\nabla f(a) ?

Solution

Le vecteur gradient f(a)\nabla f(a) a deux interprétations géométriques majeures en un point aa où il n'est pas nul :

1. Direction de la plus forte pente :

Le vecteur f(a)\nabla f(a) pointe dans la direction dans laquelle la fonction ff augmente le plus rapidement à partir du point aa. La norme du gradient, f(a)\|\nabla f(a)\|, donne la valeur de ce taux d'accroissement maximal (la pente la plus forte).

Exemple : Si f(x,y)f(x,y) représente l'altitude d'une montagne, le gradient en un point (x,y)(x,y) est un vecteur sur la carte qui indique la direction de la pente la plus raide pour monter.

2. Orthogonalité aux lignes de niveau :

Le vecteur f(a)\nabla f(a) est orthogonal (perpendiculaire) à la ligne de niveau (ou surface de niveau en 3D) de la fonction ff qui passe par le point aa. Une ligne de niveau est l'ensemble des points xx tels que f(x)=Cf(x) = C pour une constante CC.

Exemple : Sur une carte topographique, les lignes de niveau relient les points de même altitude. Le gradient en un point est perpendiculaire à la ligne de niveau passant par ce point.

Pour une fonction numérique différentiable ff, comment s'exprime sa différentielle dfa(h)df_a(h) à l'aide du gradient ?

Solution

Si f:URnRf: U \subset \mathbb{R}^n \to \mathbb{R} est différentiable en aa, sa différentielle dfa(h)df_a(h) peut être exprimée très simplement à l'aide du produit scalaire avec le gradient.

Formule :

Pour tout vecteur hRnh \in \mathbb{R}^n, on a :

dfa(h)=f(a),hdf_a(h) = \langle \nabla f(a), h \rangle

,\langle \cdot, \cdot \rangle est le produit scalaire euclidien usuel.

Détail du calcul :

Rappelons que dfa(h)=Jf(a)hdf_a(h) = J_f(a)h. Comme ff est une fonction numérique, Jf(a)J_f(a) est une matrice ligne 1×n1 \times n et f(a)\nabla f(a) est le vecteur colonne transposé.

Jf(a)=(f(a))T=(fx1(a)fxn(a))J_f(a) = (\nabla f(a))^T = \begin{pmatrix} \frac{\partial f}{\partial x_1}(a) & \cdots & \frac{\partial f}{\partial x_n}(a) \end{pmatrix}

La multiplication matricielle Jf(a)hJ_f(a)h est donc :

(fx1(a)fxn(a))(h1hn)=fx1(a)h1++fxn(a)hn\begin{pmatrix} \frac{\partial f}{\partial x_1}(a) & \cdots & \frac{\partial f}{\partial x_n}(a) \end{pmatrix} \begin{pmatrix} h_1 \\ \vdots \\ h_n \end{pmatrix} = \frac{\partial f}{\partial x_1}(a)h_1 + \dots + \frac{\partial f}{\partial x_n}(a)h_n

Ceci est exactement la définition du produit scalaire f(a),h\langle \nabla f(a), h \rangle.

Énoncez l'inégalité des accroissements finis pour une fonction différentiable f:URf: U \to \mathbb{R}.

Solution

L'inégalité des accroissements finis est une généralisation du théorème des accroissements finis aux fonctions de plusieurs variables. Elle permet de borner la variation d'une fonction entre deux points.

Théorème (Inégalité des Accroissements Finis)

Soit f:URf: U \to \mathbb{R} une fonction différentiable sur un ouvert URnU \subset \mathbb{R}^n. Soient a,bUa, b \in U tels que le segment [a,b][a,b] soit inclus dans UU.

Alors, il existe un point cc sur le segment ]a,b[]a,b[ tel que :

f(b)f(a)=f(c),baf(b) - f(a) = \langle \nabla f(c), b-a \rangle

De cette égalité, on déduit une inégalité très utile en utilisant l'inégalité de Cauchy-Schwarz :

f(b)f(a)f(c)ba|f(b) - f(a)| \le \|\nabla f(c)\| \cdot \|b-a\|

Cela mène à la borne générale suivante :

f(b)f(a)(supc[a,b]f(c))ba|f(b) - f(a)| \le \left( \sup_{c \in [a,b]} \|\nabla f(c)\| \right) \cdot \|b-a\|

En mots : La variation totale de la fonction entre aa et bb est au plus égale à la distance entre les points, multipliée par la plus grande valeur de la norme du gradient (la "pente maximale") rencontrée sur le segment qui les relie.

Que peut-on dire d'une fonction différentiable dont le gradient est nul sur un ouvert connexe par arcs ?

Solution

Si une fonction différentiable f:URf: U \to \mathbb{R} a un gradient nul en tout point d'un ouvert connexe par arcs UU, alors la fonction ff est constante sur UU.

Théorème :

Soit URnU \subset \mathbb{R}^n un ouvert connexe par arcs.

Soit f:URf: U \to \mathbb{R} différentiable.

Si f(x)=0\nabla f(x) = \vec{0} pour tout xUx \in U, alors il existe une constante CRC \in \mathbb{R} telle que f(x)=Cf(x) = C pour tout xUx \in U.

Importance de la connexité par arcs :

L'hypothèse "connexe par arcs" est cruciale. Elle garantit qu'on peut relier n'importe quels deux points de UU par un chemin continu. Le théorème des accroissements finis est appliqué le long de ce chemin pour montrer que la fonction ne varie pas.

Contre-exemple (domaine non connexe) :

Soit UU l'union de deux boules ouvertes disjointes : U=B1B2U = B_1 \cup B_2.

Définissons f(x)=0f(x) = 0 pour xB1x \in B_1 et f(x)=5f(x) = 5 pour xB2x \in B_2.

Le gradient de ff est nul partout sur UU (car ff est localement constante). Cependant, la fonction ff n'est pas constante sur l'ensemble de UU.