Heston à partir de zéro
1/5La variance est vivante
Black-Scholes traite la volatilité comme un nombre fixe estampillé sur le contrat. Il ne change jamais. Le monde ne fonctionne évidemment pas ainsi. Heston corrige cela en donnant à la variance sa propre équation différentielle stochastique.
Dans Black-Scholes, le prix spot suit une seule EDS avec une constante σ. Chaque option, chaque prix d'exercice, chaque échéance utilise la même vol. Le modèle est cohérent en interne mais faux : le marché cote une σ différente pour chaque prix d'exercice. C'est le smile, et BS ne peut pas le produire.
Imaginez le spot comme une voiture et la variance comme le revêtement de la route. Dans BS, la route est un asphalte parfaitement lisse partout. Dans Heston, le revêtement lui-même change -- parfois du gravier, parfois du verglas, parfois du bitume neuf. La voiture réagit à la surface sur laquelle elle roule. Plus la route est cahoteuse, plus le trajet est agité.
Heston dit : le spot évolue comme dans BS mais avec une variable √v au lieu d'une constante σ. Et la variance suit son propre processus de racine carrée à retour à la moyenne :
Deuxième ligne : la variance a sa propre dérive (tirée vers θ) et son propre bruit (mis à l'échelle par σ).
Troisième ligne : les deux mouvements browniens sont corrélés. C'est le moteur derrière le skew.
Cette deuxième équation est un processus CIR (Cox-Ingersoll-Ross) -- le même processus utilisé pour les taux d'intérêt. Il possède un plancher intégré : le √terme de diffusion v diminue à mesure que v approche de zéro, ce qui empêche la variance de devenir négative (dans les bonnes conditions).
Résultat : la vol peut bondir, s'estomper, se regrouper et co-évoluer avec le spot. Tous ces schémas sont visibles sur les marchés réels. BS ne peut en reproduire aucun. Heston, si.
Les cinq paramètres
Heston possède exactement cinq paramètres libres. Chacun raconte une histoire distincte sur le comportement du marché. Apprenez à les lire comme un tableau de bord.
κ (kappa) -- vitesse de retour à la moyenne. À quel point la variance est ramenée vers son niveau de long terme. Un κ élevé signifie que les pics de volatilité sont de courte durée : le processus revient rapidement. Un κ faible signifie que les régimes de volatilité persistent. En crypto,κ tend à être faible -- la volatilité reste élevée après un choc.
θ (theta) -- variance de long terme. Le niveau vers lequel la variance gravite au fil du temps. Si vous prenez √θ, vous obtenez à peu près la volatilité ATM de longue échéance. Pour le BTC, cela se situe typiquement autour de 50-70 % annualisés.
σ (sigma) -- vol-of-vol. À quel point le processus de variance lui-même est erratique. Lorsque σ = 0, il n'y a aucun smile du tout -- vous revenez à un monde de volatilité déterministe. À mesure que σ augmente, les deux ailes du smile se soulèvent. Voyez cela ainsi : plus d'aléatoire dans la variance = queues plus épaisses = options OTM plus chères.
ρ (rho) -- corrélation spot-volatilité. Le lien de direction entre les mouvements du spot et ceux de la volatilité. Un ρ négatif signifie spot en baisse, volatilité en hausse. C'est le paramètre le plus important pour le skew. Nous l'abordons en profondeur dans la section suivante.
v₀ -- variance initiale. Où se situe la variance en ce moment. Si v₀ est au-dessus de θ, les options de courte échéance intègrent le stress actuel tandis que les options de longue échéance reviennent vers la normale. Après un pic de volatilité, v₀ >θ et la structure par terme s'inverse.
Faites glisser les curseurs ci-dessus. Concentrez-vous sur un paramètre à la fois. L'idée la plus importante : ρ incline le smile vers la gauche ou la droite. σ l'élargit. κ/θ/v₀ fixent le niveau et la structure par terme.
Comment la corrélation crée le skew
C'est l'intuition mathématique centrale de Heston. Un ρ négatif signifie que lorsque le spot baisse, la variance tend à monter. Cette seule relation produit tout le smile incliné à gauche que l'on observe sur les marchés actions et crypto.
Voici le mécanisme, étape par étape :
1. Le spot chute (dW₁ est négatif).
2. Parce que ρ < 0, dW₂ tend à être positif.
3. Un dW positif₂ pousse la variance à la hausse.
4. Une variance plus élevée signifie que le sous-jacent est désormais plus volatil.
5. Les puts OTM (strikes bas) ont plus de chances de finir dans la monnaie.
6. Le marché les valorise plus cher. L'aile gauche du smile s'élève.
L'inverse vaut aussi : spot en hausse, vol en baisse. Les options côté call perdent une partie de la prime de volatilité. C'est pourquoi l'aile droite est généralement plus plate que la gauche.
Cliquez entre les trois préréglages ci-dessus. La différence est spectaculaire :
ρ = −0.7: Fort skew à gauche. C'est à cela que ressemblent les marchés actions et crypto. La protection à la baisse est chère car la volatilité s'envole quand le marché chute.
ρ = 0: Smile symétrique. Aucune préférence directionnelle entre le spot et la volatilité. Vous obtenez une courbure pure liée au vol-of-vol, mais sans inclinaison.
ρ = +0.3: Skew à droite. Les options à la hausse sont relativement chères. C'est rare en pratique, mais cela peut survenir sur les marchés de matières premières, où des chocs d'offre font monter à la fois le prix et l'incertitude.
ρ correspond directement à l'exposition vanna. Le vanna est la sensibilité du delta aux variations de volatilité. Quandρ est fortement négatif, les puts OTM ont un vanna positif important : leur delta devient plus négatif à mesure que la volatilité augmente. C'est pourquoi les positions short put deviennent plus dangereuses lors d'un sell-off -- elles sont short vanna.
La fonction caractéristique
La plupart des modèles à vol stochastique exigent une simulation de Monte Carlo pour la valorisation. Heston a une astuce : on peut valoriser les options par inversion de Fourier d'une fonction caractéristique connue. Aucune simulation nécessaire.
La formule standard de Black-Scholes pour le prix d'un call a la forme C = S·N(d₁) − K·e−rTN(d₂). Heston présente une structure analogue :
L'objet clé est la fonction caractéristique φ(u). Elle encode tout sur la distribution de probabilité du log-prix spot à l'échéance. Voyez-la comme l'empreinte digitale de la distribution dans l'espace des fréquences.
Pourquoi cela fonctionne-t-il ? Trois étapes :
1. Fonction génératrice des moments. Comme l'EDS de Heston est affine (linéaire en les variables d'état), sa fonction génératrice des moments peut être résolue en forme fermée. C'est l'accident mathématique qui rend Heston si particulier.
2. Fonction caractéristique = MGF sur l'axe imaginaire. La fonction caractéristique est φ(u) = E[eiu·X] where X = ln(ST). Une fois que vous avez la MGF, vous avez φ.
3. Inverser pour la densité, intégrer pour le prix. L'inversion de Fourier standard permet de retrouver la densité risque-neutre à partir de φ. Intégrer cette densité contre le payoff vous donne le prix de l'option. L'intégrale est unidimensionnelle et converge en quelques microsecondes.
Résultat : un smile complet calculé en millisecondes, pas en minutes. Cela rend la calibration réalisable. Vous pouvez ajuster cinq paramètres à un smile observé en évaluant cette intégrale des milliers de fois dans un optimiseur.
Avant Heston (1993), les modèles à volatilité stochastique existaient mais étaient peu pratiques -- il fallait simuler des trajectoires pour valoriser une seule option. La fonction caractéristique de Heston a rendu la volatilité stochastique utilisable sur un desk de trading. Chaque modèle qui en descend (Bates, double Heston, rough Bergomi) tente de préserver ou d'approximer cette structure de pricing par Fourier.
Quand Heston atteint ses limites
Heston est élégant, mais il a de vraies limites. Le processus de variance peut toucher zéro, la forme du smile est trop rigide pour la crypto, et le problème d'ajustement à cinq paramètres est un champ de mines d'optima locaux.
La condition de Feller. Pour que la variance reste strictement positive, il faut :
En pratique, les paramètres de Heston calibrés violent fréquemment la condition de Feller. Le marché veut plus de vol-of-vol (σ) que ce que la condition de Feller autorise. En cas de violation, le processus de variance peut toucher zéro et doit être « réfléchi » ou « absorbé » -- ce qui crée des complications numériques et rend le modèle moins fiable dans les ailes.
Augmentez σ et observez la condition de Feller se briser. Les trajectoires rouges touchent zéro. Dans un vrai moteur de valorisation, ces contacts avec zéro exigent un traitement spécial qui ralentit les calculs et introduit des erreurs subtiles.
Les smiles crypto sont trop pentus. Les options crypto à courte échéance présentent souvent des skews extrêmement pentus et des ailes larges. Le processus de variance CIR de Heston est trop lisse pour capturer cela. Le comportement des ailes du modèle tend vers une pente constante, mais les vraies ailes crypto sont plus pentues que cela. C'est pourquoi les desks crypto utilisent SVI ou SSVI pour l'ajustement de la surface et considérez Heston comme un outil conceptuel, et non comme un moteur d'ajustement de production.
L'ajustement à cinq paramètres est instable. Différentes combinaisons de paramètres peuvent produire des smiles presque identiques. L'optimiseur possède plusieurs minima locaux. Les calibrations quotidiennes peuvent osciller entre des ensembles de paramètres très différents tout en produisant des prix similaires. Cela rend la couverture peu fiable, car les Greeks dépendent de l'ensemble de paramètres sur lequel vous êtes tombé.
Extensions qui corrigent ces problèmes :
Bates = Heston + sauts. Ajouter une composante de saut au processus du spot vous donne des ailes plus épaisses à court terme sans nécessiter de valeurs déraisonnables de σ . L'intensité et la taille des sauts ajoutent des paramètres supplémentaires, mais la fonction caractéristique conserve une forme semi-fermée.
Volatilité locale stochastique (SLV). Combine une variance stochastique de type Heston avec une surcouche de volatilité locale. Vous obtenez une calibration exacte sur la surface observée (grâce à la volatilité locale) ainsi qu'une dynamique réaliste (grâce à la composante stochastique). C'est ce que font tourner de nombreux desks de production.
Rough Bergomi. Remplace le processus de variance CIR lisse par un mouvement brownien fractionnaire (paramètre de Hurst H proche de 0,1). Les trajectoires de variance deviennent rugueuses et irrégulières, correspondant bien mieux au comportement observé de la volatilité. Le coût : pas de fonction caractéristique en forme fermée.
Pour aller plus loin :
Paramétrisation SVI -- le standard d'ajustement du smile pour les surfaces de volatilité crypto
Modèle SABR -- vol stochastique sans retour à la moyenne, ajustement plus simple
Rough Bergomi -- vol stochastique fractionnaire, trajectoires rugueuses
Méthodes d'interpolation -- comparaison de toutes les méthodes