Gdtyjr

La géostatistique intrinsèque est la branche de la géostatistique qui étudie une variable régionalisée en la considération comme réalisation d'une fonction aléatoire. Ce passage est nommé modèle topo-probabiliste.

Ce passage n'est pas trivial. En effet, le phénomène physique étudié est le plus généralement unique. La géostatistique intrinsèque nécessite de déduire un modèle probabiliste à partir d'une seule de ses réalisations. On parle de randomisation ou d'immersion probabiliste.

Sommaire

1 Notations

2 Concepts et propriétés utilisés
- 2.1 Stationnarité du modèle
- 2.2 Problèmes globaux et locaux
- 2.3 Ergodicité
- 2.4 Échelle de travail
- 2.5 Support

3 Géostatistique linéaire (cas stationnaire ou intrinsèque)
- 3.1 Combinaisons linéaires autorisées
  - 3.1.1 Cas stationnaire d'ordre 2
  - 3.1.2 Cas intrinsèque
- 3.2 Variance d'extension
  - 3.2.1 Cas stationnaire d'ordre 2
  - 3.2.2 Cas intrinsèque
- 3.3 Dispersion statistique
  - 3.3.1 Cas stationnaire d'ordre 2
  - 3.3.2 Cas intrinsèque
- 3.4 Représentation glissante
  - 3.4.1 Régularisation

4 Géostatistique non-stationnaire

5 Géostatistique multivariable

6 Notes et références

7 Annexes
- 7.1 Articles connexes
- 7.2 Bibliographie

Notations |

Les notations usuelles sont :

$x$ le point courant de l'espace de travail

$z$ la variable régionalisée étudiée

$Z$ la fonction aléatoire associée à $z$

$S$ le champ de la variable régionalisée étudiée, généralement borné

On notera, pour une fonction aléatoire $Z$ , sa moyenne sur un domaine $v$ (sous-ensemble de $S$ ) :
$displaystyle bar Zleft(vright)=frac 1[v]int _vZ(x)mathrm d x$ où $displaystyle scriptstyle [v]=int _vmathrm d x$ est la mesure du domaine $v$ .

Concepts et propriétés utilisés |

Stationnarité du modèle |

Articles détaillés : Stationnarité (probabilités), Fonction aléatoire stationnaire d'ordre 2 et Fonction aléatoire intrinsèque.

Stricto sensu, une variable régionalisée n'est pas sujette à des propriétés de stationnarité ; cette notion n'est pertinente que pour la fonction aléatoire dont le géostatisticien propose un modèle. Ces notions sont donc empiriques et approximatives, dépendantes du domaine et de l'échelle de travail : elles sont souvent supposées a priori, et parfois contrôlées a posteriori.

La stationnarité d'une loi est son invariance par translation. Soit un multiplet quelconque de points (de dimensions et orientation fixées), sa loi spatiale ne dépend pas du lieu de son implantation. On peut également exiger la stationnarité locale, c'est-à-dire que la fonction doit, en tout point, être stationnaire sur un voisinage de ce point (voisinage glissant indépendant du point^{[pourquoi ?]}).

Cette hypothèse est extrêmement forte, on lui préfère en pratique la stationnarité d'ordre 2, qui requiert que les espérances des valeurs ponctuelles et des doublets de points de processus existent et soient invariantes par translation. Par rapport à la définition stricte, celle-ci ne concerne que les lois au plus bivariables, cependant elle exige l'existence des moments d'ordre 1 et 2 sur les valeurs ponctuelles. Par abus de langage, cette propriété est souvent appelée « stationnarité », et la précédente « stationnarité stricte ».

Enfin, on peut évoluer dans un modèle intrinsèque, si les accroissements $Z (x)- Z (y)$ sont stationnaires d'ordre 2. Il en découle l'existence de deux fonctions:

une dérive, fonction linéaire $displaystyle scriptstyle forall x,mleft(hright)=mathbf E [Zleft(x+hright)-Zleft(xright)]$ ; le cas sans dérive est tel que $displaystyle scriptstyle mleft(hright)=0$ ;

un demi-variogramme, ou variogramme $displaystyle scriptstyle forall x,gamma left(hright)=tfrac 12mathbf Var [Zleft(x+hright)-Zleft(xright)]$ , et dans le cas sans dérive $displaystyle scriptstyle gamma left(hright)=tfrac 12mathbf E [left(Zleft(x+hright)-Zleft(xright)right)^2]$ .

Une fonction aléatoire intrinsèque non stationnaire d'ordre 2 est dite strictement intrinsèque.

Problèmes globaux et locaux |

Un problème est dit global s'il met en jeu la totalité du champ de la variable régionalisée étudiée. Il dépend à la fois de la structure intrinsèque de la variable régionalisée et de la géométrie du champ d'étude. Un tel problème se traite par la géostatistique transitive. Il est alors demandé l'homogénéité spatiale de l'implantation des données. Dans ce cas, on pourra distinguer le problème d'estimation (qui ne nécessite pas la stationnarité de la variable régionalisée, et se résout à l'aide du comportement à l'origine du covariogramme transitif), et le problème d'interprétation structurale sur la variable régionalisée (où les effets de la variable régionalisée et du champ d'étude doivent être séparés).

Un problème est dit local s'il se pose dans le voisinage d'un point d'étude. Sous la même contrainte d'homogénéité de la répartition de l'information, on construira alors des estimateurs linéaires invariants par translations; la stationnarité est celle de l'estimateur, non celle du phénomène physique.

Ergodicité |

On demande généralement au processus stationnaire $Z$ de satisfaire l'hypothèse d'ergodicité. On définit :
$displaystyle M^*=frac 1[S]int _SZ(x)mathrm d x$
L'hypothèse d'ergodicité suppose que :
$displaystyle lim _[S]to infty M^*=mathbf E left[Zright]$
On a alors:
$displaystyle mathbf E [M^*]=m$
$displaystyle mathbf Var [M^*]=frac 1[S]^2int sigma (h)K(h)mathrm d h$ avec $K (h)$ le covariogramme géométrique de $S$ et $σ (h)$ la covariance centrée de $Z$ .

La stationnarité n'entraîne pas l'ergodicité. En pratique $S$ ne peut tendre vers l'infini. On dira que plus $Var [M *]$ est faible, plus $m$ présente de signification objective. Asymptotiquement, on aura :
$displaystyle mathbf Var [M^*]sim frac ASsigma left(0right)$ où $displaystyle scriptstyle A=frac 1sigma left(0right)int sigma (h)mathrm d h$ est la portée intégrale, qui a la dimension de l'espace (aire dans $ℝ 2$ ).

Tout se passe comme si l'estimateur $M *$ était obtenu en prenant la moyenne de $N = S / A$ variables indépendantes de variance $σ (0)$ . Plus $N$ est grand, plus le paramètre présente de signification objective. Par conséquent, on peut supposer l'hypothèse d'ergodicité si $S$ est grand par rapport à $A$ . De plus, soit un support $s$ suffisamment grand par rapport à $A$ . On peut écrire $displaystyle scriptstyle bar sigma left(v,vright)=frac Av$ . On peut contrôler si le modèle est correct en estimant la validité de la relation $Sright)=Aleft(frac 1s-frac 1Sright)$ . Il existe également des modèles théoriques de portée intégrale infinie, à éviter.

Échelle de travail |

L'échelle de travail est totalement absente du formalisme probabiliste, néanmoins elle détermine la manière dont le géostatisticien contrôlera a posteriori les hypothèses de stationnarité et d'ergodicité.

Support |

Article détaillé : Support (géostatistique).

Le support est la taille physique, caractérisée par une géométrie et une orientation, du volume sur lequel est mesurée la variable régionalisée.

Géostatistique linéaire (cas stationnaire ou intrinsèque) |

La géostatistique linéaire est la partie de la géostatistique intrinsèque qui étudie des combinaisons linéaires de la fonction aléatoire $Z$ considérée, qui sera prise dans la suite comme stationnaire d'ordre 2. Une telle fonction aléatoire est décrite par sa loi spatiale pour tout n-uplet de points :

$displaystyle fleft(leftx_1;...;x_nright;leftz_1;...;z_nrightright)=mathbf P left(Zleft(x_1right)leq z_1;...;Zleft(x_nright)leq z_nright)$

En pratique, la loi spatiale est trop riche, c'est pourquoi ou se limite à la manipulation des deux premiers moments de la fonction aléatoire :

$displaystyle m_x=mathbf E left[Zleft(xright)right]$

$displaystyle C_xy=mathbf Cov left[Zleft(xright),Zleft(yright)right]$ (covariance centrée)

Les espérances seront utilisées pour définir la valeur des estimateurs qui seront utilisés, et les variances comme critères de qualité de ces estimateurs^[1].

Cette restriction impose de n'utiliser que des combinaisons linéaires de la fonction aléatoire étudiée, seules expressions dont on saura fournir une espérance et une variance. Une conséquence est qu'il faudra travailler sur des variables régionalisées additives (c'est-à-dire telles que toute combinaison linéaire de cette variable ait le même sens physique que la variable ponctuelle).

Malgré ces restrictions, la géostatistique linéaire possède les avantages suivants : elle est simple à mettre en œuvre, et c'est souvent la seule approche possible.

Combinaisons linéaires autorisées |

Une combinaison linéaire de la fonction aléatoire est $displaystyle scriptstyle sum _ilambda _iZ_i$ . Une mesure sur la fonction aléatoire est $displaystyle scriptstyle int lambda left(mathrm d tright)Zleft(tright)$ .

Une combinaison linéaire (respectivement une mesure) est dite autorisée (en abrégé, CLA) si son espérance et sa variance sont finies.

Cas stationnaire d'ordre 2 |

Dans le cadre d'une fonction aléatoire stationnaire d'ordre 2, toutes les mesures sont autorisées, toutes les combinaisons linéaires sont autorisées et stationnaires.
Dans ce cas, les deux premiers moments s'écrivent :

$displaystyle mathbf E left[sum _ilambda _iZ_iright]=sum _ilambda _im_i$
$displaystyle mathbf Var left[sum _ilambda _iZ_iright]=sum _ijlambda _iC_ijlambda _j$

De plus, dans les hypothèses présentes, on peut simplifier l'écriture des moments :
$displaystyle mleft(xright)=m$ constant dans l'espace
$displaystyle Cleft(x,yright)=Cleft(hright)$ avec $displaystyle h=x-y$

La covariance stationnaire a les propriétés de symétrie, d'inégalité de Schwarz, de positivité. De plus, son comportement à l'origine est lié aux caractères de continuité ou de dérivabilité en moyenne quadratique de la fonction aléatoire. Par contre, à la différence du covariogramme transitif, $C (h)$ peut ne pas être identiquement nul au-delà d'une certaine valeur de $h$ . Son intégrale $\int C (h)d h$ n'est non plus pas forcément définie.

Cas intrinsèque |

Dans l'hypothèse intrinsèque, les CLA exactement les combinaisons d'accroissement (du type $displaystyle scriptstyle sum _ilambda _ileft(Zleft(x_iright)-Zleft(y_iright)right)$ ), c'est-à-dire les mesures de poids total nul : $λ (d t)$ telles que $\int λ (d t)=0$ . La valeur ponctuelle elle-même n'est pas une CLA.

L'espérance d'une CLA dans le cas intrinsèque sans dérive est nulle. Sa variance s'obtient comme s'il existait une covariance égale à l'opposé du variogramme : $displaystyle mathbf Var [sum _ilambda _iZ_i]=sum _i,j-lambda _igamma _i,jlambda _j$ . Cela reste vrai si le variogramme n'est pas stationnaire.

Variance d'extension |

Cas stationnaire d'ordre 2 |

Soit un domaine borné $v$ . On posera la variable aléatoire suivante, moyenne spatiale de la fonction aléatoire étudiée :
$displaystyle bar Zleft(vright)=frac 1[v]int _vZ(x)mathrm d x$ où $[v]$ est la mesure du domaine $v$

La variance de $Z (v)$ s'écrit:
$displaystyle mathbf Var left[bar Zleft(vright)right]=frac 1[v]^2int _vint _vZ(x-y)mathrm d xmathrm d y$ , qui est la version continue d'une variance de CLA

Posons maintenant deux domaines $v$ et $v'$ . Comme $displaystyle scriptstyle mathbf E left[bar Zleft(vright)-Zleft(v'right)right]=0$ , $Z (v')$ est un estimateur sans biais de $Z (v)$ . On appelle variance d'extension de $v$ à $v'$ la variance de l'erreur d'estimation :
$displaystyle sigma _E^2left(v,v'right)=mathbf Var left[bar Zleft(vright)-Zleft(v'right)right]$

On écrit alors:
$displaystyle sigma _E^2=bar Cleft(v,vright)+bar Cleft(v',v'right)-2bar Cleft(v,v'right)$

La variance d'extension est invariante par translation identique des deux domaines $v$ et $v'$ ; c'est donc une caractéristique non-locale du modèle. Dans le cas où $v'$ est un ensemble fini de points $Z (x i)$ , on parle de variance d'estimation de $v$ par les prélèvements $Z (x i)$ .
Cependant, $displaystyle scriptstyle sigma _E^2$ n'est pas une variance conditionnelle, puisque la quantité à estimer et l'estimateur y jouent un rôle symétrique. De plus, on ne peut pas en déduire d'intervalle de confiance.

Historiquement, la géostatistique s'est développé initialement pour expliquer les comportements de la variance de dispersion, ce que ne faisait pas la statistique classique.

Cas intrinsèque |

On vérifie aisément que $Z (v)- Z (v')$ est une CLA. Alors $displaystyle sigma _mathrm E ^2left(v,v'right)=2bar gamma left(v,v'right)-bar gamma left(v,v,right)-bar gamma left(v',v'right)$ .

On retrouve en cas particulier : $displaystyle sigma _mathrm E ^2left(leftxright,leftx+hrightright)=2gamma left(hright),forall x$ .

Dispersion statistique |

Cas stationnaire d'ordre 2 |

Soit un domaine $V$ de l'espace de travail et une partition de $V$ en $N$ sous-domaines $v i$ identiques entre eux à une translation près. Nous poserons $Z$ et $z i$ les moyennes respectivement sur $V$ et sur $v i$ de $z (x)$ . On généralise le concept de dispersion (ou variance) grâce à la dispersion statistique de $v$ dans $V$ , donnée par :
$Vright)=frac 1Nsum _ileft(bar z_i-bar zright)^2$ , où l'on retrouve la variance statistique pour un domaine $v$ = $x$ ponctuel.

Par immersion probabiliste, on définit une nouvelle variable aléatoire $S 2 (v | V)$ :
$Vright)=frac 1Nsum _ileft(bar Z_i-bar Zright)^2$

On définit la variance de dispersion de $v$ dans $V$ comme l'espérance mathématique de $S 2 (v | V)$ , et on la note $σ 2 (v | V)$ .

La variance de dispersion peut également s'écrire sans contrainte de partition (et même quand $v$ est un sur-ensemble de $V$ , auquel cas elle est négative) :
$V)=bar C(v,v)-bar C(V,V)$

On définit également la covariance de dispersion de $v$ et $v'$ dans $V$ :
$Vright)=bar C(v,v)-bar C(V,V)$

On a également:
$displaystyle sigma ^2left(0$
$Vright),forall V$

Il existe des phénomènes où $s 2 (v | V)$ croît indéfiniment lorsque $V$ croît. Cela oblige à proposer le cas échéant un modèle sans variance a priori.

Cas intrinsèque |

On a alors : $displaystyle sigma ^2left(v$ . En particulier, $displaystyle sigma ^2left(leftoright$

Représentation glissante |

La représentation glissante d'une variable régionalisée $z$ $S 0$ est la fonction aléatoire $Z$ définie par :
$displaystyle Zleft(xright)=zleft(underline u+xright)$ où $u$ est le point aléatoire uniforme sur $S 0$ .

En posant en outre la grandeur régionale suivante, qui est covariance de $Z$ :
$displaystyle Cleft(x,yright)=frac 1[S_0]int _S_0zleft(u+xright)zleft(u+yright)mathrm d u$

avec $displaystyle Cleft(x,yright)=mathbf E [Z(x).Z(y)]$

Régularisation |

La régularisation d'une variable aléatoire est sa pondération par une mesure. Soit $p (d t)$ une mesure supposée normée ( $\int p (d t)=1$ ), on écrit la régularisée:
$displaystyle scriptstyle Z_pleft(xright)=int Zleft(x+tright)pleft(mathrm d tright)$

$Z p$ est une intégrale stochastique, définie, dans le cas stationnaire d'ordre 2, ssi $displaystyle int int pleft(mathrm d xright)C_x,ypleft(mathrm d yright)<inf$ .

En cas d'existence, $Z p$ est stationnaire d'ordre 2 et de covariance $displaystyle C_pleft(hright)=int int Cleft(h+x-yright)pleft(mathrm d xright)pleft(mathrm d yright)$ .

Cela reste vrai en hypothèse intrinsèque stricte, en remplaçant alors $C (\cdot)$ par $γ (\infty)- γ (\cdot)$ .

Géostatistique non-stationnaire |

Dans cette partie, nous étudions les modèles locaux de non-stationnarité.

Deux techniques permettent de se ramener à une situation stationnaire:

Krigeage universel : séparation du phénomène en deux composantes;

géostatistique intrinsèque par les FAI-k: transformation du phénomène en phénomène stationnaire.

Géostatistique multivariable |

La géostatistique multivariable s'intéresse à l'étude de plusieurs variables connues aux mêmes points (isotopie), ou en des points différant partiellement (hétérotopie). Deux approches sont possibles et équivalentes:

selon une famille de fonctions aléatoires $Z i (x)$ où $x \inℝ n$ et $i \in D$ ;

selon une fonction aléatoire vectorielle $Z (x, i)$ où $(x, i)\inℝ n ✕ D$ .

Dans le cas général, les variables ne peuvent pas être traitées indépendamment, même dans le cas où elles sont indépendantes. Les dépendances s'expriment au moyen de la covariance croisée :

$displaystyle K_i,jleft(x;yright)=mathbf Cov [Z_ileft(xright);Z_jleft(yright)]$

Supposons que le cas d'une Fonction aléatoire stationnaire d'ordre 2 d'espérance nulle. Les covariances et covariances croisées sont alors toujours définies et invariantes par translation dans l'espace géographique $ℝ n$ : elles ne dépendent que du vecteur différence $h = y - x$ , et on les note $K i, j (h)$ . On vérifie:

$K i, i (h) = 0$ ;

$K i, j (h) ≢ K i, j (h)$ pour $i \neq j$ dans le cas général; on parle de décalage ou déphasage; la symétrie peut être assurée (par exemple pour l'étude corégionalisée entre une fonction aléatoire et sa dérivée seconde), de même que l'antisymétrie (par exemple pour entre une fonction aléatoire et sa dérivée);

$K i, j (h) ≢ K j, i (- h)$ (la symétrie est hermitienne dans le cas complexe);

$K i, j (h) = 0$ si $Z i$ et $Z j$ sont indépendantes;

la matrice $σ i, j = K i, j (0)$ , de dimensions $d \times d$ , est la matrice de variances-covariances ; on vérifie l'inégalité de Schwarz $| K i, j (h)|\leq \sqrt σ i, i σ j, j$ .

Notes et références |

↑ On aurait pu imaginer des estimateurs fondés sur la médiane, le maximum de vraisemblance, ou des critères basés sur des intervalles de confiance, mais les outils et le modèle dépassent alors le cadre de la géostatistique linéaire. D'autre part, la géostatistique linéaire est d'autant mieux adaptée à une étude que la fonction aléatoire traitée est proche d'une gaussienne

Annexes |

Articles connexes |

Géostatistique

Bibliographie |

Pierre Chauvet, Aide-mémoire de géostatistique linéaire, Paris, Les Presses de l'École des Mines, août 1999 (réimpr. 1993, 1994, 1998, 1999, 2008) (1^re éd. 1989), 367 p., 16 × 24 cm (ISBN 2-911762-16-9, notice BnF n^o FRBNF37051458)

Portail des probabilités et de la statistique
Portail de l’information géographique
Portail de la géologie

[1] On aurait pu imaginer des estimateurs fondés sur la médiane, le maximum de vraisemblance, ou des critères basés sur des intervalles de confiance, mais les outils et le modèle dépassent alors le cadre de la géostatistique linéaire. D'autre part, la géostatistique linéaire est d'autant mieux adaptée à une étude que la fonction aléatoire traitée est proche d'une gaussienne

搜尋此網誌

Gdtyjr

Géostatistique intrinsèque Sommaire Notations | Concepts et propriétés utilisés | Géostatistique linéaire (cas stationnaire ou intrinsèque) | Géostatistique non-stationnaire | Géostatistique multivariable | Notes et références | Annexes | Menu de navigationFRBNF37051458

Sommaire

Notations |

Concepts et propriétés utilisés |

Stationnarité du modèle |

Problèmes globaux et locaux |

Ergodicité |

Échelle de travail |

Support |

Géostatistique linéaire (cas stationnaire ou intrinsèque) |

Combinaisons linéaires autorisées |

Cas stationnaire d'ordre 2 |

Cas intrinsèque |

Variance d'extension |

Cas stationnaire d'ordre 2 |

Cas intrinsèque |

Dispersion statistique |

Cas stationnaire d'ordre 2 |

Cas intrinsèque |

Représentation glissante |

Régularisation |

Géostatistique non-stationnaire |

Géostatistique multivariable |

Notes et références |

Annexes |

Articles connexes |

Bibliographie |

Popular posts from this blog

Isabella Eugénie Boyer Biographie | Références | Menu de navigationmodifiermodifier le codeComparator to Compute the Relative Value of a U.S. Dollar Amount – 1774 to Present.