Géostatistique intrinsèque Sommaire Notations | Concepts et propriétés utilisés | Géostatistique linéaire (cas stationnaire ou intrinsèque) | Géostatistique non-stationnaire | Géostatistique multivariable | Notes et références | Annexes | Menu de navigationFRBNF37051458

Géostatistique


géostatistiquevariable régionaliséeréalisationfonction aléatoirevariable régionaliséefonction aléatoirestationnaritéstationnarité d'ordre 2momentsmodèle intrinsèquegéostatistique transitiveergodicitévariable régionaliséestationnaire d'ordre 2momentsfonction aléatoire stationnaire d'ordre 2covariogramme transitifintégrale stochastiqueFonction aléatoire stationnaire d'ordre 2espérance




La géostatistique intrinsèque est la branche de la géostatistique qui étudie une variable régionalisée en la considération comme réalisation d'une fonction aléatoire. Ce passage est nommé modèle topo-probabiliste.


Ce passage n'est pas trivial. En effet, le phénomène physique étudié est le plus généralement unique. La géostatistique intrinsèque nécessite de déduire un modèle probabiliste à partir d'une seule de ses réalisations. On parle de randomisation ou d'immersion probabiliste.




Sommaire





  • 1 Notations


  • 2 Concepts et propriétés utilisés

    • 2.1 Stationnarité du modèle


    • 2.2 Problèmes globaux et locaux


    • 2.3 Ergodicité


    • 2.4 Échelle de travail


    • 2.5 Support



  • 3 Géostatistique linéaire (cas stationnaire ou intrinsèque)

    • 3.1 Combinaisons linéaires autorisées

      • 3.1.1 Cas stationnaire d'ordre 2


      • 3.1.2 Cas intrinsèque



    • 3.2 Variance d'extension

      • 3.2.1 Cas stationnaire d'ordre 2


      • 3.2.2 Cas intrinsèque



    • 3.3 Dispersion statistique

      • 3.3.1 Cas stationnaire d'ordre 2


      • 3.3.2 Cas intrinsèque



    • 3.4 Représentation glissante

      • 3.4.1 Régularisation




  • 4 Géostatistique non-stationnaire


  • 5 Géostatistique multivariable


  • 6 Notes et références


  • 7 Annexes

    • 7.1 Articles connexes


    • 7.2 Bibliographie





Notations |


Les notations usuelles sont :



  • x le point courant de l'espace de travail


  • z la variable régionalisée étudiée


  • Z la fonction aléatoire associée à z


  • S le champ de la variable régionalisée étudiée, généralement borné

On notera, pour une fonction aléatoire Z, sa moyenne sur un domaine v (sous-ensemble de S) :
Z¯(v)=1[v]∫vZ(x)dxdisplaystyle bar Zleft(vright)=frac 1[v]int _vZ(x)mathrm d x[v]=∫vdxdisplaystyle scriptstyle [v]=int _vmathrm d x est la mesure du domaine v.



Concepts et propriétés utilisés |



Stationnarité du modèle |


Articles détaillés : Stationnarité (probabilités), Fonction aléatoire stationnaire d'ordre 2 et Fonction aléatoire intrinsèque.

Stricto sensu, une variable régionalisée n'est pas sujette à des propriétés de stationnarité ; cette notion n'est pertinente que pour la fonction aléatoire dont le géostatisticien propose un modèle. Ces notions sont donc empiriques et approximatives, dépendantes du domaine et de l'échelle de travail : elles sont souvent supposées a priori, et parfois contrôlées a posteriori.


La stationnarité d'une loi est son invariance par translation. Soit un multiplet quelconque de points (de dimensions et orientation fixées), sa loi spatiale ne dépend pas du lieu de son implantation. On peut également exiger la stationnarité locale, c'est-à-dire que la fonction doit, en tout point, être stationnaire sur un voisinage de ce point (voisinage glissant indépendant du point[pourquoi ?]).


Cette hypothèse est extrêmement forte, on lui préfère en pratique la stationnarité d'ordre 2, qui requiert que les espérances des valeurs ponctuelles et des doublets de points de processus existent et soient invariantes par translation. Par rapport à la définition stricte, celle-ci ne concerne que les lois au plus bivariables, cependant elle exige l'existence des moments d'ordre 1 et 2 sur les valeurs ponctuelles. Par abus de langage, cette propriété est souvent appelée « stationnarité », et la précédente « stationnarité stricte ».


Enfin, on peut évoluer dans un modèle intrinsèque, si les accroissements Z(x)-Z(y) sont stationnaires d'ordre 2. Il en découle l'existence de deux fonctions:


  • une dérive, fonction linéaire ∀x,m(h)=E[Z(x+h)−Z(x)]displaystyle scriptstyle forall x,mleft(hright)=mathbf E [Zleft(x+hright)-Zleft(xright)]; le cas sans dérive est tel que m(h)=0displaystyle scriptstyle mleft(hright)=0 ;

  • un demi-variogramme, ou variogramme ∀x,γ(h)=12Var[Z(x+h)−Z(x)]displaystyle scriptstyle forall x,gamma left(hright)=tfrac 12mathbf Var [Zleft(x+hright)-Zleft(xright)], et dans le cas sans dérive γ(h)=12E[(Z(x+h)−Z(x))2]displaystyle scriptstyle gamma left(hright)=tfrac 12mathbf E [left(Zleft(x+hright)-Zleft(xright)right)^2].

Une fonction aléatoire intrinsèque non stationnaire d'ordre 2 est dite strictement intrinsèque.



Problèmes globaux et locaux |


Un problème est dit global s'il met en jeu la totalité du champ de la variable régionalisée étudiée. Il dépend à la fois de la structure intrinsèque de la variable régionalisée et de la géométrie du champ d'étude. Un tel problème se traite par la géostatistique transitive. Il est alors demandé l'homogénéité spatiale de l'implantation des données. Dans ce cas, on pourra distinguer le problème d'estimation (qui ne nécessite pas la stationnarité de la variable régionalisée, et se résout à l'aide du comportement à l'origine du covariogramme transitif), et le problème d'interprétation structurale sur la variable régionalisée (où les effets de la variable régionalisée et du champ d'étude doivent être séparés).


Un problème est dit local s'il se pose dans le voisinage d'un point d'étude. Sous la même contrainte d'homogénéité de la répartition de l'information, on construira alors des estimateurs linéaires invariants par translations; la stationnarité est celle de l'estimateur, non celle du phénomène physique.



Ergodicité |


On demande généralement au processus stationnaire Z de satisfaire l'hypothèse d'ergodicité. On définit :
M∗=1[S]∫SZ(x)dxdisplaystyle M^*=frac 1[S]int _SZ(x)mathrm d x
L'hypothèse d'ergodicité suppose que :
lim[S]→∞M∗=E[Z]displaystyle lim _[S]to infty M^*=mathbf E left[Zright]
On a alors:
E[M∗]=mdisplaystyle mathbf E [M^*]=m
Var[M∗]=1[S]2∫σ(h)K(h)dhdisplaystyle mathbf Var [M^*]=frac 1[S]^2int sigma (h)K(h)mathrm d h avec K(h) le covariogramme géométrique de S et σ(h) la covariance centrée de Z.


La stationnarité n'entraîne pas l'ergodicité. En pratique S ne peut tendre vers l'infini. On dira que plus Var[M*] est faible, plus m présente de signification objective. Asymptotiquement, on aura :
Var[M∗]∼ASσ(0)displaystyle mathbf Var [M^*]sim frac ASsigma left(0right)A=1σ(0)∫σ(h)dhdisplaystyle scriptstyle A=frac 1sigma left(0right)int sigma (h)mathrm d h est la portée intégrale, qui a la dimension de l'espace (aire dans 2).


Tout se passe comme si l'estimateur M* était obtenu en prenant la moyenne de N=S/A variables indépendantes de variance σ(0). Plus N est grand, plus le paramètre présente de signification objective. Par conséquent, on peut supposer l'hypothèse d'ergodicité si S est grand par rapport à A. De plus, soit un support s suffisamment grand par rapport à A. On peut écrire σ¯(v,v)=Avdisplaystyle scriptstyle bar sigma left(v,vright)=frac Av. On peut contrôler si le modèle est correct en estimant la validité de la relation s2(s|S)=A(1s−1S)Sright)=Aleft(frac 1s-frac 1Sright). Il existe également des modèles théoriques de portée intégrale infinie, à éviter.



Échelle de travail |


L'échelle de travail est totalement absente du formalisme probabiliste, néanmoins elle détermine la manière dont le géostatisticien contrôlera a posteriori les hypothèses de stationnarité et d'ergodicité.



Support |


Article détaillé : Support (géostatistique).

Le support est la taille physique, caractérisée par une géométrie et une orientation, du volume sur lequel est mesurée la variable régionalisée.



Géostatistique linéaire (cas stationnaire ou intrinsèque) |


La géostatistique linéaire est la partie de la géostatistique intrinsèque qui étudie des combinaisons linéaires de la fonction aléatoire Z considérée, qui sera prise dans la suite comme stationnaire d'ordre 2. Une telle fonction aléatoire est décrite par sa loi spatiale pour tout n-uplet de points :


f(x1;...;xn;z1;...;zn)=P(Z(x1)≤z1;...;Z(xn)≤zn)displaystyle fleft(leftx_1;...;x_nright;leftz_1;...;z_nrightright)=mathbf P left(Zleft(x_1right)leq z_1;...;Zleft(x_nright)leq z_nright)


En pratique, la loi spatiale est trop riche, c'est pourquoi ou se limite à la manipulation des deux premiers moments de la fonction aléatoire :


mx=E[Z(x)]displaystyle m_x=mathbf E left[Zleft(xright)right]


Cxy=Cov[Z(x),Z(y)]displaystyle C_xy=mathbf Cov left[Zleft(xright),Zleft(yright)right] (covariance centrée)


Les espérances seront utilisées pour définir la valeur des estimateurs qui seront utilisés, et les variances comme critères de qualité de ces estimateurs[1].


Cette restriction impose de n'utiliser que des combinaisons linéaires de la fonction aléatoire étudiée, seules expressions dont on saura fournir une espérance et une variance. Une conséquence est qu'il faudra travailler sur des variables régionalisées additives (c'est-à-dire telles que toute combinaison linéaire de cette variable ait le même sens physique que la variable ponctuelle).


Malgré ces restrictions, la géostatistique linéaire possède les avantages suivants : elle est simple à mettre en œuvre, et c'est souvent la seule approche possible.



Combinaisons linéaires autorisées |


Une combinaison linéaire de la fonction aléatoire est ∑iλiZidisplaystyle scriptstyle sum _ilambda _iZ_i. Une mesure sur la fonction aléatoire est ∫λ(dt)Z(t)displaystyle scriptstyle int lambda left(mathrm d tright)Zleft(tright).


Une combinaison linéaire (respectivement une mesure) est dite autorisée (en abrégé, CLA) si son espérance et sa variance sont finies.



Cas stationnaire d'ordre 2 |


Dans le cadre d'une fonction aléatoire stationnaire d'ordre 2, toutes les mesures sont autorisées, toutes les combinaisons linéaires sont autorisées et stationnaires.
Dans ce cas, les deux premiers moments s'écrivent :


E[∑iλiZi]=∑iλimidisplaystyle mathbf E left[sum _ilambda _iZ_iright]=sum _ilambda _im_i
Var[∑iλiZi]=∑ijλiCijλjdisplaystyle mathbf Var left[sum _ilambda _iZ_iright]=sum _ijlambda _iC_ijlambda _j


De plus, dans les hypothèses présentes, on peut simplifier l'écriture des moments :
m(x)=mdisplaystyle mleft(xright)=m constant dans l'espace
C(x,y)=C(h)displaystyle Cleft(x,yright)=Cleft(hright) avec h=x−ydisplaystyle h=x-y


La covariance stationnaire a les propriétés de symétrie, d'inégalité de Schwarz, de positivité. De plus, son comportement à l'origine est lié aux caractères de continuité ou de dérivabilité en moyenne quadratique de la fonction aléatoire. Par contre, à la différence du covariogramme transitif, C(h) peut ne pas être identiquement nul au-delà d'une certaine valeur de h. Son intégrale C(h)dh n'est non plus pas forcément définie.



Cas intrinsèque |


Dans l'hypothèse intrinsèque, les CLA exactement les combinaisons d'accroissement (du type ∑iλi(Z(xi)−Z(yi))displaystyle scriptstyle sum _ilambda _ileft(Zleft(x_iright)-Zleft(y_iright)right)), c'est-à-dire les mesures de poids total nul : λ(dt) telles que λ(dt)=0. La valeur ponctuelle elle-même n'est pas une CLA.


L'espérance d'une CLA dans le cas intrinsèque sans dérive est nulle. Sa variance s'obtient comme s'il existait une covariance égale à l'opposé du variogramme : Var[∑iλiZi]=∑i,j−λiγi,jλjdisplaystyle mathbf Var [sum _ilambda _iZ_i]=sum _i,j-lambda _igamma _i,jlambda _j. Cela reste vrai si le variogramme n'est pas stationnaire.



Variance d'extension |



Cas stationnaire d'ordre 2 |


Soit un domaine borné v. On posera la variable aléatoire suivante, moyenne spatiale de la fonction aléatoire étudiée :
Z¯(v)=1[v]∫vZ(x)dxdisplaystyle bar Zleft(vright)=frac 1[v]int _vZ(x)mathrm d x[v] est la mesure du domaine v


La variance de Z(v) s'écrit:
Var[Z¯(v)]=1[v]2∫v∫vZ(x−y)dxdydisplaystyle mathbf Var left[bar Zleft(vright)right]=frac 1[v]^2int _vint _vZ(x-y)mathrm d xmathrm d y, qui est la version continue d'une variance de CLA


Posons maintenant deux domaines v et v′. Comme E[Z¯(v)−Z(v′)]=0displaystyle scriptstyle mathbf E left[bar Zleft(vright)-Zleft(v'right)right]=0, Z(v′) est un estimateur sans biais de Z(v). On appelle variance d'extension de v à v′ la variance de l'erreur d'estimation :
σE2(v,v′)=Var[Z¯(v)−Z(v′)]displaystyle sigma _E^2left(v,v'right)=mathbf Var left[bar Zleft(vright)-Zleft(v'right)right]


On écrit alors:
σE2=C¯(v,v)+C¯(v′,v′)−2C¯(v,v′)displaystyle sigma _E^2=bar Cleft(v,vright)+bar Cleft(v',v'right)-2bar Cleft(v,v'right)


La variance d'extension est invariante par translation identique des deux domaines v et v′ ; c'est donc une caractéristique non-locale du modèle. Dans le cas où v′ est un ensemble fini de points Z(xi), on parle de variance d'estimation de v par les prélèvements Z(xi).
Cependant, σE2displaystyle scriptstyle sigma _E^2 n'est pas une variance conditionnelle, puisque la quantité à estimer et l'estimateur y jouent un rôle symétrique. De plus, on ne peut pas en déduire d'intervalle de confiance.


Historiquement, la géostatistique s'est développé initialement pour expliquer les comportements de la variance de dispersion, ce que ne faisait pas la statistique classique.



Cas intrinsèque |


On vérifie aisément que Z(v)-Z(v′) est une CLA. Alors σE2(v,v′)=2γ¯(v,v′)−γ¯(v,v,)−γ¯(v′,v′)displaystyle sigma _mathrm E ^2left(v,v'right)=2bar gamma left(v,v'right)-bar gamma left(v,v,right)-bar gamma left(v',v'right).


On retrouve en cas particulier : σE2(x,x+h)=2γ(h),∀xdisplaystyle sigma _mathrm E ^2left(leftxright,leftx+hrightright)=2gamma left(hright),forall x.



Dispersion statistique |



Cas stationnaire d'ordre 2 |


Soit un domaine V de l'espace de travail et une partition de V en N sous-domaines vi identiques entre eux à une translation près. Nous poserons Z et zi les moyennes respectivement sur V et sur vi de z(x). On généralise le concept de dispersion (ou variance) grâce à la dispersion statistique de v dans V, donnée par :
s2(v|V)=1N∑i(z¯i−z¯)2Vright)=frac 1Nsum _ileft(bar z_i-bar zright)^2, où l'on retrouve la variance statistique pour un domaine v = x ponctuel.


Par immersion probabiliste, on définit une nouvelle variable aléatoire S2(v|V):
S2(v|V)=1N∑i(Z¯i−Z¯)2Vright)=frac 1Nsum _ileft(bar Z_i-bar Zright)^2


On définit la variance de dispersion de v dans V comme l'espérance mathématique de S2(v|V), et on la note σ2(v|V).


La variance de dispersion peut également s'écrire sans contrainte de partition (et même quand v est un sur-ensemble de V, auquel cas elle est négative) :
σ2(v|V)=C¯(v,v)−C¯(V,V)V)=bar C(v,v)-bar C(V,V)


On définit également la covariance de dispersion de v et v′ dans V :
σ2(v,v′|V)=C¯(v,v)−C¯(V,V)Vright)=bar C(v,v)-bar C(V,V)


On a également:
σ2(0|V)=C(0)−C¯(V,V)displaystyle sigma ^2left(0
σE2(v,v′)=σ2(v|V)+σ2(v′|V)−2σ2(v,v′|V),∀VVright),forall V


Il existe des phénomènes où s2(v|V) croît indéfiniment lorsque V croît. Cela oblige à proposer le cas échéant un modèle sans variance a priori.



Cas intrinsèque |


On a alors : σ2(v|V)=γ¯(V,V)−γ¯(v,v)displaystyle sigma ^2left(v. En particulier, σ2(o|V)=γ¯(V,V)displaystyle sigma ^2left(leftoright



Représentation glissante |


La représentation glissante d'une variable régionalisée z S0 est la fonction aléatoire Z définie par :
Z(x)=z(u_+x)displaystyle Zleft(xright)=zleft(underline u+xright)u est le point aléatoire uniforme sur S0.


En posant en outre la grandeur régionale suivante, qui est covariance de Z :
C(x,y)=1[S0]∫S0z(u+x)z(u+y)dudisplaystyle Cleft(x,yright)=frac 1[S_0]int _S_0zleft(u+xright)zleft(u+yright)mathrm d u

avec C(x,y)=E[Z(x).Z(y)]displaystyle Cleft(x,yright)=mathbf E [Z(x).Z(y)]



Régularisation |


La régularisation d'une variable aléatoire est sa pondération par une mesure. Soit p(dt) une mesure supposée normée (p(dt)=1), on écrit la régularisée:
Zp(x)=∫Z(x+t)p(dt)displaystyle scriptstyle Z_pleft(xright)=int Zleft(x+tright)pleft(mathrm d tright)


Zp est une intégrale stochastique, définie, dans le cas stationnaire d'ordre 2, ssi ∫∫p(dx)Cx,yp(dy)<infdisplaystyle int int pleft(mathrm d xright)C_x,ypleft(mathrm d yright)<inf .


En cas d'existence, Zp est stationnaire d'ordre 2 et de covariance Cp(h)=∫∫C(h+x−y)p(dx)p(dy)displaystyle C_pleft(hright)=int int Cleft(h+x-yright)pleft(mathrm d xright)pleft(mathrm d yright).


Cela reste vrai en hypothèse intrinsèque stricte, en remplaçant alors C(·) par γ(∞)−γ(·).



Géostatistique non-stationnaire |


Dans cette partie, nous étudions les modèles locaux de non-stationnarité.


Deux techniques permettent de se ramener à une situation stationnaire:


  • Krigeage universel : séparation du phénomène en deux composantes;

  • géostatistique intrinsèque par les FAI-k: transformation du phénomène en phénomène stationnaire.


Géostatistique multivariable |


La géostatistique multivariable s'intéresse à l'étude de plusieurs variables connues aux mêmes points (isotopie), ou en des points différant partiellement (hétérotopie). Deux approches sont possibles et équivalentes:


  • selon une famille de fonctions aléatoires Zi(x)x∈ℝn et iD;

  • selon une fonction aléatoire vectorielle Z(x,i)(x,i)∈ℝnD.

Dans le cas général, les variables ne peuvent pas être traitées indépendamment, même dans le cas où elles sont indépendantes. Les dépendances s'expriment au moyen de la covariance croisée :


Ki,j(x;y)=Cov[Zi(x);Zj(y)]displaystyle K_i,jleft(x;yright)=mathbf Cov [Z_ileft(xright);Z_jleft(yright)]


Supposons que le cas d'une Fonction aléatoire stationnaire d'ordre 2 d'espérance nulle. Les covariances et covariances croisées sont alors toujours définies et invariantes par translation dans l'espace géographique n : elles ne dépendent que du vecteur différence h=y-x, et on les note Ki,j(h). On vérifie:



  • Ki,i(h) = 0;


  • Ki,j(h) ≢ Ki,j(h) pour ij dans le cas général; on parle de décalage ou déphasage; la symétrie peut être assurée (par exemple pour l'étude corégionalisée entre une fonction aléatoire et sa dérivée seconde), de même que l'antisymétrie (par exemple pour entre une fonction aléatoire et sa dérivée);


  • Ki,j(h) ≢ Kj,i(−h) (la symétrie est hermitienne dans le cas complexe);


  • Ki,j(h) = 0 si Zi et Zj sont indépendantes;

  • la matrice σi,j=Ki,j(0), de dimensions d×d, est la matrice de variances-covariances ; on vérifie l'inégalité de Schwarz |Ki,j(h)|≤σi,iσj,j.


Notes et références |




  1. On aurait pu imaginer des estimateurs fondés sur la médiane, le maximum de vraisemblance, ou des critères basés sur des intervalles de confiance, mais les outils et le modèle dépassent alors le cadre de la géostatistique linéaire. D'autre part, la géostatistique linéaire est d'autant mieux adaptée à une étude que la fonction aléatoire traitée est proche d'une gaussienne




Annexes |



Articles connexes |


  • Géostatistique


Bibliographie |



  • Document utilisé pour la rédaction de l’articlePierre Chauvet, Aide-mémoire de géostatistique linéaire, Paris, Les Presses de l'École des Mines, août 1999 (réimpr. 1993, 1994, 1998, 1999, 2008) (1re éd. 1989), 367 p., 16 × 24 cm (ISBN 2-911762-16-9, notice BnF no FRBNF37051458)
  • Portail des probabilités et de la statistique Portail des probabilités et de la statistique
  • Portail de l’information géographique Portail de l’information géographique
  • Portail de la géologie Portail de la géologie

Popular posts from this blog

Isabella Eugénie Boyer Biographie | Références | Menu de navigationmodifiermodifier le codeComparator to Compute the Relative Value of a U.S. Dollar Amount – 1774 to Present.

Join wedge with single bond in chemfigHow to make only one part of double bond bold with chemfig?Crossing bonds in chemfigjoining atoms in chemfig. Two adjacent molculesHow do I selectively change bond length in chemfig?Ugly bond joints in chemfigchemfig: reaction above arrowUsing the mhchem and chemfig packages in conjunctionBonding to specific element letter using chemfigResonance hybrids in chemfigScale chemfig molecule in beamer with tikzWhy does this chemfig bond with a hook start in the middle of the atom?

Are small insurances worth itIs insurance worth it if you can afford to replace the item? If not, when is it?Is accident insurance worth it for my kids who play sportsIs insuring property for more than it is worth allowed?At what point does it become worth it to file an insurance claim?Are wage loss insurance programs worth the cost compared to having an emergency fund?When is an event worth insuring against?Is insurance worth it if you can afford to replace the item? If not, when is it?FHA loan just commenced : Any way to get any of the up-front mortgage insurance back?Which types of insurances do I need to buy?Should I carry less renter's insurance if I can self-insure?Mortgage Adviser Signed Me Up For Multiple Home and Life Insurances (UK)Why many travel insurances don't cover country of nationality?