Distribución log-normal

Log-normal

Función de densidad de probabilidad

Función de distribución de probabilidad
Parámetros μ R , {\displaystyle \mu \in \mathbb {R} ,}
σ > 0 {\displaystyle \sigma >0}
Dominio x ( 0 , ) {\displaystyle x\in (0,\infty )}
Función de densidad (pdf) 1 x σ 2 π exp ( ( ln x μ ) 2 2 σ 2 ) {\displaystyle {\frac {1}{x\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(\ln x-\mu )^{2}}{2\sigma ^{2}}}\right)}
Función de distribución (cdf) Φ ( ln ( x ) μ σ ) {\displaystyle \Phi \left({\frac {\ln(x)-\mu }{\sigma }}\right)}
Media exp ( μ + σ 2 2 ) {\displaystyle \exp \left(\mu +{\frac {\sigma ^{2}}{2}}\right)}
Mediana exp ( μ ) {\displaystyle \exp(\mu )}
Moda exp ( μ σ 2 ) {\displaystyle \exp(\mu -\sigma ^{2})}
Varianza e 2 μ + σ 2 ( e σ 2 1 ) {\displaystyle e^{2\mu +\sigma ^{2}}\left(e^{\sigma ^{2}}-1\right)}
Coeficiente de simetría ( e σ 2 + 2 ) e σ 2 1 {\displaystyle \left(e^{\sigma ^{2}}+2\right){\sqrt {e^{\sigma ^{2}}-1}}}
Entropía log 2 ( σ e μ + 1 2 2 π ) {\displaystyle \log _{2}\left(\sigma e^{\mu +{\frac {1}{2}}}{\sqrt {2\pi }}\right)}
[editar datos en Wikidata]

En probabilidad y estadística, la distribución normal logarítmica es una distribución de probabilidad continua de una variable aleatoria cuyo logaritmo está normalmente distribuido. Es decir, si X {\displaystyle X} es una variable aleatoria con una distribución normal, entonces exp ( X ) {\displaystyle \operatorname {exp} (X)} tiene una distribución log-normal, es decir e X Lognormal ( μ x , σ x 2 ) {\displaystyle e^{X}\sim \operatorname {Lognormal} (\mu _{x},\sigma _{x}^{2})} .

Log-normal también se escribe log normal o lognormal o distribución de Tinaut.

Una variable puede ser modelada como log-normal si puede ser considerada como un producto multiplicativo de muchos pequeños factores independientes. Un ejemplo típico es un retorno a largo plazo de una inversión: puede considerarse como un producto de muchos retornos diarios.

Definición

Función de Densidad

Una variable aleatoria positiva X {\displaystyle X} tiene una distribución lognormal con parámetros μ {\displaystyle \mu } y σ {\displaystyle \sigma } y escribimos X Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} , si el logaritmo natural de X {\displaystyle X} sigue una distribución normal con media μ {\displaystyle \mu } y varianza σ 2 {\displaystyle \sigma ^{2}} , esto es

ln ( X ) N ( μ , σ 2 ) {\displaystyle \ln(X)\sim N(\mu ,\sigma ^{2})}

Sean Φ {\displaystyle \Phi } y ϕ {\displaystyle \phi } las funciones de distribución acumulada y de densidad de una normal estándar N ( 0 , 1 ) {\displaystyle N(0,1)} , entonces la función de densidad de probabilidad de la distribución log-normal está dada por:

f X ( x ) = d d x P [ X x ] = d d x P [ ln ( X ) ln ( x ) ] = d d x Φ ( ln x μ σ ) = ϕ ( ln x μ σ ) d d x ( ln x μ σ ) = ϕ ( ln x μ σ ) 1 σ x = 1 σ x 2 π exp ( ( ln x μ ) 2 2 σ 2 ) {\displaystyle {\begin{aligned}f_{X}(x)&={\frac {d}{dx}}\operatorname {P} [X\leq x]={\frac {d}{dx}}\operatorname {P} [\ln(X)\leq \ln(x)]={\frac {d}{dx}}\Phi \left({\frac {\ln x-\mu }{\sigma }}\right)\\&=\phi \left({\frac {\ln x-\mu }{\sigma }}\right){\frac {d}{dx}}\left({\frac {\ln x-\mu }{\sigma }}\right)=\phi \left({\frac {\ln x-\mu }{\sigma }}\right){\frac {1}{\sigma x}}\\&={\frac {1}{\sigma x{\sqrt {2\pi }}}}\exp \left(-{\frac {(\ln x-\mu )^{2}}{2\sigma ^{2}}}\right)\end{aligned}}}

Función de Distribución

La función de distribución acumulada es

F X ( x ) = Φ ( ln x μ σ ) {\displaystyle F_{X}(x)=\Phi \left({\frac {\ln x-\mu }{\sigma }}\right)}

donde Φ {\displaystyle \Phi } es la función de distribución acumulada de una normal estándar N ( 0 , 1 ) {\displaystyle N(0,1)} .

La expresión anterior también puede ser escrita como

1 2 [ 1 + erf ( ln x μ σ 2 ) ] = 1 2 erfc ( ln x μ σ 2 ) {\displaystyle {\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {\ln x-\mu }{\sigma {\sqrt {2}}}}\right)\right]={\frac {1}{2}}\operatorname {erfc} \left(-{\frac {\ln x-\mu }{\sigma {\sqrt {2}}}}\right)}

Log-normal Multivariada

Si X N ( μ , Σ ) {\displaystyle {\boldsymbol {X}}\sim N({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})} es una distribución normal multivariada entonces Y = exp ( X ) {\displaystyle {\boldsymbol {Y}}=\exp({\boldsymbol {X}})} tiene una distribución lognormal multivariante con media

E [ Y ] i = e μ i + 1 2 Σ i i {\displaystyle \operatorname {E} [{\boldsymbol {Y}}]_{i}=e^{\mu _{i}+{\frac {1}{2}}\Sigma _{ii}}}

y matriz de covarianza

Var ( Y ) i j = e μ i + μ j 1 2 ( Σ i i + Σ j j ) ( e Σ i j 1 ) {\displaystyle \operatorname {Var} ({\boldsymbol {Y}})_{ij}=e^{\mu _{i}+\mu _{j}{\frac {1}{2}}(\Sigma _{ii}+\Sigma _{jj})}\left(e^{\Sigma _{ij}}-1\right)}

Propiedades

Si X Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} entonces la variable aleatoria X {\displaystyle X} cumple algunas propiedades.

La media de X {\displaystyle X} es

E [ X ] = e μ + σ 2 2 {\displaystyle \mathrm {E} [X]=e^{\mu +{\frac {\sigma ^{2}}{2}}}}

La varianza de X {\displaystyle X} es

Var ( X ) = ( e σ 2 1 ) e 2 μ + σ 2 {\displaystyle \operatorname {Var} (X)=\left(e^{\sigma ^{2}}-1\right)e^{2\mu +\sigma ^{2}}} .

Relación con media y la desviación estándar geométrica

La distribución log-normal, la media geométrica, y la desviación estándar geométrica están relacionadas. En este caso, la media geométrica es igual a exp ( μ ) {\displaystyle \exp(\mu )} y la desviación estándar geométrica es igual a exp ( σ ) {\displaystyle \exp(\sigma )} .

Si una muestra de datos determina que proviene de una población distribuida siguiendo una distribución log-normal, la media geométrica de la desviación estándar geométrica puede utilizarse para estimar los intervalos de confianza tal como la media aritmética y la desviación estándar se usan para estimar los intervalos de confianza para un dato distribuido normalmente.

Límite de intervalo de confianza log geométrica
3σ límite inferior μ 3 σ {\displaystyle \mu -3\sigma } μ g e o / σ g e o 3 {\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{3}}
2σ límite inferior μ 2 σ {\displaystyle \mu -2\sigma } μ g e o / σ g e o 2 {\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{2}}
1σ límite inferior μ σ {\displaystyle \mu -\sigma } μ g e o / σ g e o {\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }}
1σ límite superior μ + σ {\displaystyle \mu +\sigma } μ g e o σ g e o {\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }}
2σ límite superior μ + 2 σ {\displaystyle \mu +2\sigma } μ g e o σ g e o 2 {\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{2}}
3σ límite superior μ + 3 σ {\displaystyle \mu +3\sigma } μ g e o σ g e o 3 {\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{3}}

Donde la media geométrica μ g e o = exp ( μ ) {\displaystyle \mu _{\mathrm {geo} }=\exp(\mu )} y la desviación estándar geométrica σ g e o = exp ( σ ) {\displaystyle \sigma _{\mathrm {geo} }=\exp(\sigma )}

Momentos

Los primeros momentos son:

μ 1 = e μ + σ 2 / 2 {\displaystyle \mu _{1}=e^{\mu +\sigma ^{2}/2}}
μ 2 = e 2 μ + 4 σ 2 / 2 {\displaystyle \mu _{2}=e^{2\mu +4\sigma ^{2}/2}}
μ 3 = e 3 μ + 9 σ 2 / 2 {\displaystyle \mu _{3}=e^{3\mu +9\sigma ^{2}/2}}
μ 4 = e 4 μ + 16 σ 2 / 2 {\displaystyle \mu _{4}=e^{4\mu +16\sigma ^{2}/2}}

o de forma general:

μ k = e k μ + k 2 σ 2 / 2 . {\displaystyle \mu _{k}=e^{k\mu +k^{2}\sigma ^{2}/2}.}

Inferencia Estadística

Estimación de parámetros

Para determinar los estimadores por máxima verosimilitud de la distribución lognormal con parámetros μ {\displaystyle \mu } y σ 2 {\displaystyle \sigma ^{2}} , podemos utilizar el mismo método que se utilizó para estimar los parámetros de una distribución normal. Notemos que

L ( μ , σ ) = i = 1 n 1 x i φ μ , σ ( ln x i ) {\displaystyle L(\mu ,\sigma )=\prod _{i=1}^{n}{\frac {1}{x_{i}}}\varphi _{\mu ,\sigma }(\ln x_{i})}

donde φ {\displaystyle \varphi } denota la función de densidad de la distribución normal N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} entonces la función logarítmica de verosimilitud es

L ( x 1 , x 2 , . . . , x n ; μ , σ ) = i ln x i + L N ( ln x 1 , ln x 2 , . . . , ln x n ; μ , σ ) {\displaystyle {\mathcal {L}}(x_{1},x_{2},...,x_{n};\mu ,\sigma )=-\sum _{i}\ln x_{i}+{\mathcal {L}}_{N}(\ln x_{1},\ln x_{2},...,\ln x_{n};\mu ,\sigma )}

Dado que el primer término es constante respecto a μ {\displaystyle \mu } y σ {\displaystyle \sigma } , ambas funciones logarítmicas de verosimilitud, L {\displaystyle {\mathcal {L}}} y L N {\displaystyle {\mathcal {L}}_{N}} , obtienen su máximo con el mismo μ {\displaystyle \mu } y σ {\displaystyle \sigma } , por lo tanto, utilizando los estimadores por máxima verosimilitud son idénticos a los de la distribución normal para observaciones ln x 1 , ln x 2 , , ln x n {\displaystyle \ln x_{1},\ln x_{2},\dots ,\ln x_{n}}

μ ^ = k ln x k n , σ 2 ^ = k ( ln x k μ ^ ) 2 n . {\displaystyle {\widehat {\mu }}={\frac {\sum _{k}\ln x_{k}}{n}},\qquad {\widehat {\sigma ^{2}}}={\frac {\sum _{k}{\left(\ln x_{k}-{\widehat {\mu }}\right)^{2}}}{n}}.}

Para una n {\displaystyle n} finita, estos estimadores son in sesgados.

Distribución log-normal ajustada a datos de lluvias máximas diarias por año.[1]

Aplicación

  • En la hidrología, se utiliza la distribución log-normal para analizar variables aleatorias como valores máximos de la precipitación y la descarga de ríos,[2]​ y además para describir épocas de sequía.[3]


La imagen azul ilustra un ejemplo del ajuste de la distribución log-normal a lluvias máximas diarias ordenadas, mostrando también la franja de 90% de confianza, basada en la distribución binomial. Las observaciones presentan los marcadores de posición, como parte del análisis de frecuencia acumulada.

Distribución relacionada

  • Si X   N ( μ , σ 2 ) {\displaystyle X\sim \ N(\mu ,\sigma ^{2})} es una distribución normal entonces e X Lognormal ( μ , σ 2 ) {\displaystyle e^{X}\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} .
  • Si X Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} entonces ln ( X ) N ( μ , σ 2 ) {\displaystyle \ln(X)\sim N(\mu ,\sigma ^{2})} .
  • Si X m Lognormal ( μ , σ m 2 ) ,   m = 1... n ¯ {\displaystyle X_{m}\sim \operatorname {Lognormal} (\mu ,\sigma _{m}^{2}),\ m={\overline {1...n}}} son variables independentes log-normalmente distribuidas con el mismo parámetro μ y permitiendo que varíe σ, y Y = m = 1 N X m {\displaystyle Y=\prod _{m=1}^{N}X_{m}} , entonces Y es una variable distribuida log-normalmente como: Y Lognormal ( μ , m σ m 2 ) {\displaystyle Y\sim \operatorname {Lognormal} \left(\mu ,\sum _{m}\sigma _{m}^{2}\right)} .
  • Si X Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} entonces X α Lognormal ( α μ , α 2 σ 2 ) {\displaystyle X^{\alpha }\sim \operatorname {Lognormal} (\alpha \mu ,\alpha ^{2}\sigma ^{2})} para α 0 {\displaystyle \alpha \neq 0} .

Véase también

Software

Se puede usar software o programa de computadora para el ajuste de una distribución de probabilidad, incluyendo la lognormal, a una serie de datos:

  • Easy fit Archivado el 23 de febrero de 2018 en Wayback Machine., "data analysis & simulation"
  • MathWorks Benelux (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  • ModelRisk, "risk modelling software"
  • Ricci distributions, fitting distrubutions with R , Vito Ricci, 2005
  • Risksolver, automatically fit distributions and parameters to samples
  • StatSoft distribution fitting Archivado el 30 de agosto de 2012 en Wayback Machine.
  • CumFreq [2] , libre sin costo, incluye la distribución normal, la lognormal, raíz-normal, cuadrado-normal, e intervalos de confianza a base de la distribución binomial
  • Calculadora Distribución log-normal

Referencias

  1. CumFreq, software for cumulative frequency analysis and probability distribution fitting [1]
  2. Oosterbaan, R.J. (1994). «Chapter 6 Frequency and Regression Analysis». En Ritzema, H.P., ed. Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175-224. ISBN 90-70754-33-9. 
  3. Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). «An extreme value analysis of UK drought and projections of change in the future». Journal of Hydrology 388: 131. doi:10.1016/j.jhydrol.2010.04.035. 


Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q826116
  • Commonscat Multimedia: Log-normal distribution / Q826116

  • Identificadores
  • GND: 4221613-8
  • LCCN: sh85078134
  • NLI: 987007536256605171
  • Wd Datos: Q826116
  • Commonscat Multimedia: Log-normal distribution / Q826116