Función densidad de probabilidad

5.1. Función densidad de probabilidad#

Recordando de la Sección 2.1 las ecuaciones (2.3) y (2.5), definidas para un conjunto de \(N\) variables aleatorias \(x_i\), la probabilidad de encontrar una variable dentro del intervalo \(\Delta_i = x_{i+1} - x_i\) era \(f_i \Delta_i\), donde \(f_i\) correspondía a la altura del intervalo. Así mismo, la suma total de las probabilidades era igual a la unidad

(5.1)#\[ \sum_{i = 0}^M f_i\Delta_i = 1. \]

En esta ecuación, \(M\) corresponde al número de intervalos, y por lo tanto el tamaño de los intervalos \(\Delta_i\) dependerá del valor de \(M\). Entonces, es de esperarse que si el número de intervalos aumenta, el tamaño de los intervalos disminuya, tal que en el límite en que \(N \to \infty\) y \(M \to \infty\) el intervalo tiende a un infinitesimal \(dx\), y la ecuación (5.1) se convierte en la integral

(5.2)#\[ \int_{-\infty}^{\infty} f(x)\,dx = 1 .\]

La altura del intervalo \(f_i\) en la ecuación (5.1) se convierte ahora en \(f(x)\), una función continua de la variable aleatoria continua \(x\), que se denomina función densidad de probabilidad o función de la distribución de probabilidad.

En la Figura 5.1 se puede ver esta transformación a medida que cambian los valores de \(N\) y \(M\).

../../_images/normal.gif

Figura 5.1 Dependencia de la distribución al tamaño \(N\) de la muestra y al número \(M\) de intervalos del histograma.#

¡Hazlo tu mismo!

Si quieres cambiar tú mismo los parámetros puedes desplegar la siguiente ventana. Allí encontrarás el programa que genera la gráfica.

Hide code cell content
#### Valores a cambiar ###
##########################
N = 100    # Tamaño muestra. Cambiar por ejemplo hasta 1000 
M = 10      # Número de intervalos. Cambiar por ejemplo hasta 100
##########################

import numpy as np
import pylab as plt
plt.rcParams.update({'font.size': 16})

def normal(x,loc=0,scale=1):
    return (1/np.sqrt(2*np.pi))*np.exp(-x**2/2)

np.random.seed(0)
conjunto = np.random.normal(loc=0,scale=1,size=N)
infoHist = plt.hist(conjunto,bins=M,density=True,align='left',
                   color='silver')
x = np.linspace(-5,5,100)
plt.plot(x,normal(x,loc=0,scale=1),color='r',label=r'$f(x)$')
plt.title(r'N = {}, M = {}'.format(N,M))
plt.xlabel(r'$x_i$')
plt.ylabel(r'$f_i$')
plt.legend()
plt.show()
../../_images/b1b4586c85ab39ee3b63f9fa0a1bf6bae36923394a04eb1f4cb1f37520e36591.png

A partir de la definición (5.2) se puede determinar la probabilidad de obtener un resultado \(x\) para un rango definido,

(5.3)#\[ P(x_1 \leq x \leq x_2) = \int_{x_1}^{x_2} f(x)\,dx .\]

También se puede determinar la media o valor esperado de la variable \(x\),

(5.4)#\[ \bar x = \int_{-\infty}^{\infty} x f(x)\,dx, \]

o incluso, se puede determinar el valor esperado de la potencia \(n\) de la variable \(x\)[1]:

(5.5)#\[ \langle x^n \rangle = \int_{-\infty}^{\infty} x^n f(x)\,dx, \]

Finalmente, recordando la ecuación (2.11), ahora se puede definir el cuadrado de la desviación estándar, varianza, como

(5.6)#\[ \sigma^2 = \int_{-\infty}^{\infty} (x-\bar x)^2 f(x)\,dx .\]

Ver también

Más sobre la función densidad de probabilidad se puede encontrar en la sección 3.1 de [Hughes and Hase, 2010], secciones 4.2, 5.1 y 5.2 de [Taylor, 1996], sección 1.3 de [Bevington and Keith, 2001] y sección 1.4.2 de [Mahecha, 2009].