12 diciembre 2010

Pronósticos de series


El objetivo de esta entrada es el investigar la generación de pronósticos a partir de una serie. La herramienta que utilice para generar estos pronósticos fue Dobles Medias móviles las cuales son más acertadas cuando el comportamiento de la variable que estudiamos tiene una tendencia variable. Esta herramienta utiliza como predicción del periódo T+1 el valor del periódo T más la media de los incrementos observados en la muestra (1,2,…T)
Esta técnica supone dos medias móviles. La primera sobre el valor original de la variable y la segunda sobre la media móvil simple. La primera calcula el periodo T y con la segunda obtenemos su incremento. La predicción para más allá de un periódo supone una perdida de información o el uso de predicciones.
Para obtener la media móvil la obtenemos de la siguiente formula:
Para obtener la segunda media móvil utilizamos la siguiente fórmula:
Para obtener la predicción la obtenemos de la siguiente fórmula:

Donde

Para obtener los errores de las predicciones se utilizaron las siguientes fórmulas:


A continuación muestro los resultados de las predicciones que obtuve con la los prestamos de libros registrados en el 2009 en la UANL. He eliminado los prestamos realizados los sábados ya que son muy pocos (máximo 250) en comparación con los que se realizan de lunes a viernes.
Para la generación de predicciones con medias móviles es necesario especificar la cantidad de valores anteriores que se tomarán en cuenta.
En la gráficas siguientes podremos observar de color azul los prestamos registrados en el sistema y de color rojo los valores generados mediante las dobles medias móviles.
En primer instancia realicé la prueba con 30 valores anteriores para generar las predicciones y obtuve los siguientes resultados:

Se puede observar que la predicción tiende a tener un comportamiento parecido a los valores reales pero con muy poca precisión.
Estos son los resultados de error que de esta prueba:

Error absoluto de la media (MAD)
14.5257978
Error absoluto porcentual de la media (MAPE)
0.28473171
Desviación porcentual absoluta de la media (PMAD)
0.00753047
Error cuadrático de la media (MSE)
386527.106
Raíz del error cuadrático de la media (RMSE)
621.713041


Para la segunda prueba reduje el número de valores a considerar para la predicción a 15 y obtuve los siguientes resultados:

Se puede observar que los valores pronosticados tienden a ser más precisos que la prueba anterior. En los valores de los errores se puede observar que el error absoluto de la media se incrementa pero los valores del error cuadrático de la media y la raíz del error cuadrático disminuyen.

Error absoluto de la media (MAD)
71.6742415
Error absoluto porcentual de la media (MAPE)
0.18077682
Desviación porcentual absoluta de la media (PMAD)
0.03715738
Error cuadrático de la media (MSE)
248015.863
Raíz del error cuadrático de la media (RMSE)
498.01191

Continué disminuyendo la cantidad de valores a considerar para generar la predicción a 10 y obtuve los siguientes resultados:


Se puede observar que los valores son todavía más cercanos a los valores reales que en la prueba anterior.
También el error cuadrático de la media disminuye:
Error absoluto de la media (MAD)
90.3441498
Error absoluto porcentual de la media (MAPE)
0.16649666
Desviación porcentual absoluta de la media (PMAD)
0.04683624
Error cuadrático de la media (MSE)
169679.553
Raíz del error cuadrático de la media (RMSE)
411.92178
Al generar las predicciones con 5 valores anteriores se obtuvo la siguiente gráfica:


A simple vista podría decirse que se ajusta muy bien a los valores reales pero al obtener los valores de los errores de la predicción se puede observar que son mayores que la prueba anterior, por lo que puede concluirse que la cantidad optima de valores a tomar para generar la predicción con este método para este caso está entre 5 y 10 valores.
Error absoluto de la media (MAD)
242.963291
Error absoluto porcentual de la media (MAPE)
0.30465659
Desviación porcentual absoluta de la media (PMAD)
0.16433797
Error cuadrático de la media (MSE)
198008.115
Raíz del error cuadrático de la media (RMSE)
444.981028

1 comentario:

  1. Muy bien. Siete. Típicamente se usaría una parte de los datos (digamos 90) para crear un pronóstico para el restante y luego se compararía eso con el dato real conocido de la última décima parte.

    ResponderEliminar