El objetivo de esta entrada es el investigar la generación de pronósticos a partir de una serie. La herramienta que utilice para generar estos pronósticos fue Dobles Medias móviles las cuales son más acertadas cuando el comportamiento de la variable que estudiamos tiene una tendencia variable. Esta herramienta utiliza como predicción del periódo T+1 el valor del periódo T más la media de los incrementos observados en la muestra (1,2,…T)
Esta técnica supone dos medias móviles. La primera sobre el valor original de la variable y la segunda sobre la media móvil simple. La primera calcula el periodo T y con la segunda obtenemos su incremento. La predicción para más allá de un periódo supone una perdida de información o el uso de predicciones.
Para obtener la media móvil la obtenemos de la siguiente formula:
Para obtener la segunda media móvil utilizamos la siguiente fórmula:
Para obtener la predicción la obtenemos de la siguiente fórmula:
Donde
Para obtener los errores de las predicciones se utilizaron las siguientes fórmulas:
A continuación muestro los resultados de las predicciones que obtuve con la los prestamos de libros registrados en el 2009 en la UANL. He eliminado los prestamos realizados los sábados ya que son muy pocos (máximo 250) en comparación con los que se realizan de lunes a viernes.
Para la generación de predicciones con medias móviles es necesario especificar la cantidad de valores anteriores que se tomarán en cuenta.
En la gráficas siguientes podremos observar de color azul los prestamos registrados en el sistema y de color rojo los valores generados mediante las dobles medias móviles.
En primer instancia realicé la prueba con 30 valores anteriores para generar las predicciones y obtuve los siguientes resultados:
Se puede observar que la predicción tiende a tener un comportamiento parecido a los valores reales pero con muy poca precisión.
Estos son los resultados de error que de esta prueba:
Error absoluto de la media (MAD) | 14.5257978 |
Error absoluto porcentual de la media (MAPE) | 0.28473171 |
Desviación porcentual absoluta de la media (PMAD) | 0.00753047 |
Error cuadrático de la media (MSE) | 386527.106 |
Raíz del error cuadrático de la media (RMSE) | 621.713041 |
Para la segunda prueba reduje el número de valores a considerar para la predicción a 15 y obtuve los siguientes resultados:
Se puede observar que los valores pronosticados tienden a ser más precisos que la prueba anterior. En los valores de los errores se puede observar que el error absoluto de la media se incrementa pero los valores del error cuadrático de la media y la raíz del error cuadrático disminuyen.
Error absoluto de la media (MAD) | 71.6742415 |
Error absoluto porcentual de la media (MAPE) | 0.18077682 |
Desviación porcentual absoluta de la media (PMAD) | 0.03715738 |
Error cuadrático de la media (MSE) | 248015.863 |
Raíz del error cuadrático de la media (RMSE) | 498.01191 |
Continué disminuyendo la cantidad de valores a considerar para generar la predicción a 10 y obtuve los siguientes resultados:
Se puede observar que los valores son todavía más cercanos a los valores reales que en la prueba anterior.
También el error cuadrático de la media disminuye:
Error absoluto de la media (MAD) | 90.3441498 |
Error absoluto porcentual de la media (MAPE) | 0.16649666 |
Desviación porcentual absoluta de la media (PMAD) | 0.04683624 |
Error cuadrático de la media (MSE) | 169679.553 |
Raíz del error cuadrático de la media (RMSE) | 411.92178 |
Al generar las predicciones con 5 valores anteriores se obtuvo la siguiente gráfica:
A simple vista podría decirse que se ajusta muy bien a los valores reales pero al obtener los valores de los errores de la predicción se puede observar que son mayores que la prueba anterior, por lo que puede concluirse que la cantidad optima de valores a tomar para generar la predicción con este método para este caso está entre 5 y 10 valores.
Error absoluto de la media (MAD) | 242.963291 |
Error absoluto porcentual de la media (MAPE) | 0.30465659 |
Desviación porcentual absoluta de la media (PMAD) | 0.16433797 |
Error cuadrático de la media (MSE) | 198008.115 |
Raíz del error cuadrático de la media (RMSE) | 444.981028 |
Muy bien. Siete. Típicamente se usaría una parte de los datos (digamos 90) para crear un pronóstico para el restante y luego se compararía eso con el dato real conocido de la última décima parte.
ResponderEliminar