Interpretar los coeficientes de la regresión lineal
Aprende a interpretar correctamente los resultados de la regresión lineal – incluyendo los casos con transformaciones de las variables
Hoy en día existe una plétora de algoritmos de aprendizaje automático que podemos probar para encontrar el que mejor se adapte a nuestro problema particular. Algunos de los algoritmos tienen una interpretación clara, otros funcionan como una caja negra y podemos utilizar enfoques como LIME o SHAP para derivar algunas interpretaciones.
En este artículo, me gustaría centrarme en la interpretación de los coeficientes del modelo de regresión más básico, es decir, la regresión lineal, incluyendo las situaciones en las que las variables dependientes/independientes han sido transformadas (en este caso hablo de la transformación logarítmica).
Supongo que el lector está familiarizado con la regresión lineal (si no hay muchos buenos artículos y posts en Medium), así que me centraré únicamente en la interpretación de los coeficientes.
La fórmula básica de la regresión lineal se puede ver arriba (he omitido los residuos a propósito, para mantener las cosas simples y al punto). En la fórmula, y denota la variable dependiente y x es la variable independiente. Para simplificar, vamos a suponer que se trata de una regresión univariante, pero los principios obviamente también son válidos para el caso multivariante.
Para ponerlo en perspectiva, digamos que después de ajustar el modelo recibimos: