Interpretare i coefficienti della regressione lineare
Impara come interpretare correttamente i risultati della regressione lineare – inclusi i casi con trasformazioni di variabili
Oggi c’è una pletora di algoritmi di apprendimento automatico che possiamo provare per trovare il migliore per il nostro particolare problema. Alcuni algoritmi hanno un’interpretazione chiara, altri funzionano come una scatola nera e possiamo usare approcci come LIME o SHAP per ricavare alcune interpretazioni.
In questo articolo, vorrei concentrarmi sull’interpretazione dei coefficienti del modello di regressione più basilare, cioè la regressione lineare, comprese le situazioni in cui le variabili dipendenti/indipendenti sono state trasformate (in questo caso sto parlando della trasformazione log).
Presumo che il lettore abbia familiarità con la regressione lineare (se no c’è un sacco di buoni articoli e post su Medium), quindi mi concentrerò esclusivamente sull’interpretazione dei coefficienti.
La formula di base della regressione lineare può essere vista sopra (ho omesso i residui di proposito, per mantenere le cose semplici e al punto). Nella formula, y denota la variabile dipendente e x è la variabile indipendente. Per semplicità assumiamo che si tratti di regressione univariata, ma i principi ovviamente valgono anche per il caso multivariato.
Per metterlo in prospettiva, diciamo che dopo aver adattato il modello riceviamo: