Mysql
 sql >> Datenbank >  >> RDS >> Mysql

VIFs, die Alias-Koeffizienten in R zurückgeben

Verwenden Sie die Alias-Funktion in R, um zu sehen, welche Variablen linear abhängig sind. Entfernen Sie die abhängigen Variablen und die vif-Funktion sollte korrekt funktionieren.

formula <- as.formula(Spring_Autumn ~ Oct + Nov + Dec + Jan + Feb + Mar + Apr + May + Jun + Jul + Aug + Sep + X1min + X3min +   X7min + X30min + X90min + X1max + X3max + X7max + X30max + X90max + BF + Dmin + Dmax+ LP + LPD + HP + HPD + RR + FR + Rev, data = IHA_stats)
fit <-lm(formula)

#the linearly dependent variables
ld.vars <- attributes(alias(fit)$Complete)$dimnames[[1]]

#remove the linearly dependent variables variables
formula.new <- as.formula(
    paste(
        paste(deparse(formula), collapse=""), 
        paste(ld.vars, collapse="-"),
        sep="-"
    )
)

#run model again
fit.new <-lm(formula.new)
vif(fit.new)

HINWEIS:Dies funktioniert nicht, wenn Sie automatisch generierte Dummy-Variablen haben, die mit anderen Variablen identisch sind. Die Variablennamen werden durcheinander gebracht. Sie können Ihren eigenen Hack erstellen, um dies zu umgehen.