Regresi ganda atau multiple regression merupakan perluasan dari regresi linier ke dalam hubungan antara lebih dari dua variabel. Dalam hubungan linier sederhana kita memiliki satu variabel prediktor dan satu variabel respon, tetapi dalam regresi berganda kita memiliki lebih dari satu variabel prediktor dan satu variabel respon.
Persamaan matematika umum untuk regresi ganda adalah –
y = a + b1x1 + b2x2 + … bnxn
Deskripsi :
y
adalah variabel respon.
a, b1, b2 … bn
adalah koefisien.
x1, x2, … xn
adalah variabel prediktor.
Kita akan membuat model regresi dengan menggunakan fungsi lm()
di R. Model untuk menentukan nilai koefisien menggunakan data masukan. Selanjutnya kita dapat memprediksi nilai variabel respon untuk satu set variabel prediktor menggunakan koefisien ini.
Section Artikel
Fungsi lm ()
Fungsi ini menciptakan model hubungan antara prediktor dan variabel respon.
Sintaksis
Sintaks dasar untuk fungsi lm () dalam regresi berganda adalah –
lm (y ~ x1 + x2 + x3 …, data)
Deskripsi :
formula
(mis. y ~ x1 + x2 + x3 …
) adalah simbol yang mempresentasikan hubungan antara variabel respon dan variabel prediktor.
data
adalah vektor di mana rumus akan diterapkan.
Contoh
Masukan data
Pertimbangkan kumpulan data “mtcars” yang tersedia di lingkungan R. Ini memberikan perbandingan antara model mobil yang berbeda dalam hal jarak tempuh per galon (mpg), perpindahan silinder (“disp”), horse power(“hp”), berat mobil (“wt”) dan beberapa parameter lainnya.
Tujuan dari model ini adalah untuk menetapkan hubungan antara “mpg” sebagai variabel respon dengan “disp”, “hp” dan “wt” sebagai variabel prediktor. Kita akan buat subset variabel ini dari kumpulan data mtcars :
input <- mtcars[,c("mpg","disp","hp","wt")] print(head(input))
Output :
mpg disp hp wt
Mazda RX4 21.0 160 110 2.620
Mazda RX4 Wag 21.0 160 110 2.875
Datsun 710 22.8 108 93 2.320
Hornet 4 Drive 21.4 258 110 3.215
Hornet Sportabout 18.7 360 175 3.440
Valiant 18.1 225 105 3.460
Buat Relationship Model dan dapatkan Koefisien
input <- mtcars[,c("mpg","disp","hp","wt")] # Buat relationship model. model <- lm(mpg~disp+hp+wt, data = input) # Tampilkan model. print(model) # Dapatkan Intercept dan koefisien sebagai elemen vektor. cat("# # # # The Coefficient Values # # # ","\n") a <- coef(model)[1] print(a) Xdisp <- coef(model)[2] Xhp <- coef(model)[3] Xwt <- coef(model)[4] print(Xdisp) print(Xhp) print(Xwt)
Output :
Call:
lm(formula = mpg ~ disp + hp + wt, data = input)
Coefficients:
(Intercept) disp hp wt
37.105505 -0.000937 -0.031157 -3.800891
# # # # The Coefficient Values # # #
(Intercept)
37.10551
disp
-0.0009370091
hp
-0.03115655
wt
-3.800891
Buat Persamaan untuk Model Regresi
Berdasarkan intersep dan nilai koefisien di atas, kita buat persamaan matematikanya :
Y = a + Xdisp.x1 + Xhp.x2 + Xwt.x3
atau
Y = 37,15 + (- 0,000937) * x1 + (- 0,0311) * x2 + (- 3,8008) * x3
Terapkan Persamaan untuk memprediksi Nilai Baru
Kita dapat menggunakan persamaan regresi yang dibuat di atas untuk memprediksi jarak tempuh ketika serangkaian nilai baru untuk perpindahan, horsepower dan bobot disediakan.
Untuk mobil dengan disp = 221, hp = 102 dan wt = 2.91 jarak tempuh yang diprediksi adalah :
Y = 37.15+(-0.000937)*221+(-0.0311)*102+(-3.8008)*2.91 = 22.7104