Home » R » Statistika di R : Poisson Regression Pada R Language

Statistika di R : Poisson Regression Pada R Language

by Hanifah Nurbaeti
by Hanifah Nurbaeti

Section Artikel

Regresi Poisson

Regresi Poisson melibatkan model regresi dimana variabel responnya berupa bilangan dan bukan bilangan pecahan. Misalnya, jumlah kelahiran atau jumlah kemenangan dalam seri pertandingan sepak bola. Juga nilai variabel respon mengikuti distribusi Poisson.

Persamaan matematika umum untuk regresi Poisson adalah –

log (y) = a + b1x1 + b2x2 + bnxn …..

Berikut adalah deskripsi parameter yang digunakan –

y adalah variabel respon.

a dan b adalah koefisien numerik.

x adalah variabel prediktor.

Fungsi yang digunakan untuk membuat model regresi Poisson adalah fungsi glm().

Syntax

Sintaks dasar untuk fungsi glm() dalam regresi Poisson adalah :

glm (formula, data, family)

Deskripsi :

formula adalah simbol yang mempresentasikan hubungan antar variabel.

data adalah kumpulan data yang memberikan nilai variabel-variabel ini.

family adalah objek R untuk menentukan detail model. Nilainya adalah ‘Poisson’ untuk Regresi Logistik.

Contoh

Kita akan pakai kumpulan data built-in “warpbreaks” yang menjelaskan pengaruh jenis wol (A atau B) dan tegangan (rendah, sedang atau tinggi) pada jumlah kerusakan warp per alat tenun. Mari kita pertimbangkan “breaks” sebagai variabel respons yang merupakan jumlah jeda. “type” dan “tension” wol diambil sebagai variabel prediktor.

Masukkan Data

input <- warpbreaks
print(head(input))

Output :

     breaks   wool  tension
1     26       A     L
2     30       A     L
3     54       A     L
4     25       A     L
5     70       A     L
6     52       A     L

Buat Model Regresi

output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
   family = poisson)
print(summary(output))

Output :

Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)

Deviance Residuals: 
    Min       1Q     Median       3Q      Max  
  -3.6871  -1.6503  -0.4269     1.1902   4.2616  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  3.69196    0.04541  81.302  < 2e-16 ***
woolB       -0.20599    0.05157  -3.994 6.49e-05 ***
tensionM    -0.32132    0.06027  -5.332 9.73e-08 ***
tensionH    -0.51849    0.06396  -8.107 5.21e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 297.37  on 53  degrees of freedom
Residual deviance: 210.39  on 50  degrees of freedom
AIC: 493.06

Number of Fisher Scoring iterations: 4

Kesimpulannya dari contoh di atas adalah mencari nilai-p di kolom terakhir menjadi kurang dari 0,05 untuk mempertimbangkan dampak variabel prediktor pada variabel respons. Seperti yang terlihat pada wol tipe B yang memiliki tipe tegangan M dan H berpengaruh terhadap jumlah putus.

You may also like