Boxplot adalah ukuran seberapa baik distribusi data dalam suatu kumpulan data. Ini membagi kumpulan data menjadi tiga kuartil. Grafik ini mewakili kuartil minimum, maksimum, median, kuartil pertama, dan ketiga dalam kumpulan data. Ini juga berguna dalam membandingkan distribusi data di seluruh kumpulan data dengan menggambar diagram kotak untuk masing-masingnya.
Boxplot dibuat di R dengan menggunakan fungsi boxplot()
.
Sintaks dasar untuk membuat diagram kotak di R adalah –
boxplot (x, data, notch, varwidth, names, main)
Deskripsi
x
adalah vektor atau rumus.
data
adalah kerangka data.
notch
adalah nilai logis. Setel sebagai TRUE untuk menggambar notch.
varwidth
adalah nilai logis. Tetapkan sebagai true untuk menggambar lebar kotak yang proporsional dengan ukuran sampel.
names
adalah label grup yang akan dicetak di bawah setiap boxplot.
main
digunakan untuk memberi judul pada grafik.
Contoh
Kita akan gunakan kumpulan data “mtcars” yang tersedia di lingkungan R untuk membuat diagram kotak dasar. Mari kita lihat kolom “mpg” dan “cyl” di mtcars.
Contoh :
input <- mtcars[,c('mpg','cyl')] print(head(input))
Output :
mpg cyl
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
Skrip di bawah ini akan membuat grafik diagram kotak untuk hubungan antara mpg (mil per galon) dan silinder (jumlah silinder).
Contoh :
# Beri nama file bagan. png(file = "boxplot.png") # Plot the chart. boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data") # Save the file. dev.off()
Output :
Kita dapat menggambar diagram kotak dengan notch untuk mengetahui bagaimana median dari kelompok data yang berbeda cocok satu sama lain.
Skrip di bawah ini akan membuat grafik diagram kotak dengan takik untuk masing-masing grup data.
Contoh :
# Beri nama file bagan. png(file = "boxplot_with_notch.png") # Plot the chart. boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data", notch = TRUE, varwidth = TRUE, col = c("green","yellow","purple"), names = c("High","Medium","Low") ) # Save the file. dev.off()
Output :