Scatterplot
Scatterplots menunjukkan banyak titik yang diplot di bidang Cartesian. Setiap titik mewakili nilai dua variabel. Satu variabel dipilih di sumbu horizontal dan variabel lainnya di sumbu vertikal. Sebuah “Scatterplot” adalah jenis plot yang digunakan untuk menampilkan hubungan antara dua variabel numerik, dan plot satu titik untuk setiap pengamatan.
Dibutuhkan dua vektor dengan panjang yang sama, satu untuk sumbu x (horizontal) dan satu untuk sumbu y (vertikal):
Contoh
bitmap(file="7.png") x <- c(5,7,8,7,2,2,9,4,11,12,9,6) y <- c(99,86,87,88,111,103,87,94,78,77,85,86) plot(x, y)
Output :

Hasil dari kode contoh di atas akan menunjukkan 12 titik mobil yang ada
Itu mungkin tidak jelas bagi seseorang yang melihat grafik untuk pertama kalinya, jadi mari tambahkan judul dan label berbeda untuk mendeskripsikan scatterplot dengan lebih baik:
Contoh
bitmap(file="in.jpg") x <- c(5,7,8,7,2,2,9,4,11,12,9,6) y <- c(99,86,87,88,111,103,87,94,78,77,85,86) plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")
Output :

Berdasarkan contoh di atas, dapat disimpulkan :
Sumbu x menunjukkan usia mobil tersebut.
Sumbu y menunjukkan kecepatan mobil saat melintas.
Apa hubungannya dengan observasi?
Tampaknya semakin baru mobilnya, semakin cepat ia melaju, tetapi itu bisa jadi kebetulan, lagipula kita hanya mendaftarkan 12 mobil.
Syntax
Sintaks dasar untuk membuat sebar di R adalah –
plot (x, y, main, xlab, ylab, xlim, ylim, axes)
Deskripsi Syntax :
x
adalah kumpulan data yang nilainya adalah koordinat horizontal.
y
adalah kumpulan data yang nilainya adalah koordinat vertikal.
main
adalah judul grafik.
xlab
adalah label pada sumbu horizontal.
ylab
adalah label pada sumbu vertikal.
xlim
adalah batas nilai x yang digunakan untuk plot.
ylim
adalah batas nilai y yang digunakan untuk plot.
axes
menunjukkan apakah kedua sumbu harus digambar di plot.
Contoh
Kita akan gunakan kumpulan data dari “mtcars” yang tersedia di lingkungan R untuk membuat scatterplot. Mari kita gunakan kolom “wt” dan “mpg” di mtcars.
input <- mtcars[,c('wt','mpg')] print(head(input))
Output :
wt mpg
Mazda RX4 2.620 21.0
Mazda RX4 Wag 2.875 21.0
Datsun 710 2.320 22.8
Hornet 4 Drive 3.215 21.4
Hornet Sportabout 3.440 18.7
Valiant 3.460 18.1
Membandingkan Scatterplot
Pada contoh di atas, tampaknya ada hubungan antara kecepatan mobil dan usia, tetapi bagaimana jika kita memplot pengamatan dari hari lain juga? Akankah scatterplot memberi tahu kita sesuatu yang lain?
Untuk membandingkan plot dengan plot lain, gunakan fungsi points()
:
Contoh
Gambar dua plot pada gambar yang sama:
bitmap(file="out.png") # hari pertama, usia dan kecepatan 12 mobil: x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6) y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86) # hari kedua, umur dan kecepatan 15 mobil: x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12) y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85) plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2) points(x2, y2, col="blue", cex=2)
Output :

Catatan: Untuk dapat melihat perbedaan perbandingan, maka kita harus menetapkan warna yang berbeda pada plot (dengan menggunakan parameter col). Merah mewakili nilai hari 1
, sedangkan biru mewakili hari 2
. Kita juga menambahkan parameter cex untuk meningkatkan ukuran titik.
Kesimpulan pengamatan: Dengan membandingkan kedua plot, saya pikir aman untuk mengatakan bahwa keduanya memberi kita kesimpulan yang sama: semakin baru mobilnya, semakin cepat ia melaju.
Matriks Scatterplot
Ketika memiliki lebih dari dua variabel dan ingin menemukan korelasi antara satu variabel versus variabel yang tersisa, kita akan menggunakan matriks scatterplot. Kita gunakan fungsi pairs()
untuk membuat matriks dari scatterplot.
Syntax
Sintaks dasar untuk membuat matriks scatterplot di R adalah –
pairs(formula, data)
Deskripsi Syntax :
formula
mewakili rangkaian variabel yang digunakan berpasangan.
data
mewakili kumpulan data dari mana variabel akan diambil.
Contoh
Setiap variabel dipasangkan dengan masing-masing variabel yang tersisa. Sebuah scaterplot sudah diplot untuk setiap pasangan.
# Beri nama file png(file = "scatterplot_matrices.png") # Plotkan matriks antara 4 variabel yang menghasilkan 12 plot. # Satu variabel dengan 3 lainnya dan total 4 variabel. pairs(~wt+mpg+disp+cyl,data = mtcars, main = "Scatterplot Matrix") # Simpan file. dev.off()
Output :
