Home » R » Macam Grafik Di R : Scatterplot Pada R Language

Macam Grafik Di R : Scatterplot Pada R Language

by Hanifah Nurbaeti
by Hanifah Nurbaeti

Section Artikel

Scatterplot

Scatterplots menunjukkan banyak titik yang diplot di bidang Cartesian. Setiap titik mewakili nilai dua variabel. Satu variabel dipilih di sumbu horizontal dan variabel lainnya di sumbu vertikal. Sebuah “Scatterplot” adalah jenis plot yang digunakan untuk menampilkan hubungan antara dua variabel numerik, dan plot satu titik untuk setiap pengamatan.

Dibutuhkan dua vektor dengan panjang yang sama, satu untuk sumbu x (horizontal) dan satu untuk sumbu y (vertikal):

Contoh

bitmap(file="7.png")

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Output :

Hasil dari kode contoh di atas akan menunjukkan 12 titik mobil yang ada

Itu mungkin tidak jelas bagi seseorang yang melihat grafik untuk pertama kalinya, jadi mari tambahkan judul dan label berbeda untuk mendeskripsikan scatterplot dengan lebih baik:

Contoh

bitmap(file="in.jpg")

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Output :

Berdasarkan contoh di atas, dapat disimpulkan :

Sumbu x menunjukkan usia mobil tersebut.

Sumbu y menunjukkan kecepatan mobil saat melintas.

Apa hubungannya dengan observasi?

Tampaknya semakin baru mobilnya, semakin cepat ia melaju, tetapi itu bisa jadi kebetulan, lagipula kita hanya mendaftarkan 12 mobil.

Syntax

Sintaks dasar untuk membuat sebar di R adalah –

plot (x, y, main, xlab, ylab, xlim, ylim, axes)

Deskripsi Syntax :

x adalah kumpulan data yang nilainya adalah koordinat horizontal.

y adalah kumpulan data yang nilainya adalah koordinat vertikal.

main adalah judul grafik.

xlab adalah label pada sumbu horizontal.

ylab adalah label pada sumbu vertikal.

xlim adalah batas nilai x yang digunakan untuk plot.

ylim adalah batas nilai y yang digunakan untuk plot.

axes menunjukkan apakah kedua sumbu harus digambar di plot.

Contoh
Kita akan gunakan kumpulan data dari “mtcars” yang tersedia di lingkungan R untuk membuat scatterplot. Mari kita gunakan kolom “wt” dan “mpg” di mtcars.

input <- mtcars[,c('wt','mpg')]
print(head(input))

Output :

                    wt      mpg
Mazda RX4           2.620   21.0
Mazda RX4 Wag       2.875   21.0
Datsun 710          2.320   22.8
Hornet 4 Drive      3.215   21.4
Hornet Sportabout   3.440   18.7
Valiant             3.460   18.1

Membandingkan Scatterplot

Pada contoh di atas, tampaknya ada hubungan antara kecepatan mobil dan usia, tetapi bagaimana jika kita memplot pengamatan dari hari lain juga? Akankah scatterplot memberi tahu kita sesuatu yang lain?

Untuk membandingkan plot dengan plot lain, gunakan fungsi points():

Contoh
Gambar dua plot pada gambar yang sama:

bitmap(file="out.png")

# hari pertama, usia dan kecepatan 12 mobil:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# hari kedua, umur dan kecepatan 15 mobil:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Output :

Catatan: Untuk dapat melihat perbedaan perbandingan, maka kita harus menetapkan warna yang berbeda pada plot (dengan menggunakan parameter col). Merah mewakili nilai hari 1, sedangkan biru mewakili hari 2. Kita juga menambahkan parameter cex untuk meningkatkan ukuran titik.

Kesimpulan pengamatan: Dengan membandingkan kedua plot, saya pikir aman untuk mengatakan bahwa keduanya memberi kita kesimpulan yang sama: semakin baru mobilnya, semakin cepat ia melaju.

Matriks Scatterplot

Ketika memiliki lebih dari dua variabel dan ingin menemukan korelasi antara satu variabel versus variabel yang tersisa, kita akan menggunakan matriks scatterplot. Kita gunakan fungsi pairs() untuk membuat matriks dari scatterplot.

Syntax

Sintaks dasar untuk membuat matriks scatterplot di R adalah –

pairs(formula, data)

Deskripsi Syntax :

formula mewakili rangkaian variabel yang digunakan berpasangan.

data mewakili kumpulan data dari mana variabel akan diambil.

Contoh
Setiap variabel dipasangkan dengan masing-masing variabel yang tersisa. Sebuah scaterplot sudah diplot untuk setiap pasangan.

# Beri nama file 
png(file = "scatterplot_matrices.png")

# Plotkan matriks antara 4 variabel yang menghasilkan 12 plot.

# Satu variabel dengan 3 lainnya dan total 4 variabel.

pairs(~wt+mpg+disp+cyl,data = mtcars,
   main = "Scatterplot Matrix")

# Simpan file.
dev.off()

Output :

You may also like