Home » R » Statistika di R : Mean, Median dan Mode Pada R Language

Statistika di R : Mean, Median dan Mode Pada R Language

by Hanifah Nurbaeti
by Hanifah Nurbaeti

Analisis statistik di R dilakukan dengan menggunakan banyak fungsi built-in. Sebagian besar fungsi ini adalah bagian dari paket dasar R. Fungsi-fungsi ini mengambil vektor R sebagai masukan bersama dengan argumen dan memberikan hasil. Kali ini kita akan membahasa fungsi mean() , median() dan mode() :

Mean, Median dan Mode

Dalam statistika, kita biasanya menghitung nilai-nilai yang ada dengan menggunakan mean() , median() dan mode()

  • Mean – Nilai rata-rata
  • Median – Nilai tengah
  • Mode – Nilai paling umum

Mean

Untuk menghitung nilai rata-rata (mean) variabel dari kumpulan data mtcars, temukan jumlah semua nilai dan bagi jumlahnya dengan jumlah nilai.

Sorted observation of wt (weight)

1.5131.6151.8351.9352.1402.2002.3202.465
2.6202.7702.7802.8753.1503.1703.1903.215
3.4353.4403.4403.4403.4603.5203.5703.570
3.7303.7803.8403.8454.0705.2505.3455.424

Sintaks yang digunakan untuk menghitung mean() :

mean(x, trim = 0, na.rm = FALSE, ...)

Berikut adalah deskripsi parameter yang digunakan :

  • x adalah vektor masukan.
  • trim digunakan untuk menghilangkan beberapa pengamatan dari kedua ujung vektor yang diurutkan.
  • na.rm digunakan untuk menghilangkan nilai yang hilang dari vektor masukan.

Contoh
Temukan berat rata-rata (wt) sebuah mobil:

Data_Cars <- mtcars

mean(Data_Cars$wt)

Output:

[1] 3.21725

Median

Nilai median adalah nilai di tengah. Nilai paling tengah dalam rangkaian data disebut median. Fungsi median() digunakan di R untuk menghitung nilai ini.

Jika kita melihat nilai variabel wt (dari kumpulan data mtcars), kita akan melihat bahwa ada dua angka di tengah:

Sorted observation of wt (weight)

1.5131.6151.8351.9352.1402.2002.3202.465
2.6202.7702.7802.8753.1503.1703.1903.215
3.4353.4403.4403.4403.4603.5203.5703.570
3.7303.7803.8403.8454.0705.2505.3455.424

Catatan: Jika ada dua angka di tengah, maka kita harus membagi jumlah angka-angka itu dengan dua, untuk mencari median.

Sintaks yang digunakan untuk menghitung median() :

median(x, na.rm = FALSE)

Berikut adalah deskripsi parameter yang digunakan :

  • x adalah vektor masukan.
  • na.rm digunakan untuk menghilangkan nilai yang hilang dari vektor masukan.

Contoh
Temukan nilai titik tengah berat (wt):

Data_Cars <- mtcars

median(Data_Cars$wt)

Output:

[1] 3.325

Mode

Mode adalah nilai yang memiliki jumlah kemunculan tertinggi dalam satu set data. Tidak seperti mean dan median, mode dapat memiliki data numerik dan karakter.

R tidak memiliki fungsi bawaan standar untuk menghitung mode. Jadi kita membuat fungsi pengguna untuk menghitung mode kumpulan data di R. Fungsi ini mengambil vektor sebagai input dan memberikan nilai mode sebagai output. Jadi kita dapat membuat fungsi kita sendiri untuk menemukannya.

Jika kita melihat nilai variabel wt (dari kumpulan data mtcars), kita akan melihat bahwa angka 3.440 sering ditampilkan:

Sorted observation of wt (weight)

1.5131.6151.8351.9352.1402.2002.3202.465
2.6202.7702.7802.8753.1503.1703.1903.215
3.4353.4403.4403.4403.4603.5203.5703.570
3.7303.7803.8403.8454.0705.2505.3455.424

Kita tidak akan menghitungnya sendiri, kita akan menggunakan kode berikut untuk menemukan mode:

Contoh

Data_Cars <- mtcars

names(sort(-table(Data_Cars$wt)))[1]

Output:

[1] "3.44"

Dari contoh di atas, kita sekarang tahu bahwa bilangan yang paling sering muncul dalam variabel mtcars wt adalah 3,44 atau 3,440 lbs.

You may also like