Home » python » Standard Deviation Python Machine Learning

Standard Deviation Python Machine Learning

by Catur Kurnia Sari
by Catur Kurnia Sari

Apa itu Standar Deviasi?

Standar Deviasi adalah angka yang menggambarkan sebaran nilai tersebut.

Standar Deviasi yang rendah berarti bahwa sebagian besar angka mendekati nilai mean (rata-rata).

Standar Deviasi yang tinggi berarti nilai-nilai tersebut tersebar pada rentang yang lebih luas.

Contoh: Kali ini kita telah mencatat kecepatan 7 mobil:

kecepatan = [86,87,88,86,87,85,86]

Deviasi standarnya adalah:

0.9

Artinya sebagian besar nilai berada dalam kisaran 0.9 dari nilai mean yaitu 86.4.

Mari kita lakukan hal yang sama dengan pilihan angka dengan jangkauan yang lebih luas:

kecepatan = [32.111.138.28.59.77.97]

Deviasi standarnya adalah:

37.85

Artinya sebagian besar nilai berada dalam kisaran 37.85 dari nilai mean, yaitu 77.4.

Seperti yang kita lihat, Standar Deviasi yang lebih tinggi menunjukkan bahwa nilai-nilai tersebut tersebar pada rentang yang lebih luas.

Modul NumPy memiliki metode untuk menghitung deviasi standar:

Contoh:
Gunakan metode NumPy std() untuk mencari deviasi standar

import numpy

speed = [86,87,88,86,87,85,86]

x = numpy.std(speed)

print(x)
import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)

Varians

Varians adalah angka lain yang menunjukkan seberapa menyebar nilai-nilai tersebut.

Faktanya, jika kita mengambil akar kuadrat dari varians, kita mendapatkan nilai standar deviasi!

Atau sebaliknya, jika kita mengalikan standar deviasi dengan dirinya sendiri, kita mendapatkan variansnya!

Untuk menghitung varians, Anda harus melakukan sebagai berikut:

  1. Temukan mean:

(32 + 111 + 138 + 28 + 59 + 77 + 97) / 7 = 77,4

  1. Untuk setiap nilai: temukan varians dari mean: 32 – 77,4 = -45,4
    111 – 77,4 = 33,6
    138 – 77,4 = 60,6
    28 – 77,4 = -49,4
    59 – 77,4 = -18,4
    77 – 77,4 = – 0,4
    97 – 77,4 = 19,6
  2. Untuk setiap varians: temukan nilai kuadratnya:
    (-45,4)2 = 2061,16
    (33,6) 2 = 1128,96
    (60,6) 2 = 3672,36
    (-49,4) 2 = 2440,36
    (-18,4) 2 = 338,56
    (- 0,4) 2 = 0,16
    (19,6) 2 = 384,16
  1. Varians adalah jumlah rata-rata dari selisih kuadrat berikut:
    (2061.16 + 1128.96 + 3672.36 + 2440.36 + 338.56 + 0.16 + 384.16) / 7 = 1432.2

Untungnya, NumPy memiliki metode untuk menghitung varians:

Contoh:
Gunakan metode NumPy var() untuk menemukan varians

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.var(speed)

print(x)

Standar Deviasi

Seperti yang telah kita pelajari, rumus untuk mencari standar deviasi adalah akar kuadrat dari varians:

√1432.25 = 37.85

Atau, seperti pada contoh sebelumnya, gunakan NumPy untuk menghitung deviasi standar:

Contoh:
Gunakan metode NumPy std() untuk mencari deviasi standar

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)

Simbol

Standar Deviasi sering diwakili oleh simbol Sigma: σ

Varians sering diwakili oleh simbol Sigma Square: σ2

Ringkasan Bab

Standar Deviasi dan Varians merupakan istilah yang sering digunakan dalam Machine Learning, jadi penting untuk memahami cara mendapatkannya, dan konsep di baliknya.

You may also like