Home » python » SciPy Significance Tests

SciPy Significance Tests

by Catur Kurnia Sari
by Catur Kurnia Sari

Apa itu Uji Signifikansi Statistik?

Dalam statistik, signifikansi statistik berarti bahwa hasil yang dihasilkan memiliki alasan di baliknya, tidak diproduksi secara acak atau kebetulan.

SciPy memberi kita modul bernama scipy.stats, yang memiliki fungsi untuk melakukan uji signifikansi statistik.

Berikut beberapa teknik dan kata kunci yang penting saat melakukan pengujian tersebut:

Hipotesis dalam Statistik

Hipotesis adalah asumsi tentang suatu parameter dalam populasi.

Hipotesis Nol

Ini mengasumsikan bahwa observasi tidak signifikan secara statistik.

Hipotesis Alternatif

Ini mengasumsikan bahwa observasi disebabkan oleh beberapa alasan.

Ini alternatif untuk Hipotesis Nol.

Contoh:

Pada penilaian seorang siswa kita akan mengambil:

“siswa lebih buruk dari rata-rata” – sebagai hipotesis nol, dan:

“siswa lebih baik dari rata-rata” – sebagai hipotesis alternatif.

Tes One tailed

Ketika hipotesis kita hanya menguji satu sisi nilai, itu disebut “uji satu sisi”.

Contoh:

Untuk hipotesis nol:

“mean sama dengan k”, kita dapat memiliki hipotesis alternatif:

“meannya kurang dari k”, atau:

“mean lebih besar dari k”

Tes Two tailed

Saat hipotesis menguji kedua sisi nilai.

Contoh:

Untuk hipotesis nol:

“mean sama dengan k”, kita dapat memiliki hipotesis alternatif:

“mean tidak sama dengan k”

Dalam hal ini mean kurang dari, atau lebih besar dari k, dan kedua sisi harus diperiksa.

Nilai alfa

Nilai alfa adalah tingkat signifikansi.

Contoh:

Seberapa dekat data ekstrem tersebut agar hipotesis nol dapat ditolak.

Biasanya diambil sebagai 0,01, 0,05, atau 0,1.

Nilai P.

Nilai P menunjukkan seberapa dekat data ekstrim sebenarnya.

Nilai P dan nilai alpha dibandingkan untuk menetapkan signifikansi statistik.

Jika nilai p <= alpha kita menolak hipotesis nol dan mengatakan bahwa data signifikan secara statistik. jika tidak, kami menerima hipotesis nol.

Uji-T

Uji-t digunakan untuk menentukan apakah ada perbedaan yang signifikan antara rata-rata dua variabel. dan memberi kita informasi jika mereka termasuk dalam distribusi yang sama.

Ini adalah tes two tailed.

Fungsi ttest_ind () mengambil dua sampel dengan ukuran yang sama dan menghasilkan tupel statistik-t dan nilai-p.

Contoh:
Temukan apakah nilai yang diberikan v1 dan v2 berasal dari distribusi yang sama:

import numpy as np
from scipy.stats import ttest_ind

v1 = np.random.normal(size=100)
v2 = np.random.normal(size=100)

res = ttest_ind(v1, v2)

print(res)

Jika Anda hanya ingin mengembalikan nilai p, gunakan properti nilai p:

import numpy as np
from scipy.stats import ttest_ind

v1 = np.random.normal(size=100)
v2 = np.random.normal(size=100)

res = ttest_ind(v1, v2).pvalue

print(res)

KS-Test

Uji KS digunakan untuk memeriksa apakah nilai yang diberikan mengikuti distribusi.

Fungsi tersebut mengambil nilai untuk diuji, dan CDF sebagai dua parameter.

CDF dapat berupa string atau fungsi yang dapat dipanggil yang mengembalikan probabilitas.

Ini dapat digunakan sebagai uji satu sisi atau dua sisi.

Secara default ini adalah dua sisi. Kita bisa melewatkan alternatif parameter sebagai string dua sisi, kurang dari, atau lebih besar.

Contoh:
Temukan apakah nilai yang diberikan mengikuti distribusi normal:

import numpy as np
from scipy.stats import kstest

v = np.random.normal(size=100)

res = kstest(v, 'norm')

print(res)

Deskripsi Statistik Data

Untuk melihat ringkasan nilai dalam sebuah array, kita dapat menggunakan fungsi description().

Ini mengembalikan deskripsi berikut:

  1. jumlah pengamatan (nobs)
  2. nilai minimum dan maksimum = minmax
  3. Means
  4. varians
  5. skewness
  6. kurtosis

Contoh:
Perlihatkan deskripsi statistik dari nilai-nilai dalam sebuah array

import numpy as np
from scipy.stats import describe

v = np.random.normal(size=100)
res = describe(v)

print(res)

Tes Normalitas (Skewness dan Kurtosis)

Tes normalitas didasarkan pada skewness dan kurtosis.

Fungsi normaltest() mengembalikan nilai p untuk hipotesis nol:

“x berasal dari distribusi normal”.

Skewness:

Ukuran simetri dalam data.

Untuk distribusi normal nilainya 0.

Jika negatif, berarti data miring ke kiri.

Jika positif berarti data miring ke kanan.

Kurtosis:

Ukuran apakah data berat atau sedikit mengarah ke distribusi normal.

Kurtosis positif berarti bersisi berat.

Kurtosis negatif berarti bersiis ringan.

Contoh:
Temukan kemiringan dan kurtosis nilai dalam sebuah array

import numpy as np
from scipy.stats import skew, kurtosis

v = np.random.normal(size=100)

print(skew(v))
print(kurtosis(v))

Contoh:
Cari tahu apakah data tersebut berasal dari distribusi normal

import numpy as np
from scipy.stats import normaltest

v = np.random.normal(size=100)

print(normaltest(v))

You may also like