Apa itu Uji Signifikansi Statistik?
Dalam statistik, signifikansi statistik berarti bahwa hasil yang dihasilkan memiliki alasan di baliknya, tidak diproduksi secara acak atau kebetulan.
SciPy memberi kita modul bernama scipy.stats, yang memiliki fungsi untuk melakukan uji signifikansi statistik.
Berikut beberapa teknik dan kata kunci yang penting saat melakukan pengujian tersebut:
Section Artikel
Hipotesis dalam Statistik
Hipotesis adalah asumsi tentang suatu parameter dalam populasi.
Hipotesis Nol
Ini mengasumsikan bahwa observasi tidak signifikan secara statistik.
Hipotesis Alternatif
Ini mengasumsikan bahwa observasi disebabkan oleh beberapa alasan.
Ini alternatif untuk Hipotesis Nol.
Contoh:
Pada penilaian seorang siswa kita akan mengambil:
“siswa lebih buruk dari rata-rata” – sebagai hipotesis nol, dan:
“siswa lebih baik dari rata-rata” – sebagai hipotesis alternatif.
Tes One tailed
Ketika hipotesis kita hanya menguji satu sisi nilai, itu disebut “uji satu sisi”.
Contoh:
Untuk hipotesis nol:
“mean sama dengan k”, kita dapat memiliki hipotesis alternatif:
“meannya kurang dari k”, atau:
“mean lebih besar dari k”
Tes Two tailed
Saat hipotesis menguji kedua sisi nilai.
Contoh:
Untuk hipotesis nol:
“mean sama dengan k”, kita dapat memiliki hipotesis alternatif:
“mean tidak sama dengan k”
Dalam hal ini mean kurang dari, atau lebih besar dari k, dan kedua sisi harus diperiksa.
Nilai alfa
Nilai alfa adalah tingkat signifikansi.
Contoh:
Seberapa dekat data ekstrem tersebut agar hipotesis nol dapat ditolak.
Biasanya diambil sebagai 0,01, 0,05, atau 0,1.
Nilai P.
Nilai P menunjukkan seberapa dekat data ekstrim sebenarnya.
Nilai P dan nilai alpha dibandingkan untuk menetapkan signifikansi statistik.
Jika nilai p <= alpha kita menolak hipotesis nol dan mengatakan bahwa data signifikan secara statistik. jika tidak, kami menerima hipotesis nol.
Uji-T
Uji-t digunakan untuk menentukan apakah ada perbedaan yang signifikan antara rata-rata dua variabel. dan memberi kita informasi jika mereka termasuk dalam distribusi yang sama.
Ini adalah tes two tailed.
Fungsi ttest_ind () mengambil dua sampel dengan ukuran yang sama dan menghasilkan tupel statistik-t dan nilai-p.
Contoh:
Temukan apakah nilai yang diberikan v1 dan v2 berasal dari distribusi yang sama:
import numpy as np from scipy.stats import ttest_ind v1 = np.random.normal(size=100) v2 = np.random.normal(size=100) res = ttest_ind(v1, v2) print(res)
Jika Anda hanya ingin mengembalikan nilai p, gunakan properti nilai p:
import numpy as np from scipy.stats import ttest_ind v1 = np.random.normal(size=100) v2 = np.random.normal(size=100) res = ttest_ind(v1, v2).pvalue print(res)
KS-Test
Uji KS digunakan untuk memeriksa apakah nilai yang diberikan mengikuti distribusi.
Fungsi tersebut mengambil nilai untuk diuji, dan CDF sebagai dua parameter.
CDF dapat berupa string atau fungsi yang dapat dipanggil yang mengembalikan probabilitas.
Ini dapat digunakan sebagai uji satu sisi atau dua sisi.
Secara default ini adalah dua sisi. Kita bisa melewatkan alternatif parameter sebagai string dua sisi, kurang dari, atau lebih besar.
Contoh:
Temukan apakah nilai yang diberikan mengikuti distribusi normal:
import numpy as np from scipy.stats import kstest v = np.random.normal(size=100) res = kstest(v, 'norm') print(res)
Deskripsi Statistik Data
Untuk melihat ringkasan nilai dalam sebuah array, kita dapat menggunakan fungsi description().
Ini mengembalikan deskripsi berikut:
- jumlah pengamatan (nobs)
- nilai minimum dan maksimum = minmax
- Means
- varians
- skewness
- kurtosis
Contoh:
Perlihatkan deskripsi statistik dari nilai-nilai dalam sebuah array
import numpy as np from scipy.stats import describe v = np.random.normal(size=100) res = describe(v) print(res)
Tes Normalitas (Skewness dan Kurtosis)
Tes normalitas didasarkan pada skewness dan kurtosis.
Fungsi normaltest() mengembalikan nilai p untuk hipotesis nol:
“x berasal dari distribusi normal”.
Skewness:
Ukuran simetri dalam data.
Untuk distribusi normal nilainya 0.
Jika negatif, berarti data miring ke kiri.
Jika positif berarti data miring ke kanan.
Kurtosis:
Ukuran apakah data berat atau sedikit mengarah ke distribusi normal.
Kurtosis positif berarti bersisi berat.
Kurtosis negatif berarti bersiis ringan.
Contoh:
Temukan kemiringan dan kurtosis nilai dalam sebuah array
import numpy as np from scipy.stats import skew, kurtosis v = np.random.normal(size=100) print(skew(v)) print(kurtosis(v))
Contoh:
Cari tahu apakah data tersebut berasal dari distribusi normal
import numpy as np from scipy.stats import normaltest v = np.random.normal(size=100) print(normaltest(v))