Home » python » Numpy Random Distribusi Data

Numpy Random Distribusi Data

by Catur Kurnia Sari
by Catur Kurnia Sari

Apa itu Distribusi Data?

Distribusi Data adalah daftar semua nilai yang mungkin, dan seberapa sering setiap nilai muncul.

Daftar seperti itu penting ketika bekerja dengan statistik dan ilmu data.

Modul random menyediakan metode yang mengembalikan distribusi data yang dibuat secara acak.

Distribusi Acak

Distribusi acak adalah sekumpulan bilangan acak yang mengikuti fungsi kepadatan probabilitas tertentu.

Fungsi Kepadatan Probabilitas: Fungsi yang menggambarkan probabilitas kontinu. yaitu probabilitas semua nilai dalam array.

Kita dapat menghasilkan angka acak berdasarkan probabilitas yang ditentukan menggunakan metode choice() dari modul random.

Metode choice() memungkinkan kita untuk menentukan probabilitas pada setiap nilai.

Probabilitas ditentukan oleh angka antara 0 dan 1, di mana 0 berarti nilai tidak akan pernah terjadi dan 1 berarti nilai akan selalu terjadi.

Contoh:
Buat array 1-D yang berisi 100 nilai, di mana setiap nilai harus 3, 5, 7 atau 9.

Probabilitas untuk nilai menjadi 3 diatur menjadi 0,1

Probabilitas untuk nilai menjadi 5 diatur menjadi 0,3

Probabilitas untuk nilai menjadi 7 diatur menjadi 0,6

Probabilitas untuk nilai menjadi 9 diatur menjadi 0

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

Jumlah semua angka probabilitas harus 1.

Bahkan jika kita menjalankan contoh di atas 100 kali, nilai 9 tidak akan pernah terjadi.

Kita dapat mengembalikan array dalam bentuk dan ukuran apapun dengan menentukan bentuk di parameter size.

Contoh:
Contoh yang sama seperti di atas, tetapi mengembalikan array 2-D dengan 3 baris, masing-masing berisi 5 nilai

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)

You may also like