Home » python » Memulai Machine Learning Python

Memulai Machine Learning Python

by Catur Kurnia Sari
by Catur Kurnia Sari

Machine Learning membuat komputer belajar dari mempelajari data dan statistik.

Machine Learning adalah langkah menuju kecerdasan buatan (AI).

Machine Learning adalah program yang menganalisis data dan belajar memprediksi hasilnya.

Mulai dari mana?

Dalam tutorial ini kita akan membahas tentang matematika dan mempelajari statistik, dan bagaimana menghitung angka-angka penting berdasarkan kumpulan data.

Kita juga akan belajar bagaimana menggunakan berbagai modul Python untuk mendapatkan jawaban yang kita butuhkan.

Dan kita akan belajar bagaimana membuat fungsi yang mampu memprediksi hasil berdasarkan apa yang telah kita pelajari.

Himpunan data

Dalam otak komputer, kumpulan data dapat terdiri dari kumpulan data apa pun mulai dari array hingga database lengkap.

Contoh array:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Contoh database:

NamamobilWarnaUsiaKecepatamAutoPass
BMWmerah599Y
Volvohitam786Y
VWabu887N
VWputih788Y
Fordputih2111Y
VWputih1786Y
Teslamerah2103Y
BMWhitam987Y
Volvoabu494N
Fordputih1178N
Toyotaabu1277N
VWputih985N
Toyotabiru686Y

Dengan melihat array, kita dapat menebak bahwa nilai rata-ratanya mungkin sekitar 80 atau 90, dan kita juga dapat menentukan nilai tertinggi dan nilai terendah, tetapi apa lagi yang bisa kita lakukan?

Dan dengan melihat database kita dapat melihat bahwa warna yang paling populer adalah putih, dan mobil tertua adalah 17 tahun, tetapi bagaimana jika kita dapat memprediksi jika sebuah mobil memiliki AutoPass, hanya dengan melihat nilai lainnya?

Untuk itulah Machine Learning! Menganalisis data dan memprediksi hasilnya!

Dalam Machine Learning, bekerja dengan kumpulan data yang sangat besar merupakan hal yang umum. Dalam tutorial ini kita akan mencoba membuatnya semudah mungkin untuk memahami berbagai konsep Machine Learning, dan kita akan bekerja dengan kumpulan data kecil yang mudah dipahami.

Tipe Data

Untuk menganalisis data, penting untuk mengetahui tipe data yang digunakan.

Kita dapat membagi tipe data menjadi tiga kategori utama:

  • Numerical
  • Categorical
  • Ordinal

Data numerical adalah angka, dan dapat dibagi menjadi dua kategori numerik:

Data Diskrit

  • angka yang dibatasi bilangan bulat. Contoh: Jumlah mobil yang lewat.
    Data Berkelanjutan
  • angka yang nilainya tak terbatas. Contoh: Harga suatu barang, atau ukuran suatu barang

Data Categorical adalah nilai yang tidak dapat diukur satu sama lain. Contoh: nilai warna, atau nilai ya / tidak.

Data ordinal seperti data kategori, tetapi dapat diukur satu sama lain. Contoh: nilai sekolah dimana A lebih baik dari B dan seterusnya.

Dengan mengetahui tipe data dari sumber data, kita akan dapat mengetahui teknik apa yang digunakan saat menganalisisnya.

Anda akan mempelajari lebih lanjut tentang statistik dan menganalisis data di bab-bab berikutnya.

You may also like