Machine Learning membuat komputer belajar dari mempelajari data dan statistik.
Machine Learning adalah langkah menuju kecerdasan buatan (AI).
Machine Learning adalah program yang menganalisis data dan belajar memprediksi hasilnya.
Section Artikel
Dalam tutorial ini kita akan membahas tentang matematika dan mempelajari statistik, dan bagaimana menghitung angka-angka penting berdasarkan kumpulan data.
Kita juga akan belajar bagaimana menggunakan berbagai modul Python untuk mendapatkan jawaban yang kita butuhkan.
Dan kita akan belajar bagaimana membuat fungsi yang mampu memprediksi hasil berdasarkan apa yang telah kita pelajari.
Dalam otak komputer, kumpulan data dapat terdiri dari kumpulan data apa pun mulai dari array hingga database lengkap.
Contoh array:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Contoh database:
Namamobil | Warna | Usia | Kecepatam | AutoPass |
BMW | merah | 5 | 99 | Y |
Volvo | hitam | 7 | 86 | Y |
VW | abu | 8 | 87 | N |
VW | putih | 7 | 88 | Y |
Ford | putih | 2 | 111 | Y |
VW | putih | 17 | 86 | Y |
Tesla | merah | 2 | 103 | Y |
BMW | hitam | 9 | 87 | Y |
Volvo | abu | 4 | 94 | N |
Ford | putih | 11 | 78 | N |
Toyota | abu | 12 | 77 | N |
VW | putih | 9 | 85 | N |
Toyota | biru | 6 | 86 | Y |
Dengan melihat array, kita dapat menebak bahwa nilai rata-ratanya mungkin sekitar 80 atau 90, dan kita juga dapat menentukan nilai tertinggi dan nilai terendah, tetapi apa lagi yang bisa kita lakukan?
Dan dengan melihat database kita dapat melihat bahwa warna yang paling populer adalah putih, dan mobil tertua adalah 17 tahun, tetapi bagaimana jika kita dapat memprediksi jika sebuah mobil memiliki AutoPass, hanya dengan melihat nilai lainnya?
Untuk itulah Machine Learning! Menganalisis data dan memprediksi hasilnya!
Dalam Machine Learning, bekerja dengan kumpulan data yang sangat besar merupakan hal yang umum. Dalam tutorial ini kita akan mencoba membuatnya semudah mungkin untuk memahami berbagai konsep Machine Learning, dan kita akan bekerja dengan kumpulan data kecil yang mudah dipahami.
Untuk menganalisis data, penting untuk mengetahui tipe data yang digunakan.
Kita dapat membagi tipe data menjadi tiga kategori utama:
Data numerical adalah angka, dan dapat dibagi menjadi dua kategori numerik:
Data Diskrit
Data Categorical adalah nilai yang tidak dapat diukur satu sama lain. Contoh: nilai warna, atau nilai ya / tidak.
Data ordinal seperti data kategori, tetapi dapat diukur satu sama lain. Contoh: nilai sekolah dimana A lebih baik dari B dan seterusnya.
Dengan mengetahui tipe data dari sumber data, kita akan dapat mengetahui teknik apa yang digunakan saat menganalisisnya.
Anda akan mempelajari lebih lanjut tentang statistik dan menganalisis data di bab-bab berikutnya.