Section Artikel
Pengertian Time Series Analysis
Time series analysis atau deret waktu adalah rangkaian titik data yang setiap titik datanya dikaitkan dengan stempel waktu. Contoh sederhananya adalah harga saham di pasar saham pada titik waktu yang berbeda pada hari tertentu. Contoh lainnya adalah jumlah curah hujan di suatu wilayah pada bulan-bulan yang berbeda dalam setahun. Bahasa R menggunakan banyak fungsi untuk membuat, memanipulasi, dan memplot data deret waktu. Data untuk deret waktu disimpan dalam objek R yang disebut objek deret waktu. Ini juga merupakan objek data R seperti vektor atau bingkai data.
Objek deret waktu dibuat dengan menggunakan fungsi ts()
.
Syntax
Sintaks dasar untuk fungsi ts()
dalam analisis deret waktu adalah :
timeseries.object.name <- ts(data, start, end, frequency)
Berikut adalah deskripsi parameter yang digunakan –
data
adalah vektor atau matriks yang berisi nilai-nilai yang digunakan dalam deret waktu.
start
menentukan waktu mulai untuk pengamatan pertama dalam deret waktu.
end
menentukan waktu berakhir untuk pengamatan terakhir dalam deret waktu.
frequency
menentukan jumlah pengamatan per satuan waktu.
Parameter “data” sifatnya wajib tercantung, sedangkan yang lain opsional.
Contoh
Pertimbangkan detail curah hujan tahunan di suatu tempat mulai Januari 2012. Kita akan buat objek deret waktu R untuk jangka waktu 12 bulan dan memplotnya.
# Dapatkan titik data dalam bentuk vektor R. rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071) # Ubah menjadi objek timeseries. rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12) # Cetak data timeseries. print(rainfall.timeseries) # Beri nama file chart. png(file = "rainfall.png") # Plot grafik deret waktu. plot(rainfall.timeseries) # Simpan file. dev.off()
Output :
Jan Feb Mar Apr May Jun Jul Aug Sep
2012 799.0 1174.8 865.1 1334.6 635.4 918.5 685.5 998.6 784.2
Oct Nov Dec
2012 985.0 882.8 1071.0
Diagram Time Series :
Perbedaan Interval Waktu
Nilai parameter frekuensi dalam fungsi ts()
digunakan untuk menentukan interval waktu pengukuran titik data. Nilai 12 menunjukkan bahwa deret waktu selama 12 bulan. Nilai-nilai lain dan artinya adalah sebagai berikut –
- frekuensi = 12 irisan titik data untuk setiap bulan dalam setahun.
- frekuensi = 4 irisan poin data untuk setiap kuartal dalam satu tahun.
- frekuensi = 6 irisan titik data untuk setiap 10 menit dalam satu jam.
- frekuensi = 24 * 6 irisan titik data untuk setiap 10 menit sehari.
Multiple Time Series
Kita dapat memplot beberapa deret waktu dalam satu bagan dengan menggabungkan kedua deret tersebut ke dalam matriks.
# Dapatkan titik data dalam bentuk vektor R.. rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071) rainfall2 <- c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8) # Ubah menjadi matriks. combined.rainfall <- matrix(c(rainfall1,rainfall2),nrow = 12) # Ubah menjadi objek deret waktu. rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12) # Cetak data deret waktu. print(rainfall.timeseries) # Beri nama file grafik. png(file = "rainfall_combined.png") # Plot grafik deret waktu. plot(rainfall.timeseries, main = "Multiple Time Series") # Simpan file. dev.off()
Output :
Series 1 Series 2
Jan 2012 799.0 655.0
Feb 2012 1174.8 1306.9
Mar 2012 865.1 1323.4
Apr 2012 1334.6 1172.2
May 2012 635.4 562.2
Jun 2012 918.5 824.0
Jul 2012 685.5 822.4
Aug 2012 998.6 1265.5
Sep 2012 784.2 799.6
Oct 2012 985.0 1105.6
Nov 2012 882.8 1106.7
Dec 2012 1071.0 1337.8
Diagram Time Series :