Home » R » Statistika di R : Time Series Analysis Pada R Language

Statistika di R : Time Series Analysis Pada R Language

by Hanifah Nurbaeti
by Hanifah Nurbaeti

Section Artikel

Pengertian Time Series Analysis

Time series analysis atau deret waktu adalah rangkaian titik data yang setiap titik datanya dikaitkan dengan stempel waktu. Contoh sederhananya adalah harga saham di pasar saham pada titik waktu yang berbeda pada hari tertentu. Contoh lainnya adalah jumlah curah hujan di suatu wilayah pada bulan-bulan yang berbeda dalam setahun. Bahasa R menggunakan banyak fungsi untuk membuat, memanipulasi, dan memplot data deret waktu. Data untuk deret waktu disimpan dalam objek R yang disebut objek deret waktu. Ini juga merupakan objek data R seperti vektor atau bingkai data.

Objek deret waktu dibuat dengan menggunakan fungsi ts().

Syntax

Sintaks dasar untuk fungsi ts() dalam analisis deret waktu adalah :

timeseries.object.name <-  ts(data, start, end, frequency)

Berikut adalah deskripsi parameter yang digunakan –

data adalah vektor atau matriks yang berisi nilai-nilai yang digunakan dalam deret waktu.

start menentukan waktu mulai untuk pengamatan pertama dalam deret waktu.

end menentukan waktu berakhir untuk pengamatan terakhir dalam deret waktu.

frequency menentukan jumlah pengamatan per satuan waktu.

Parameter “data” sifatnya wajib tercantung, sedangkan yang lain opsional.

Contoh

Pertimbangkan detail curah hujan tahunan di suatu tempat mulai Januari 2012. Kita akan buat objek deret waktu R untuk jangka waktu 12 bulan dan memplotnya.

# Dapatkan titik data dalam bentuk vektor R.
rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)

# Ubah menjadi objek timeseries.
rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)

# Cetak data timeseries.
print(rainfall.timeseries)

# Beri nama file chart.
png(file = "rainfall.png")

# Plot grafik deret waktu.
plot(rainfall.timeseries)

# Simpan file.
dev.off()

Output :

Jan    Feb    Mar    Apr    May     Jun    Jul    Aug    Sep
2012  799.0  1174.8  865.1  1334.6  635.4  918.5  685.5  998.6  784.2
        Oct    Nov    Dec
2012  985.0  882.8 1071.0

Diagram Time Series :

Perbedaan Interval Waktu

Nilai parameter frekuensi dalam fungsi ts() digunakan untuk menentukan interval waktu pengukuran titik data. Nilai 12 menunjukkan bahwa deret waktu selama 12 bulan. Nilai-nilai lain dan artinya adalah sebagai berikut –

  • frekuensi = 12 irisan titik data untuk setiap bulan dalam setahun.
  • frekuensi = 4 irisan poin data untuk setiap kuartal dalam satu tahun.
  • frekuensi = 6 irisan titik data untuk setiap 10 menit dalam satu jam.
  • frekuensi = 24 * 6 irisan titik data untuk setiap 10 menit sehari.

Multiple Time Series

Kita dapat memplot beberapa deret waktu dalam satu bagan dengan menggabungkan kedua deret tersebut ke dalam matriks.

# Dapatkan titik data dalam bentuk vektor R..
rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
rainfall2 <- 
           c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)

# Ubah menjadi matriks.
combined.rainfall <-  matrix(c(rainfall1,rainfall2),nrow = 12)

# Ubah menjadi objek deret waktu.
rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)

# Cetak data deret waktu.
print(rainfall.timeseries)

# Beri nama file grafik.
png(file = "rainfall_combined.png")

# Plot grafik deret waktu.
plot(rainfall.timeseries, main = "Multiple Time Series")

# Simpan file.
dev.off()

Output :

           Series 1  Series 2
Jan 2012    799.0    655.0 
Feb 2012   1174.8   1306.9
Mar 2012    865.1   1323.4 
Apr 2012   1334.6   1172.2 
May 2012    635.4    562.2 
Jun 2012    918.5    824.0 
Jul 2012    685.5    822.4 
Aug 2012    998.6   1265.5 
Sep 2012    784.2    799.6 
Oct 2012    985.0   1105.6
Nov 2012    882.8   1106.7 
Dec 2012   1071.0   1337.8

Diagram Time Series :

You may also like