Section Artikel
Data Frame
Data Frame adalah tabel atau struktur seperti array dua dimensi di mana setiap kolom berisi nilai dari satu variabel dan setiap baris berisi satu set nilai dari setiap kolom. Singkatnya, Data Frames adalah data yang ditampilkan dalam format tabel. Data Frame dapat memiliki berbagai jenis data di dalamnya. Kolom pertama dapat berupa character
, sedangkan kolom kedua dan ketiga dapat berupa numerik
atau logical
. Namun, setiap kolom harus memiliki tipe data yang sama.
Berikut adalah ciri-ciri dari data frame.
- Nama kolom tidak boleh kosong.
- Nama baris harus unik.
- Data yang disimpan dalam data frame dapat berupa numerik, faktor atau tipe karakter.
- Setiap kolom harus berisi jumlah item data yang sama.
Gunakan fungsi data.frame ()
untuk membuat data frame:
Contoh
# Buat data frame Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) # Cetak data frame Data_Frame
Output :
Training Pulse Duration
1 Strength 100 60
2 Stamina 150 30
3 Other 120 45
Ringkaskan Data
Gunakan fungsi summary()
untuk meringkas data dari Data Frame:
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) Data_Frame summary(Data_Frame)
Output :
Training Pulse Duration
1 Strength 100 60
2 Stamina 150 30
3 Other 120 45
Training Pulse Duration
Other :1 Min. :100.0 Min. :30.0
Stamina :1 1st Qu.:110.0 1st Qu.:37.5
Strength:1 Median :120.0 Median :45.0
Mean :123.3 Mean :45.0
3rd Qu.:135.0 3rd Qu.:52.5
Max. :150.0 Max. :60.0
Struktur Data Frame
Struktur data frame dapat dilihat dengan menggunakan fungsi str()
.
Contoh :
# Buat data frame. emp.data <- data.frame( emp_id = c (1:5), emp_name = c("Rick","Dan","Michelle","Ryan","Gary"), salary = c(623.3,515.2,611.0,729.0,843.25), start_date = as.Date(c("2012-01-01", "2013-09-23", "2014-11-15", "2014-05-11", "2015-03-27")), stringsAsFactors = FALSE ) # Dapatkan struktur data frame. str(emp.data)
Output :
data.frame' : 5 obs. of 4 variables:
$ emp_id : int 1 2 3 4 5
$ emp_name : chr "Rick" "Dan" "Michelle" "Ryan" ...
$ salary : num 623 515 611 729 843
$ start_date: Date, format: "2012-01-01" "2013-09-23" "2014-11-15" "2014-05-11" ...
Mengakses Item
Kita dapat menggunakan tanda kurung tunggal []
, tanda kurung ganda [[]]
atau $
untuk mengakses kolom dari data frame:
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) Data_Frame[1] Data_Frame[["Training"]] Data_Frame$Training
Output :
Training
1 Strength
2 Stamina
3 Other
[1] Strength Stamina Other
Levels: Other Stamina Strength
[1] Strength Stamina Other
Levels: Other Stamina Strength
Ekstrak Data dari Data Frame
Ekstrak kolom tertentu dari data frame menggunakan nama kolom.
Contoh :
# Buat data frame. emp.data <- data.frame( emp_id = c (1:5), emp_name = c("Rick","Dan","Michelle","Ryan","Gary"), salary = c(623.3,515.2,611.0,729.0,843.25), start_date = as.Date(c("2012-01-01","2013-09-23","2014-11-15","2014-05-11", "2015-03-27")), stringsAsFactors = FALSE ) # Ekstrak spesifik kolom. result <- data.frame(emp.data$emp_name,emp.data$salary) print(result)
Output :
emp.data.emp_name emp.data.salary
1 Rick 623.30
2 Dan 515.20
3 Michelle 611.00
4 Ryan 729.00
5 Gary 843.25
Tambahkan Baris
Gunakan fungsi rbind()
untuk menambahkan baris baru di Data Frame:
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) # tambahkan baris baru New_row_DF <- rbind(Data_Frame, c("Strength", 110, 110)) # Cetak baris baru New_row_DF
Output :
Training Pulse Duration
1 Strength 100 60
2 Stamina 150 30
3 Other 120 45
4 Strength 110 110
Tambahkan Kolom
Gunakan fungsi cbind()
untuk menambahkan kolom baru di Data Frame:
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) # Tambah kolom baru New_col_DF <- cbind(Data_Frame, Steps = c(1000, 6000, 2000)) # cetak kolom baru New_col_DF
Output :
Training Pulse Duration Steps
1 Strength 100 60 1000
2 Stamina 150 30 6000
3 Other 120 45 2000
Hapus Baris dan Kolom
Gunakan fungsi c()
untuk menghapus baris dan kolom di Data Frame:
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) # Hapus baris dan kolom pertama Data_Frame_New <- Data_Frame[-c(1), -c(1)] # cetak data frame terbaru Data_Frame_New
Output :
Pulse Duration
2 150 30
3 120 45
Jumlah Baris dan Kolom
Gunakan fungsi dim()
untuk menemukan jumlah baris dan kolom dalam data frame:
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) dim(Data_Frame)
Output :
[1] 3 3
Bisa juga menggunakan fungsi ncol()
untuk mencari jumlah kolom dan nrow()
untuk mencari jumlah baris:
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) ncol(Data_Frame) nrow(Data_Frame)
Output :
[1] 3
[1] 3
Panjang Data Frame
Gunakan fungsi length()
untuk mencari jumlah kolom dalam Data Frame (mirip dengan ncol()
):
Contoh
Data_Frame <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) length(Data_Frame)
Output :
[1] 3
Menggabungkan Data Frame
Gunakan fungsi rbind()
untuk menggabungkan dua atau lebih data frame di R secara vertikal:
Contoh
Data_Frame1 <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) Data_Frame2 <- data.frame ( Training = c("Stamina", "Stamina", "Strength"), Pulse = c(140, 150, 160), Duration = c(30, 30, 20) ) New_Data_Frame <- rbind(Data_Frame1, Data_Frame2) New_Data_Frame
Output :
Training Pulse Duration
1 Strength 100 60
2 Stamina 150 30
3 Other 120 45
4 Stamina 140 30
5 Stamina 150 30
6 Strength 160 20
Dan gunakan fungsi cbind()
untuk menggabungkan dua atau lebih bingkai data di R secara horizontal:
Contoh
Data_Frame3 <- data.frame ( Training = c("Strength", "Stamina", "Other"), Pulse = c(100, 150, 120), Duration = c(60, 30, 45) ) Data_Frame4 <- data.frame ( Steps = c(3000, 6000, 2000), Calories = c(300, 400, 300) ) New_Data_Frame1 <- cbind(Data_Frame3, Data_Frame4) New_Data_Frame1
Output :
Training Pulse Duration Steps Calories
1 Strength 100 60 3000 300
2 Stamina 150 30 6000 400
3 Other 120 45 2000 300