Home » R » Struktur Data R : Data Frame Pada R Language

Struktur Data R : Data Frame Pada R Language

by Hanifah Nurbaeti
by Hanifah Nurbaeti

Data Frame

Data Frame adalah tabel atau struktur seperti array dua dimensi di mana setiap kolom berisi nilai dari satu variabel dan setiap baris berisi satu set nilai dari setiap kolom. Singkatnya, Data Frames adalah data yang ditampilkan dalam format tabel. Data Frame dapat memiliki berbagai jenis data di dalamnya. Kolom pertama dapat berupa character , sedangkan kolom kedua dan ketiga dapat berupa numerik atau logical. Namun, setiap kolom harus memiliki tipe data yang sama.

Berikut adalah ciri-ciri dari data frame.

  • Nama kolom tidak boleh kosong.
  • Nama baris harus unik.
  • Data yang disimpan dalam data frame dapat berupa numerik, faktor atau tipe karakter.
  • Setiap kolom harus berisi jumlah item data yang sama.

Gunakan fungsi data.frame () untuk membuat data frame:

Contoh

# Buat data frame
Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

# Cetak data frame
Data_Frame

Output :

  Training Pulse Duration
1 Strength   100       60
2  Stamina   150       30
3    Other   120       45

Ringkaskan Data

Gunakan fungsi summary() untuk meringkas data dari Data Frame:

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

Data_Frame

summary(Data_Frame)

Output :

  Training Pulse Duration
1 Strength   100       60
2  Stamina   150       30
3    Other   120       45
     Training     Pulse          Duration   
 Other   :1   Min.   :100.0   Min.   :30.0  
 Stamina :1   1st Qu.:110.0   1st Qu.:37.5  
 Strength:1   Median :120.0   Median :45.0  
              Mean   :123.3   Mean   :45.0  
              3rd Qu.:135.0   3rd Qu.:52.5  
              Max.   :150.0   Max.   :60.0

Struktur Data Frame

Struktur data frame dapat dilihat dengan menggunakan fungsi str().

Contoh :

# Buat data frame.
emp.data <- data.frame(
   emp_id = c (1:5), 
   emp_name = c("Rick","Dan","Michelle","Ryan","Gary"),
   salary = c(623.3,515.2,611.0,729.0,843.25), 
   
   start_date = as.Date(c("2012-01-01", "2013-09-23", "2014-11-15", "2014-05-11",
      "2015-03-27")),
   stringsAsFactors = FALSE
)
# Dapatkan struktur data frame.
str(emp.data)

Output :

data.frame'  :   5 obs. of  4 variables:
 $ emp_id    : int  1 2 3 4 5
 $ emp_name  : chr  "Rick" "Dan" "Michelle" "Ryan" ...
 $ salary    : num  623 515 611 729 843
 $ start_date: Date, format: "2012-01-01" "2013-09-23" "2014-11-15" "2014-05-11" ...

Mengakses Item

Kita dapat menggunakan tanda kurung tunggal [], tanda kurung ganda [[]] atau $ untuk mengakses kolom dari data frame:

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

Data_Frame[1]

Data_Frame[["Training"]]

Data_Frame$Training

Output :

  Training
1 Strength
2  Stamina
3    Other
[1] Strength Stamina  Other   
Levels: Other Stamina Strength
[1] Strength Stamina  Other   
Levels: Other Stamina Strength

Ekstrak Data dari Data Frame

Ekstrak kolom tertentu dari data frame menggunakan nama kolom.

Contoh :

# Buat data frame.
emp.data <- data.frame(
   emp_id = c (1:5),
   emp_name = c("Rick","Dan","Michelle","Ryan","Gary"),
   salary = c(623.3,515.2,611.0,729.0,843.25),
   
   start_date = as.Date(c("2012-01-01","2013-09-23","2014-11-15","2014-05-11",
      "2015-03-27")),
   stringsAsFactors = FALSE
)
# Ekstrak spesifik kolom.
result <- data.frame(emp.data$emp_name,emp.data$salary)
print(result)

Output :

  emp.data.emp_name emp.data.salary
1              Rick          623.30
2               Dan          515.20
3          Michelle          611.00
4              Ryan          729.00
5              Gary          843.25

Tambahkan Baris

Gunakan fungsi rbind() untuk menambahkan baris baru di Data Frame:

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

# tambahkan baris baru
New_row_DF <- rbind(Data_Frame, c("Strength", 110, 110))

# Cetak baris baru
New_row_DF

Output :

  Training Pulse Duration
1 Strength   100       60
2  Stamina   150       30
3    Other   120       45
4 Strength   110      110

Tambahkan Kolom

Gunakan fungsi cbind() untuk menambahkan kolom baru di Data Frame:

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

# Tambah kolom baru
New_col_DF <- cbind(Data_Frame, Steps = c(1000, 6000, 2000))

# cetak kolom baru
New_col_DF

Output :

  Training Pulse Duration Steps
1 Strength   100       60  1000
2  Stamina   150       30  6000
3    Other   120       45  2000

Hapus Baris dan Kolom

Gunakan fungsi c() untuk menghapus baris dan kolom di Data Frame:

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

# Hapus baris dan kolom pertama
Data_Frame_New <- Data_Frame[-c(1), -c(1)]

# cetak data frame terbaru
Data_Frame_New

Output :

  Pulse Duration
2   150       30
3   120       45

Jumlah Baris dan Kolom

Gunakan fungsi dim() untuk menemukan jumlah baris dan kolom dalam data frame:

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

dim(Data_Frame)

Output :

[1] 3 3

Bisa juga menggunakan fungsi ncol() untuk mencari jumlah kolom dan nrow() untuk mencari jumlah baris:

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

ncol(Data_Frame)
nrow(Data_Frame)

Output :

[1] 3
[1] 3

Panjang Data Frame

Gunakan fungsi length() untuk mencari jumlah kolom dalam Data Frame (mirip dengan ncol()):

Contoh

Data_Frame <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

length(Data_Frame)

Output :

[1] 3

Menggabungkan Data Frame

Gunakan fungsi rbind() untuk menggabungkan dua atau lebih data frame di R secara vertikal:

Contoh

Data_Frame1 <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

Data_Frame2 <- data.frame (
  Training = c("Stamina", "Stamina", "Strength"),
  Pulse = c(140, 150, 160),
  Duration = c(30, 30, 20)
)

New_Data_Frame <- rbind(Data_Frame1, Data_Frame2)
New_Data_Frame

Output :

  Training Pulse Duration
1 Strength   100       60
2  Stamina   150       30
3    Other   120       45
4  Stamina   140       30
5  Stamina   150       30
6 Strength   160       20

Dan gunakan fungsi cbind() untuk menggabungkan dua atau lebih bingkai data di R secara horizontal:

Contoh

Data_Frame3 <- data.frame (
  Training = c("Strength", "Stamina", "Other"),
  Pulse = c(100, 150, 120),
  Duration = c(60, 30, 45)
)

Data_Frame4 <- data.frame (
  Steps = c(3000, 6000, 2000),
  Calories = c(300, 400, 300)
)

New_Data_Frame1 <- cbind(Data_Frame3, Data_Frame4)
New_Data_Frame1

Output :

  Training Pulse Duration Steps Calories
1 Strength   100       60  3000      300
2  Stamina   150       30  6000      400
3    Other   120       45  2000      300

You may also like