본문 바로가기

R

[R] category 형 변수 Label encoding

# data 내 category 형 변수를 factor 사용하여 숫자로 label encoding

ex.) train 내 col_A라는 변수가 category형일 때 숫자로 label encoding 한 후 저장

train$col_A <- as.numeric(factor(train$col_A, levels = unique(train$col_A)))

주의) train 의 label encoding을 다른 data.frame인 test에 동일하게 적용 시,

       levels는 train의 unique 순서를 사용해야 됨. 

train$col_A <- as.numeric(factor(train$col_A, levels = unique(train$col_A)))

test$col_A <- as.numeric(factor(test$col_A, levels = unique(train$col_A)))

'R' 카테고리의 다른 글

[R] ggplot color palette  (0) 2021.08.25
[R package] lubridate  (0) 2021.08.24
[R] data.frame을 클립보드 복사  (0) 2021.08.23
[R] 결측치 처리  (0) 2021.08.22
[R] 특정 열 제외  (0) 2021.08.22