# data 내 category 형 변수를 factor 사용하여 숫자로 label encoding
ex.) train 내 col_A라는 변수가 category형일 때 숫자로 label encoding 한 후 저장
train$col_A <- as.numeric(factor(train$col_A, levels = unique(train$col_A)))
주의) train 의 label encoding을 다른 data.frame인 test에 동일하게 적용 시,
levels는 train의 unique 순서를 사용해야 됨.
train$col_A <- as.numeric(factor(train$col_A, levels = unique(train$col_A)))
test$col_A <- as.numeric(factor(test$col_A, levels = unique(train$col_A)))
'R' 카테고리의 다른 글
[R] ggplot color palette (0) | 2021.08.25 |
---|---|
[R package] lubridate (0) | 2021.08.24 |
[R] data.frame을 클립보드 복사 (0) | 2021.08.23 |
[R] 결측치 처리 (0) | 2021.08.22 |
[R] 특정 열 제외 (0) | 2021.08.22 |