전체 글 (12) 썸네일형 리스트형 [R] 특정 열 제외 # 특정 열 제외하여 저장 ex.) df 의 'col_A' 라는 열 제외 df [R] 각 column 별 value 종류 개수 확인 # 각 column 별 unique value 종류 개수 확인 sapply(df, function(x) length(unique(x))) # 각 column 별 중복 된 개수 확인 sapply(df, function(x) nrow(df) - length(unique(x))) # 각 column 별 unique value 이름 확인 ex) df의 col_A 내 value 종류들(category 명) 확인 unique(df$col_A) [R] 결측치 확인 # data 결측치 전체 개수 확인 sum(is.na(df)) # 각 column별 결측치 개수 확인 colSums(is.na(df)) # 특정 열 결측치 존재 data 추출 ex.) df 내 결측치가 존재하는 'col_na' 라는 열이 존재할 경우, 결측이 있는 행들만 출력 df[is.na(df$col_na)] # 특정 열 결측치 존재 행 번호 추출 ex.) df 내 결측치가 존재하는 'col_na' 라는 열이 존재할 경우, 결측이 있는 행들의 번호를 출력 which(is.na(df$col_na)) [R] data load (한글 깨짐, 공백 변환) # 한글 포함 csv 파일 read.csv로 로드시 에러날 때 library(data.table) train NA로 처리 train 이전 1 2 다음