범주값에도 최빈값이라는 형태로 대표값이 존재하는데, 최빈값은 가장 많이 나타나는 값을 말합니다. 수치 데이터도 범주형으로 변환하여 최빈값을 구할 수 있습니다.
r에는 최빈값을 계산하는 함수가 없습니다. 따라서 출현 횟수를 계산한 후에 출현 횟수가 최대가 되는 범주값을 찾아야 합니다. 단순한 함수의 조합으로 구현할 수 있지만 이때는 코드가 복잡해집니다.
- round() 함수로 total_price를 1000 단위로 반올림한다.
- table() 함수로 금액별 예약 건수를 계산한다.
- (백터의 속성 정보(names)가 계산된 금액, 백터의 값이 예약 건수)
- which.max() 함수로 예약 건수가 최대인 백터 요소를 구한다.
- names() 함수로 예약 건수가 최대인 백터 요소의 속성 정보를(names) 구한다.
: names(which.max(table(round(reserve_tb$total_price, -3))))
round() 함수는 지정한 자릿수 이하를 반올림하는 함수입니다. 매개변수에는 대상 열과 반올림 후의 유효한 자릿수 n을 매개변수로 지정합니다.
table() 함수는 매개변수로 전달된 백터의 각 값의 데이터 수를 계산하여 그 결과를 토대로 백터를 반환합니다. 결과 백터의 속성 정보(names)에 카운팅 된 값, 값(value)에는 데이터 수가 할당됩니다.
which.max() 함수는 전달된 백터에서 최댓값이 되는 백터의 요소를 반환합니다.
which.min() 함수는 전달된 백터에서 최솟값이 되는 백터 요소를 반환합니다.
names() 함수는 전달된 백터의 속성 정보(names)를 반환합니다.
'데이터 분석 > 데이터 전처리' 카테고리의 다른 글
R전처리 - 결합 (0) | 2021.02.14 |
---|---|
R전처리 - 순위계산 (0) | 2021.02.11 |
분포 계산 (0) | 2021.02.08 |
최댓갓, 최솟값, 데푯값 산출 (0) | 2021.02.05 |
합곗값 계산 (0) | 2021.02.04 |
댓글