최댓갓, 최솟값, 데푯값 산출
수치 데이터를 분석할 때는 보통 평균 값을 이용합니다. 서로 다른 데이터 집합을 비교할 때 같은 열의 수치 데이터의 평균값을 비교하는 것은 분석의 기본입니다. 평균은 원리가 단순하고 이해하기 쉬워 수치 데이터의 특징을 나타내는 데 유용합니다. 하지만 데이터 분포를 파악하지 않고 평균값의 결과만을 그대로 받아들이면 결과를 잘못 인식할 수 있습니다. 01. 대푯값 데이터셋은 호텔 예약 레코드입니다. 예약 테이블에서 호텔별 예약 금액의 최댓값, 최솟값, 평균값, 중앙갑, 20백분위 값(근삿값도 가능)을 산출합니다. R에서 최댓값은 max() 함수, 최솟값은 min()함수, 평균은 mean() 함수, 중앙값은 median() 함수, 백분위는 quantile() 함수로 구현합니다. reserve_tb %>% gr..
2021. 2. 5.