본문 바로가기

데이터분석29

합곗값 계산 월별 매출을 알아야 하거나 점포별 매출 금액을 출력하고 싶을 때처럼 분석 대상의 값이 숫자일 경우 게이터의 합을 계산해야 할 경우가 있습니다. 합계 처리는 수치 데이터를 대상으로 하며, 가장 단순하며 유용합니다. R에서 합계 함수는 sum() 함수입니다. reserve_tb %>% group_by()에 hotel_id와 people_num의 조합을 지정한다. : group_by(hotel_id, people_num) %>% sum() 함수를 total_price에 적용하여 매출 합계를 산출한다. : summarise(price_sum = sum(total_price)) # 호텔별 예약 안원수에 따른 total_price의 합계를 산출한다. 2021. 2. 4.
수학의 쓸모 http://www.yes24.com/Product/Goods/89607340?OzSrank=1 수학의 쓸모 언제나 답은 수학이니까우리에게는 여전히 수학이 필요하다당신이 마지막으로 ‘계산’해본 적은 언제인가? 계산이라는 말만 들어도 진절머리가 나는가? 여기, 끔찍한 수포자 바이러스에 걸린 www.yes24.com 이 책은 넷플릭스의 취향을 읽는 법은 과거에 2차 대전에서 유용했던 조건부 확률을 이용해 추천 시스템을 통해 영화를 개인별로 맞춤 제공하고 있다. 우리의 미래는 확률에 달려 있다는 것이다. 데이터의 홍수 속에서 살아남기 위해 확률이라는 수학적 사고로 똑똑해지는 법을 배워나간다. 뉴스 데이터, 주식 시장, 스포츠 통계 등 일상에서 성공의 확률을 높여주는 것은 수학이다. 우리에게 여전히 수학이 필요.. 2021. 2. 4.
R, 데이터와 종류의 개수 산출 가장 기본적인 집약 처리로 데이터 카운트가 있습니다. 대상 데이터 레코드의 수(행 수)를 세는 처리입니다. 이외에도 자주 사용하는 집계 처리로 유니크 카운트가 있는데, 데이터에서 같은 값인 레코드를 제외한 레코드 수를 세는 처리입니다. 즉, 데이터 값의 종류를 카운팅 하는 것입니다. R로 집약 처리할때는 dplyr 패키지의 group_by 함수로 집약 단위를 지정하고 dplyr 패키지의 summarise 함수에서 집약 함수를 지정해 구현합니다. apply 계열의 함수를 사용하는 등 다른 방법도 있지만 계산속도와 가독성을 고려하면 dplyr 패키지를 이용하는 것이 가장 좋습니다. reserve_tb %>% group_by 함수로 집약 단위를 hotel_id로 지정한다 : group_by(hotel_id) .. 2021. 2. 3.
숫자에 약한 사람들을 위한 통계학 수업 http://www.yes24.com/Product/Goods/91860119?OzSrank=1 숫자에 약한 사람들을 위한 통계학 수업 “통계학은 빅데이터 시대의 새로운 필수 교양이다”집값 예측부터 질병 추적, 살인 패턴 분석까지 넘치는 정보 속 세상의 모든 답은 통계에 숨어 있다!-햄, 소시지가 암 발병률을 18% 높인다고 www.yes24.com 통계학인 필수이다. 4차 산업혁명 시대의 넘치는 정보 속에서 세상의 모든 답은 통계에 있다고 주장한다. 집값 예측부터 질병을 추적하거나 하는 일련의 의사결정을 데이터를 바탕으로 한다는 것이다. 데이터에서 세상의 흐름을 읽어내는 통계적 사고를 길러줄 필수 교양 책이다. 통계학은 비전공자에게 쉽게 공부하기 힘든 과목 중 하나이다. 수학적 사고와 논리적 사고가 필.. 2021. 2. 3.