일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 리텐션
- 머신러닝
- BM분석
- fundbox
- 역설구조
- 활성화
- 그로스해킹
- 올라
- 전환율
- 바로팜
- 팔방이익구조
- aarrr
- 인게이지먼트
- allra
- retention
- CAC
- 선정산서비스
- activation
- pmf
- 퍼널분석
- 비즈니스모델
- 한장으로끝내는비즈니스모델100
- 서말리포켓
- model_selection
- 핀테크
- sklearn
- 셀프스토리지
- 코호트
- mysql설치 #mysql #mysqluser #mysqlworkbench
- 데이터분석
- Today
- Total
목록#2. Data Analysis (17)
데이터로그😎

0. 테이블 Airport 테이블에과 전국 주유소 테이블에 포함된 정보는 다음과 같습니다.Airport 테이블출발 공항 정보Deparing Airport: 출발 공항명 (모두 시애틀 공항)Latitude (Departure): 출발 공항 위도Longitude (Departure): 출발 공항 경도도착 공항 정보Arriving Airport: 도착 공항명Latitude (Arrival): 도착 공항 위도Longitude (Arrival) : 도착 공항 경도Arrival Country: 도착 국가기타 정보Passengers : 탑승자 수전국 주유소 테이블주유소 위치 정보시군구시도주소LatitudeLongitude기타 정보고유 ID상호상표전화번호셀프여부고급 휘발유/휘발유/경유/실내등유 1. 시애틀에서 출발한 ..

0. 데이터1) 빅맥 지수 테이블Date: 기준 일자Dolloar Price: 달러로 환산된 각 국가의 빅맥 가격Korea_Price: 한국 빅맥 가격1. 빅맥 가격의 국가별 상승률 (2000 --> 2020년) 각 국가의 빅맥 가격이 2000년에 비해 2020년에 몇 % 상승했는지 상승률을 분석하려 합니다. 위의 시각화 결과처럼 라인으로 상승률을 표현해보겠습니다. 이러한 시각화를 구현하기 위해서 설정해야 할 항목들은 다음과 같습니다.연도를 2020년과 2020년만 필터링 하기측정값을 비율차이(%)로 설정마크 선반에서 비쥬얼리제이션을 라인으로 설정성장률 크기 별로 색상 표기 라인별 국가명 표시하기 ✅연도 필터링 (2000, 2020)년(Date)를 필터에 포함 시키고, 2000년과 2020년만 체크한 뒤..

0. 데이터1) 도시대기 미세먼지 테이블기준년월: 미세먼지 측정 일자PM10: 미세먼지 측정량시도, 시군구, 측정소: 측정 장소1. 월별 미세먼지 평균 지수 시간의 흐름에 따라 데이터의 패턴과 트렌드를 살펴보는데 라인차트가 유용합니다. 위의 사진은 라인차트로 구현한 월별 미세먼지 평균 지수입니다. 1-5월 정도까지 대체로 봄에 미세먼지 지수가 높은 것을 알 수 있습니다. 그러나 이러한 월별이 아닌 2010년부터 2020년까지 매월 미세먼지 평균 지수의 추세를 알고 싶다면 어떻게 해야 할까요? 위의 분석에서는 '불연속형' +'월'을 X축에 두었습니다. 태블로에서 불연속형은 날짜 필드를 하나의 카테고리처럼 처리하기 때문에, 연도 구분없이 월 이름만 추출하게 됩니다. 즉, 2018년 5월이든, 2019년 5..
0. 테이블 정보 1. 메뉴 카테고리 별 평균 칼로리 분석 + 고정된 카페인 함량 표시 (계산 필드)메뉴 카테고리 별 평균 칼로리 분석은 지난 포스팅 #1에서 진행 했습니다. 이러한 막대 그래프에서 '평균 카페인 함유량이 80mg 보다 높은 카테고리와 아닌 카테고리를 분류해서 볼 수 있도록' 하려면 어떻게 해야할까요? 이럴 땐 계산필드를 사용할 수 있습니다. 계산필드란 기존 데이터 필드를 활용하여 새로운 값을 계산하거나, 논리 조건을 기반으로 필드를 생성할 수 있게 해주는 기능입니다. ✅'지정 카페인 용량' 계산필드 생성 평균 카페인 용량이 80mg 보다 높은 카테고리는 '카페인 > 80mg'으로 표시하고, 높지 않은 카테고리는 '카페인 ✅계산필드를 마크(색상)에 적용하기 생성된 '지정 카페인 ..

✈️오늘의 분석 거리지난번 스타벅스 분석 #1에 이은 심화 분석을 진행하겠습니다.1. 상세 메뉴별 칼로리 분석 (근데 이제 워드클라우드를 곁들인...)2. 메뉴 카테고리 별로 칼로리 분포 상태와 이상치 분석 (박스 플롯)0. 테이블 정보 1. 상세 메뉴 별 칼로리 분석 (텍스트 분석) 사용한 스타벅스 메뉴 정보를 보면 메뉴 종류가 약 140가지가 되는데요, 이 메뉴들의 칼로리를 알아보고 싶습니다. 자세한 칼로리를 알기보단 대강적인 칼로리 크기를 한 눈에 파악하면 좋겠는데요, 이럴 땐 워드클라우드를 사용할 수 있습니다. 워드클라우드는 방대한 키워드 속에서 분석 목적에 따라 핵심 키워드를 표현하는데 유용한 시각화입니다. 태블로에서 워드클라우드를 표현할 땐, 열과 행을 사용하지 않습니다. 만약 칼로리가 많..

✈️오늘의 분석 거리오늘은 스타벅스의 메뉴 데이터와 매장정보 데이터를 활용해 간단한 태블로 분석을 하고자 합니다. 아래의 분석 주제에 대한 효과적인 시각화 방법은 무엇일지 공부하고 태블로를 활용해 시각화를 진행하겠습니다.1. 스타벅스 메뉴 카테고리 별 평균 칼로리 & 카페인 분석 2. 메뉴 별 칼로리 & 카페인 분석 3. 당분 함유량-칼로리의 상관관계 분석 0. 테이블 정보 태블로에서는 정성적 데이터/분석 기준이 되는 값/불연속형 데이터로서 측정값을 쪼개어 보는 하나의 관점을 "차원" 이라고 합니다. 정량적이고 연속형 데이터로서 집계할 수 있는 수치는 "측정값"이라 합니다. 측정값은 차원을 기준으로 집계됩니다. 스타벅스 테이블1을 예로 들면 메뉴의 카테고리(에스프레소, 티, 프라푸치노 등)라는 차원을 기..