반응형
이전 내용
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-2
2) 시간 데이터 전처리 해주기 기존의 sparta_data에 있는 컬럼들은 다음과 같습니다. access_date 컬럼을 이용하여 access_date_time 컬럼 만들기 a = '%Y-%m-%dT%H:%M:%S.%f' # a라는 변수에 '%Y-%m-%dT%H:%M:%S.%f'라는
datanaly.tistory.com
요일 별 접속한 수강생 수 구하기
weeks = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
# 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'가 담겨있는
# weeks라는 리스트 생성
weekdata = sparta_data.groupby('access_date_time_weekday')['user_id'].count()
#1 weekdata라는 series를 만들겠다.
#2 sparta_data.groupby('access_date_time_weekday')
# -> sparta_data의 "access_date_time_weekday" 컬럼을 기준으로 그룹화를 시킬거야.
#3 ['user_id'].count() -> "access_date_time_weekday"별 'user_id'의 개수를 구할거야.
weekdata
# weekdata를 출력할거야.
출력 결과
weeks 리스트 순서에 맞춰 weekdata 다시 만들기
weekdata = weekdata.agg(weeks)
# 아까 만들어둔 weeks 리스트 순서에 맞춰 weekdata를 다시 만들어준다.
weekdata
# weekdata 출력
출력 결과
시간 가져오기
sparta_data['access_date_time_hour'] = sparta_data['access_date_time'].dt.hour
# sparta_date에 'access_date_time_hour' 컬럼을 추가할건데.
# 'access_date_time'에 시간값으로 구성할거야.
# .dt.hour : 시간 데이터 가져오기
출력 결과
access_date_time_hour 별 user_id 개수 구하기
hourdata = sparta_data.groupby('access_date_time_hour')['user_id'].count()
#1 hourdata라는 Series를 만들거야.
#2 sparta_data.groupby('access_date_time_hour')
# -> access_date_time_hour 컬럼 기준으로 그룹화를 할거야.
#3 ['user_id'].count() access_date_time_hour별 user_id 개수를 구할거야.
인덱스 기준으로 오름차순 정렬하기
hourdata = hourdata.sort_index()
# hourdata를 인덱스 기준으로 오름차순 정렬하기
hourdata
# hourdata 출력
출력결과
다음 내용
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-4
데이터 시각화 라이브러리 가져오기 import matplotlib.pyplot as plt # matplotlib 라이브러리를 가져오고 plt라고 부를거야. import numpy as np # numpy 라이브러리를 가져오고 np라고 부를거야. plt.figure(figsize=(10,5
datanaly.tistory.com
반응형
'Today i learned & Week i learned > 파이썬 관련' 카테고리의 다른 글
코랩(colab)에 활용할 파일 업로드 하는 법 (1) | 2023.12.23 |
---|---|
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-5 (1) | 2023.12.20 |
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-4 (0) | 2023.12.20 |
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-2 (0) | 2023.12.19 |
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-1 (2) | 2023.12.07 |