Today i learned & Week i learned/파이썬 관련

[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-3

데분조 2023. 12. 20. 10:23
반응형

이전 내용

 

[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-2

2) 시간 데이터 전처리 해주기 기존의 sparta_data에 있는 컬럼들은 다음과 같습니다. access_date 컬럼을 이용하여 access_date_time 컬럼 만들기 a = '%Y-%m-%dT%H:%M:%S.%f' # a라는 변수에 '%Y-%m-%dT%H:%M:%S.%f'라는

datanaly.tistory.com

 

요일 별 접속한 수강생 수 구하기

weeks = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
# 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'가 담겨있는 
#  weeks라는 리스트 생성 

weekdata = sparta_data.groupby('access_date_time_weekday')['user_id'].count()
#1 weekdata라는 series를 만들겠다.
#2 sparta_data.groupby('access_date_time_weekday') 
# -> sparta_data의 "access_date_time_weekday" 컬럼을 기준으로 그룹화를 시킬거야.
#3 ['user_id'].count() -> "access_date_time_weekday"별 'user_id'의 개수를 구할거야.

weekdata
# weekdata를 출력할거야.

 

출력 결과

출력 결과


weeks 리스트 순서에 맞춰 weekdata 다시 만들기

weekdata = weekdata.agg(weeks)
# 아까 만들어둔 weeks 리스트 순서에 맞춰 weekdata를 다시 만들어준다.

weekdata
# weekdata 출력

출력 결과

출력 결과


시간 가져오기

sparta_data['access_date_time_hour'] = sparta_data['access_date_time'].dt.hour
# sparta_date에 'access_date_time_hour' 컬럼을 추가할건데.
# 'access_date_time'에 시간값으로 구성할거야.
# .dt.hour : 시간 데이터 가져오기

 

출력 결과

출력 결과


access_date_time_hour 별 user_id 개수 구하기

hourdata = sparta_data.groupby('access_date_time_hour')['user_id'].count()
#1 hourdata라는 Series를 만들거야.
#2 sparta_data.groupby('access_date_time_hour')
# -> access_date_time_hour 컬럼 기준으로 그룹화를 할거야.
#3 ['user_id'].count() access_date_time_hour별 user_id 개수를 구할거야.

 

인덱스 기준으로 오름차순 정렬하기

hourdata = hourdata.sort_index()
# hourdata를 인덱스 기준으로 오름차순 정렬하기

hourdata
# hourdata 출력

 

출력결과

 

다음 내용

 

[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-4

데이터 시각화 라이브러리 가져오기 import matplotlib.pyplot as plt # matplotlib 라이브러리를 가져오고 plt라고 부를거야. import numpy as np # numpy 라이브러리를 가져오고 np라고 부를거야. plt.figure(figsize=(10,5

datanaly.tistory.com

 

반응형