Today i learned & Week i learned/파이썬 관련

[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-2

데분조 2023. 12. 19. 17:08
반응형

이전 내용

 

[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-1

1. 판다스 불러오기 import pandas as pd import라는 명령어 이용해서 pandas라는 라이브러리 가져올건데 pd로 사용할거야 2. CSV 파일 불러오기 sparta_data = pd.read_table('access_detail.csv',sep=',') 1. pd(pandas)안에 csv

datanaly.tistory.com

 

2) 시간 데이터 전처리 해주기

기존의 sparta_data에 있는 컬럼들은 다음과 같습니다.

기존 sparta_data의 데이터

 

access_date 컬럼을 이용하여 access_date_time 컬럼 만들기

a = '%Y-%m-%dT%H:%M:%S.%f' 
# a라는 변수에 '%Y-%m-%dT%H:%M:%S.%f'라는 날짜 형식을 넣을거야.

sparta_data['access_date_time'] = pd.to_datetime(sparta_data['access_date'], format=a)
#1 sparta_data에 'access_date_time'라는 컬럼을 추가할거야.
#2 그 내용은 pd.to_datetime(sparta_data['access_date'], format=a)인데.
#3 pd.to_datetime()은 str(문자열)을 datetime(날짜형식)으로 바꿔주는 함수.
#4 sparta_data의 'access_date' 컬럼을 a라는 포맷으로 바꿔서 'access_date_time' 컬럼을 만들거야.

sparta_data.tail(5)
# sparta_data의 마지막 5개 열을 보여줘

 

출력 결과

 

요일 추가하기

sparta_data['access_date_time_weekday'] = sparta_data['access_date_time'].dt.day_name()
# access_date_time 컬럼과 dt.day_name() 함수를 이용하여 access_date_time_weekday 컬럼을 만들거야.
# .dt.day_name() 함수는 요일을 문자열로 추출하는 함수.

sparta_data.tail(5)
# 마지막 5개 열 출력

 

출력 결과

 

다음 내용

 

[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-3

요일 별 접속한 수강생 수 구하기 weeks = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'] # 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'가 담겨있는 # weeks라는 리스트 생

datanaly.tistory.com

 

반응형