반응형
이전 내용
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-1
1. 판다스 불러오기 import pandas as pd import라는 명령어 이용해서 pandas라는 라이브러리 가져올건데 pd로 사용할거야 2. CSV 파일 불러오기 sparta_data = pd.read_table('access_detail.csv',sep=',') 1. pd(pandas)안에 csv
datanaly.tistory.com
2) 시간 데이터 전처리 해주기
기존의 sparta_data에 있는 컬럼들은 다음과 같습니다.
access_date 컬럼을 이용하여 access_date_time 컬럼 만들기
a = '%Y-%m-%dT%H:%M:%S.%f'
# a라는 변수에 '%Y-%m-%dT%H:%M:%S.%f'라는 날짜 형식을 넣을거야.
sparta_data['access_date_time'] = pd.to_datetime(sparta_data['access_date'], format=a)
#1 sparta_data에 'access_date_time'라는 컬럼을 추가할거야.
#2 그 내용은 pd.to_datetime(sparta_data['access_date'], format=a)인데.
#3 pd.to_datetime()은 str(문자열)을 datetime(날짜형식)으로 바꿔주는 함수.
#4 sparta_data의 'access_date' 컬럼을 a라는 포맷으로 바꿔서 'access_date_time' 컬럼을 만들거야.
sparta_data.tail(5)
# sparta_data의 마지막 5개 열을 보여줘
출력 결과
요일 추가하기
sparta_data['access_date_time_weekday'] = sparta_data['access_date_time'].dt.day_name()
# access_date_time 컬럼과 dt.day_name() 함수를 이용하여 access_date_time_weekday 컬럼을 만들거야.
# .dt.day_name() 함수는 요일을 문자열로 추출하는 함수.
sparta_data.tail(5)
# 마지막 5개 열 출력
출력 결과
다음 내용
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-3
요일 별 접속한 수강생 수 구하기 weeks = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'] # 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'가 담겨있는 # weeks라는 리스트 생
datanaly.tistory.com
반응형
'Today i learned & Week i learned > 파이썬 관련' 카테고리의 다른 글
코랩(colab)에 활용할 파일 업로드 하는 법 (1) | 2023.12.23 |
---|---|
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-5 (1) | 2023.12.20 |
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-4 (0) | 2023.12.20 |
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-3 (0) | 2023.12.20 |
[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-1 (2) | 2023.12.07 |