반응형

파이썬 22

맷플롯립 기초 plt.figure() [feat.혼자 공부하는 데이터분석]

활용 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com plt.figure() 사용 방법 : plt.figure(figsize=(가로 사이즈, 세로 사이즈), dpi(해상도)=원하는 값) -> 그래프의 크기를 지정할 수 있다. 예제 코드 plt.figure(figsize=(9, 6)) # 그래프의 크기는 가로 9 , 세로 6으로 한다. plt.scatter(ns_book7['도서권수'], ns_book7['대출건수'], alpha=0.1) # x값은 ns_book7 데이터프레임의 "도서권수" 컬럼의 값들 # y값은 ns_book7 데이터프레임의 "대출건수" 컬럼의 값들 # 투명도는 0.1로 하고 # 산점도 그..

맷플롯립 기초 scatter() [feat.혼자공부하는데이터분석]

활용 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .scatter() 사용법 plt.scatter(x축 값, y축 값, alpha(투명도) =[0~1]) -> 산점도 그래프를 그릴 수 있다. 예제 코드 import matplotlib.pyplot as plt # 맷플롯립.파이플롯 라이브러리를 가져오고 plt로 칭하겠다. plt.scatter([1,2,3,4], [1,2,3,4]) # x값은 [1,2,3,4], y값은 [1,2,3,4]로 산점도 그래프를 만들어줘. plt.show() # 그래프를 보여줘 출력 결과 예제 코드 plt.scatter(ns_book7['번호'], ns_book7['대출건수']) ..

판다스 기초 .groupby() (feat.혼공데분)

참고 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .groupby() 사용법 : 데이터프레임명.groupby(by=[그룹화할 컬럼 명], dropna = False : NaN이 있는 행 삭제하지 않음).연산함수() -> 그룹화하기 예제 코드 count_df = ns_book[['도서명','저자','ISBN','권','대출건수']] # ns_book 데이터프레임에서 '도서명','저자','ISBN','권','대출건수' 컬럼만 선택하여 # count_df 변수라는 저장 count_df # count_df 출력 출력 결과 예제 코드(case1) group_df = count_df.groupby(by=['도서명'..

스파르타 코딩 내일배움캠프 데이터분석 3주차 회고(week i learned)

- 지난 일주일 동안 가장 인상 깊었던 배움에는 뭐가 있었지? 판다스 기초! - 그 배움까지 다가가는데 어떤 어려움이 있었지? 크게 어려움은 없었지 - 그 과정에서 나는 무엇을 깨달았고, 어떤 감정/생각이 들었었지? 판다스 재밌구나! 열심히 해야겠다! - 결과적으로, 현재 나의 상태는 어떻게 되었지? 판다스 기초 마스타! - 이 상태에서 다음 일주일을 더 잘 보내려면 무엇이 필요할까? 무리하지말고 즐기자! 즐기면 된다! 이제 두 번째 프로젝트가 시작될텐데. 큰 문제 없이 잘 진행됐으면 좋겠다:) 잘하고 있어! 4주차도 파이팅이야!

판다스 기초 .duplicated()(feat.혼공데분)

참고 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .duplicated() 사용법 "데이터프레임 명".duplicated(subset=[컬럼명], keep=True) -> 중복된 행 찾기 예제 코드(1) ns_book.duplicated() # ns_book라는 데이터프레임에서 중복된 행을 True로 표시해줘! 출력 결과(1) 예제 코드(2) sum(ns_book.duplicated()) # ns_book.duplicated()의 True 개수를 알려줘! 출력 결과(2) 예제 코드(3) ns_book.duplicated(subset=['도서명','저자','ISBN']) # ns_book라는 데이터프레임에..

판다스 기초 메서드 head(), drop(), dropna() (feat.혼공데분)

활용 교재 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .head() 사용법 "데이터 프레임 명".head() → 데이터 프레임의 상위 5개 행 출력 예제 코드 ns_df.head() # ns_df라는 데이터프레임의 상위 5개 행 보여줘! 출력 결과 .drop() 사용법 "데이터 프레임 명".drop("삭제하고자하는 컬럼명", axis = [0:행, 1:열], implace=[True : 덮어쓰기, False:덮어쓰지않기]) → 데이터프레임의 행과 열을 지울 수 있다. 예제 코드 (1) ns_book = ns_df.drop('Unnamed: 13', axis=1) # ns_df라는 데이터프레임에서 'Unnam..

내일배움캠프 데이터분석 3주차 파이썬 개인과제 [3]

작성 코드 및 설명 # 재고 데이터 예시 inventory_data = [ ['Apple', 30], ['Banana', 20], ['Orange', 50] ] # 기준 데이터 예시 standard_data = [ ['Apple', 40], ['Banana', 10], ['Orange', 70] ] # check_inventory 함수 def check_inventory(x,y): # 과잉,부족 리스트 over_list = [] lack_list = [] # 이중 리스트 y 반복문 실행 for a,b in y: # 이중 리스트 x의 길이 만큼 반복문 실행 for i in range(len(x)): # 이중 리스트 x의 i번째 항목의 0번째 항목이 a와 같다면 아래 if문 실행 if x[i][0] == a..

내일 배움 캠프 데이터 분석 과정 솔직 후기 [2~3주차]

저는 강의, 교육기획, 교육컨텐츠제작, 부트 캠프 교육 운영 경력을 보유하고 있고 현재 스파르타 코딩 내일 배움 캠프 데이터 분석 과정에 적극적으로 임하고 있고 교육에 대해 만족하고 있는 상태입니다. 2~3주차 후기 파이썬 강의 제대로 듣진 않았지만 스파르타 대표님이 하는 강의는 평타 이상일 것이다. 웹개발 강의에서 느꼈다. 커리큘럼을 보았을 때 해야하는 건 다 넣으신 것 같다. -> 수강 후 - 역시 강의는 좋았지만 강의 내용이 너무 짧았다. - 추가적인 파이썬 공부에 필요한 정보라도 알려주면 좋을 것 같다. 디지털 리터러시 - 강의 구성과 강의 내용이 너무 좋았다. - 프로젝트를 할 때 도움이 될 내용들이 많았다. SQL 과제 - 일단 난이도가 너무 어려웠다. - 문제에 너무 모호한 부분도 많았다. ..

내일배움캠프 데이터분석 2주차 SQL 개인과제 [3]

문제 7: "주별 매출 순위 및 평균 매출 목표 달성 여부 확인" list_of_orders, order_details, 그리고 sales_target 세 개의 테이블이 있습니다. list_of_orders 테이블은 주문 ID(order_id)와 주문이 이루어진 주(State)를, order_details 테이블은 각 주문의 금액(Amount)과 이익(Profit)을, sales_target 테이블은 각 카테고리별 매출 목표(Target)를 포함합니다. 이 테이블들을 사용하여 각 주별로 주문의 총 금액과 이익을 계산하고, 각 주 내에서 주문의 매출 순위를 결정하세요. 또한, 각 주문의 총 금액이 해당 카테고리의 평균 매출 목표의 50%를 달성했는지 여부도 판단하세요. select loo.order_id ..

[스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-6

이전 내용 [스파르타코딩클럽] 직장인을 위한 실전 데이터분석 _ 3-5 제품 수요가 많은 지역을 찾아라! _ 라인 그래프 그리기 import pandas as pd # 판다스 라이브러리를 가져오는데 pd라고 부르겠다. import matplotlib.pyplot as plt # 맷플롯립 라이브러리를 가져오는데 plt라고 datanaly.tistory.com 4) 필요한 데이터만 볼수 있게 테이블 가공하기 area_info=sparta_data[['area','latitude','longitude']] # 새로운 테이블을 만들고자 할 땐 기존의 테이블에서 필요한 "열의 이름"을 대괄호에 넣어 변수에 지정해 주면 됩니다 # sparta_data에서 'area','latitude','longitude'열의 데..

반응형