반응형

데이터분석가 32

데이터 문해력 요약 5

이전 내용 데이터 문해력 요약 4 이전 내용 데이터 문해력 요약 3 이전 내용 데이터 문해력 요약2 이전 글 데이터 문해력 요약1 도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제 datanaly.tistory.com 데이터에서 원인을 찾는 사고방식과 방법 원인 후보를 이끌어내는 방법과 지표를 특정하는 방식 원인 후보를 열거한다. -> 지표를 결정한다. -> 관련성을 확인한다. 데이터 수집이 어려운경우 1. 유사한 데이터는 어떤 것이 있을지 생각해본다. 2. 지금 바로 수집을 시작한다. 3. 정량적이 아닌 정석적인 정보로 대응한다. 4. 포기한다. 문제와 원인, 그 관련성 유무를 확인하는 방법 1단계 : 시작적으로 관련성을 확인한다. 산포도로 나타내본다. ..

데이터 문해력 요약 4

이전 내용 데이터 문해력 요약 3 이전 내용 데이터 문해력 요약2 이전 글 데이터 문해력 요약1 도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데 datanaly.tistory.com 비교할 때 체크포인트 1. 결론으로 이어지는결과가 나올 것인가? (반드시 결론으로 부합하는 결과가 나온다는 보증은 없다.) 2. 비교를 통해 "차이"를 찾을 수 있는가? 3. '데이터 중심'으로 접근하는 사람의 결과물은 대체로 '결과'로 끝납니다. 4. '목적 중심'으로 접근하는 사람은 '결론'까지 말합니다. 5. '데이터를 활용한다'란, 결과가 아니라 결론을 도출하는 것입니다. 최종 목표는 '행동과 판단' 1. '현..

데이터 문해력 요약 3

이전 내용 데이터 문해력 요약2 이전 글 데이터 문해력 요약1 도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데이터 분석 자체가 목적이 되기 십 datanaly.tistory.com 결론 도출 프로세스 1) 평가 지표 및 기준을 결정 (어떤 요소와 지표가 더욱 목적에 부합하는가?) 2) 적합한 데이터 및 그래프 선택 (어떤 데이터 형태와 그래프가 효과적인가?) 3) 결론 (결국 무슨 말을 할 수 있는가?) 프레젠테이션 순서 1) 결론 (결국 무슨 말을 할 수 있는가?) 2) 평가 지표 및 기준을 결정 (어떤 요소와 지표가 더욱 목적에 부합하는가?) 3) 적합한 데이터 및 그래프 선택 (어떤 데이터 ..

데이터 문해력 요약2

이전 글 데이터 문해력 요약1 도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데이터 분석 자체가 목적이 되기 십상이다. 1. 데이터와 데이터 datanaly.tistory.com 풀고자 하는 문제가 명확하지 않다. 1. 가장 먼저 해야 하는 작업은 '목적과 문제에 대한 정의' 2. 사용된 언어가 구체적이고 명확한가? 3. 데이터 안에는 어떠한 논리성도 객관성도 없다. 4. 정답은 없다! 5. '문제', '원인', '해결 방안'을 구분하고 있는가? 6. 작업을 시작하기 전에, 해결하고자 하는 '문제'와 그 '목적'에 대해 명확히 할 필요가 있습니다. 7. 자신의 편견이 들어가게 되면 상황을 정리하기가..

데이터 문해력 요약1

도서 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 데이터 분석 자체가 목적이 되기 십상이다. 1. 데이터와 데이터 분석은 목적을 달성하기 위한 도구에 지나지 않습니다. 2. 그래프 중심, 데이터 중심이라 아니라 목적 중심의 데이터 분석이 중요하다. 데이터 활용 프로세스 1. 겉으로 드러난 현상 → 2. 목적 및 문제를 정의 → 3. 지표를 결정 → 4. 현재 상태를 파악 → 5. 평가 → 6. 요인을 분석 → 7. 해결 방안을 모색 데이터 활용 실패의 원인 1. 풀고자 하는 문제가 명확하지 않다. 2. 정의한 문제와 사용하는 데이터가 일치하지 않는다. 데이터를 가공한다. → 데이터에서 무엇을 알 수 있..

판다스 기초 .groupby() (feat.혼공데분)

참고 도서 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .groupby() 사용법 : 데이터프레임명.groupby(by=[그룹화할 컬럼 명], dropna = False : NaN이 있는 행 삭제하지 않음).연산함수() -> 그룹화하기 예제 코드 count_df = ns_book[['도서명','저자','ISBN','권','대출건수']] # ns_book 데이터프레임에서 '도서명','저자','ISBN','권','대출건수' 컬럼만 선택하여 # count_df 변수라는 저장 count_df # count_df 출력 출력 결과 예제 코드(case1) group_df = count_df.groupby(by=['도서명'..

스파르타 코딩 내일배움캠프 데이터분석 3주차 회고(week i learned)

- 지난 일주일 동안 가장 인상 깊었던 배움에는 뭐가 있었지? 판다스 기초! - 그 배움까지 다가가는데 어떤 어려움이 있었지? 크게 어려움은 없었지 - 그 과정에서 나는 무엇을 깨달았고, 어떤 감정/생각이 들었었지? 판다스 재밌구나! 열심히 해야겠다! - 결과적으로, 현재 나의 상태는 어떻게 되었지? 판다스 기초 마스타! - 이 상태에서 다음 일주일을 더 잘 보내려면 무엇이 필요할까? 무리하지말고 즐기자! 즐기면 된다! 이제 두 번째 프로젝트가 시작될텐데. 큰 문제 없이 잘 진행됐으면 좋겠다:) 잘하고 있어! 4주차도 파이팅이야!

판다스 기초 메서드 head(), drop(), dropna() (feat.혼공데분)

활용 교재 혼자 공부하는 데이터 분석 with 파이썬 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com .head() 사용법 "데이터 프레임 명".head() → 데이터 프레임의 상위 5개 행 출력 예제 코드 ns_df.head() # ns_df라는 데이터프레임의 상위 5개 행 보여줘! 출력 결과 .drop() 사용법 "데이터 프레임 명".drop("삭제하고자하는 컬럼명", axis = [0:행, 1:열], implace=[True : 덮어쓰기, False:덮어쓰지않기]) → 데이터프레임의 행과 열을 지울 수 있다. 예제 코드 (1) ns_book = ns_df.drop('Unnamed: 13', axis=1) # ns_df라는 데이터프레임에서 'Unnam..

내일배움캠프 데이터분석 3주차 파이썬 개인과제 [3]

작성 코드 및 설명 # 재고 데이터 예시 inventory_data = [ ['Apple', 30], ['Banana', 20], ['Orange', 50] ] # 기준 데이터 예시 standard_data = [ ['Apple', 40], ['Banana', 10], ['Orange', 70] ] # check_inventory 함수 def check_inventory(x,y): # 과잉,부족 리스트 over_list = [] lack_list = [] # 이중 리스트 y 반복문 실행 for a,b in y: # 이중 리스트 x의 길이 만큼 반복문 실행 for i in range(len(x)): # 이중 리스트 x의 i번째 항목의 0번째 항목이 a와 같다면 아래 if문 실행 if x[i][0] == a..

내일 배움 캠프 데이터 분석 과정 솔직 후기 [2~3주차]

저는 강의, 교육기획, 교육컨텐츠제작, 부트 캠프 교육 운영 경력을 보유하고 있고 현재 스파르타 코딩 내일 배움 캠프 데이터 분석 과정에 적극적으로 임하고 있고 교육에 대해 만족하고 있는 상태입니다. 2~3주차 후기 파이썬 강의 제대로 듣진 않았지만 스파르타 대표님이 하는 강의는 평타 이상일 것이다. 웹개발 강의에서 느꼈다. 커리큘럼을 보았을 때 해야하는 건 다 넣으신 것 같다. -> 수강 후 - 역시 강의는 좋았지만 강의 내용이 너무 짧았다. - 추가적인 파이썬 공부에 필요한 정보라도 알려주면 좋을 것 같다. 디지털 리터러시 - 강의 구성과 강의 내용이 너무 좋았다. - 프로젝트를 할 때 도움이 될 내용들이 많았다. SQL 과제 - 일단 난이도가 너무 어려웠다. - 문제에 너무 모호한 부분도 많았다. ..

반응형