전체 글

우당탕탕 데이터 분석일지
Study/Python

[Python] 데이터 시각화 - plot,barplot, boxplot (+ matplotlib, plot 한글 설정)

※ 아래 내용은 인프런 강의 공공데이터로 파이썬 데이터 분석 시작하기 강의로 부터 작성된 코드 요약본 입니다. ※ 아래 과정은 지난 포스팅에서 정리한 groupby, pivot_table을 바탕으로 작성되었습니다. [Python] 데이터 로드 및 전처리 ※ 아래 내용은 인프런 강의 공공데이터로 파이썬 데이터 분석 시작하기 강의로 부터 작성된 코드 요약본 입니다. 공공데이터로 파이썬 데이터 분석 시작하기 - 인프런 | 강의 이디야는 스타벅 seoyuun22.tistory.com 1. python에서 그래프를 위한 한글폰트 설정하기 # font_name 자리에는 사용자의 폰트명을 입력 import matplotlib.pyplot as plt plt.rc("font", family = "font_name") ..

Study/R

[R4DS] 1장 데이터 시각화 - 02 심미성 매핑

1.3 심미성 매핑 심미성은 플롯 객체들의 시각적 속성이다. 심미성에는 점의 크기, 모양, 색상 같은 것들이 포함된다. 심미성 속성값을 변경하여 점을 다른방법으로 표시할 수 있다. 앞으로 여기서는 심미성 속성을 설명할 때는 수준(level)이라는 용어를 사용한다. Color mapping example ggplot(data=mpg)+ geom_point(mapping = aes(x = displ, y = hwy, color = class)) 플롯 오른쪽에서 이상값으로 의심되는 데이터의 색상들을 보면 이상값 중 다수가 2인승차(2seater)임을 보여준다 이 차들은 스포츠카들이다. 스포츠카들은 SUV와 픽업트럭처럼 엔진이 크지만 차체가 중형차나 소형차처럼 작아서 연비가 좋다 심미성을 변수에 매핑하기 위해서..

Study/R

[R4DS] 1장 데이터 시각화 - 01 첫 단계

1.2 첫 단계 데이터 불러오기 mpg : 미 환경보호당국이 수집한 38개 차 모델들에 대한 관측 값 데이터프레임 # package::function() ggplot2::mpg package::function() 어떤 함수나 데이터셋이 어느 패키지에서 왔는지 명시해야 하는 경우 # 데이터 불러오기기 data(mpg) head(mpg) 분석 목적 mpg데이터를 이용한 엔진 크기와 연비의 관계 살펴보기 필요한 변수 displ : 엔진 크기 hwy : 고속도로에서의 자동차 연비. 같은 거리를 주행할 때 연비가 낮은 차는 연비가 높은 차보다 연료를 더 많이 소비 ggplot 생성 ggplot(data = mpg) + geom_point(mapping = aes(x = displ, y = hwy)) 그래프를 통해..

Study/SQL

[SQL]여러 테이블의 데이터를 조인해서 출력하기(ON절, USING절, NATURAL JOIN, LEFFT/RIGHT OUTER JOIN)

join은 크게 oracle join과 ANSI/ISO SQL:1999 standard이 있다 이전에 포스팅한 EQUI JOIN, NON EQUI JOIN, OUTER JOIN, SELF JOIN과 같은 문법을 ORACLE JOIN이라 하고, 오늘 배울 ON절, USING절, NATRUAL JOIN, LEFT/RIGHT OUTER JOIN은 모두 ORALCE 9i 버전부터 지원하는 문법. 두 문법은 작성 SQL의 차이만 있을 뿐 성능의 차이는 없음 1. ON절 ON절은 ORACLE 작성법에서 사용했던 WHERE절을 대신해 JOIN에 대한 조건을 쓸 때 사용한다. 예를 들어 사원의 이름과 부서 위치를 출력하는 경우, 두 방법의 작성법을 비교하면 아래와 같다. -- oracle EQUI JOIN SELECT..

일상

2021-11-02

#취준일기 백신 2차를 맞은 후 팔에 기운이 없어서 신경이 쓰인다.. 운동을 안해서 그런건지 백신 때문인지 몰라도 당분간은 지켜봐야할 것 같다. 오늘 오전에는 내일 공모전 회의 전에 미리 재검토를 했다. 고쳤으면 하는 부분을 체크하고 보완해야할 내용에 대해 정리도 했다. 내일이면 아마도 최종 제출을 하게될 것 같은데 이번 공모전은 좋은 결과가 너무나 간절하다ㅠ.. 목요일에 서류도 넣으려면.. 호딱 마치고 자소서도 작성해야겠다.

일상

2021-11-01

# 취준일기 오랜만에 다시 노트북을 키고 공부를 했다. 지난달에 끝내려 했는데 갑자기 공모전을 시작하게 되면서 아이디어 회의를 하고 중간에 문화생활도 하고 가족들과 쇼핑을 했더니 일주일이 지나갔다. 아직 공모전 마감은 하지 않았지만.. 이제는 마무리 단계여서 내일 보강할 자료 준비하고 수요일에 마지막회의를 하면 끝낼 수 있을 것 같다. 어제 커피를 마신 탓에 일찍 잠에 못들었는데 아침에도 언니가 깨우는 바람에 4~5시간 정도 자고 일어난 듯하다. 주말 내내 여기저기 다녀와서 쉴까도 생각했지만 여태 놀았던걸 생각하니 마음이 편하지 않았다. 앞으로는 공고도 보면서 자소서도 쓸 생각이기 때문에 멘탈을 잡아야 할 것 같다.

Study/SQL

[SQL] JOIN - EQUI JOIN, NON EQUI JOIN, OUTER JOIN, SELF JOIN

1. EQUI JOIN 서로 다른 테이블에 있는 컬럼들의 데이터를 하나의 결과로 조인해서 출력하기 위해 EQUI JOIN을 사용한다. 예를 들어사원테이블과 부서 테이블을 조인하여 이름과 부서 위치를 출력할 경우 아래와 같이 쿼리를 작성한다. SELECT ename, loc FROM EMP, DEPT WHERE EMP.deptno = DEPT.deptno; EMP와 DEPT 테이블을 서로 조인하기 위해선느 조인 조건이 있어야 한다. 조인 조건을 두개의 테이블을 연결하기 위한 연결고리이다. 여기서 조인 조건이 EMP 테이블의 부서 번호가 DEPT 테이블의 부서 번호와 같다라는 조건( : EMP.deptno = DEPT.deptno) 처럼 조인 조건이 이퀄(=)이면 EQUI JOIN이라한다. ※ 검색조건과 조..

Study/Python

[Python] 데이터 로드 및 전처리

※ 아래 내용은 인프런 강의 공공데이터로 파이썬 데이터 분석 시작하기 강의로 부터 작성된 코드 요약본 입니다. 공공데이터로 파이썬 데이터 분석 시작하기 - 인프런 | 강의 이디야는 스타벅스 근처에 입점한다는 설이 있었습니다. 과연 이디야와 스타벅스의 매장입지는 얼마나 차이가 날까요? 2013년부터 2019년까지 부동산 가격 변동 추세가 아파트 분양가에도 반영될 www.inflearn.com 1. 데이터를 로드하기 위해 pandas 라이브러리 불러오기 import pandas as pd 2. 데이터 로드 - 데이터 불러오기(인코딩) df = pd.read.csv("데이터 경로") # 한글이 포함된 파일의 경우 인코딩이 필요함 df = pd.read.csv("데이터 경로", encoding = "cp9494..

일상

2021-10-08

#취준일기 오늘은 오랜만에 python을 실행했다. 이전에 수강했던 공공데이터 시각화 강의가 리뉴얼되어 새로운 마음으로 수강을 시작했다. 사실 오늘 한 내용은 기본적은 마크다운 작성법과 데이터를 불러들여 전처리하는 과정을 진행했다. 항상 R과 같이하면 헷갈리는데 이렇게 하는 것도 벌써 한 3~4번은 된 것 같아서 익숙해진 것 같다. 그리고 edwith에서 새롭게 태블로 강의를 시작하기로 했다. 사실 이전에 수강신청해두었는데 완전 까먹고 있었다. 앞으로 edwith에서는 태블로와 파이썬을 이용한 웹크롤링에 대한 강의를 들을 예정이다. 마음은 이미 공공데이터 강의를 이번달 안에 끝내고 kaggle data를 이용해 실전에서 분석을 하고 있지만 어떻게 될 지 모르겠다. 집에 있으면 집안일을 하느라 공부에 집중..

일상

2021-08-25

#취준일기 8월이 끝나가는 이 시점에서 돌아본 나는 이번 달 내내 방황했다. 어떤 날에는 의지가 불타올라 이틀치 공부량을 하루만에 소화했고, 어떤 날에는 하염없이 의지가 바닥 나 아무이유없이 공부하지 않았다. 계획이 거창해지다보면 늘 생기는 불안감, 그 속에 게으름. 그리고 다시 죄책감과 포기 아침에 의자에 앉는게 힘들어져가고 다른일에 흥미를 붙이고, 하루종일 유튜브나 보고 있는 내 하루 문득 이렇게 변한게 목표가 없어서 일까 라는 생각이 들었다. 쉼 없이 자격증을 따고 나니 내가 뭘 해야하는지, 뭘 해왔는지 새까맣게 잊어버린 것 같다. 나에게는 목표가 필요한 것 같다.