Study/R

Study/R

[R4DS] 1장 데이터 시각화 - 08 그래프 레이어 문법

1.10 그래프 레이어 문법 ggplot(data = )+ ( mapping = aes(), stat = , position = ) + + 데이터 작동 과정 1. 데이터 셋 부터 시작해서 표시하고 싶은 정보로 변환하기 a. diamonds 데이터 셋에서 부터 시작한다 b. stat_count 로 cut 값 각각에 대한 count를 계산한다 2. 변형된 데이터 의 각 관찰값을 나타낸 기하객체를 선택한다. 데이터의 변수들을 나타내기 위해 지옴의 심미성 속성을 이용한다. 또한 각 변수의 값들을 심미성 수준에 매핑한다. a. 각 관측값을 막대로 표현한다 b. 각 막대의 fill을 ..count.. 변수로 매핑한다 3. 지옴을 위치시킬 좌표계를 선택한다 a. 지옴들을 데카르크 좌표계에 둔다 b. y 값을 ..co..

Study/R

[R4DS] 1장 데이터 시각화 - 07 좌표계

1.9 좌표계 기본 좌표계는 각 점의 위치를 결정할 때 x와 y 위치가 독립적으로 움직이는 데카르트 좌표계이다. 1. coord_filp() coord_flip()은 x와 y축을 바꾼다. 예를 들어 수평 박스플롯이 필요한 경우나 라벨이 길어서 x축과 겹치지 않고 들어 맞게 하기 힘든 경우에 유용하다. # plot 1 ggplot(data = mpg, mapping = aes(x = class, y = hwy)) + geom_boxplot() # plot 2 ggplot(data = mpg, mapping = aes(x = class, y = hwy))+ geom_bar()+ coord_filp() 2. coord_quickmap() coord_quickmap() 을 하면 지도에 맞게 가로 세로 비율이 설..

Study/R

[R4DS] 1장 데이터 시각화 - 06 위치조정

1.8 위치 조정 colour 또는 fill 옵션을 통해 막대 차트에 색상을 지정할 수 있다. ggplot(data = diamonds)+ geom_bar(mapping = aes(x = cut, colour = cut)) ggplot(data = diamonds)+ geom_bar(mapping = aes(x = cut, fill = color)) 채우기(fill) 옵션을 clarity 와 같은 다른 변수에 매핑하면 막대가 자동을 누적된다. 각 색상이 지정된 직사각형은 cut 과 clarity 의 조합으로 나타낸다. ggplot(data = diamonds)+ geom_bar(mapping = aes(x = cut, fill = clarity)) 스택은 position 옵션으로 지정된 위치 조정에 의해..

Study/R

[R4DS] 1장 데이터 시각화 - 05 통계적 변환

1.7 통계적 변환 막대그래프 (Bar plot) 막대그래프는 플롯에 대해 미묘한 것을 드러내기 때문에 흥미로운 차트이다. 막대그래프는 geom_bar() 로 그릴 수 있다. 다음은 diamond 데이터셋에서 cut으로 그룹한 다이아몬드의 총 개수를 나타낸다. diamonds 데이터 셋은 54000여개의 다이몬드를 대상으로 크기(carat), 컷팅레벨(cut), 색(color), 투명도(clarity) 등이 조사되어 있다. ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut)) 위의 코드에서도 알 수 있듯이 y축에 count는 diamonds의 변수가 아니다. count는 데이터셋의 원 값으로 플롯을 그린다. 막대그래프와 같은 다른 그래프는 플롯으로 그릴..

Study/R

[R4DS] 1장 데이터 시각화 - 04 기하객체

# 1) ggplot(data = mpg)+ geom_point(mapping = aes(x = displ, y = hwy)) # 2) ggplot(data = mpg)+ geom_smooth(mapping = aes(x = displ, y = hwy)) 플롯은 동일한 x변수, y변수를 포함하고, 동일한 데이터를 나타낸다. 그러나 데이터를 표현하는 시각 객체가 다르다. 이는 다른 지옴의 유형을 사용하기 때문을 알 수 있다. 지옴(geom) 지옴(geom)은 데이터를 나타내기 위해 플롯이 사용하는 기하 객체(geometric object)를 의미한다. 따라서 위의 플롯은 산점도를 나타내는 포인트 지옴(geom_point)을 사용했고, 아래는 평활 지옴(geom_smooth), 즉 데이터에 적합된 평활선을 ..

Study/R

[R4DS] 1장 데이터 시각화 - 03 facet

1.5 facet facet_wrap() 변수를 추가하는 방법으로 심미성을 이용하는 방법 외에 플롯을 면분할(facet)로 나누는 것으로, 이는 범주형 변수에 특히 유용하다. 하나의 변수에 대해 면분할 하기 위해서는 facet_wrap() 을 이용한다. facet_wrap() 의 첫 번째 인수로는 ~와 뒤에 변수 이름이 나오는 공식이어야 하며, facet_wrap() 에 전달하는 변수는 이산형이어야 한다. ggplot(data = mpg)+ geom_point(mapping = aes(x = displ, y = hwy)) + facet_wrap(~ class, nrow = 2) facet_grid() 플롯을 두 변수 조합으로 면분할하기 위해서는 facet_wrap() 를 플롯 호출에 추가하면 된다. fa..

Study/R

[R4DS] 1장 데이터 시각화 - 02 심미성 매핑

1.3 심미성 매핑 심미성은 플롯 객체들의 시각적 속성이다. 심미성에는 점의 크기, 모양, 색상 같은 것들이 포함된다. 심미성 속성값을 변경하여 점을 다른방법으로 표시할 수 있다. 앞으로 여기서는 심미성 속성을 설명할 때는 수준(level)이라는 용어를 사용한다. Color mapping example ggplot(data=mpg)+ geom_point(mapping = aes(x = displ, y = hwy, color = class)) 플롯 오른쪽에서 이상값으로 의심되는 데이터의 색상들을 보면 이상값 중 다수가 2인승차(2seater)임을 보여준다 이 차들은 스포츠카들이다. 스포츠카들은 SUV와 픽업트럭처럼 엔진이 크지만 차체가 중형차나 소형차처럼 작아서 연비가 좋다 심미성을 변수에 매핑하기 위해서..

Study/R

[R4DS] 1장 데이터 시각화 - 01 첫 단계

1.2 첫 단계 데이터 불러오기 mpg : 미 환경보호당국이 수집한 38개 차 모델들에 대한 관측 값 데이터프레임 # package::function() ggplot2::mpg package::function() 어떤 함수나 데이터셋이 어느 패키지에서 왔는지 명시해야 하는 경우 # 데이터 불러오기기 data(mpg) head(mpg) 분석 목적 mpg데이터를 이용한 엔진 크기와 연비의 관계 살펴보기 필요한 변수 displ : 엔진 크기 hwy : 고속도로에서의 자동차 연비. 같은 거리를 주행할 때 연비가 낮은 차는 연비가 높은 차보다 연료를 더 많이 소비 ggplot 생성 ggplot(data = mpg) + geom_point(mapping = aes(x = displ, y = hwy)) 그래프를 통해..

truthyun
'Study/R' 카테고리의 글 목록