나의 데이터 분석 일지
close
프로필 사진

나의 데이터 분석 일지

github: @denev6

  • 분류 전체보기 (144)
    • Microsoft (5)
    • Study (107)
      • Python (19)
      • SQL (39)
      • Databricks (1)
      • ML | DL (24)
      • R (8)
      • Etc (13)
    • 일상 (31)
      • 일기 (15)
      • 사진 (0)
      • 여행 (1)
      • 영화 (2)
      • 독서 (1)
  • 홈
  • 태그
  • 방명록
[R4DS] 1장 데이터 시각화 - 08 그래프 레이어 문법

[R4DS] 1장 데이터 시각화 - 08 그래프 레이어 문법

1.10 그래프 레이어 문법 ggplot(data = )+ ( mapping = aes(), stat = , position = ) + + 데이터 작동 과정 1. 데이터 셋 부터 시작해서 표시하고 싶은 정보로 변환하기 a. diamonds 데이터 셋에서 부터 시작한다 b. stat_count 로 cut 값 각각에 대한 count를 계산한다 2. 변형된 데이터 의 각 관찰값을 나타낸 기하객체를 선택한다. 데이터의 변수들을 나타내기 위해 지옴의 심미성 속성을 이용한다. 또한 각 변수의 값들을 심미성 수준에 매핑한다. a. 각 관측값을 막대로 표현한다 b. 각 막대의 fill을 ..count.. 변수로 매핑한다 3. 지옴을 위치시킬 좌표계를 선택한다 a. 지옴들을 데카르크 좌표계에 둔다 b. y 값을 ..co..

  • format_list_bulleted Study/R
  • · 2022. 1. 10.
[R4DS] 1장 데이터 시각화 - 07 좌표계

[R4DS] 1장 데이터 시각화 - 07 좌표계

1.9 좌표계 기본 좌표계는 각 점의 위치를 결정할 때 x와 y 위치가 독립적으로 움직이는 데카르트 좌표계이다. 1. coord_filp() coord_flip()은 x와 y축을 바꾼다. 예를 들어 수평 박스플롯이 필요한 경우나 라벨이 길어서 x축과 겹치지 않고 들어 맞게 하기 힘든 경우에 유용하다. # plot 1 ggplot(data = mpg, mapping = aes(x = class, y = hwy)) + geom_boxplot() # plot 2 ggplot(data = mpg, mapping = aes(x = class, y = hwy))+ geom_bar()+ coord_filp() 2. coord_quickmap() coord_quickmap() 을 하면 지도에 맞게 가로 세로 비율이 설..

  • format_list_bulleted Study/R
  • · 2022. 1. 10.
[R4DS] 1장 데이터 시각화 - 06 위치조정

[R4DS] 1장 데이터 시각화 - 06 위치조정

1.8 위치 조정 colour 또는 fill 옵션을 통해 막대 차트에 색상을 지정할 수 있다. ggplot(data = diamonds)+ geom_bar(mapping = aes(x = cut, colour = cut)) ggplot(data = diamonds)+ geom_bar(mapping = aes(x = cut, fill = color)) 채우기(fill) 옵션을 clarity 와 같은 다른 변수에 매핑하면 막대가 자동을 누적된다. 각 색상이 지정된 직사각형은 cut 과 clarity 의 조합으로 나타낸다. ggplot(data = diamonds)+ geom_bar(mapping = aes(x = cut, fill = clarity)) 스택은 position 옵션으로 지정된 위치 조정에 의해..

  • format_list_bulleted Study/R
  • · 2022. 1. 10.
[R4DS] 1장 데이터 시각화 - 05 통계적 변환

[R4DS] 1장 데이터 시각화 - 05 통계적 변환

1.7 통계적 변환 막대그래프 (Bar plot) 막대그래프는 플롯에 대해 미묘한 것을 드러내기 때문에 흥미로운 차트이다. 막대그래프는 geom_bar() 로 그릴 수 있다. 다음은 diamond 데이터셋에서 cut으로 그룹한 다이아몬드의 총 개수를 나타낸다. diamonds 데이터 셋은 54000여개의 다이몬드를 대상으로 크기(carat), 컷팅레벨(cut), 색(color), 투명도(clarity) 등이 조사되어 있다. ggplot(data = diamonds) + geom_bar(mapping = aes(x = cut)) 위의 코드에서도 알 수 있듯이 y축에 count는 diamonds의 변수가 아니다. count는 데이터셋의 원 값으로 플롯을 그린다. 막대그래프와 같은 다른 그래프는 플롯으로 그릴..

  • format_list_bulleted Study/R
  • · 2022. 1. 10.
[R4DS] 1장 데이터 시각화 - 04 기하객체

[R4DS] 1장 데이터 시각화 - 04 기하객체

# 1) ggplot(data = mpg)+ geom_point(mapping = aes(x = displ, y = hwy)) # 2) ggplot(data = mpg)+ geom_smooth(mapping = aes(x = displ, y = hwy)) 플롯은 동일한 x변수, y변수를 포함하고, 동일한 데이터를 나타낸다. 그러나 데이터를 표현하는 시각 객체가 다르다. 이는 다른 지옴의 유형을 사용하기 때문을 알 수 있다. 지옴(geom) 지옴(geom)은 데이터를 나타내기 위해 플롯이 사용하는 기하 객체(geometric object)를 의미한다. 따라서 위의 플롯은 산점도를 나타내는 포인트 지옴(geom_point)을 사용했고, 아래는 평활 지옴(geom_smooth), 즉 데이터에 적합된 평활선을 ..

  • format_list_bulleted Study/R
  • · 2022. 1. 10.
[R4DS] 1장 데이터 시각화 - 03 facet

[R4DS] 1장 데이터 시각화 - 03 facet

1.5 facet facet_wrap() 변수를 추가하는 방법으로 심미성을 이용하는 방법 외에 플롯을 면분할(facet)로 나누는 것으로, 이는 범주형 변수에 특히 유용하다. 하나의 변수에 대해 면분할 하기 위해서는 facet_wrap() 을 이용한다. facet_wrap() 의 첫 번째 인수로는 ~와 뒤에 변수 이름이 나오는 공식이어야 하며, facet_wrap() 에 전달하는 변수는 이산형이어야 한다. ggplot(data = mpg)+ geom_point(mapping = aes(x = displ, y = hwy)) + facet_wrap(~ class, nrow = 2) facet_grid() 플롯을 두 변수 조합으로 면분할하기 위해서는 facet_wrap() 를 플롯 호출에 추가하면 된다. fa..

  • format_list_bulleted Study/R
  • · 2021. 11. 27.
  • navigate_before
  • 1
  • 2
  • navigate_next
공지사항
전체 카테고리
  • 분류 전체보기 (144)
    • Microsoft (5)
    • Study (107)
      • Python (19)
      • SQL (39)
      • Databricks (1)
      • ML | DL (24)
      • R (8)
      • Etc (13)
    • 일상 (31)
      • 일기 (15)
      • 사진 (0)
      • 여행 (1)
      • 영화 (2)
      • 독서 (1)
인기 글
전체 방문자
오늘
어제
Copyright © truthyun 모든 권리 보유.
SKIN: Copyright © 쭈미로운 생활 All rights reserved. Designed by JJuum.
and Current skin "dev-roo" is modified by Jin.

티스토리툴바