Matplotlib 산점도, 버블차트 그리기

2022. 11. 5. 22:15·Pandas
반응형
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import pandas as pd
import matplotlib.pyplot as plt
 
### 산점도 ###
# plot(kind='scatter')
# 산점도는 서로 다른 두 변수 간의 관계를 나타낸다 #
# 데이터 두 개를 x, y축에 놓고 데이터가 존재하는 좌표를 찾아서 점으로 표시한다 #
 
plt.style.use('default')
 
df = pd.read_csv("C:/Users/ZenBook/Desktop/code/sample/part4/auto-mpg.csv")
df.columns=['mpg','cylinders','displacement','horsepower',4,5,6,7,8]
# 데이터프레임의 열 이름을 'mpg','cylinders,2,3...으로 바꿈.
 
sc = df.plot(kind='scatter', x='horsepower', y='mpg', c='black', s=10, figsize=(15,5))
# 산점도 그리기, x축은 'horsepower', y축은 'mpg'로 설정한다.
# c = 'black' : 점 색깔 지정
# s = 10 : 점 크기 지정
 
sc.set_title('Scatter - horsepower x mpg')
plt.xticks(rotation='vertical')
# x레이블 수직으로 회전
Colored by Color Scripter
cs

 

 

 

1
2
3
4
5
6
7
8
9
10
11
### 버블 차트 ###
# 산점도에서 하나의 변수를 추가해서 세 변수 간의 관계를 나타낸다 #
# 추가된 하나의 변수는 점의 크기로 나타낸다 #
 
cylinders_size = df.cylinders/df.cylinders.max() * 300
# s = cylinders_size 를 하기 위해 변수 지정, 0~1 사이의 값으로 만듦.
 
bb = df.plot(kind='scatter', x='horsepower', y='mpg', c='coral', figsize=(10,5), 
             s=cylinders_size, alpha=0.3)
# s(점의 크기) 에 0~1 사이의 변수를 넣어서 세 변수간의 관계를 나타내는 버블 차트를 만든다.
# alpha = 0.3 : 점 투명도 설정
Colored by Color Scripter
cs

 

반응형

'Pandas' 카테고리의 다른 글

데이터 전처리 - 누락 데이터 처리  (0) 2022.11.06
Matplotlib 파이 차트 그리기  (0) 2022.11.05
Matplotlib 히스토그램 그리기  (0) 2022.11.05
Matplotlib 면적 그래프, 막대 그래프 그리기  (0) 2022.11.05
Matplotlib 그래프 그리기 기초, 선 그래프  (1) 2022.11.04
'Pandas' 카테고리의 다른 글
  • 데이터 전처리 - 누락 데이터 처리
  • Matplotlib 파이 차트 그리기
  • Matplotlib 히스토그램 그리기
  • Matplotlib 면적 그래프, 막대 그래프 그리기
김천종
김천종
  • 김천종
    김천종
    김천종
  • 전체
    오늘
    어제
    • 분류 전체보기 (88)
      • 파이썬 (6)
      • Pandas (24)
      • 자료구조 (14)
      • 알고리즘 (4)
      • 아무거나 (16)
      • 머신러닝 (20)
      • ML 실습 (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.2
김천종
Matplotlib 산점도, 버블차트 그리기
상단으로

티스토리툴바