Pandas
[Pandas]외부 파일 불러오기
김천종
2022. 11. 2. 17:39
반응형
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
|
import pandas as pd
###외부 파일 불러오기###
'''
파일 포멧 Reader Writer
CSV read_csv to_csv
JSON read_json to_json
HTML read_html to_html
Local clipboard read_clipborad to_clipborad
MS Excel read_excel to_excel
HDF5 Format read_hdf to_hdf
SQL read_sql to_sql
'''
#CSV 파일#
#CSV파일은 데이터 값을 ','로 구분한다. CSV(comma-separated values), ','로 열을 구분하고
#줄바꿈으로 행을 구분한다.
file_path = "C:/Users/ZenBook/Desktop/part2/read_csv_sample.csv" ## CSV파일 경로를 지정
df = pd.read_csv(file_path) ##header 옵션을 지정하지 않으면 첫번째 행의 데이터가 열의 이름이 된다.
print(df)
'''
c0 c1 c2 c3
0 0 1 4 7
1 1 2 5 8
2 2 3 6 9
'''
df = pd.read_csv(file_path, header=None) ##header=None 을 지정해서 열의 이름이 정수 인덱스로 자동 지정됐다.
print(df)
'''
0 1 2 3
0 c0 c1 c2 c3
1 0 1 4 7
2 1 2 5 8
3 2 3 6 9
'''
df = pd.read_csv(file_path, index_col='c0') ##index_col 을 사용해서 행의 인덱스가 'c0'의 데이터로 지정됐다.
print(df)
'''
c1 c2 c3
c0
0 1 4 7
1 2 5 8
2 3 6 9
'''
#Excel 파일#
#Excel 파일의 행, 열은 데이터프레임의 행, 열과 일대일 대응된다.
#CSV 파일과 비슷하게 불러온다#
#Excel 파일을 파이썬에서 읽고 쓰기위해 OpenPyXL 을 설치해야 한다.
#pip install openpyxl# #pip명령어를 통해 설치한다#
file_path = "C:/Users/ZenBook/Desktop/part2/df_sample.xlsx" ## Excel파일 경로를 지정
df = pd.read_excel(file_path)
print(df)
'''
name algol basic c++
0 Jerry A C B+
1 Riah A+ B C
2 Paul B B+ C+
'''
#JSON 파일#
#JSON 파일은 데이터 공유를 목적으로 만든 파일 형식, 딕셔너리와 비슷하게
#key, value 구조를 갖는다#
file_path = "C:/Users/ZenBook/Desktop/part2/read_json_sample.json" ## JSON파일 경로를 지정
''' json파일 내용
"name":{"pandas":"",
"NumPy":"",
"matplotlib":""},
"year":{"pandas":2008,
"NumPy":2006,
"matplotlib":2003},
"developer":{"pandas":"Wes Mckinneye",
"NumPy":"Travis Oliphant",
"matplotlib":"John D. Hunter"},
"opensource":{"pandas":"True",
"NumPy":"True",
"matplotlib":"True"}
'''
df = pd.read_json(file_path)
print(df)
''' 변환 후
name year developer opensource
pandas 2008 Wes Mckinneye True
NumPy 2006 Travis Oliphant True
matplotlib 2003 John D. Hunter True
'''
|
cs |
모든 소스는 http://www.infopub.co.kr/index.asp 자료실 파이썬 머신러닝 판다스 데이터 분석 본문 소스 코드(4쇄) 에서 다운받았습니다.
정보문화사
IT도서의 표준,정보문화사가 쉽고,가깝게 IT세상으로 여러분을 안내해드리겠습니다
www.infopub.co.kr
반응형