Pandas

[Pandas]외부 파일 불러오기

김천종 2022. 11. 2. 17:39
반응형
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
import pandas as pd
 
###외부 파일 불러오기###
'''
파일 포멧             Reader             Writer
CSV                 read_csv            to_csv
JSON                read_json           to_json
HTML                read_html           to_html
Local clipboard     read_clipborad      to_clipborad
MS Excel            read_excel          to_excel
HDF5 Format         read_hdf            to_hdf  
SQL                 read_sql            to_sql
'''
 
 
#CSV 파일#
#CSV파일은 데이터 값을 ','로 구분한다. CSV(comma-separated values), ','로 열을 구분하고
#줄바꿈으로 행을 구분한다.
 
file_path = "C:/Users/ZenBook/Desktop/part2/read_csv_sample.csv" ## CSV파일 경로를 지정
df = pd.read_csv(file_path) ##header 옵션을 지정하지 않으면 첫번째 행의 데이터가 열의 이름이 된다. 
print(df)
'''
   c0  c1  c2  c3
0   0   1   4   7
1   1   2   5   8
2   2   3   6   9
'''
 
df = pd.read_csv(file_path, header=None##header=None 을 지정해서 열의 이름이 정수 인덱스로 자동 지정됐다.
print(df) 
'''
    0   1   2   3
0  c0  c1  c2  c3
1   0   1   4   7
2   1   2   5   8
3   2   3   6   9
'''
 
df = pd.read_csv(file_path, index_col='c0'##index_col 을 사용해서 행의 인덱스가 'c0'의 데이터로 지정됐다.
print(df) 
'''
   c1  c2  c3
c0
0    1   4   7
1    2   5   8
2    3   6   9
'''
 
 
#Excel 파일#
#Excel 파일의 행, 열은 데이터프레임의 행, 열과 일대일 대응된다.
#CSV 파일과 비슷하게 불러온다#
#Excel 파일을 파이썬에서 읽고 쓰기위해 OpenPyXL 을 설치해야 한다.
#pip install openpyxl# #pip명령어를 통해 설치한다#
 
file_path = "C:/Users/ZenBook/Desktop/part2/df_sample.xlsx" ## Excel파일 경로를 지정
df = pd.read_excel(file_path)
print(df)
'''
    name algol basic c++
0  Jerry     A     C  B+
1   Riah    A+     B   C
2   Paul     B    B+  C+
'''
 
 
#JSON 파일#
#JSON 파일은 데이터 공유를 목적으로 만든 파일 형식, 딕셔너리와 비슷하게
#key, value 구조를 갖는다#
 
file_path = "C:/Users/ZenBook/Desktop/part2/read_json_sample.json" ## JSON파일 경로를 지정
 
''' json파일 내용
"name":{"pandas":"",
            "NumPy":"",
            "matplotlib":""},
            
    "year":{"pandas":2008,
            "NumPy":2006,
            "matplotlib":2003},
            
    "developer":{"pandas":"Wes Mckinneye",
                "NumPy":"Travis Oliphant",
                "matplotlib":"John D. Hunter"},
                
    "opensource":{"pandas":"True",
                  "NumPy":"True",
                  "matplotlib":"True"}
'''
df = pd.read_json(file_path)
print(df)
''' 변환 후 
name            year        developer    opensource
pandas           2008    Wes Mckinneye       True
NumPy            2006  Travis Oliphant       True
matplotlib       2003   John D. Hunter       True
'''
cs

모든 소스는 http://www.infopub.co.kr/index.asp 자료실 파이썬 머신러닝 판다스 데이터 분석 본문 소스 코드(4쇄) 에서 다운받았습니다.

 

정보문화사

IT도서의 표준,정보문화사가 쉽고,가깝게 IT세상으로 여러분을 안내해드리겠습니다

www.infopub.co.kr

 

반응형