Pandas

[Pandas]인덱스 활용

김천종 2022. 11. 2. 15:57
반응형
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
import pandas as pd
 
###인덱스 활용####
 
#특정 열을 행 인덱스로 설정하기#
#set_index() 메소드 사용#
data = {'이름':['이태규''한건희''안재민'], '수학':[10020050], "토익":[500400600]}
df = pd.DataFrame(data)
print(df)
'''
 이름   수학   토익
0  이태규  100  500
1  한건희  200  400
2  안재민   50  600
'''
df1 = df.set_index(['이름'])
print(df1)
'''
     수학   토익
이름
이태규  100  500
한건희  200  400
안재민   50  600
'''
 
 
#행 인덱스 재배열#
#reindex() 메소드 사용#
new_index = [012'행3''행4'
df2 = df.reindex(new_index) ## fill_value=? 로 값을 지정해주지 않으면 NaN이 저장됨.
print(df2)
'''
     이름     수학     토익
0   이태규  100.0  500.0
1   한건희  200.0  400.0
2   안재민   50.0  600.0
행3  NaN    NaN    NaN
행4  NaN    NaN    NaN
'''
 
 
#행 인덱스 초기화#
#reset_index() 메소드 사용, 행 인덱스를 정수형 위치 인덱스로 초기화 시킨다#
df = pd.DataFrame(data, index=['행0''행1''행2'])
ndf = df.reset_index() ## 기존의 인덱스는 열로 이동함.
print(ndf)
'''
index   이름   수학   토익
0    행0  이태규  100  500
1    행1  한건희  200  400
2    행2  안재민   50  600
'''
 
 
#행 인덱스를 기준으로 데이터프레임 정렬#
#sort_index() 메소드 사용#
ndf1 = ndf.sort_index(ascending=False##ascending=True 일 경우 오름차순 정렬
print(ndf1)
'''
 index   이름   수학   토익
2    행2  안재민   50  600
1    행1  한건희  200  400
0    행0  이태규  100  500
'''
 
 
#특정 열의 데이터 값을 기준으로 정렬#
#sort_values() 메소드 사용#
ndf2 = ndf.sort_values(by='수학', ascending=False)
print(ndf2)
'''
  index   이름   수학   토익  
1    행1  한건희  200  400     수학 열의 데이터 값을 기준으로
0    행0  이태규  100  500     내림차순 정렬되었다.
2    행2  안재민   50  600
'''
 
cs
반응형