Series & DataFrame


1. pandas 패키지 로드

1
import pandas

별칭은 주로 pd로 사용한다

1
import pandas as pd
1
pd
<module 'pandas' from 'D:\\Anaconda\\lib\\site-packages\\pandas\\__init__.py'>


2. pandas의 Series 와 DataFrame

1차원, 1개의 column은 Series라고 한다

2-1. Series

Series 생성:

  • pd.Series(“list”)

  • pd.Series(“list_name”)


(1) pd.Series(“list”)

1
pd.Series([1, 2, 3, 4])
0    1
1    2
2    3
3    4
dtype: int64

(2) pd.Series(“list_name”)

1
a = [1, 2, 3, 4]
1
pd.Series(a)
0    1
1    2
2    3
3    4
dtype: int64

1
mylist = [1, 2, 3, 4]
1
pd.Series(mylist)
0    1
1    2
2    3
3    4
dtype: int64


2-2. DataFrame

방법 1. list로 만들기

1
2
3
company1 = [['삼성', 2000, '스마트폰'],
['현대', 1000, '자동차'],
['네이버', 500, '포털']]
1
pd.DataFrame(company1)
0 1 2
0 삼성 2000 스마트폰
1 현대 1000 자동차
2 네이버 500 포털

<활용을 하기 위해 DataFrame을 변수에 지정하기>

1
df1 = pd.DataFrame(company1)
1
df1
0 1 2
0 삼성 2000 스마트폰
1 현대 1000 자동차
2 네이버 500 포털

<제목컬럼 만들기> – “dfname.column = [ ]”

1
df1.columns = ['기업명', '매출액', '업종']
1
df1
기업명 매출액 업종
0 삼성 2000 스마트폰
1 현대 1000 자동차
2 네이버 500 포털

  • 주의: column명의 개수는 반드시 DataFrame의 column수와 동일해야 함

방법 2. dict로 만들기

1
2
3
4
company2 = {'기업명': ['삼성', '현대', '네이버'],  
'매출액': [2000, 1000, 500],
'업종': ['스므트폰', '자동차', '포털']
}
1
df2 = pd.DataFrame(company2)
1
df2
기업명 매출액 업종
0 삼성 2000 스므트폰
1 현대 1000 자동차
2 네이버 500 포털

2-3. index를 특정column으로 지정하기

“dfname.index = [ ]” 명령을 사용한다

1
df1
기업명 매출액 업종
0 삼성 2000 스마트폰
1 현대 1000 자동차
2 네이버 500 포털

1
df1.index = df1['기업명']
1
df1
기업명 매출액 업종
기업명
삼성 삼성 2000 스마트폰
현대 현대 1000 자동차
네이버 네이버 500 포털

2-4. column = Series

1
df1['매출액']
기업명
삼성     2000
현대     1000
네이버     500
Name: 매출액, dtype: int64

1
type(df1['매출액'])
pandas.core.series.Series