Series & DataFrame
1. pandas 패키지 로드
별칭은 주로 pd로 사용한다
<module 'pandas' from 'D:\\Anaconda\\lib\\site-packages\\pandas\\__init__.py'>
2. pandas의 Series 와 DataFrame
1차원, 1개의 column은 Series라고 한다
2-1. Series
Series 생성:
-
pd.Series(“list”)
-
pd.Series(“list_name”)
(1) pd.Series(“list”)
0 1
1 2
2 3
3 4
dtype: int64
(2) pd.Series(“list_name”)
0 1
1 2
2 3
3 4
dtype: int64
0 1
1 2
2 3
3 4
dtype: int64
2-2. DataFrame
방법 1. list로 만들기
1 2 3
| company1 = [['삼성', 2000, '스마트폰'], ['현대', 1000, '자동차'], ['네이버', 500, '포털']]
|
|
0 |
1 |
2 |
0 |
삼성 |
2000 |
스마트폰 |
1 |
현대 |
1000 |
자동차 |
2 |
네이버 |
500 |
포털 |
<활용을 하기 위해 DataFrame을 변수에 지정하기>
1
| df1 = pd.DataFrame(company1)
|
|
0 |
1 |
2 |
0 |
삼성 |
2000 |
스마트폰 |
1 |
현대 |
1000 |
자동차 |
2 |
네이버 |
500 |
포털 |
<제목컬럼 만들기> – “dfname.column = [ ]”
1
| df1.columns = ['기업명', '매출액', '업종']
|
|
기업명 |
매출액 |
업종 |
0 |
삼성 |
2000 |
스마트폰 |
1 |
현대 |
1000 |
자동차 |
2 |
네이버 |
500 |
포털 |
- 주의: column명의 개수는 반드시 DataFrame의 column수와 동일해야 함
방법 2. dict로 만들기
1 2 3 4
| company2 = {'기업명': ['삼성', '현대', '네이버'], '매출액': [2000, 1000, 500], '업종': ['스므트폰', '자동차', '포털'] }
|
1
| df2 = pd.DataFrame(company2)
|
|
기업명 |
매출액 |
업종 |
0 |
삼성 |
2000 |
스므트폰 |
1 |
현대 |
1000 |
자동차 |
2 |
네이버 |
500 |
포털 |
2-3. index를 특정column으로 지정하기
“dfname.index = [ ]” 명령을 사용한다
|
기업명 |
매출액 |
업종 |
0 |
삼성 |
2000 |
스마트폰 |
1 |
현대 |
1000 |
자동차 |
2 |
네이버 |
500 |
포털 |
|
기업명 |
매출액 |
업종 |
기업명 |
|
|
|
삼성 |
삼성 |
2000 |
스마트폰 |
현대 |
현대 |
1000 |
자동차 |
네이버 |
네이버 |
500 |
포털 |
2-4. column = Series
기업명
삼성 2000
현대 1000
네이버 500
Name: 매출액, dtype: int64
pandas.core.series.Series