[ python ] Pandas 라이브러리 불러오기 사용하기 > python

본문 바로가기
사이트 내 전체검색

python

[ python ] Pandas 라이브러리 불러오기 사용하기

페이지 정보

작성자 웹지기 댓글 0건 조회 5,264회 작성일 21-03-05 16:09

본문

 

#Pandas 라이브러리 불러오기, 사용하기

import pandas as pd


#serise 사용

population=pd.Series([9904312,3448737,289045,2466052])

population

0    9904312

1    3448737

2     289045

3    2466052

dtype: int64


population = pd.Series([9904312,3448737,289045,2466052],

                      index=['서울','부산','인천','대구'])

population

서울    9904312

부산    3448737

인천     289045

대구    2466052

dtype: int64


#series에서 실제 데이터 값만 추출하기 -> .values

population.values

array([9904312, 3448737,  289045, 2466052], dtype=int64)


#Series에서 index 내용만 추출하기 -> .index

population.index

Index(['서울', '부산', '인천', '대구'], dtype='object')


population.dtype

dtype('int64')


#Series에서 이름 지정하기

#전체적인 Series에 이름 지정 -> .name

#index에 대하여 이름 지정-> .index.name

population.name="지역별 인구수"

population.index.name="도시"

population

도시

서울    9904312

부산    3448737

인천     289045

대구    2466052

Name: 지역별 인구수, dtype: int64


#Series 의 연산

population*10

도시

서울    99043120

부산    34487370

인천     2890450

대구    24660520

Name: 지역별 인구수, dtype: int64


#Series 인덱싱 구하기

print(population[1])

print(population['부산'])

3448737

3448737


#[서울 대구 부산]

print(population[[0,3,1]])

print(population[['서울','대구','부산']])

도시

서울    9904312

대구    2466052

부산    3448737

Name: 지역별 인구수, dtype: int64

도시

서울    9904312

대구    2466052

부산    3448737

Name: 지역별 인구수, dtype: int64


population>=2500000

도시

서울     True

부산     True

인천    False

대구    False

Name: 지역별 인구수, dtype: bool


population[population>=2500000]

도시

서울    9904312

부산    3448737

Name: 지역별 인구수, dtype: int64


population[(population>=2500000) & (population<=5000000)]

도시

부산    3448737

Name: 지역별 인구수, dtype: int64


population

도시

서울    9904312

부산    3448737

인천     289045

대구    2466052

Name: 지역별 인구수, dtype: int64


#시작점부터 끝점의 -1만큰 가져온다.

population[1:3]

도시

부산    3448737

인천     289045

Name: 지역별 인구수, dtype: int64


#명칭으로 입력시 해당이름을 포함해서 가져온다.

population['서울':'인천']

도시

서울    9904312

부산    3448737

인천     289045

Name: 지역별 인구수, dtype: int64


#Series를 생성할 수 있는 2번째 방법

data = {'서울':9631482, '부산':3393191, '인천':2632035, '대전':1490158}

data

{'서울': 9631482, '부산': 3393191, '인천': 2632035, '대전': 1490158}


population2=pd.Series(data)

population2

서울    9631482

부산    3393191

인천    2632035

대전    1490158

dtype: int64


population3=pd.Series({'서울':9631482, '부산':3393191, '인천':2632035, '대전':1490158})

population3

서울    9631482

부산    3393191

인천    2632035

대전    1490158

dtype: int64


#isnull() -> null값을 찾아 True로 표현

ds.isnull()


#Series 데이터 갱신, 추가 삭제

population['부산']=2500000

population

도시

서울    9904312

부산    2500000

인천     289045

대구    2466052

Name: 지역별 인구수, dtype: int64


#Series 데이터 추가

population['대전'] = 1700000

population

도시

서울    9904312

부산    2500000

인천     289045

대구    2466052

대전    1700000

Name: 지역별 인구수, dtype: int64


del population['인천']

population

도시

서울    9904312

부산    2500000

대구    2466052

대전    1700000

Name: 지역별 인구수, dtype: int64


#1) How to create a DataFrame

data = {"2015":[9904312,3448737,2890451,2466058],

       "2010":[9631482,3393191,2632035,2431774]}

df=pd.DataFrame(data)

df


1.PNG


#Index a DataFrame

df.index=['서울','부산','인천','대구']

df

2.PNG

 

#2) How to create a DataFrame

data2 = [[9904312,3448737,2890451,2466058],

       [9631482,3393191,2632035,2431774]]

ind=['2015','2010']

col=['서울','부산','인천','대구']


#pd.DataFrame( data, index=Index name, columns = column name)

df2=pd.DataFrame(data2, index=ind, columns=col)

df2

3.PNG

 

#Location the data

df2.T

4.PNG


#Location the data

df2.T

5.PNG

 

 #Location the Save data

df3=df2.T

df3

6.PNG


#DataFrame -> values, index, columns

print(df.values)

print(df.index)

print(df.columns)

[[9904312 9631482]
 [3448737 3393191]
 [2890451 2632035]
 [2466058 2431774]]
Index(['서울', '부산', '인천', '대구'], dtype='object')
Index(['2015', '2010'], dtype='object')
 

#DataFrame Indxing

df[['2015']]

7.PNG


#2010을 먼저 보여주고 2015를 뒤에 보여주기 위해서 index값을 차례로 적어준다

df[['2010','2015']]

8.PNG


#DataFrame 값 추가하기

#2005년 컬럼명으로 인구수 대입

df['2005']=[9762546,3512547,2517680,2456016]

df

9.PNG


#서울 부산 인덱싱

df['서울':'부산']

10.PNG


#0~1 인덱싱

df[0:2]

10.PNG


#loc[], iloc[]

#loc[] - 실제 인덱스를 사용하여 행을 가지고 올 때 사용하는 ->df.loc[행,열]

#loc['서울'] 등의 형태로 조회

#iloc[] - numpy의 array 인덱싱 -> df.iloc[]

#iloc[0,1] 등의 형태로 조회


df.loc['서울':'부산', '2015':'2010']

11.PNG


df.iloc[[2],[0]]

12.PNG


df.loc[['서울','인천']]

14.PNG


df.loc[['서울','인천'],['2015']]

13.PNG


df.loc[['서울', '인천'], ['2010','2005']]

15.PNG


df.iloc[[0,2],[0,1]]

16.PNG

 

추천0 비추천0

댓글목록

등록된 댓글이 없습니다.

Total 19건 1 페이지
+2
  • 19 [ python ] pandas read & count & value_counts()
  • pandas read &amp; count import pandas as pd population_number=pd.read_csv("population_number.csv", index_col="도시", encoding="euc-kr") population_number #각 컬럼별 데이터 개수 세기 population_number.count() 지역 4 2015 4 2010 3 2005 2 200...
  • 웹지기 03-08 6438 0 0 댓글 0
+16
  • 열람중 [ python ] Pandas 라이브러리 불러오기 사용하기
  • #Pandas 라이브러리 불러오기, 사용하기 import pandas as pd #serise 사용 population=pd.Series([9904312,3448737,289045,2466052]) population 0 9904312 1 3448737 2 289045 3 2466052 dtype: int64 population = pd.Series([9904312,3448737,289045,2466052], index=['서울','부산',...
  • 웹지기 03-05 5265 0 0 댓글 0
  • 17 [ python ] 영화 데이터 불러와서 확인하기
  • 영화 데이터 불러와서 확인하기 @@데이터 불러오기 최종목표 : 각 영화의 평균 평점이 4이상을 구하는 것. # Readme # user_id 사용자 아이디 # item_id 영화 아이디 # rating 영화 평점 # timestamp 평점 입력 시간 movieData = np.loadtxt('data/ratings.dat', delimiter='::', dtype=np.int64) movieData array([[ 1, 11...
  • 웹지기 03-05 5196 0 0 댓글 0
  • 16 [ python ] 배열과 여러 함수들
  • 배열과 여러 함수들 #배열 가져오기 #배열명[행, 열] import numpy as np arr=np.arange(1,51).reshape(5,10) array([[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10], [11, 12, 13, 14, 15, 16, 17, 18, 19, 20], [21, 22, 23, 24, 25, 26, 27, 28, 29, 30], [31, 32, 33, 34, 35, 36, 37, 38, 39, 40], [41, 42,...
  • 웹지기 03-05 4727 0 0 댓글 0
  • 15 [ python ] BMI 지수 구하기
  • BMI 지수 구하기 일단 파일을 파이썬의 폴더로 업로드 시킨 후 사용가능 data = np.loadtxt("height_weight.txt", delimiter=",") data array([[175.2 ~~~~~~], [65.6 ~~~~~]]) #키를 저장 ( 키 / 100 또는 키 * 0.01 ) ki = data[0]/100 ki #몸무게를 저장 mom = data[1] mom #BMI지수 저장 bmi = mom...
  • 웹지기 03-05 7913 0 0 댓글 0
  • 14 [ python ] 파일을 모듈로 저장하기
  • 파일을 모듈로 저장하기 #함수 선언 -&gt; 두개의정수를 더해주는 함수 def add(num1, num2) : return num1+num2 File &gt; Download AS &gt; Python(.py) 클릭 저장위치는 현재 사용하는 폴더를 선택하면됨 #모듈 사용하기(불러오기) import module_test module_test.add(10,20) from module_test import add add(10,20)
  • 웹지기 03-05 5618 0 0 댓글 0
  • 13 [ python ] 반복문 , for, while
  • 반복문 , for, while #반복문 while i = 0 while i&lt;10: i+=1 print('나무를 {}번 찍었습니다.'.format(i)) if i==10 : print("나무가 넘어갑니다.") 나무를 1번 찍었습니다. 나무를 2번 찍었습니다. 나무를 3번 찍었습니다. 나무를 4번 찍었습니다. 나무를 5번 찍었습니다. 나무를 6번 ...
  • 웹지기 03-03 2216 0 0 댓글 0
+1
  • 12 [ python ] 단축키, Command mode , Edit mode
  • Command mode Enter : edit mode 로 전환 a : 위에 셀(Cell)추가 b: 아래에 셀(Cell)추가 m: Markdown으로 전환 y: Code로 전환 dd: 셀(Cell) 삭제 Edit mode Esc : Command Mode로 전환 Ctrl + z : 되돌리기 Ctrl + y : 앞으로 되돌리기 공통 단축키 - Ctrl + Enter : 실행 - Shift + Enter : 실행 후 아래로 커서 이동 - Alt + E...
  • 웹지기 03-03 2813 0 0 댓글 0
  • 11 [ python ] 파이썬 정의 및 간단 설명
  • 파이썬은 인터프리터 언어이다..(대화형언어) 배우기 쉽다. 다양한 라이브러리 툴. 인간다운 언어(직관적) 문법이 쉬워 배우기 쉽고 코드가 간결하다. 파이썬패키지 - 에디터(주피터 에디터) - ANACONDA anaconda.com &gt; download &gt; install 설치가 되면 anaconda 설치 &gt; jupyter 실행 실행은 우측상단 new &gt; python3 클릭 아래 화면에서 왼쪽이 녹색과 파란색 파란색은 실행완...
  • 웹지기 03-03 2390 0 0 댓글 0
  • 10 [ python ] 타이타닉 승객의 사망 분석 (Titanic 탑승객 중 생존/사망자 예측) - 엑셀활용
  • 타이타닉 승객의 사망 분석 - 엑셀활용 Titanic 탑승객 중 생존/사망자 예측) 과연, 어떤 사람이 생존하고 어떤사람이 사망했을까? EXCEL - 데이터 분석 kaggle.com 회원가입 후 검색창에 titanic Titanic - Machine Learning From Disaster &gt; enter Data click &gt; 화면아래로 내려서 Download All 정상 다운로드가 되면 다운로드 받고 &gt; 다운로드가 안되고 다른화면이...
  • 웹지기 03-03 2299 0 0 댓글 0
  • 9 [ python ] python을 활용한 데이터 분석 / 예측
  • python을 활용한 데이터 분석 / 예측 1) 빅데이터 - 1~2012 까지의 데이터 0.1% - 2013~현재 까지의 데이터 99.9% (스마트폰, 사물인터넷등의 의한 데이터) 2) 활용사례 - 기저귀와 맥주? (편의점 체인점에서 쇼핑 행태를 분석하여 발견) - 구글 독감 유행 징후 감지 (사람들의 검색어 분석 독감의 증상, 치료법, 가까운 병원등) - 금융권 빅데이터 - 자동차회사 IoT #빅데이터 #인공지능 #사물인터넷 #수요증가 #산업채용 3)...
  • 웹지기 03-03 2687 0 0 댓글 0
  • 8 [ python ] Numpy 라이브러리 활용 - 데이터 불러와서 확인하기 1
  • 데이터 불러와서 확인하기numpy_학습자료.zip 파일을 압축을 풀어서 jupyter 노트에서 새폴더 &gt; 폴더명:data &gt; 압축푼파일에서 height_weight.txt ratings.dat 두개의 파을을 업로드 다시 data 폴더에서 나가서 인재캠퍼스_Numpy 학습자료.ipynb 에 업로드 # ✨ Numpy란? numpy는 과학 계산을 위한 라이브러리로서 다차원 배열을 처리하는데 필요한 여러 유용한 기능을 제공 - 빠르고 효율적인 벡터 산술...
  • 웹지기 02-25 3980 0 0 댓글 0
  • 7 [ python ] 함수의 정의와 사용 방법
  • 함수의 정의와 사용 방법 함수란(function) - 하나의 특별한 목적의 작업을 수행하기 위해 독립적으로 설계된 코드의 집합 - 함수 사용 목적 = 반폭을 피함 = 모듈화로 가독성 높임 = 문제발생시 기능변경 필요시 손쉽게 유지보수 - 구조 (defined: 정의) def 함수명(매개변수) : 실행문장 return 반환변수 #함수 만들어 보기 def numberSum(num1, num2) : result =...
  • 웹지기 02-24 2673 0 0 댓글 0
  • 6 [ python ] 리스트와 튜플
  • 리스트와 튜플 리스트(list)란? - 파이썬의 자료구조 형태중 하나 - 순서가 있는 수정이 가능한 객체의 집합 - 대괄호( [ ] ) 로 작성, 내부는 ,로 구분 - 추가,수정,삭제 가능 리스트는 + 연산이 가능하다 list4 = [1,2,3] list5 = [3,4,5,6] print(list4+list5) print(list5+list4) list4 = [1,2,3] list5 = [3,4,5,6] print(l...
  • 웹지기 02-24 3107 0 0 댓글 0
게시물 검색

회원로그인

접속자집계

오늘
7,865
어제
5,698
최대
61,067
전체
11,203,456

그누보드5
Copyright © funyphp.com. All rights reserved.