[ python ] 타이타닉 승객의 사망 분석 (Titanic 탑승객 중 생존/사망자 예측) - 엑셀활용
페이지 정보
작성자 웹지기 댓글 0건 조회 2,299회 작성일 21-03-03 09:22본문
타이타닉 승객의 사망 분석 - 엑셀활용
Titanic 탑승객 중 생존/사망자 예측) 과연, 어떤 사람이 생존하고 어떤사람이 사망했을까?
EXCEL - 데이터 분석
kaggle.com
회원가입 후
검색창에 titanic
Titanic - Machine Learning From Disaster > enter
Data click > 화면아래로 내려서 Download All
정상 다운로드가 되면 다운로드 받고 > 다운로드가 안되고 다른화면이 뜨면 클릭 > 확인을 누르고 다시 Data탭으로 이동 후 다운로드
압축을 풀어서 확인
train.csv => 분석용 파일
test.cvs => 테스트용 파일
gender_submission.csv => 완료 저장 후 kaggle 사이트 재업로드용
아래처럼 피벗차트를 이용해서 사망자등을 분석
train.csv로 분석한 내용을
test.csv의 Pclass 에서 삽입을 해서 한행을 추가해서
Survived라는 필드를 B1에 적고
B2에는 Excel함수를 이용해서 찾아낸다
1) excel 피벗 테이블 필드 및 피벗 차트 만들기
데이터의 아무위치 > 삽입 > 피벗차트 || 피벗차트 & 테이블
우측 피벗차트 필드 > Survived 를 하단 열에 드래그해서 추가
sex를 행에 드래그해서 추가
값에 survived 추가 후 ▼를 클릭해서 값필드 설정에서 개수로 변경
또는 값 에 Sex 추가 > 값필드 클릭해서 값필드 설정 > 개수로 변경
차트는 상단탭의 분석 > 피벗차트 > 차트선택 후 확인
차트에서 숫자가 보이게 하고 싶다면
차트우측 + 버튼 클릭 > 데이터 레이블에 체크
2) excel 함수
if구문이 맞다면 0이실행 아니면 1이 실행
=if(E2="male", 0, 1) //E2의 열이 남자면 0 여자면 1을 입력해라
0이 있던자리에 다시 조건을 추가
=if(E2="male", if(C2=1, 1, 0), 1) // 남자고 클랙스가 1이면 생존
=if(or(E2="female", C2=1)), 1, 0) //or안에 하나라도 true가 있으면 true
분석된 데이터에서 Passenger, Survived 두개 행을 복사해서
gender_submission.csv 에 붙여놓기를 하는데
Passenger 위에서 마우스 우클릭 붙여놓기 옵션에서 숫자123 적어진 옵션선택
붙여 넣기를 하게 되면 함수를 삭제되고 결과값이 복사된다.
댓글목록
등록된 댓글이 없습니다.