Data Science : Project/개인 프로젝트 썸네일형 리스트형 캐글 샌프란시스코 범죄발생률 예측 : train & test ▶이전글 : EDA 캐글 샌프란시스코 범죄발생률 예측 : EDA 파이썬으로 진행하였고, 데이터 분석 강의 4주차를 마무리하고 캐글에 최종적으로 제출한 버전을 기반으로 코드를 설명했다. (중간 과정이 궁금하다면 github를 참고! github.com/helloMinji/Kaggle_crime_Sa hellominji.tistory.com 데이터 전처리 여기서는 train에 대해서만 기재하지만, test에도 같은 과정을 거쳤다. 1 Dates train["Dates-year"] = train["Dates"].dt.year train["Dates-month"] = train["Dates"].dt.month train["Dates-day"] = train["Dates"].dt.day train["Dates-h.. 더보기 캐글 샌프란시스코 범죄발생률 예측 : EDA 이 예측의 목적은, feature와 같은 정보가 있을 때 어떤 종류의 범죄가 발생할 확률이 얼마인지 예측하는 것이다. 파이썬으로 진행하였고, 데이터 분석 강의 4주차를 마무리하고 캐글에 최종적으로 제출한 버전을 기반으로 코드를 설명했다. (중간 과정이 궁금하다면 github를 참고! github.com/helloMinji/Kaggle_crime_SanFrancisco ) helloMinji/Kaggle_crime_SanFrancisco [Kaggle] 샌프란시스코에서 발생한 범죄 종류 예측. Contribute to helloMinji/Kaggle_crime_SanFrancisco development by creating an account on GitHub. github.com 데이터 설명 Dates.. 더보기 캐글 타이타닉 생존자 예측 캐글 연습은 타이타닉으로 시작! 타이타닉은 데이터분석 수업을 들으면서 많이 접한 데이터이긴 한데, 나 혼자서 처음부터 끝까지 제대로 해 본적은 없었다. 그리고 결측치 처리에서 단순히 평균으로 대체하는 것으로 배우고 지나갔는데, 좀 더 꼼꼼하게 처리하면 분석 결과가 더 좋아지지 않을까 생각해서 결측치 처리 방식을 고민하고 시도해보고 싶었다. R과 파이썬 모두 진행했고, 그 중 submission 결과가 더 좋은 R코드를 기반으로 설명했다. 진행하면서 생기는 이슈에 대해서는 R과 파이썬 모두 설명했다. 생각보다 기초적인 이슈가 많이 발생하네. 데이터 설명 survival: 생존 여부. 0은 사망, 1은 생존. pclass: 좌석 등급. 1등급이 제일 높다. sex: 성별. age: 나이. sibsp: 타이타.. 더보기 이전 1 다음