python
은 데이터 분석을 하기에 좋은 도구입니다. 사용하기에 쉽고 csv 파일이나 엑셀 파일을 편하게 조작할 수 있으며 웹 크롤링 또한 겨우 몇 줄만 사용하면 할 수 있습니다.
그래서 한번 해보기로 했습니다.
기상청 데이터를 사용해서 여름과 겨울 온도의 연관성에 대해 알아보기로 하였습니다. 한마디로, 여름이 더울수록 겨울은 추울까? 하는 것입니다.
그 해 여름이 유난히 더웠고 겨울은 유난히 추웠습니다.
먼저 데이터를 찾아야 했습니다. 그래서 기상청 홈페이지에 들어가 뒤졌습니다. 그리고 다음과 같은 메뉴를 찾을 수 있었습니다.
원래는 웹 크롤링이 목적이었지만, 아쉽게도 csv 파일을 통해 계산하기로 했습니다.
여름과 겨울의 온도 연관성을 위해 근 20년 동안의 대한민국 전 지역의 일 평균 기온, 일 평균 풍속, 상대 습도를 조회했습니다.
이를 그대로 csv 파일로 옮겼습니다.
단순히 기온을 사용하지 않은 이유는 그래도 나름 뭔가 해보고자 생각한 것이 체감 온도를 구하는 것이었기 때문입니다. 그래서 기온, 풍속, 습도를 모두 가져와 체감온도 값을 계산하도록 하였습니다. 그 결과는 matplotlib 를 통해 출력하도록 하였습니다.
총 99개의 지점에서 온도의 연관성 비율과, 그래프와, 여름의 체감온도 값, 겨울의 체감온도 값을 나타내도록 했습니다.
결과는 52% 가 나왔습니다. 결론은 여름이 덥다고 겨울이 춥다는 것은 아니란 것입니다.
과연 그럴까요?
아쉽게도 이 분석은 여러 오류와 문제들을 가지고 있습니다.
가장 큰 이유는 제가 내린 식에 있습니다. 아무래도 처음 해보는 것이라 정밀한 식을 세우기에는 문제가 있었습니다.
둘쨰로는 데이터에 있습니다. 기상청 데이터는 아쉽게도 정확하지 않았습니다.
그래서 여름이 더우면 그 해 겨울이 추울까요?
무엇이 됬든 이 코드가 그 증거가 되기에는 아쉽게도 힘들어 보입니다.