모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!!
📝 목차
1. 데이터 불러오기
2. KOSPI 데이터 확인
🏆 1. 데이터 불러오기
📈 데이터는 데이콘에서 배포한 코드를 바탕으로 2022-09-13 까지의 코스피 지수를 추출하였습니다.
📈 데이터 설명
- Close : 종가
- Open : 시가
- High : 고가
- Low : 저가
- Volume : 거래량
- Change : 등락률(전일대비 등락률) -> 등락률 = (현재 종가 - 전일 종가) / 전일종가
📈 데이터 확인
# 코드 진행 중 불필요하게 출력되는 warning 무시 코드
import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import numpy as np
# 시계열 처리를 위한 datetime 임포트
from datetime import datetime
# 시각화를 위한 seaborn, matplotlib 라이브러리 임포트
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
# 시각화를 위한 plotly library 임포트
import plotly.graph_objects as go
import plotly.offline as pyo
pd.options.plotting.backend = 'plotly'
import plotly.io as pio
pio.renderers.default = "notebook_connected"
kospi = pd.read_csv('kospi_data.csv')
kospi
🏆 KOSPI 데이터 확인
2.- 결측치 존재여부 확인
- Outlier 존재여부 확인
- 중복 날짜 존재여부 확인
2.1. 결측치 존재여부 확인
kospi.isnull().sum()
>> Out[26]
Date 0
Close 0
Open 0
High 0
Low 0
Volume 0
Change 0
dtype: int64
📈 결측치는 존재하지 않음을 확인하였습니다.
2.2. Outlier 존재여부 확인
# boxplot을 사용한 outlier 검증
fig = go.Figure()
fig.add_trace(go.Box(x = kospi['Close'], name = 'Close'))
fig.add_trace(go.Box(x = kospi['Open'], name = 'Open'))
fig.add_trace(go.Box(x = kospi['High'], name = 'High'))
fig.add_trace(go.Box(x = kospi['Low'], name = 'Low'))
fig.show()
# Change attribute 확인 - 이상없음
fig = go.Figure()
fig.add_trace(go.Box(x = kospi['Change'], name = 'Change'))
fig.show()
# Volume attribute 확인 - max 값 의심스러움
fig = go.Figure()
fig.add_trace(go.Box(x = kospi['Volume'], name = 'Volume'))
fig.show()
📈 Outlier 확인 중에 Volume attribute에 대해서 max값이 지나치게 크다는 생각이 들어 확인해 보았습니다. 네이버금융에서 확인한 결과 이상없는 데이터로 나왔으며, 인접한 날들과 비교하여 유일하게 상승세를 보인 장이었기 때문에 이와 같이 높은 거래량을 보인 것이 아닐까 생각합니다.
kospi[kospi['Volume']==kospi['Volume'].max()]
>> Out[30]
Date Close Open High Low Volume Change
------------------------------------------------------------------------
10644 2021-02-19 3107.62 3089.96 3109.67 3040.28 3.460000e+09 0.0068
📈 데이터 확인 결과 결측치나 이상치 등의 문제는 존재하지 않았습니다. 따라서 본 데이터에서 별도의 전처리 없이 분석하기로 결정하였습니다.
🏆 다음 포스팅에서는 이동평균선을 사용하여 KOSPI를 분석할 것입니다!!
'🐍 파이썬 데이터 분석 프로젝트 > 📈 KOSPI 시각화 분석' 카테고리의 다른 글
📈 데이콘 KOSPI 주가 분석 04. FbProphet 예측 (0) | 2023.01.15 |
---|---|
📈 데이콘 KOSPI 주가 분석 03. 이동평균선 시각화 (0) | 2023.01.15 |
📈 데이콘 KOSPI 주가 분석 01. readme (0) | 2023.01.14 |