시각화 9

🕑시계열데이터 분석 08 - 시계열 회귀분석

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🕑 시계열 회귀분석 서로 다른 개체 간 오차항들은 서로 자기상관이 없다는 가정의 영향을 고려해줘야 합니다. 특히 시계열 데이터의 특성 상, 각 개체 간 자기상관이 없을 수 없기 때문에 꼭 이에 대한 처리를 해주어야 합니다. 대표적으로, 차분을 진행해서 자기상관을 줄이는 방법이 있겠습니다. 🕑 선형회귀 : lm(Y ~ X1 + X2 + X3, data = DATA) 🕑 먼저, 일반 데이터프레임에 대해 회귀분석을 진행하겠습니다. ## 데이터프레임 head(df1) ## year consumption income wealth interest lnconsump lndpi lnwealth ## 1 1947 ..

🕑시계열데이터 분석 07 - 평활기법

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🕑 평활기법 (Smoothing) 평활기법은 대부분 prediction 혹은 projection을 위한 방법입니다. 만약 계절성이 있는 데이터라면, 반드시 계절성을 제거한 다음 진행해야합니다. 🕑 1. 선형평활 - naive : naive(TS_DATA) 가장 최근 값을 사용해서 예측하는 방법입니다. setwd("C:\\Users\\yamingu\\Desktop\\고급비즈니스어낼리틱스") oil.df=read.csv("[Ch1.시계열자료준비시계열분해]_files\\BOK_energy_oil.csv") oil.ts=ts(oil.df$oil, start=c(1994,1), frequency=12) ##..

🕑시계열데이터 분석 06 - 시계열 데이터 분해

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🕑 시계열 분해 시계열 분석 모형의 선택은 Y 변수와 그와 관련있는 다른 변수의 유무에 의해 정해집니다. 🕑 시계열자료의 구성 및 요인 추세요인(trend factor) : 장기변동 / 기술의 변화, 인플레이션 / 전반적인 움직임 순환요인(cycle factor) : 중기변동 / 경기순환주기 / 몇년 단위 반복 움직임 / 파악 어려움 / 계절성 잡은 후 잡기 가능 계절요인(seasonal factor) : 1년 주기로 발생하는 단기변동 불규칙요인(irregular factor) : 측정 및 예측이 어려운 오차변동 / 시계열을 위 세 가지 요인으로 설명하고 남은 변동 • 보통, 주어진 시계열을 추세(..

🕑시계열데이터 분석 05 - aggregate( ) 함수

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🕑 aggregate( ) 월별 / 분기별 / 년도별 데이터가 있다면, 큰 주기에 맞춰서 각 데이터의 주기를 맞춰줘야 합니다. 큰 주기의 데이터를 작은 주기로 넣으려면 없는 데이터를 만들어서 넣어야 하기에 가정과 추가적인 모델링이 필요한 경우가 있습니다. 하지만 이 경우, 데이터의 크기가 작아져 몇 가지 문제가 생길 수 있습니다. 어쨌든, 각 데이터의 주기를 맞춰주어야 시계열 분석에 용이하고, 여러 데이터를 하나의 시간 축에 대해서 분석하는 것이 가능해지기 때문에, R에서는 이러한 기능을 수행하는 함수를 제공합니다. 원래 주기가 12짜리 월별 데이터인 AirPassengers 에 aggregate ..

🕑 시계열 데이터 분석 04 - 시계열 데이터 plot

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🕑 데이터 선언 unemploy.df=read.csv("BOK_unemployment_rate.csv") oil.df=read.csv("BOK_energy_oil.csv") exchange.df=read.csv("BOK_exchange_rate_krw_usd.csv") unemploy.ts=ts(unemploy.df$unemployment_rate, start=2000, frequency=1) oil.ts=ts(oil.df$oil, start=c(1994,1), frequency=12) exchange.ts=ts(exchange.df$exchange_rate_krw_usd, start=c(1980,..

🕑시계열데이터 분석 03 - quantmod 패키지

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🕑 quantmod 패키지 🕑 getSymbols( ) 함수 : 파이낸스 데이터 불러오기 quantmod 패키지의 getSymbols( ) 함수를 통해 야후 파이낸스 데이터를 ts data 형태로 불러올 수 있습니다. 주말도 알아서 제외해줍니다. 🕑 getSymbols("META", src = "yahoo", from = as.Date("2015-08-01"), to = as.Date("2016-08-31")) ## quantmod ## 페이스북 데이터 불러옴 ## FB에서 META로 이름이 바뀌었으므로 META로 키값 지정 install.packages("quantmod") library(quan..

😎 2주차 분석 피드백

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! ☁️ 과제로 제출한 차트들에 대해 멘토님께서 피드백을 남겨주셨습니다. ☁️ 전체 피드백을 한번 살펴보고, 적용할 차트들은 수정해보도록 하겠습니다!! 🚫 피드백 1 실무에서의 몇 가지 팁만 간단하게 전달드려보겠습니다 :) 1번 시트에서 전체적인 트렌드를 보여주신 것 좋습니다! 이 시트와 함께 마케터를 위한 성과 모니터링 대시보드를 만든다면, 주 단위로 집계해서 명확하게 비교가 가능한 지표(숫자)가 나오는 것이 좋을 것 같습니다. 퍼포먼스 마케팅에서는 전 주 대비 이번주 숫자가 어떤지를 주 별로 모니터링 하는 경우가 많아서, 주 별 집계와 전 주 대비 증감율까지 보여주는 게 지표의 증감을 보고 다음 액..

😎 02. 인플루언서 홍보 실적 현황 분석

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 😎 2023년 3월 인플루언서 실적 현황 파악하기 (📆 2023.03.06 ~ 2023.03.09) ▪ 비즈니스 시나리오 : 전 직원이 개발한 자사의 제품을 홍보하기 위해 여러 인플루언서들과 계약을 진행하였습니다. 3월 한달 동안 광고협찬 컨텐츠를 찍어내고, 우수한 성과를 낸 인플루언서들에 한해 4월달에도 계약을 유지하려고 합니다. 이에 인플루언서들의 데이터를 바탕으로 실적을 파악하고자 합니다. 😎 1. 인플루언서 및 일 별 평균 컨텐츠 노출 수 & 평균 클릭 수 추세 파악 ​ 차트 활용 방안 : 각 인플루언서와의 재계약을 정하고자 하는 시각화이기 때문에 일별 추세를 알아보는 것과 최근 실적을 알아..

🫀 심혈관질환 데이터 분석 14. 결정트리 시각화

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🩸 저번 글에서는 결정 트리를 통해 Classification을 진행했습니다. correlation 분석으로 얻어진 4개의 attribute set과 PCA dataframe에 대해 예측력을 평가했습니다. 이번 글에서는 앞서 얻은 결정 트리 모델을 시각화해볼 것입니다. 🫀 1. 라이브러리 📌 결정트리를 위한 graphviz 라이브러리 를 사용합니다. 처음 설치할 때 바이너리 코드의 경로를 잘 설정해줘야합니다. 데이터의 크기가 크지 않은 경우에는 만들어진 결정 트리를 살펴보기 어렵지 않지만, 본 프로젝트에 사용한 데이터는 column이 많기에 한번에 파악하기 어렵습니다. 따라서 이렇게 만들어진 결정 ..