🎰 통계학 실습 - python 6

🎲 상관분석 / 신뢰도 분석

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 상관분석 (correlation analysis) 데이터 분석 시 주요 관심 대상 중의 하나는 변수들간의 상호연관성을 분석하는 것. 이때, 상관분석은 변수들 간의 선형적인 상호 연관성을 알아보는 분석 기법임. 하지만 상관관계가 인과관계를 의미하지는 않음. 산점도를 통해서 두 변수 간의 상호연관성과 그 강도를 확인할 수 있음. ☑️ 산점도 01. plt.plot( ), plt.scatter( ) import pandas as pd import matplotlib.pyplot as plt Student = pd.read_csv("D://data//Student.csv") plt.plot('Incom..

🎲 가설검정 - 두 모집단에 대한 검정

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 두 모집단에 대한 비교 실제 현실에 적용되는 경우는 대부분 두개 이상의 모집단의 특성을 비교함 • 두 모집단에 대한 비교의 예 - 새로운 약품을 개발하였을때 새로운 약품의 효능을 임상실험을 통하여 검증 - 새로운 약품을 사용한 환자와 사용하지 않은 환자간의 데이터를 비교하여 새로운 약품의 효능 비교 - 휴대폰의 사용시간이 성별(남, 여)에 따라 차이가 있는가를 검토하여 새로운 마케팅 제안 - 사회현상에 대한 남녀별 인식정도의 차이 - 흡연 집단과 비흡연 집단 간의 폐암 발생률의 차이 - 두 회사 제품에 대한 소비자들의 선호도 차이 주로 두 모집단의 모평균, 모비율, 모분산의 차이에 대한 가설검정..

🎲 가설검정 - 단일모집단에 대한 검정

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! . 🎲 01. 모평균에 대한 검정 • 모분산을 안다는 가정 하에, 표본평균은 Z 분포를 따름. • 모분산을 모른다는 가정 하에서는, 표본평균은 T(n-1) 분포를 따름 : ttest_1samp( ) 함수 ☑️ Csi 데이터에서 ‘서비스 만족도의 모평균이 70이 아니다’ 라는 가설검정 - 양측검정 # ttest_1samp(a, popmean, alternative='two-sided’) from scipy.stats import ttest_1samp print(ttest_1samp(csi.Index, popmean=70)) ## T 분포 검정통계량, p-value 출력 ## 검정 결과 귀무가설 기각 ..

🎲 신뢰구간

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 01. 모평균에 대한 신뢰구간 ☑️ 데이터 분포 확인 : seaborn.distplot( ) # 히스토그램 및 kde plot 출력 import pandas as pd csi = pd.read_csv('D://data//Csi.csv') import seaborn as sns import matplotlib.pyplot as plt sns.distplot(csi.Index) plt.show() ☑️ 모평균에 대한 신뢰구간 계산 : DescrStatsW( ) # DescrStatsW() : 변수에 대한 기술통계량, 검정통계량, 모평균에 대한 신뢰구간 저장 리스트 생상 # tconfint_mean(..

🎲 확률분포

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 00. 베르누이 시행 - 정의 : 성공과 실패의 결과만을 가지는 시행이 반복되면서, 각 시행의 결과가 다른 시행의 결과에 영향을 주지 않는 경우 - 확률 : 성공 p, 실패 q = (1-p) - 예시 : 동전 던지기(앞/뒤), 복원추출 🎲 01. 이산형확률분포 • 이산형확률분포 01. 이항분포 - 정의 : 성공 확률이 p인 베르누이 시행을 n번 반복하는 경우 성공 횟수를 X라 할 때, 이 확률변수 X의 확률분포 $X$ ~ $B(n, p)$ ☑️ 이항분포의 확률질량함수 # X ~ B(n, p) # 이항분포의 확률질량함수 # X ~ B(6, 0.5) 를 따른다고 할 때 # binom.pmf(k, n..

🎲 데이터의 표현 및 요약

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 01. 통계학 종류 • 기술통계학(Descriptive Statistics) : 자료를 그래프나 표 또는 몇 개의 숫자로 요약하여, 전반적인 내용을 빠르게 파악하는 기법 • 추측통계학(Inferential Statistics) : 관심의 대상이 되는 모집단에서 일부(표본)를 추출하고, 표본으로부터 관측된 내용(통계량)을 근거로 하여 모집단의 특성(모수)을 추측하고 검정하는 방법 🎲 02. 표본추출(Sampling) • 모집단(Population) : 정보를 원하는 전체 대상 • 표본(Sample) : 관측하는 모집단의 일부 • 표집단위(Unit; 개체) : 조사의 기본 단위(예: 응답자, 가구,..