전체 글 105

🎲 상관분석 / 신뢰도 분석

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 상관분석 (correlation analysis) 데이터 분석 시 주요 관심 대상 중의 하나는 변수들간의 상호연관성을 분석하는 것. 이때, 상관분석은 변수들 간의 선형적인 상호 연관성을 알아보는 분석 기법임. 하지만 상관관계가 인과관계를 의미하지는 않음. 산점도를 통해서 두 변수 간의 상호연관성과 그 강도를 확인할 수 있음. ☑️ 산점도 01. plt.plot( ), plt.scatter( ) import pandas as pd import matplotlib.pyplot as plt Student = pd.read_csv("D://data//Student.csv") plt.plot('Incom..

🎲 가설검정 - 두 모집단에 대한 검정

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 두 모집단에 대한 비교 실제 현실에 적용되는 경우는 대부분 두개 이상의 모집단의 특성을 비교함 • 두 모집단에 대한 비교의 예 - 새로운 약품을 개발하였을때 새로운 약품의 효능을 임상실험을 통하여 검증 - 새로운 약품을 사용한 환자와 사용하지 않은 환자간의 데이터를 비교하여 새로운 약품의 효능 비교 - 휴대폰의 사용시간이 성별(남, 여)에 따라 차이가 있는가를 검토하여 새로운 마케팅 제안 - 사회현상에 대한 남녀별 인식정도의 차이 - 흡연 집단과 비흡연 집단 간의 폐암 발생률의 차이 - 두 회사 제품에 대한 소비자들의 선호도 차이 주로 두 모집단의 모평균, 모비율, 모분산의 차이에 대한 가설검정..

🎲 가설검정 - 단일모집단에 대한 검정

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! . 🎲 01. 모평균에 대한 검정 • 모분산을 안다는 가정 하에, 표본평균은 Z 분포를 따름. • 모분산을 모른다는 가정 하에서는, 표본평균은 T(n-1) 분포를 따름 : ttest_1samp( ) 함수 ☑️ Csi 데이터에서 ‘서비스 만족도의 모평균이 70이 아니다’ 라는 가설검정 - 양측검정 # ttest_1samp(a, popmean, alternative='two-sided’) from scipy.stats import ttest_1samp print(ttest_1samp(csi.Index, popmean=70)) ## T 분포 검정통계량, p-value 출력 ## 검정 결과 귀무가설 기각 ..

✏️ 11. UNION

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🐬 UNION JOIN 은 테이블을 옆으로 이어붙이는 구문이라면, UNION은 위아래로 붙이는 구문입니다. UNION 구문은 중복을 허용하지 않으며, UNION ALL 구문은 중복을 허용해 모든 값을 그대로 남겨둡니다. Products 테이블에서 가격이 5 이하 또는 200 이상인 제품을 가져오는 쿼리입니다. 일반적으로는 WHERE 절을 사용해서 아래와 같이 실행할 것입니다. SELECT * FROM Products WHERE price = 200; 이 쿼리를 UNION 구문을 사용해서 구현할 수도 있습니다. SELECT * FROM Products WHERE price = 200; 🐬 UNION ..

✏️ 10. OUTER JOIN

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🐬 OUTER JOIN INNER JOIN은 두 테이블의 공통적으로 존재하는 열의 값을 기준으로 합치는 구문이라면, OUTER JOIN은 한쪽 테이블에 열의 값이 없더라도 합쳐줍니다. OUTER JOIN 에는 LEFT JOIN 과 RIGHT JOIN 의 두 종류가 있습니다. 예를 들어 Table1에는 id가 1,2,3 이 있고 Table2에는 id가 1,2 밖에 없을 때, INNER JOIN을 한다면 최종 출력 값은 id 1,2 에 대한 테이블이 됩니다. 반면, Table1에 대한 LEFT JOIN을 한다면 id 1,2,3 에 대한 테이블을 출력해줍니다. 대신 Table2의 열에 대한 데이터는 모두..

✏️ 09. INNER JOIN

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🐬 INNER JOIN 테이블 하나만 가지고 원하는 분석을 할 수는 없습니다. 그렇다고 원하는 정보가 있는 테이블에서 일일히 검색해볼 수도 없는 노릇이기도 합니다. 따라서, 서로 관련이 있는 테이블을 이어붙여서 흩어져 있는 정보들을 한번에 다루기 위해 JOIN 구문이 등장했습니다. INNER JOIN은 양쪽 테이블 모두에 공통인 열이 존재하는 경우에 사용하는 구문입니다. 보통 SELECT FROM 테이블1 INNER JOIN 테이블2 ON 테이블1.공통열 = 테이블2.공통열 의 형태로 쿼리를 구성합니다. 아래 쿼리는 Orders 테이블에 있는 정보를 확인하기 위한 SELECT 구문이고, 그 아래 쿼..

🎲 신뢰구간

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 🎲 01. 모평균에 대한 신뢰구간 ☑️ 데이터 분포 확인 : seaborn.distplot( ) # 히스토그램 및 kde plot 출력 import pandas as pd csi = pd.read_csv('D://data//Csi.csv') import seaborn as sns import matplotlib.pyplot as plt sns.distplot(csi.Index) plt.show() ☑️ 모평균에 대한 신뢰구간 계산 : DescrStatsW( ) # DescrStatsW() : 변수에 대한 기술통계량, 검정통계량, 모평균에 대한 신뢰구간 저장 리스트 생상 # tconfint_mean(..