🐼 판다스/Pandas 함수 7

🐼 Pandas 07. pd.Categorical( ) 함수

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 📝 목차 1. pd.Categorical( ) 함수 2. 함수 문법 🐼 가끔씩 데이터 전처리를 하다 보면 sort_values( ) 함수나 sort_index( ) 함수를 써도 원하는대로 정렬이 이뤄지지 않는 경우가 있습니다. 이 상황은 apply( ) 함수로 임의의 함수를 데이터에 적용할 때 주로 생기는데, 이번 포스팅에서는 이를 해결하는 함수에 대해서 알아봅시다!! 1. pd.Categorical( ) 함수 🐼 앞선 포스팅에서 다룬 pd. to_datetime( ) 함수에 dt 메서드를 적용하면 년, 월, 일, 요일 등 시계열과 관련한 다양한 column 을 만들 수 있습니다. 하지만 이때 생기..

🐼 Pandas 06. pd.to_datetime( ) 함수

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 📝 목차 1. pd.to_datetime( ) 기본 모양 2. month.day 형태의 데이터가 있는 경우 3. year, month, day 가 각각의 column인 경우 🐼 이번 포스팅에서는 시계열 분석을 위해 알아야 할 시간 관련 함수 pd.to_datetime( ) 에 대해서 알아보겠습니다. 🐼 처리 기준은 year - month - day 의 형태입니다. 1. pd.to_datetime( ) 기본 모양 🐼 pd.to_datetime(series, format, errors) 처음 들어가는 인수인 series 는 데이터 처리 과정에서 datetime 형태로 바꾸려고 하는 열을 선언합니다. 두..

🐼 Pandas 05. loc / iloc 함수

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 📝 목차 1. 행으로 접근 2. 행 / 열으로 접근 🐼 공부하다 보니 loc / iloc 함수가 생각보다 다양한 경우에 사용가능하다는 것을 알게되었습니다. 🐼 이번에 정리해두면 나중에 전처리를 할때 좀 더 수월하게 할 수 있을거 같아서 적어둘 생각입니다. 🐼 먼저 사용할 데이터프레임을 하나 만들어 봅시다. import pandas as pd df = pd.DataFrame({'국어':[90, 85, 88], '수학':[92, 88, 96], '과학':[85, 92, 90]}, index = ['A','B','C']) df >> 국어수학과학 A909285 B858892 C889690 1. 행에 접근 ..

🐼 Pandas 04. DataFrame 열에 접근하기

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 📝 목차 2.1. 열의 요소에 접근하기 2.2. 새로운 열 만들기 2.3. 열 삭제하기 2.4. 원본데이터 보존하기 2.5. 정규표현식으로 접근하기 🐼 이번에는 데이터프레임의 열에 접근하는 법에 대해 살펴보겠습니다. 🐼 시작 전에 df 라는 데이터프레임을 하나 만들어두겠습니다!! import pandas as pd df = pd.DataFrame({"국어" : [85, 92, 88], "수학" : [100, 92, 84], "영어" : [90, 90, 90]}, index = ["A","B","C"]) df >> 국어 수학 영어 A 85 100 90 B 92 92 90 C 88 84 90 2. Da..

🐼 Pandas 03. DataFrame 행에 접근하기

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 📝 목차 1.1. loc / iloc 함수 1.2. 값 변경하기 1.3. 행 삭제하기 1.4. 조건에 맞는 행 가져오기 1.5. 포함관계 파악하기 1.6. 행 추출하기 🐼 이번 포스팅과 다음 포스팅을 통해 데이터프레임의 행/열에 접근하는 방법에 대해 알아봅시다. 🐼 시작 전에 df 라는 데이터프레임을 하나 만들어둘게요!! import pandas as pd df = pd.DataFrame({"국어" : [85, 92, 88, 80], "수학" : [100, 92, 84, 90], "영어" : [90, 90, 90, 82]}, index = ["A","B","C","D"]) df >> 국어수학영어 A..

🐼 Pandas 02. DataFrame 만들기

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 📝 목차 1. 데이터프레임 정의 2. 데이터프레임 생성 3. 데이터프레임 접근 1. DataFrame 🐼 데이터프레임은 시리즈로 이루어진 데이터입니다. 🐼 row 와 column으로 구성되는 Table 형식입니다. 2. Dafatrame 생성 - pd.DataFrame( ) 함수 2.1 index를 따로 지정해서 만들기 import pandas as pd 🐼 pd.DataFrame(딕셔너리, index) df1 = pd.DataFrame({"a" : [1,2,3], "b" : [4,5,6], "c" : [7,8,9]}, index=[1,2,3]) df1 >> a b c 1 1 4 7 2 2 5 8 ..

🐼 Pandas 01. Series

모바일은 화면을 돌려 가로화면으로 보시는 게 읽으시기 편할 수 있습니다. 돌려서 보시는 걸 추천드릴게요!! 📝 목차 1. Series 정의 2. Sereis 생성 3. Series 값 접근 1. Series 🐼 시리즈는 행 / 열의 구분이 없습니다. 🐼 index 와 values 만을 가지는 데이터형식입니다. 2. Series 생성 2.1. index를 따로 지정해서 만들기 🐼pandas 라이브러리 import import pandas as pd 🐼 pd.Series(리스트) a = pd.Series(["a","b","c","d"]) a >> 0 a 1 b 2 c 3 d dtype: object 인덱스를 따로 지정하지 않는 경우 default 값은 0,1,2,3... 으로 자동으로 설정됩니다. 🐼 .in..