요약 변수 생성
(1) 더미 변수 생성
pd.get_dummies(data = , columns = [ ] , drop_first = )
- columns = : 리스트형태로 전달
- drop_frist =
- True : 첫 번째 더미변수는 생성하지 않음
- False : 모든 더미 변수 생성 (디폴트)
(2) np.where(조건, 조건이 참일때 데이터, 조건이 거짓일 때 데이터)
(3) 시리즈.str. : 문자열 데이터 요약변수 생성
- str.slice(시작 숫자, 끝 숫자) : 시작 인덱스부터 끝 인덱스 -1 까지 문자열을 반환
- str.split : 문자열 데이터를 구분자를 통해 리스트로 반환
- str.get() : 여러 값이 있는 데이터를 인덱싱으로 불러옴
(4) 시리즈.dt. : 날짜형 데이터 요약변수 생성
.dt.year |
년도 추출 |
|
.dt.month |
월 추출 |
|
.dt.day |
일 추출 |
|
.dt.date |
년도,월,일 추출 |
|
.dt.time |
시간,분,초 추출 |
|
.dt.hour |
시간 추출 |
|
.dt.minute |
분 추출 |
|
.dt.second |
초 추출 |
|
.dt.dayofweek |
요일 추출 |
0 : 월요일 |
.dt.weekofyear |
일년을 기준으로 주차 추출 |
|
※
본 게시물은 개인적인 용도로 작성된 게시물이며. 이후 포트폴리오로 사용될 정리 자료이니
불펌과 무단도용은 하지 말아주시길 부탁드리고, 개인 공부 목적으로 이용해주시면 감사하겠습니다.
※