728x90
반응형
기출 유형 정리
작업형 제1유형 : 데이터 전처리 작업
전처리 문제 : 데이터 분석, 변환 등... 작업을 하게 됩니다.
주로 사용하는 패키지: numpy, pandas
작업형 제2유형 : 데이터 모형 구축 작업
모형 구축 문제 (머신러닝) : 주어진 데이터를 전처리 하고 모델을 학습하여, 예측하는 문제입니다.
주로 사용하는 패키지: sklearn
제3유형 : 데이터 모형 평가 작업
통계분석 문제 : 통계 정보를 도출하는 문제 입니다.
주로 사용하는 패키지: scipy.stats, statsmodels
채점 기준
작업 유형 | 문항 수 | 점수 |
1유형 | 3문항 | 문항당 10점 30점 |
2유형 | 1문항 | 40점 |
3유형 | 2문항 | 문항당 15점(소문항 구성) 30점 |
합계 | 6문항 | 100점 |
합격선 : 60점
1,2유형에서 높은 점수를 받는 전략을 추천 드립니다.
패키지 함수 리스트 및 사용 방법 확인하기
dir() 함수를 잘 활용하자!
dir을 사용하면 패키지가 가지고 있는 속성과 함수 리스트 정보를 얻을 수 있습니다.
import pandas as pd
dir(pd.DataFrame)[-10:]
import sklearn
sklearn.__all__
dir(sklearn)
from sklearn import metrics
dir(sklearn.metrics)
from scipy import stats
stats.__all__[-10:]
dir(stats)
from statsmodels import formula
dir(formula)
help 함수 활용하기!
help 함수를 활용하면, 함수의 인자와 return 정보를 알수 있다.
help(sklearn.preprocessing.LabelEncoder)
728x90
반응형
'빅데이터' 카테고리의 다른 글
[Knowledge Graph] 지식 그래프란 무엇인가? (0) | 2024.07.09 |
---|---|
[WorkFlow] 일잘하는 사람들은 모두 안다는 Zapier 알아보기! (0) | 2024.06.23 |
ETL vs ELT - 데이터 처리 접근 방식 차이점 알아보기 (0) | 2024.06.14 |
[dbt] dbt란 무엇인가? (0) | 2024.06.14 |
[Airflow] Airflow란 무엇인가? (0) | 2024.06.13 |