본문 바로가기

빅데이터

빅데이터 분석 기사 실기 시험 정보 정리 및 꿀팁 #1

728x90
반응형

기출 유형 정리

작업형 제1유형 : 데이터 전처리 작업

전처리 문제 : 데이터 분석, 변환 등... 작업을 하게 됩니다. 
주로 사용하는 패키지: numpy, pandas

작업형 제2유형 : 데이터 모형 구축 작업

모형 구축 문제 (머신러닝) : 주어진 데이터를 전처리 하고 모델을 학습하여, 예측하는 문제입니다. 
주로 사용하는 패키지: sklearn

제3유형 : 데이터 모형 평가 작업

통계분석 문제 : 통계 정보를 도출하는 문제 입니다. 
주로 사용하는 패키지: scipy.stats, statsmodels 

채점 기준

작업 유형문항 수 점수
1유형3문항문항당 10점 30점
2유형1문항40점
3유형2문항문항당 15점(소문항 구성) 30점
합계6문항100점

합격선 : 60점
1,2유형에서 높은 점수를 받는 전략을 추천 드립니다. 

패키지 함수 리스트 및 사용 방법 확인하기

dir() 함수를 잘 활용하자!

dir을 사용하면 패키지가 가지고 있는 속성과 함수 리스트 정보를 얻을 수 있습니다. 

import pandas as pd
dir(pd.DataFrame)[-10:]
import sklearn
sklearn.__all__
dir(sklearn)
from sklearn import metrics
dir(sklearn.metrics)
from scipy import stats
stats.__all__[-10:]
dir(stats)
from statsmodels import formula
dir(formula)

help 함수 활용하기!

help 함수를 활용하면, 함수의 인자와 return 정보를 알수 있다. 

help(sklearn.preprocessing.LabelEncoder)
728x90
반응형