Data Science

사이킷런(scikit-learn)

Gauss1 2020. 8. 14. 04:33

파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 library

cf) 대표적인 딥러닝 라이브러리: tensorflow, keras

 

예시1) 븟꽃 품종 예측

import sklearn
print(sklearn.__version__)
import pandas as pd

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

iris = load_iris()
iris_data = iris.data
iris_label = iris.target
iris_df = pd.Dataframe(data=iris.data,columns=iris.feature_names)
iris_df['label'] = iris.target

# 데이터 세트 분리
X_train, X_test, y_train, y_test = train_test_splilt(iris_data, iris_label, tset_size=0.2, random_state=11)

# 모델 학습
dt_clf = DecisionTreeClassifier(random+state=11)
dt_clf.fit(X_train, y_train)

# 예측 수행
pred = dt_clf.predict(X_test)

# 평가
print('예측 정확도: {0:.4f}'.format(accuracy_score(y_test,pred)))

 

 

'Data Science' 카테고리의 다른 글

회귀  (0) 2020.10.07
분류  (0) 2020.10.06
데이터 가공  (0) 2020.08.19
Numpy, Pandas  (0) 2020.08.14
Day 1. Intro To Machine Learning  (0) 2020.07.28