본문
트리(graphviz) pip install graphviz 먼저 설치 # 필요한 라이브러리 및 모듈을 가져오기 from sklearn.tree import DecisionTreeClassifier # 결정 트리 분류기를 사용하기 위한 모듈 from sklearn.datasets import load_iris # 아이리스 데이터셋을 불러오기 위한 모듈 from sklearn.model_selection import train_test_split # 데이터를 훈련 및 테스트 세트로 분할하기 위한 모듈 from sklearn.tree import export_graphviz # 결정 트리를 시각화하기 위한 모듈 import graphviz # 그래프 시각화 도구를 사용하기 위한 모듈 import pandas as pd # 데이터프.. 2023. 10. 31. 09:23 코딩 study/python
titanic_csv(평가지표) import pandas as pd from sklearn.model_selection import train_test_split import numpy as np from sklearn.preprocessing import Binarizer from sklearn.metrics import precision_recall_curve import matplotlib.pyplot as plt import matplotlib.ticker as ticker # 데이터 전처리 함수 정의 def fillna(df): df['Age'].fillna(df['Age'].mean(), inplace=True) # 'Age' 열의 누락된 값들을 평균값으로 대체 df['Cabin'].fillna('N', inplace=Tru.. 2023. 10. 30. 12:40 코딩 study/python
평가지표(accuracy) from sklearn.base import BaseEstimator import numpy as np class MyDummyClassifier(BaseEstimator): def fit(self, x, y=None): pass def predict(self, x): pred = np.zeros((x.shape[0], 1)) # 0으로 채워진 배열 생성 for i in range(x.shape[0]): if x['Sex'].iloc[i] == 1: # 'Sex' 열의 값이 1인 경우 0으로 예측 pred[i] = 0 else: pred[i] = 1 # 'Sex' 열의 값이 1이 아닌 경우 1로 예측 return pred # 예측 결과 반환 import pandas as pd from sklearn.mo.. 2023. 10. 30. 09:43 코딩 study/python
titanic_csv를 활용한 모델별 예측 import pandas as pd # 판다스를 사용하여 'titanic_train.csv' 파일을 읽어 데이터프레임을 생성 df = pd.read_csv('titanic_train.csv') print(df) # 데이터프레임 출력 # 'Age' 열의 누락된 값을 해당 열의 평균값으로 대체 df['Age'].fillna(df['Age'].mean(), inplace=True) # 'Cabin'과 'Embarked' 열의 누락된 값을 각각 'N'으로 대체 df['Cabin'].fillna('N', inplace=True) df['Embarked'].fillna('N', inplace=True) # 'Sex'와 'Survived' 열을 기반으로 그룹화하고, 각 그룹별로 'Survived' 값의 개수를 세어 .. 2023. 10. 30. 09:23 코딩 study/python
레이블 인코딩(label encoder, OneHotencoder),standardScaler,MinMaxScaler # 필요한 라이브러리 임포트 from sklearn.preprocessing import LabelEncoder # 라벨 인코딩을 위한 라이브러리 임포트 from sklearn.preprocessing import OneHotEncoder # 원핫 인코딩을 위한 라이브러리 임포트 import numpy as np # 배열 조작을 위한 넘파이 라이브러리 임포트 import pandas as pd # 데이터프레임 생성 및 가공을 위한 판다스 라이브러리 임포트 from sklearn.datasets import load_iris # 아이리스 데이터셋 로드 from sklearn.preprocessing import StandardScaler # 표준화를 위한 스케일러 라이브러리 임포트 from sklearn... 2023. 10. 30. 09:02 코딩 study/python