목록코딩 study/python (32)
Creative Code
pip install graphviz 먼저 설치 # 필요한 라이브러리 및 모듈을 가져오기 from sklearn.tree import DecisionTreeClassifier # 결정 트리 분류기를 사용하기 위한 모듈 from sklearn.datasets import load_iris # 아이리스 데이터셋을 불러오기 위한 모듈 from sklearn.model_selection import train_test_split # 데이터를 훈련 및 테스트 세트로 분할하기 위한 모듈 from sklearn.tree import export_graphviz # 결정 트리를 시각화하기 위한 모듈 import graphviz # 그래프 시각화 도구를 사용하기 위한 모듈 import pandas as pd # 데이터프..
import pandas as pd from sklearn.model_selection import train_test_split import numpy as np from sklearn.preprocessing import Binarizer from sklearn.metrics import precision_recall_curve import matplotlib.pyplot as plt import matplotlib.ticker as ticker # 데이터 전처리 함수 정의 def fillna(df): df['Age'].fillna(df['Age'].mean(), inplace=True) # 'Age' 열의 누락된 값들을 평균값으로 대체 df['Cabin'].fillna('N', inplace=Tru..
from sklearn.base import BaseEstimator import numpy as np class MyDummyClassifier(BaseEstimator): def fit(self, x, y=None): pass def predict(self, x): pred = np.zeros((x.shape[0], 1)) # 0으로 채워진 배열 생성 for i in range(x.shape[0]): if x['Sex'].iloc[i] == 1: # 'Sex' 열의 값이 1인 경우 0으로 예측 pred[i] = 0 else: pred[i] = 1 # 'Sex' 열의 값이 1이 아닌 경우 1로 예측 return pred # 예측 결과 반환 import pandas as pd from sklearn.mo..
from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784') print(mnist.data) import matplotlib.pyplot as plt plt.imshow(mnist.data.values[0].reshape(28,28),cmap = 'gray') from sklearn.model_selection import train_test_split X_train,X_test,y_train,y_test = train_test_split(mnist.data,mnist.target,test_size=0.1) from sklearn.ensemble import RandomForestClassifier from sklearn.metr..
import pandas as pd # 판다스를 사용하여 'titanic_train.csv' 파일을 읽어 데이터프레임을 생성 df = pd.read_csv('titanic_train.csv') print(df) # 데이터프레임 출력 # 'Age' 열의 누락된 값을 해당 열의 평균값으로 대체 df['Age'].fillna(df['Age'].mean(), inplace=True) # 'Cabin'과 'Embarked' 열의 누락된 값을 각각 'N'으로 대체 df['Cabin'].fillna('N', inplace=True) df['Embarked'].fillna('N', inplace=True) # 'Sex'와 'Survived' 열을 기반으로 그룹화하고, 각 그룹별로 'Survived' 값의 개수를 세어 ..
# 필요한 라이브러리 임포트 from sklearn.preprocessing import LabelEncoder # 라벨 인코딩을 위한 라이브러리 임포트 from sklearn.preprocessing import OneHotEncoder # 원핫 인코딩을 위한 라이브러리 임포트 import numpy as np # 배열 조작을 위한 넘파이 라이브러리 임포트 import pandas as pd # 데이터프레임 생성 및 가공을 위한 판다스 라이브러리 임포트 from sklearn.datasets import load_iris # 아이리스 데이터셋 로드 from sklearn.preprocessing import StandardScaler # 표준화를 위한 스케일러 라이브러리 임포트 from sklearn...