import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import train_test_split

# 读取数据
data = pd.read_csv('/root/data/titanic/wine0501.csv')
print(data.info())

data = data[data['Class label']!=1]
x = data[['Alcohol','Hue']].copy()
y = data['Class label'].copy()
print(y)

pre = LabelEncoder()
# 实例化一个 LabelEncoder 对象,命名为 pre。
# 这个对象将负责把文本或非数值型标签转换成数值型标签。
# 但注意,在代码中你的 y 已经是数字(0, 2),这一步可能不是必需的,
# 但它能确保标签从0开始连续编码。
y = pre.fit_transform(y)
print(y)

x_train,x_test,y_train,y_test = train_test_split(x,y)

# 模型训练
ada = AdaBoostClassifier()
ada.fit(x_train,y_train)

# 模型评估
print(ada.score(x_test,y_test))

作者 admin

张宴银,大数据开发工程师

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注