100 Ngày học Machine Learning Code -Ngày 2
Ngày 2: Hồi quy tuyến tính cơ bản (#100ngayMLcode#)
Bước 1: Tiền xử lý dữ liệu
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
dataset = pd.read_csv('studentscores.csv')
X = dataset.iloc[ : , : 1 ].values
Y = dataset.iloc[ : , 1 ].values
from sklearn.cross_validation import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split( X, Y, test_size = 1/4, random_state = 0)
Bước 2: Lắp mô hình hồi quy tuyến tính cơ bản và thực hành huấn luyện
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train, Y_train)
Bước 3: Dự đoán kết quả
Y_pred = regressor.predict(X_test)
Bước 4: Định hình
Trực quan hóa kết quả huấn luyện
plt.scatter(X_train , Y_train, color = 'red')
plt.plot(X_train , regressor.predict(X_train), color ='blue')
Trực quan hóa kết quả kiểm tra
plt.scatter(X_test , Y_test, color = 'red')
plt.plot(X_test , regressor.predict(X_test), color ='blue')
Bạn đã kết thúc ngày thứ 2 rồi đó. Hãy tiếp tục kiên trì nhé!
Còn tiếp…
Nguồn: github.com
Nội dung của bài viết này có ích với bạn không? Hãy cho chúng tôi biết bằng cách comment phía dưới bài viết này nhé.
Những đánh giá và đóng góp của bạn sẽ tiếp thêm động lực để chúng tôi phát triển thêm về nội dung và chủ đề liên quan.
Chân thành cám ơn!
Leave a Reply
Want to join the discussion?Feel free to contribute!