100 Ngày học Machine Learning Code -Ngày 2

Ngày 2: Hồi quy tuyến tính cơ bản (#100ngayMLcode#)

Bước 1: Tiền xử lý dữ liệu

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

dataset = pd.read_csv('studentscores.csv')
X = dataset.iloc[ : ,   : 1 ].values
Y = dataset.iloc[ : , 1 ].values

from sklearn.cross_validation import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split( X, Y, test_size = 1/4, random_state = 0)

Bước 2: Lắp mô hình hồi quy tuyến tính cơ bản và thực hành huấn luyện

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train, Y_train)

Bước 3: Dự đoán kết quả

Y_pred = regressor.predict(X_test)

Bước 4: Định hình

Trực quan hóa kết quả huấn luyện

plt.scatter(X_train , Y_train, color = 'red')
plt.plot(X_train , regressor.predict(X_train), color ='blue')

Trực quan hóa kết quả kiểm tra

plt.scatter(X_test , Y_test, color = 'red')
plt.plot(X_test , regressor.predict(X_test), color ='blue')

Bạn đã kết thúc ngày thứ 2 rồi đó. Hãy tiếp tục kiên trì nhé!

Còn tiếp…
Nguồn: github.com

Nội dung của bài viết này có ích với bạn không? Hãy cho chúng tôi biết bằng cách comment phía dưới bài viết này nhé.
Những đánh giá và đóng góp của bạn sẽ tiếp thêm động lực để chúng tôi phát triển thêm về nội dung và chủ đề liên quan.
Chân thành cám ơn!

0 replies

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Website này sử dụng Akismet để hạn chế spam. Tìm hiểu bình luận của bạn được duyệt như thế nào.