Khóa học Machine Learning online trên Coursera miễn phí – Andrew NG
I. Trong Machine Learning có 2 lớp bài toán người ta hay gặp là Classification và Regression.
Regression giống như ví dụ ở trên, đoán giá trị là một tập số liên tục. Thường là thuộc tập số thực.
Classification hay còn gọi là phân loại, đoán thuộc loại nào.
Tuy nhiên, vì một vài lý do lịch sử mà thuật toán Logistic Regression dù là thuật toán dùng cho bài toán phân loại (chính xác hơn là phân loại nhị phân – tức chỉ có 2 loại), nhưng lại có cái tên rất Regression.
II. Hàm sigmoid được giới thiệu.
Để tính xác xuất thuộc vào một lớp (đang xét bài toán chỉ có 2 lớp thôi).
Nó thực hiện hàm sigmoid trên tích giữa vector hệ số và đầu vào.
Giống nhữa Linear Regression:
Zi = Xi * Theta
Áp dụng hàm signmoid lên tích này:
g(Zi) = 1 / (1 + e^-z)
III. Sau đó, khái niệm Decision Boudary (biên quyết định) cũng được giới thiệu.
Tức là nhìn trên đồ thị đơn giản nó sẽ đường thằng (trong nhiều chiều hơn là mặt phẳng, siêu phẳng) để phân chia 2 vùng tuơng ứng với 2 lớp
IV. Hàm Cost Function của Logistic Regression cũng được đưa ra.
Sau đó là cách tính Gradient
Kể từ đây ta có thể hiểu rằng, đi đâu làm gì thì đều cần nhớ đến 2 thứ
Cost Function và cách tính Gradient
V. Trong tuần này, cũng giới thiệu một khái niệm mới nữa, đó là Regularization.
Để giải thích rõ ràng về tại sao lại có khái niệm này thì hơi khó.
Trong khóa học có giới thiệu về Overfitting, rồi Generalize (tính tổng quan), rồi Underfetting.
Leave a Reply