Hi, I am

Ngô Tôn

I am a programmer.

Home / HCMUS / Data Mining / Phân lớp dữ liệu – Classification

Phân lớp dữ liệu – Classification

Mục lục

Kĩ thuật phân lớp được tiến hành bao gồm 2 bước : Xây dựng mô hình và sử dụng mô hình .

  • Xây dựng mô hình : là mô tả một tập những lớp được định nghĩa trước trong đó : mỗi bộ hoặc mẫu được gán thuộc về một lớp được định nghĩa trước như là được xát định bởi thuộc tính nhãn lớp , tập hợp của những bộ được sử dụng trong việc sử dụng mô hình được gọi là tập huấn luyện . Mô hình được biểu diễn là những luật phân lớp , cây quyết định và những công thức toán học .
  • Sử dụng mô hình : Việc sử dụng mô hình phục vụ cho mục đích phân lớp dữ liệu trong tương lai hoặc phân lớp cho những đối tượng chưa biết đến . Trước khi sử dụng mô hình người ta thường phải đánh giá tính chính xát của mô hình trong đó : nhãn được biết của mẫu kiểm tra được so sánh với kết quả phân lớp của mô hình , độ chính xác là phần trăm của tập hợp mẫu kiểm tra mà phân loại đúng bởi mô hình , tập kiểm tra là độc lập với tập huấn luyện .

Phân lớp là một hình thức học được giám sát tức là : tập dữ liệu huấn luyện ( quan sát , thẩm định .) đi đôi với những nhãn chỉ định lớp quan sát , những dữ liệu mới được phân lớp dựa trên tập huấn luyện .

Ngược lại với hình thức học được giám sát là hình thức học không được giám sát lúc đó nhãn lớp của tập dữ liệu huấn luyện là không được biết đến.

Các thuật toán phân lớp dữ liệu

 Phân lớp với cây quyết định (decision tree)

 Phân lớp với Naïve Bayesian

 Phân lớp với k phần tử gần nhất (k-nearest neighbor)

 Phân lớp với máy vector hỗ trợ (SVM)

 Phân lớp với mạng neural (neural network)

 Phân lớp dựa trên tiến hoá gen (genetic algorithms)

 Phân lớp với lý thuyết tập thô, tập mờ (rough sets)

 Phân lớp với lý thuyết tập mờ (fuzzy sets)

Phân lớp với cây quyết định (decision tree) – Thuật toán ID3

 

About ngoton

Ngô Tôn is a programmer with passion for tailored software solutions. Comes with 7+ years of IT experience, to execute beautiful front-end experiences with secure and robust back-end solutions.

Leave a Reply

avatar
  Subscribe  
Notify of