Lý thuyết Cơ Bản về Machine Learning – Máy học
Lý thuyết về Machine Learning – Máy học
Machine Learning (ML) – máy học là ngành khá hay, ứng dụng khá nhiều và đang trở thành xu hướng. Nó là 1 nhánh của AI (trí tuệ nhân tạo), và ứng dụng của ML vào thực tế càng lúc càng nhiều.
Hãy tưởng tượng máy tính là 1 đứa trẻ, bạn cho nó nhìn hình ảnh rồi dạy đó là chó hoặc mèo. Sau đó đưa 1 tấm hình chưa từng xem qua nó vẫn đoán được đó là chó hay mèo. Não của đứa trẻ học những đặc điểm của chó mèo rồi dùng quy luật đó để dự đoán. Khi đoán sai người lớn sẽ sửa lại để mô hình học đúng hơn, đó gọi là học có giám sát.
Cũng với 1 đứa trẻ, đưa cho nó 1 đống đồ chơi rồi kêu nó phân loại tùy ý. Nó sẽ sắp xếp các loại đồ chơi theo quy tắc nào đó mà nó nhận ra như màu sắc, kích thước. Tuy nhiên mỗi đứa trẻ sẽ có 1 cách sắp xếp khác nhau, đó gọi là học không giám sát.
Vậy ML có dự đoán được xổ số hay không? Câu trả lời là không vì xổ số hoàn toàn ngẫu nhiên. Nó không có quy luật để rút trích đặc trưng mà dự đoán. Nếu làm được thì các nhà khoa học đã giàu hết rồi và ngành xổ số dẹp tiệm rồi.
Trong Thị giác máy tính thì ML là bước cuối cùng sau khi đã xử lý ảnh thành dữ liệu input. Kết quả trả về là lớp (nhãn) của hình ảnh input. Như là nhận dạng ảnh động vật, biển số xe, biển báo giao thông,…
Tổng quan thì một ứng dụng ML đều có những bước cơ bản như:
– Thu thập dữ liệu (biển số, khuôn mặt, chó mèo,…)
– Trích xuất thông tin cần thiết từ dữ liệu
– Huấn luyện (training) để tạo thành model để sử dụng
– Lập trình ứng dụng sử dụng model đã huấn luyện
– Thu thập dữ liệu (biển số, khuôn mặt, chó mèo,…)
– Trích xuất thông tin cần thiết từ dữ liệu
– Huấn luyện (training) để tạo thành model để sử dụng
– Lập trình ứng dụng sử dụng model đã huấn luyện
Theo định nghĩa của Wikipedia:
Có nhiều giải thuật liên quan đến lĩnh vực thú vị này, như:
Support Vector Machine (SVM)
Xem dữ liệu như vectơ nhiều chiều rồi phân lớp kết quả
Hình trên là ảnh 3 chiều cho thấy rằng siêu phẳng (hyperplane) phân lớp các phần tử trong không gian 3 chiều thành 2 lớp khác nhau. Và theo mô hình xây dựng sẵn thì dựa vào tọa độ của siêu phẳng mà kết luận. Tất nhiên là dữ liệu sẽ có n chiều chứ không phải chỉ là 3 chiều như ảnh minh họa.
Hình trên là ảnh 3 chiều cho thấy rằng siêu phẳng (hyperplane) phân lớp các phần tử trong không gian 3 chiều thành 2 lớp khác nhau. Và theo mô hình xây dựng sẵn thì dựa vào tọa độ của siêu phẳng mà kết luận. Tất nhiên là dữ liệu sẽ có n chiều chứ không phải chỉ là 3 chiều như ảnh minh họa.
Các bạn có thể tham khảo bài viết LIBSVM – giới thiệu tổng quan và ví dụ (link: updating...)
k-nearest neighboor (KNN): số láng giềng gần nhất
Có 2 khu rừng: rừng lá kim (màu đỏ) và rừng lá rộng (màu xanh) nằm cạnh bên nhau. Vậy cây mọc tại vị trí màu trắng là cây lá kim hay cây lá rộng?
Số k chính là số lượng cây mọc xung quanh cây cần dự đoán, giả sử lấy k=9 (9 cây xung quanh) có 2 cây lá rộng, 7 cây lá kim, vậy người ta sẽ dự đoán cây màu trắng là cây lá kim. Thuật toán này căn cứ vào phân bố xác suất.
Naive Bayes: Bayes thơ ngây
Giả sử có 1 cô gái được 2 anh chàng yêu cùng lúc, cô gái sẽ phải cân nhắc anh nào ưu điểm nhiều để cưới. Mỗi anh đều có một vài ưu điểm như: đẹp trai, tài năng, quan hệ rộng, tâm lý,… Nhưng cô không biết ưu điểm nào là quan trọng hơn ưu điểm nào, thế thì cứ liệt kê ra ưu điểm, ai nhiều hơn thì cô yêu người đó.
Vấn đề nhìn thấy rõ là: xem mức độ quan trọng của từng thuộc tính như nhau là không hợp lý, nhưng kết quả trong thực tế lại cho kết quả khá tốt. Các bạn tham khảo slide về cách tính toán xác suất cuối bài.
Và còn rất nhiều giải thuật khác hay ho thú vị nhưng rất nhức đầu, hại não. Quay lại chủ đề chính, Machine Learning cần thiết cho xử lý ở phần Object Detection. OpenCV sẽ sử dụng những thuật toán đó để học ra những quy luật của chữ số, mặt người, vật thể thành các mô hình nhận dạng, sau đó so sánh hình ảnh input với mô hình nhận dạng để tìm ra đối tượng trong ảnh.
Khái quát về ML là như vậy, mục đích bài này để giúp bạn hiểu được ML là gì nên có thể từ ngữ không chính xác lắm. Mình sẽ cập nhật liên tục về những mô hình ML mới một cách dễ đọc, dễ hiểu nhất.
Lý thuyết Cơ Bản về Machine Learning – Máy học
Reviewed by Jacky
on
tháng 3 26, 2018
Rating:
Không có nhận xét nào: