images
07/10/2020 05:20 am

Gấu mèo đi làm Data Scientist - Phần 4 - Câu đố xứ Rivia (Part 1)

“Geralt xứ Rivia có quen 12 phù thủy, như trong hình, những người được đánh dấu chữ Yes là những người có pháp thuật, chữ No là những người không có pháp thuật. Phù thuỷ thứ 13, Yennefer xứ Vengerberg xuất hiện, Geralt sẽ làm thế nào để biết cô ấy có pháp thuật hay không?”


Fat Cat muốn tiếp tục troll Gấu Mèo, nên khi thấy câu đố này nó tag ngay Gấu Mèo vào kèm thêm cái icon thách thức.


Gấu Mèo định lờ đi, nhưng mà - dân phân tích như nó thì thứ này đâu có thể làm khó được!!!


“Bài này dạng Supervised Segmentation bởi vì dữ liệu mẫu đã được gán nhãn rồi (Yes hay No). Thế này thì đơn giản, 2 phút là xong”. Gấu Mèo nghĩ.


"I Drink And I Know Things" - Nó làm một hớp bia và bắt đầu suy diễn.

Trước hết là về thuộc tính, có 3 thuộc tính:

✅ Hình dạng đầu: có đầu tròn và đầu vuông

✅ Hình dạng người: có oval và hình chữ nhật

✅ Quần áo thì có hai loại Đen và Trắng


Mình chỉ cần tìm ra thuộc tính nào mang tính quyết định nhất để phân loại thì sẽ tìm ra cách.


Về lý thuyết mà nói thì chỉ cần thuộc tính đó chia ra được thành các nhóm thuần chủng (Pure). Một nhóm được coi là thuần chủng nếu nhóm đấy có cùng một giá trị đầu ra (Đều có pháp thuật hoặc đều không có pháp thuật).


Cơ mà nhìn lại thì:

✅ Với 1 thuộc tính khó có thể chia được ra các nhóm dạng Pure.

✅ May cái trong câu đố mỗi thuộc tính nó chỉ chia thành hai nhóm khác nhau, chứ ngoài thật thì còn nhiều nhóm nữa.

✅ Đấy là chưa kể có loại giá trị của nó là số chứ chả phải phân loại rõ ràng thế này.


Thế này thì phải đo độ thuần chủng mới có cách. Nhưng mà quên béng mất cách đo dựa trên Entropy và Information gain thế nào rồi…


Cùng tìm câu trả lời trong Phần 4 - Gấu mèo đi làm Data Scientist (Part 2) nhé.


Mời các bạn đọc Phần 3 - Gấu mèo đi làm Data Scientist.


- Tech Zone -


Thư giãn chút nào!!!

Bài viết liên quan