images
07/10/2020 04:49 am

Gấu mèo đi làm Data Scientist - Phần 2

Khi Gấu Mèo thức dậy thì cũng sắp tới giờ kẹt đường. Nó phi vội lên công ty. Hú hồn thêm phút nữa là bị phạt vì đi muộn.

Nó sung sướng, quyết định tự thưởng cho mình một gói bim bim làm đồ ăn sáng. Thế nhưng, mới được nửa gói thì bị sếp gọi vào phòng.


- “Nghiên cứu phân tích tới đâu rồi Gấu Mèo” - Sếp hỏi.

- “Hix, Sếp mới giao cho em ngày hôm qua mà. Cũng may mà hôm qua em trắng đêm.”

- “Mày lại chém, tiếp đi"

- “Theo em thì mình cần bắt đầu quá trình phân tích thế này”


Gấu Mèo vừa chém vừa cười thầm trong bụng, may mà hôm qua vừa đọc lại 5 chiêu. Tuy nhiên tới chiêu thứ 5 thì nó bắt đầu bí:


- “Co-occurrence grouping, có thể dùng cho việc trả lời câu hỏi như: Những sản phẩm nào khách hàng hay mua cùng nhau… À…ờ…”


Bỗng có tiếng nói phát ra ở góc phòng.


- “Nó có thể dùng để trả lời cho việc suggest sản phẩm. Ngoài ra còn có mấy phương pháp nữa sếp ạ”

- “Uh kể nốt đi xem nào?”


6. Profiling


Hay còn gọi là Behavior description. Phương pháp này sẽ mô tả những hành vi tiêu biểu của một cá nhân, một nhóm hoặc một tập lớn. Ví dụ như profiling hành vi sử dụng điện thoại di động đòi hỏi những mô tả như thời gian trung bình phát sóng mỗi đêm, cuối tuần, số phút nhắn tin, gọi điện quốc tế….


Profiling thường được dùng xác định các hành vi thông thường, từ đó phát hiện được các điểm dị thường để chăm sóc. Chẳng hạn như nếu khách hàng chi trả trong tháng vượt trội so với những người khác trong nhóm thì nên xem có gì đặc biệt. Hoặc ví dụ như số lần thao tác sai của khách khác hẳn với đám đông thì cũng nên cho nhân viên chăm sóc gọi điện và hỏi han vì sao. Những việc như thế sẽ phát hiện sớm được các lỗi tiềm ẩn và nhiều khi cứu cả tỷ đồng cho công ty.


Nghe đến đây thì Gấu Mèo tái mặt. Sao hắn ta biết bí quyết của sư phụ.


7. Link prediction


Dùng để dự đoán mối quan hệ giữa các điểm dữ liệu, từ đấy suggest ra mối quan hệ. Để dễ hình dung hơn, thì Gấu Mèo cứ thử mở Facebook và xem cách nó giới thiệu kết bạn ấy. Phương pháp này cũng có thể dùng để giới thiệu phim trên các trang online.


Lúc này thì Gấu Mèo nhận ra ai đang nói. Hắn đích thị là Fat Black Cat. Trong công ty này ai mà chả biết hắn, thế nhưng không ai thực sự biết hắn nghĩ gì.


Fat Black Cat không nhìn nhưng hắn vẫn thấy được sự trầm trồ ở sếp lẫn vẻ tức giận của Gấu Mèo. Hắn tỉnh bơ nói tiếp:


8. Data reduction


Thường dùng khi dữ liệu quá lớn. Phương pháp này sẽ giúp tìm ra những thông tin quan trọng hơn từ đấy đưa ra bộ dữ liệu rút gọn, giúp cho xử lý hệ thống nhanh và mượt hơn rất nhiều. Dĩ nhiên là so với dữ liệu gốc nó không nhiều thông tin bằng. Thế nhưng 80 - 20, việc rút gọn dataset cũng có thể làm cho việc xử lý dữ liệu tìm được những yếu tố quan trọng mà ko cần xử lý quá nhiều.


9. Causal modeling


Giúp chúng ta tìm được các yếu tố có thể khiến khách hàng mua hàng. Lấy ví dụ: Chúng ta cần xây một hệ thống Suggestion. Trước hết chúng ta sẽ xem lại những khách hàng có tỷ lệ click xem mua hàng cao. Liệu quảng cáo làm họ mua nhiều hơn? Liệu nút mua màu đỏ có thể làm họ mua nhiều hơn. Để làm được điều này, chúng ta cần hệ thống tracking để lưu lại các hành vi của khách hàng cũng như các sự kiện mà chúng ta chủ động cho hiện ra. Có một kĩ thuật hay dùng trong vấn đề này đấy là A/B testing...


Tối đấy Gấu Mèo thất thểu bước về nhà. F*ck, cứ tưởng nó sẽ chém trước sếp như một vị thần, ai dè đẻ ra cái tên Fat Black Cat. Mà khó hiểu nhất là ko hiểu sao hắn lại biết cả 9 bí quyết, y như sư phụ viết. Gấu Mèo lại xoắn não, cho tới khi nó chợt nhớ ra, lúc đi về - khi đi qua bàn Fat Black Cat, hình như nó có thấy một tờ giấy ố vàng.

--------------------------

P/S: Fat Black Cat là người thế nào, sao hắn lại có bí kíp phân tích của Gấu Mèo. Tất cả sẽ được tiết lộ trong Phần 3 - Gấu mèo đi làm Data Scientist.


Mời các bạn đọc thêm Phần 1 - Gấu mèo đi làm Data Scientist.


- Tech Zone -

Thư giãn chút nào!!!

Bài viết liên quan