Kế tiếp học có giám sát, học không giám sát là một trong những thuật toán phổ biến của Machine Learning. Trong bài này, chúng ta hãy cùng tìm hiểu kỹ hơn về các thuật toán cũng như ứng dụng của học không giám sát nhé!
Mục lục
Học không giám sát là gì?
Trong học không giám sát, các máy tính sẽ sử dụng dữ liệu không gắn nhãn và tự học, mà không cần có sự giám sát nào bên ngoài.
Hệ thống sẽ cố gắng tìm các mẫu dữ liệu chưa được gắn nhãn để học hỏi, sau đó đưa ra phản hồi cho người dùng.
Để bạn hiểu rõ hơn về khái niệm học không giám sát là gì, chúng ta hãy quay lại ví dụ về nhận dạng hình ảnh thìa hay dao mà chúng tôi đã trình bày trước đó nhé. Hệ thống sẽ tập hợp các hình ảnh giống nhau, dựa trên kích thước, màu sắc, hình dạng,… sau đó phân loại chúng.
Nhìn chung, học không giám sát có thể được nhóm lại thành 2 loại chính:
- Phân cụm (Clustering)
- Liên kết (Association)
>> Bài viết cùng chủ đề: Bài 6: Tất tần tật về học có giám sát trong Machine Learning
Phân cụm trong học không giám sát
Phân cụm là phương pháp phân chia các đối tượng thành nhiều cụm, các mẫu trong 1 cụm sẽ giống nhau và khác với những mẫu thuộc cụm khác.
Ví dụ: Hệ thống sẽ tìm ra các khách hàng có điểm chung là đã mua 1 sản phẩm bất kỳ nào đó.
Giả sử nếu một công ty viễn thông muốn tăng tỷ lệ mua hàng của khách hàng, bằng cách cung cấp các cuộc gọi được cá nhân hóa. Lúc này, hệ thống Machine Learning sẽ nghiên cứu mô hình gồm tệp dữ liệu của khách hàng, sau đó phân khúc ra những khách hàng có hành vi tương tự nhau.
Dựa vào các phân khúc này, doanh nghiệp có thể phát triển nhiều chiến lược phù hợp với nhu cầu cá nhân của từng khách hàng, để tăng tỷ lệ mua hàng và tối đa hóa lợi nhuận cho mình.
Như mình họa ở bên phải của hình trên, bạn có thể thấy các khách hàng đã được nhóm lại thành từng nhóm riêng biệt: nhóm A, B và C. Mỗi nhóm sẽ có hành vi khác nhau:
- Nhóm A sử dụng nhiều dữ liệu để truy cập Internet hơn và cũng có thời lượng dùng cuộc gọi cao
- Nhóm B sử dụng nhiều dữ liệu để truy cập Internet
- Nhóm C có thời lượng dùng cuộc gọi cao
Liên kết trong học không giám sát
Liên kết là một dạng Machine Learning hoạt động dựa trên quy tắc. Chúng sẽ khám phá xác suất xuất hiện cùng một lúc của các mục trong một bộ sưu tập.
Ví dụ của liên kết: Tìm ra các sản phẩm đã được mua cùng nhau
Giả sử nếu một khách hàng đến siêu thị và mua đồng thời 3 sản phẩm: trái cây, bánh mì và sữa.
Một khách hàng khác thì lại mua bánh mì, sữa, gạo và bơ.
Tiếp đó, nếu một khách hàng khác đến, nếu anh ta mua bánh mì, thì khả năng cao là anh ta sẽ mua thêm sữa. Đây là mối quan hệ được tạo ra dựa trên hành vi mua hàng của khách hàng.
Đây cũng là cách hoạt động của liên kết trong học không giám sát.
>> Xem thêm: 7 lưu ý khi triển khai câu lạc bộ STEM robot cho học sinh
Ứng dụng thực tế của học không giám sát là gì?
Vậy, trong thực tế thì học không giám sát được áp dụng vào những lĩnh vực nào? Hãy cùng tìm hiểu một số ứng dụng phổ biến của công nghệ Machine Learning này trong thực tế nhé!
Phân tích giỏ hàng
Đây là một mô hình Machine Learning nghiên cứu về hành vi mua hàng của khách hàng. Chúng sẽ cho bạn biết nếu khách hàng mua một nhóm mặt hàng nhất định, họ có khả năng mua một mặt hàng khác cao hay thấp.
Phân cụm ngữ nghĩa
Các từ ngữ tương tự nhau về ý nghĩa có thể sẽ có một ngữ cảnh chung. Khách hàng khi tìm kiếm trên trang Web hay trên công cụ tìm kiếm bất kỳ đều sẽ sử dụng từ ngữ riêng của mình.
Nhờ vào công nghệ phân cụm ngữ nghĩa, máy tính có thể nhóm tất cả các từ ngữ riêng của từng khách hàng này vào một cụm, để đảm bảo khách hàng có thể tìm thấy thông tin mà họ cần một cách nhanh chóng nhất.
Công nghệ phân cụm ngữ nghĩa có vai trò cực kỳ quan trọng trong việc truy xuất thông tin, mang lại trải nghiệm duyệt Web tốt cho người dùng.
Tối ưu hóa việc bán hàng
Các mô hình Machine Learning được ứng dụng vào dự đoán nhu cầu của khách hàng, từ đó đảm bảo nguồn cung ổn định. Chúng cũng được sử dụng để doanh nghiệp có thể mở thêm nhiều cửa hàng vào đúng thời điểm, đáp ứng tốt nhu cầu của khách hàng.
Ngoài ra, Machine Learning cũng hỗ trợ việc tối ưu công việc giao hàng sao cho hiệu quả hơn, dựa trên dữ liệu và hành vi được xác định trong quá khứ.
Xác định khu vực dễ gặp tai nạn
Các mô hình Machine Learning học không giám sát cũng được sử dụng để xác định những khu vực thường xuyên xảy ra tai nạn, từ đó đưa ra các biện pháp an toàn cho chúng ta.
Điểm khác biệt giữa học không giám sát và học có giám sát
Học có giám sát | Học không giám sát |
Sử dụng dữ liệu đã biết trước và được gắn nhãn làm đầu vào | Sử dụng dữ liệu không được gắn nhãn làm đầu vào |
Có cơ chế phản hồi | Không có cơ chế phản hồi |
Các thuật toán phổ biến là: Phân loại và hồi quy | Các thuật toán phổ biến là: Phân cụm và liên kết |
Kết luận
Trên đây, chúng ta đã cùng tìm hiểu về khái niệm học không giám sát là gì, cũng như các ứng dụng và những thuật toán của chúng. Nếu bạn có thắc mắc nào khác, hãy để lại bình luận bên dưới nhé.
Đây là bài số 7 trong chuỗi bài về hướng dẫn AI & Machine Learning của chúng tôi, bạn hãy truy cập toàn bộ chuỗi bài viết để tìm hiểu kỹ hơn về chủ đề này nhé!
Nếu bạn có bất kỳ thắc mắc nào khác, vui lòng liên hệ chúng tôi để được hỗ trợ.
Để tìm hiểu thêm về kit học STEM và các chương trình dạy học STEM, vui lòng liên hệ OhStem qua:
- Fanpage: https://www.facebook.com/ohstem.aitt
- Hotline: 08.6666.8168
- Youtube: https://www.youtube.com/c/ohstem
OhStem Education – Đơn vị cung cấp công cụ và giải pháp giáo dục STEAM cho mọi lứa tuổi tại Việt Nam