Bài 6: Tất tần tật về học có giám sát trong Machine Learning

Machine Learning là một kỹ thuật giúp cho máy tính có thể học giống như con người, và chúng chia làm 2 loại: Học có giám sát và học không giám sát.

Một ví dụ phổ biến về Machine Learning (học máy) là khi bạn yêu cầu Siri làm việc gì đó, tính năng nhận dạng giọng nói sẽ chuyển âm thanh thành văn bản tương ứng, sau đó gửi lệnh đến máy chủ để xử lý và trả về kết quả cho người dùng.

Trong chủ đề tiếp theo của chuỗi bài viết về học máy này, chúng ta sẽ cùng tìm hiểu kỹ hơn về khái niệm học có giám sát và học không giám sát nhé!

Học có giám sát là gì?

Trong kỹ thuật học có giám sát, các hệ thống máy tính sẽ đào tạo mô hình, học hỏi từ dữ liệu dưới sự giám sát từ bên ngoài.

Cụ thể hơn, chúng sẽ chứa một mô hình có thể dự đoán, với sự tập hợp của các dữ liệu đã được gắn nhãn trước đó. Dữ liệu được gắn nhãn là những dữ liệu mà bạn đã biết câu trả lời đích.

Ví dụ, bạn cung cấp hình ảnh các con mèo cho hệ thống và gắn nhãn đó là hình ảnh của chú mèo, để hệ thống biết được câu trả lời khi nhìn vào tấm hình đó. Máy tính sẽ tự phân tích để tìm hiểu sự liên kết giữa hình ảnh các con mèo, dựa vào các đặc điểm như hình dạng, kích thước, màu sắc,…

Sau khi máy đã tìm hiểu và học hỏi xong, bạn có thể đưa hình ảnh một con mèo mới vào mà không gắn nhãn để máy biết đó là con mèo, thì máy tính vẫn có thể dễ dàng dự đoán chính xác đó là hình về con mèo, thông qua sự trợ giúp của việc tìm hiểu dữ liệu đã gắn nhãn trước đó.

Khái niệm học có giám sát là gì?
Khái niệm học có giám sát là gì?

Học có giám sát có thể được chia thành 2 loại:

  • Phân loại
  • Hồi quy

Phân loại và hồi quy trong học có giám sát là gì? Chúng ta sẽ cùng tìm hiểu kỹ hơn nhé:

Phân loại

Phân loại là kỹ thuật được sử dụng khi biến đầu ra có tính phân loại, nghĩa là các biến này có 2 hoặc nhiều lớp. Ví dụ, biến đầu ra là có hoặc không, là nam hoặc nữ, là đúng hoặc sai,…

Một ví dụ về ứng dụng phân loại trong học có giám sát là khả năng phân loại và xác định một email gửi đến có phải là thư rác hay không.

Kỹ thuật phân loại trong học có giám sát
Kỹ thuật phân loại trong học có giám sát

Trước tiên, chúng ta cần dạy cho hệ thống biết thư rác là gì. Các nhà nghiên cứu đã xây dựng rất nhiều bộ lọc thư rác, ví dụ như:

  • Xem xét nội dung của thư có chứa các từ khóa quảng cáo, spam hay không
  • Xem xét tiêu đề của thư có các từ khóa bán hàng, khuyến mãi,… hay không
  • Xem xét thư gửi đến có chứa bất kỳ thông tin sai lệch nào hay không
  • … Và nhiều bộ lọc khác nữa

Các từ khóa và bộ lọc nằm trong danh sách đen của Email là những mã tống tiền hoặc email có chứa virus,….

Tất cả các bộ lọc này được sử dụng để chấm điểm cho từng email và để phân loại chúng vào thư rác hay không. Tổng điểm thư rác càng thấp thì chúng sẽ không bị xem là email lừa đảo và không bị cho vào mục thư rác / spam.

Hồi quy

Hồi quy là kỹ thuật trong học có giám sát được sử dụng khi biến đầu ra là một giá trị thực hoặc liên tục. Trong trường hợp này, giữa 2 hoặc nhiều biến đầu ra sẽ có mối liên hệ với nhau (một biến này thay đổi sẽ dẫn đến biến khác cũng thay đổi theo).

Ví dụ điển hình của biến đầu ra trong hồi quy có thể kể đến là số lương của từng nhân viên dựa trên kinh nghiệm làm việc, hoặc tổng cân nặng dựa trên chiều cao,…

Hồi quy trong học có giám sát là gì?
Hồi quy trong học có giám sát là gì?

Ở đây, chúng ta hãy xem xét đến 2 biến – độ ẩm và nhiệt độ. Lúc này, nhiệt độ là biến độc lập và độ ẩm sẽ là biến phụ thuộc: nếu nhiệt độ tăng, độ ẩm sẽ giảm.

Đây là 2 biến được đưa vào mô hình học có giám sát để máy tính học hỏi mối quan hệ giữa chúng. Sau khi máy tính đã được huấn luyện, chúng có thể dễ dàng dự đoán được độ ẩm, dựa trên giá trị nhiệt độ đã cho.

>> Xem thêm: Bài 1: Giới thiệu về Machine Learning cơ bản cho người mới

Ứng dụng thực tế của học có giám sát

Dự đoán rủi ro

Học có giám sát có thể được dùng để dự đoán và đánh giá rủi ro trong các dịch vụ tài chính hoặc lĩnh vực bảo hiểm, nhằm mục đích giảm thiểu tối đa rủi ro của công ty

Nhận dạng và phân loại hình ảnh

Phân loại hình ảnh là một trong những trường hợp điển hình để minh họa cho kỹ thuật học máy có giám sát. Ví dụ: Facebook có thể nhận ra hình ảnh bạn bè của bạn trong một bức ảnh có nhiều người.

Phát hiện gian lận

Học có giám sát còn được sử dụng để xác định xem các giao dịch được thực hiện bởi người dùng thực tế không, hay do hệ thống máy tính spam thực hiện. Điều này giúp các công ty tránh được gian lận.

Nhận dạng trực quan

Mô hình học có giám sát sẽ giúp hệ thống có thể xác định các đối tượng, địa điểm, con người, hành động hoặc hình ảnh một cách trực quan.

Lời kết

Trên đây là tất cả các thông tin chi tiết về mô hình học có giám sát, hy vọng bài viết hữu ích với bạn.

Đây là bài số 6 trong chuỗi bài về  hướng dẫn AI & Machine Learning của chúng tôi, bạn hãy truy cập toàn bộ chuỗi bài viết để tìm hiểu kỹ hơn về chủ đề này nhé!

Nếu bạn có bất kỳ thắc mắc nào khác, vui lòng liên hệ chúng tôi để được hỗ trợ.

Để tìm hiểu thêm về kit học STEM và các chương trình dạy học STEM, vui lòng liên hệ OhStem qua:

OhStem Education – Đơn vị cung cấp công cụ và giải pháp giáo dục STEAM cho mọi lứa tuổi tại Việt Nam

Những bài liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Fill out this field
Fill out this field
Vui lòng nhập địa chỉ email hợp lệ.
You need to agree with the terms to proceed