[Tất tần tật] Chương trình máy học là gì ? (Machine learning – ML)

Chương trình máy học là gì ?” Học máy là khoa học giúp máy tính học và hoạt động giống như con người, đồng thời cải thiện việc học của chúng theo thời gian theo cách tự trị, bằng cách cung cấp cho chúng dữ liệu và thông tin dưới dạng quan sát và tương tác trong thế giới thực” .

“Trong lĩnh vực phân tích dữ liệu , học máy là một phương pháp được sử dụng để tạo ra các mô hình và thuật toán phức tạp cho phép dự đoán; trong sử dụng thương mại, đây được gọi là phân tích dự đoán. Các mô hình phân tích này cho phép các nhà nghiên cứu, nhà khoa học dữ liệu , kỹ sư và nhà phân tích để ‘đưa ra các quyết định và kết quả đáng tin cậy, có thể lặp lại’ và khám phá ‘thông tin chi tiết tiềm ẩn’ thông qua việc học hỏi từ các mối quan hệ lịch sử và xu hướng trong dữ liệu “.

“Các quy trình liên quan đến học máy tương tự như khai thác dữ liệu và mô hình dự đoán . Cả hai đều yêu cầu tìm kiếm thông qua dữ liệu để tìm kiếm các mẫu và điều chỉnh các hành động của chương trình cho phù hợp” .

MÁY HỌC – HỌC MÁY

Học máy là gì?

Máy học là một nhánh của trí tuệ nhân tạo (AI) và khoa học máy tính, tập trung vào việc sử dụng dữ liệu và thuật toán để bắt chước cách con người học, dần dần cải thiện độ chính xác của nó.

Trong vài thập kỷ qua, những tiến bộ công nghệ trong khả năng lưu trữ và xử lý đã cho phép một số sản phẩm sáng tạo dựa trên công nghệ máy học, chẳng hạn như công cụ đề xuất của Netflix và ô tô tự lái.

Học máy là một thành phần quan trọng của lĩnh vực khoa học dữ liệu đang phát triển. Thông qua việc sử dụng các phương pháp thống kê, các thuật toán được đào tạo để đưa ra các phân loại hoặc dự đoán và khám phá những thông tin chi tiết chính trong các dự án khai thác dữ liệu. Những thông tin chi tiết này sau đó thúc đẩy việc đưa ra quyết định trong các ứng dụng và doanh nghiệp, tác động lý tưởng đến các chỉ số tăng trưởng chính. Khi dữ liệu lớn tiếp tục mở rộng và phát triển, nhu cầu thị trường đối với các nhà khoa học dữ liệu sẽ tăng lên. Họ sẽ được yêu cầu để giúp xác định các câu hỏi kinh doanh có liên quan nhất và dữ liệu để trả lời chúng.

Các thuật toán học máy thường được tạo bằng cách sử dụng các khuôn khổ giúp tăng tốc phát triển giải pháp, chẳng hạn như TensorFlow và PyTorch.

Cách hoạt động của máy học

UC Berkeley  chia hệ thống học tập của một thuật toán học máy thành ba phần chính.

  1. Quy trình quyết định : Nói chung, các thuật toán học máy được sử dụng để đưa ra dự đoán hoặc phân loại. Dựa trên một số dữ liệu đầu vào, có thể được gắn nhãn hoặc không được gắn nhãn, thuật toán của bạn sẽ đưa ra ước tính về một mẫu trong dữ liệu.
  2. Một chức năng lỗi : Một chức năng lỗi đánh giá dự đoán của mô hình. Nếu có các ví dụ đã biết, hàm lỗi có thể thực hiện so sánh để đánh giá độ chính xác của mô hình.
  3. Quy trình tối ưu hóa mô hình : Nếu mô hình có thể phù hợp hơn với các điểm dữ liệu trong tập huấn luyện, thì trọng số được điều chỉnh để giảm sự khác biệt giữa ví dụ đã biết và ước tính mô hình. Thuật toán sẽ lặp lại quá trình “đánh giá và tối ưu hóa” này, cập nhật các trọng số một cách tự động cho đến khi đạt đến ngưỡng độ chính xác.
Nhiều người quan tâm:  [Mách bạn] Học sâu là gì ? (Deep Learning - DL)

Các thuật toán học máy phổ biến

Ứng dụng ML vào Phân tích dữ liệu
Ứng dụng ML vào DA

Một số thuật toán học máy thường được sử dụng. Bao gồm các:

  1. Mạng nơ-ron: Mạng nơ-ron mô phỏng cách thức hoạt động của bộ não con người, với một số lượng khổng lồ các nút xử lý được liên kết. Mạng nơ-ron rất tốt trong việc nhận dạng các mẫu và đóng một vai trò quan trọng trong các ứng dụng bao gồm dịch ngôn ngữ tự nhiên, nhận dạng hình ảnh, nhận dạng giọng nói và tạo hình ảnh.
  2. Hồi quy tuyến tính: Thuật toán này được sử dụng để dự đoán các giá trị số, dựa trên mối quan hệ tuyến tính giữa các giá trị khác nhau. Ví dụ: kỹ thuật này có thể được sử dụng để dự đoán giá nhà dựa trên dữ liệu lịch sử của khu vực.
  3. Hồi quy logistic: Thuật toán học có giám sát này đưa ra dự đoán cho các biến phản hồi phân loại, chẳng hạn như câu trả lời “có / không” cho các câu hỏi. Nó có thể được sử dụng cho các ứng dụng như phân loại thư rác và kiểm soát chất lượng trên dây chuyền sản xuất.
  4. Phân cụm: Sử dụng phương pháp học không giám sát, các thuật toán phân cụm có thể xác định các mẫu trong dữ liệu để nó có thể được nhóm lại. Máy tính có thể giúp các nhà khoa học dữ liệu bằng cách xác định sự khác biệt giữa các mục dữ liệu mà con người đã bỏ qua.
  5. Cây quyết định: Cây quyết định có thể được sử dụng cho cả dự đoán giá trị số (hồi quy) và phân loại dữ liệu thành các loại. Cây quyết định sử dụng một chuỗi phân nhánh của các quyết định được liên kết có thể được biểu diễn bằng sơ đồ cây. Một trong những ưu điểm của cây quyết định là chúng dễ xác thực và kiểm tra, không giống như hộp đen của mạng nơ-ron.
  6. Rừng ngẫu nhiên: Trong một khu rừng ngẫu nhiên, thuật toán máy học dự đoán một giá trị hoặc danh mục bằng cách kết hợp các kết quả từ một số cây quyết định.
Nhiều người quan tâm:  7 kỹ năng cần thiết: nhà phân tích nghiệp vụ chuyên nghiệp

Các ứng dụng thực tế

Đây chỉ là một vài ví dụ về học máy mà bạn có thể gặp hàng ngày:

  1. Nhận dạng giọng nói : Nó còn được gọi là nhận dạng giọng nói tự động (ASR), nhận dạng giọng nói máy tính hoặc chuyển giọng nói thành văn bản và nó là một khả năng sử dụng xử lý ngôn ngữ tự nhiên (NLP) để dịch giọng nói của con người sang định dạng viết. Nhiều thiết bị di động tích hợp tính năng nhận dạng giọng nói vào hệ thống của chúng để thực hiện tìm kiếm bằng giọng nói — ví dụ như Siri — hoặc cải thiện khả năng tiếp cận để nhắn tin.
  2. Dịch vụ khách hàng :   Dịch vụ khách hàng:   Chatbots trực tuyến đang thay thế các tác nhân con người trong hành trình của khách hàng, thay đổi cách chúng ta nghĩ về sự tương tác của khách hàng trên các trang web và nền tảng truyền thông xã hội. Chatbots trả lời các câu hỏi thường gặp (FAQ) về các chủ đề như vận chuyển, hoặc cung cấp lời khuyên được cá nhân hóa, bán kèm sản phẩm hoặc đề xuất kích thước cho người dùng. Ví dụ như đại lý ảo  trên các trang thương mại điện tử; bot nhắn tin, sử dụng Slack và Facebook Messenger; và các tác vụ thường được thực hiện bởi trợ lý ảo và trợ lý giọng nói.
  3. Thị giác máy tính: Công nghệ AI này cho phép máy tính lấy thông tin có ý nghĩa từ hình ảnh kỹ thuật số, video và các đầu vào trực quan khác, sau đó thực hiện hành động thích hợp. Được hỗ trợ bởi mạng nơ-ron phức hợp, thị giác máy tính có các ứng dụng trong việc gắn thẻ ảnh trên phương tiện truyền thông xã hội, chụp ảnh X quang trong chăm sóc sức khỏe và xe hơi tự lái trong ngành công nghiệp ô tô.
  4. Công cụ đề xuất: Sử dụng dữ liệu hành vi tiêu dùng trong quá khứ, các thuật toán AI có thể giúp khám phá các xu hướng dữ liệu có thể được sử dụng để phát triển các chiến lược bán chéo hiệu quả hơn. Cách tiếp cận này được các nhà bán lẻ trực tuyến sử dụng để đưa ra các đề xuất sản phẩm có liên quan cho khách hàng trong quá trình thanh toán.
  5. Giao dịch chứng khoán tự động: Được thiết kế để tối ưu hóa danh mục đầu tư chứng khoán, các nền tảng giao dịch tần suất cao do AI điều khiển thực hiện hàng nghìn hoặc thậm chí hàng triệu giao dịch mỗi ngày mà không cần sự can thiệp của con người.
  6. Phát hiện gian lận: Các ngân hàng và các tổ chức tài chính khác có thể sử dụng máy học để phát hiện các giao dịch đáng ngờ. Học tập có giám sát có thể đào tạo một mô hình sử dụng thông tin về các giao dịch gian lận đã biết. Phát hiện bất thường có thể xác định các giao dịch trông không điển hình và đáng được điều tra thêm.
Nhiều người quan tâm:  Công việc phân tích dữ liệu (DA) gồm những gì ?

Khác biệt cơ bạn với khái niệm gần giống

Khác biệt về khái niệm gần giống

  • Trí tuệ nhân tạo ( Artificial Intelligence – AI)
  • Máy học (Machine Learning – ML)
  • Mạng thần kinh ( Neural Networks – NN)
  • Học sâu ( Deep Learning – DL )

Vì học sâu và học máy có xu hướng được sử dụng thay thế cho nhau, nên cần lưu ý các sắc thái giữa hai phương pháp này. Học máy, học sâu và mạng nơ-ron đều là các lĩnh vực phụ của trí tuệ nhân tạo. Tuy nhiên, mạng nơ-ron thực sự là một lĩnh vực phụ của học máy và học sâu là một lĩnh vực phụ của mạng nơ-ron.

Cách học sâu và học máy khác nhau ở cách mỗi thuật toán học. Học máy “sâu” có thể sử dụng tập dữ liệu được gắn nhãn, còn được gọi là học có giám sát, để thông báo cho thuật toán của nó, nhưng nó không nhất thiết phải yêu cầu tập dữ liệu được gắn nhãn. Học sâu có thể nhập dữ liệu phi cấu trúc ở dạng thô của nó (ví dụ: văn bản hoặc hình ảnh) và nó có thể tự động xác định tập hợp các tính năng giúp phân biệt các danh mục dữ liệu khác nhau với nhau. Điều này giúp loại bỏ một số sự can thiệp của con người cần thiết và cho phép sử dụng các tập dữ liệu lớn hơn.

Học máy cổ điển, hoặc “không sâu”, phụ thuộc nhiều hơn vào sự can thiệp của con người để học. Các chuyên gia về con người xác định tập hợp các tính năng để hiểu sự khác biệt giữa các đầu vào dữ liệu, thường yêu cầu nhiều dữ liệu có cấu trúc hơn để tìm hiểu.

Mạng nơ-ron, hay mạng nơ-ron nhân tạo (ANN), bao gồm các lớp nút, chứa một lớp đầu vào, một hoặc nhiều lớp ẩn và một lớp đầu ra. Mỗi nút, hoặc nơ-ron nhân tạo, kết nối với một nút khác và có trọng số và ngưỡng liên quan. Nếu đầu ra của bất kỳ nút riêng lẻ nào vượt quá giá trị ngưỡng được chỉ định, nút đó sẽ được kích hoạt, gửi dữ liệu đến lớp tiếp theo của mạng. Nếu không, không có dữ liệu nào được chuyển đến lớp tiếp theo của mạng bởi nút đó. “Sâu” trong học sâu chỉ là đề cập đến số lượng các lớp trong mạng nơ-ron. Một mạng nơ-ron bao gồm hơn ba lớp — sẽ bao gồm đầu vào và đầu ra — có thể được coi là một thuật toán học sâu hoặc một mạng nơ-ron sâu. Một mạng nơ-ron chỉ có ba lớp chỉ là một mạng nơ-ron cơ bản.

Học sâu và mạng thần kinh được ghi nhận là giúp tăng tốc tiến bộ trong các lĩnh vực như thị giác máy tính, xử lý ngôn ngữ tự nhiên và nhận dạng giọng nói.

Có thể bạn cũng thích

5 thoughts on “[Tất tần tật] Chương trình máy học là gì ? (Machine learning – ML)

  1. Pingback: [Mách bạn] Học sâu là gì ? (Deep Learning - DL) - Phân tích nghiệp vụ

  2. Pingback: [Thêm] Trí tuệ nhân tạo là gì ? Artificial Intelligence (AI) - Phân tích nghiệp vụ

  3. Pingback: Dịch vụ chạy thuê MÁY HỌC Machine Learning theo nhu cầu doanh nghiệp - Phân tích nghiệp vụ

  4. Pingback: Nhận dự báo với mạng thần kinh - Neural Networks

  5. Pingback: KNN - Thuật toán láng giềng gần nhất K-Nearest Neighbor là gì - Phân tích nghiệp vụ

Trả lời

Email của bạn sẽ không được hiển thị công khai.