Câu hỏi:

22/10/2024 183

Tại sao cần chia dữ liệu Học máy thành hai phần: dữ liệu huấn luyện và dữ liệu kiểm tra?

A. Để máy tính có thể học từ cả hai loại dữ liệu một cách cân bằng.

B. Để đánh giá khách quan hiệu suất của mô hình học máy.

C. Để tăng khối lượng dữ liệu mà máy tính có thể học.

D. Để có thể dự đoán kết quả của mô hình trên dữ liệu thực tế.

Quảng cáo

Trả lời:

verified
Giải bởi Vietjack

Đáp án: B: Việc chia dữ liệu thành hai phần giúp đảm bảo rằng khi mô hình được kiểm tra, nó không "nhìn thấy" dữ liệu kiểm tra trong quá trình huấn luyện. Điều này cho phép đánh giá khách quan về hiệu suất của mô hình trên dữ liệu mà nó chưa thấy, từ đó xác định khả năng tổng quát của mô hình.

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Lời giải

Đáp án: A. Dữ liệu có nhãn (còn gọi là dữ liệu giám sát) là những dữ liệu mà mỗi điểm dữ liệu đều có gán một nhãn hoặc giá trị mục tiêu cụ thể. Ví dụ, trong bài toán phân loại thư điện tử, mỗi email có thể được gán nhãn là "thư rác" hoặc "thư hợp lệ".

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 199K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP