Câu hỏi:

24/10/2024 430 Lưu

Ý tưởng chính của thuật toán Apriori là: 

a. Tạo ra các tập phổ biến (thường xuyên) có 1 item, rồi tiếp đến là 2 items, 3 items... cho đến khi chúng ta tạo ra tập phổ biến của mọi kích thước. Mỗi tập item được tạo ra phải được tính toán độ hỗ trợ và độ tin cậy. Tập k-item được tạo ra từ tập k-1 items. Tạo danh sách các item dự kiến của tập k-items bằng cách hợp từng đôi một tập k-1 items có trong danh sách. 
b. Tạo ra các tập phổ biến (thường xuyên) có 1 item, rồi tiếp đến là 2 items, 3 items... cho đến khi chúng ta tạo ra tập phổ biến của mọi kích thước. Tập k item được tạo ra từ tập k-1 items. Tạo danh sách các item dự kiến của tập k-items bằng cách hợp từng đôi một tập k-1 items có trong danh sách. Loại bỏ các tập item không thỏa độ hỗ trợ và độ tin cậy 
c. Tạo bảng chứa các item phổ biến, loại bỏ các item không phổ biến. Giả sử có k item là ứng viên. Tính các tập mục mà mỗi mục có số lượng phần tử là tổ hợp chập 1, 2, 3, … k của k item. Loại bỏ các item không thỏa mãn độ hỗ trợ và độ tin cậy. 
d. Lần lượt tạo ra danh sách các item dự kiến của tập k-items bằng cách hợp từng đôi một tập k-1 items có trong danh sách. Loại bỏ các tập item không thỏa độ hỗ trợ và độ tin cậy.

Quảng cáo

Trả lời:

verified Giải bởi Vietjack
a là đáp án đúng

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

a. Bỏ qua bản ghi có dữ liệu bị thiếu, điền giá trị thiếu bằng tay, điền giá trị tự động
b. Loại bỏ dựa trên quan sát, loại bỏ khi lựa chọn đặc trưng 
c. Loại bỏ toàn bộ dữ liệu bị nhiễu và thay thế bằng tập dữ liệu mới, lựa chọn các đặc trưng quan trọng
d. Sử dụng các thuật toán phân lớp, phân cụm, tìm luật kết hợp

Lời giải

a là đáp án đúng

Câu 2

a. Data Preprocessing Khoa CNTT – Data Mining 1
b. Data Processing 
c. Preprocessing in Database 
d. Data Process

Lời giải

a là đáp án đúng

Câu 3

a. Dữ liệu quá lớn, dữ liệu bị thiếu hoặc nhiễu, sự phức tạp của dữ liệu, dữ liệu thường xuyên thay đổi... 
b. Trình độ của con người còn hạn chế, dữ liệu không được lưu trữ tập trung... 
c. Dữ liệu quá lớn, máy khai phá dữ liệu có tốc độ hạn chế... 
d. Tốc độ xử lý của máy tính còn hạn chế, dữ liệu thường xuyên thay đổi...

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 199K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 4

a. Loại bỏ nhiễu và dữ liệu không nhất quán 
b. Tìm kiếm dữ liệu có ích 
c. Tìm kiếm dữ liệu có ích trong cơ sở dữ liệu lớn 
d. Tổ hợp nhiều nguồn dữ liệu khác nhau

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 199K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 5

a. Không thể gán (hoặc gán lại) từng điểm vào cụm khác 
b. Số cụm sinh ra là k 
c. Tùy theo yêu cầu của người dùng 
d. Khi tất cả các phần tử đã được gán vào k cụm

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 199K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

a. Khai phá luật kết hợp, phân loại, phân cụm, hồi qui... 
b. Khai phá luật kết hợp, xây dựng máy tìm kiếm... 
c. Web mining, Text mining, mạng nơron… 
d. Bài toán nhận dạng, bài toán tìm kiếm thông tin, bài toán lựa chọn đặc trưng...

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 199K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 7

a. Tốn nhiều bộ nhớ và thời gian. Không thích hợp với các mẫu lớn. Chi phí để duyệt CSDL nhiều. 
b. Không tìm được các tập thường xuyên 
c. Kết quả của thuật toán không ứng dụng được trong các bài toán thực tế 
d. Thuật toán quá phức tạp, khó hiểu

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 199K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP