khoahoc.vietjack.com

Câu hỏi:

20/05/2026 26 Lưu

Mục đích chính của việc sử dụng "stop words" (từ dừng) trong tiền xử lý văn bản là gì?

A.

Tăng cường tính đa dạng từ vựng trong văn bản.

B.

Đảm bảo tính chính xác ngữ pháp của văn bản.

C.

Giảm kích thước dữ liệu và loại bỏ các từ phổ biến không mang nhiều thông tin ngữ nghĩa.

D.

Chuẩn hóa cách viết của các từ trong văn bản.

Quảng cáo

Trả lời:

verified Giải bởi Vietjack

Chọn đáp án C

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

A.

Đo tốc độ dịch của mô hình.

B.

Đánh giá khả năng hiểu ngôn ngữ nguồn của mô hình.

C.

Đo mức độ tương đồng giữa bản dịch của mô hình với bản dịch tham khảo.

D.

Xác định ngôn ngữ nguồn và ngôn ngữ đích của văn bản.

Lời giải

Chọn đáp án C

Câu 2

A.

Cả hai đều nhằm mục đích giảm các từ về dạng gốc của chúng.

B.

Cả hai đều sử dụng từ điển để tra cứu dạng gốc của từ.

C.

Cả hai đều loại bỏ hoàn toàn hậu tố và tiền tố của từ.

D.

Cả hai đều giữ lại tất cả các dạng biến thể của từ để phân tích.

Lời giải

Chọn đáp án A

Câu 3

A.

Phân loại văn bản theo chủ đề.

B.

Phân tích cảm xúc và thái độ trong văn bản.

C.

Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

D.

Xác định và phân loại các thực thể có tên (ví dụ: người, tổ chức, địa điểm) trong văn bản.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 4

A.

Token hóa (Tokenization)

B.

Gán nhãn POS (Part-of-Speech Tagging)

C.

Phân tích cú pháp (Parsing)

D.

Chuẩn hóa văn bản (Text Normalization)

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

A.

Số lượng từ vựng trong tập dữ liệu huấn luyện.

B.

Độ dài trung bình của câu trong văn bản.

C.

Số lượng lớp ẩn trong mạng nơ-ron của mô hình.

D.

Số lượng từ liên tiếp được xem xét để dự đoán từ tiếp theo.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 7

A.

Kỹ thuật phân tích cú pháp câu.

B.

Kỹ thuật biểu diễn từ dưới dạng vectơ (word embeddings).

C.

Kỹ thuật giảm chiều dữ liệu văn bản.

D.

Kỹ thuật sinh văn bản tự động.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP