Câu hỏi:

20/05/2026 2 Lưu

Bạn đang xây dựng một hệ thống phân loại văn bản để xác định xem một bài đánh giá sản phẩm trực tuyến là tích cực hay tiêu cực. Phương pháp "TF-IDF" (Tần suất từ - Nghịch tần suất văn bản) sẽ hỗ trợ bạn như thế nào trong quá trình này?

A.

Giảm số lượng từ vựng cần xử lý.

B.

Phân tích cấu trúc cú pháp của câu trong bài đánh giá.

C.

Đánh trọng số các từ dựa trên tần suất xuất hiện trong bài đánh giá và độ hiếm trong toàn bộ tập đánh giá.

D.

Biểu diễn mỗi từ trong bài đánh giá thành một vectơ số cố định.

Quảng cáo

Trả lời:

verified Giải bởi Vietjack

Chọn đáp án C

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

A.

BERT chỉ có thể xử lý văn bản tiếng Anh, trong khi Word2Vec và GloVe có thể xử lý đa ngôn ngữ.

B.

BERT tạo ra biểu diễn từ theo ngữ cảnh (contextualized word embeddings), trong khi Word2Vec và GloVe tạo ra biểu diễn từ tĩnh (static word embeddings).

C.

BERT sử dụng mạng nơ-ron hồi quy (RNN), trong khi Word2Vec và GloVe sử dụng mạng nơ-ron tích chập (CNN).

D.

BERT đòi hỏi ít dữ liệu huấn luyện hơn so với Word2Vec và GloVe.

Lời giải

Chọn đáp án B

Câu 2

A.

Giảm kích thước dữ liệu huấn luyện để tăng tốc độ huấn luyện.

B.

Loại bỏ dữ liệu nhiễu khỏi tập huấn luyện.

C.

Tạo ra các biến thể của dữ liệu hiện có (ví dụ: thay thế từ đồng nghĩa, xáo trộn câu) để tăng tính đa dạng của tập huấn luyện.

D.

Chia nhỏ dữ liệu huấn luyện thành các phần nhỏ hơn để huấn luyện song song.

Lời giải

Chọn đáp án C

Câu 3

A.

Dịch văn bản giữa nhiều ngôn ngữ khác nhau.

B.

Huấn luyện mô hình trên dữ liệu đa ngôn ngữ cùng một lúc.

C.

Chuyển giao kiến thức học được từ một ngôn ngữ (thường là ngôn ngữ có nhiều tài nguyên) sang một ngôn ngữ khác (thường là ngôn ngữ ít tài nguyên hơn).

D.

Đánh giá mô hình NLP trên nhiều ngôn ngữ.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 4

A.

Phân tích cảm xúc trong văn bản.

B.

Lưu trữ và truy xuất thông tin, hỗ trợ trả lời câu hỏi và suy luận.

C.

Tạo ra văn bản tự động.

D.

Dịch văn bản giữa các ngôn ngữ.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 5

A.

Mô hình huấn luyện chậm hơn.

B.

Mô hình dễ bị "overfitting" hơn.

C.

Mô hình tiêu thụ nhiều bộ nhớ hơn.

D.

Mô hình khó học được các phụ thuộc dài hạn trong chuỗi văn bản, làm giảm khả năng xử lý văn bản dài.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

A.

Khả năng xử lý tốt hơn với các từ ngoài từ vựng (out-of-vocabulary words) và lỗi chính tả.

B.

Tạo ra biểu diễn từ giàu ngữ nghĩa hơn.

C.

Huấn luyện nhanh hơn và hiệu quả hơn.

D.

Yêu cầu ít dữ liệu huấn luyện hơn.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 7

A.

Giảm chiều dữ liệu văn bản hiệu quả hơn.

B.

Nắm bắt được mối quan hệ ngữ nghĩa giữa các từ.

C.

Tăng tốc độ xử lý văn bản trong các mô hình NLP.

D.

Đơn giản hóa quá trình tiền xử lý văn bản.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP