Câu hỏi:

20/05/2026 2 Lưu

Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật "word embedding" (biểu diễn từ) mang lại lợi ích chính nào so với phương pháp "bag-of-words" (túi từ)?

A.

Giảm chiều dữ liệu văn bản hiệu quả hơn.

B.

Nắm bắt được mối quan hệ ngữ nghĩa giữa các từ.

C.

Tăng tốc độ xử lý văn bản trong các mô hình NLP.

D.

Đơn giản hóa quá trình tiền xử lý văn bản.

Quảng cáo

Trả lời:

verified Giải bởi Vietjack

Chọn đáp án B

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

A.

BERT chỉ có thể xử lý văn bản tiếng Anh, trong khi Word2Vec và GloVe có thể xử lý đa ngôn ngữ.

B.

BERT tạo ra biểu diễn từ theo ngữ cảnh (contextualized word embeddings), trong khi Word2Vec và GloVe tạo ra biểu diễn từ tĩnh (static word embeddings).

C.

BERT sử dụng mạng nơ-ron hồi quy (RNN), trong khi Word2Vec và GloVe sử dụng mạng nơ-ron tích chập (CNN).

D.

BERT đòi hỏi ít dữ liệu huấn luyện hơn so với Word2Vec và GloVe.

Lời giải

Chọn đáp án B

Câu 2

A.

Giảm kích thước dữ liệu huấn luyện để tăng tốc độ huấn luyện.

B.

Loại bỏ dữ liệu nhiễu khỏi tập huấn luyện.

C.

Tạo ra các biến thể của dữ liệu hiện có (ví dụ: thay thế từ đồng nghĩa, xáo trộn câu) để tăng tính đa dạng của tập huấn luyện.

D.

Chia nhỏ dữ liệu huấn luyện thành các phần nhỏ hơn để huấn luyện song song.

Lời giải

Chọn đáp án C

Câu 3

A.

Dịch văn bản giữa nhiều ngôn ngữ khác nhau.

B.

Huấn luyện mô hình trên dữ liệu đa ngôn ngữ cùng một lúc.

C.

Chuyển giao kiến thức học được từ một ngôn ngữ (thường là ngôn ngữ có nhiều tài nguyên) sang một ngôn ngữ khác (thường là ngôn ngữ ít tài nguyên hơn).

D.

Đánh giá mô hình NLP trên nhiều ngôn ngữ.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 4

A.

Phân tích cảm xúc trong văn bản.

B.

Lưu trữ và truy xuất thông tin, hỗ trợ trả lời câu hỏi và suy luận.

C.

Tạo ra văn bản tự động.

D.

Dịch văn bản giữa các ngôn ngữ.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 5

A.

Mô hình huấn luyện chậm hơn.

B.

Mô hình dễ bị "overfitting" hơn.

C.

Mô hình tiêu thụ nhiều bộ nhớ hơn.

D.

Mô hình khó học được các phụ thuộc dài hạn trong chuỗi văn bản, làm giảm khả năng xử lý văn bản dài.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

A.

Khả năng xử lý tốt hơn với các từ ngoài từ vựng (out-of-vocabulary words) và lỗi chính tả.

B.

Tạo ra biểu diễn từ giàu ngữ nghĩa hơn.

C.

Huấn luyện nhanh hơn và hiệu quả hơn.

D.

Yêu cầu ít dữ liệu huấn luyện hơn.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 7

A.

Mã hóa tuần tự văn bản đầu vào và giải mã tuần tự văn bản đầu ra.

B.

Sử dụng mạng nơ-ron tích chập để trích xuất đặc trưng từ văn bản.

C.

Phân tích tần suất xuất hiện của các từ trong văn bản.

D.

Cho phép mô hình học cách gán trọng số khác nhau cho các phần khác nhau của dữ liệu đầu vào khi tạo ra đầu ra.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP