Câu hỏi:

20/05/2026 4 Lưu

Để xử lý hiệu quả các từ "out-of-vocabulary" (OOV - từ ngoại từ điển) mà mô hình chưa từng gặp trong quá trình huấn luyện, kỹ thuật nào thường được sử dụng trong các mô hình ngôn ngữ hiện đại, ví dụ như mô hình dựa trên Transformer?

A.

Thay thế từ OOV bằng từ đồng nghĩa

B.

Sử dụng mã hóa theo cặp byte (Byte Pair Encoding - BPE) hoặc các phương pháp phân tách từ con

C.

Bỏ qua hoàn toàn các từ OOV trong quá trình xử lý

D.

Gán ngẫu nhiên vectơ cho các từ OOV

Quảng cáo

Trả lời:

verified Giải bởi Vietjack

Chọn đáp án B

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

A.

Các mệnh đề độc lập và phụ thuộc

B.

Các từ khóa quan trọng nhất trong câu

C.

Các cụm từ có nghĩa (ví dụ: cụm danh từ, cụm động từ)

D.

Các thực thể có tên (Named Entities)

Lời giải

Chọn đáp án C

Câu 2

A.

BERT chỉ xử lý văn bản từ trái sang phải, giống như các mô hình RNN truyền thống.

B.

BERT xem xét cả ngữ cảnh bên trái và bên phải của một từ khi tạo biểu diễn vectơ từ đó.

C.

BERT chỉ phù hợp cho các bài toán phân loại văn bản, không dùng được cho nhận dạng thực thể.

D.

BERT là một mô hình ngôn ngữ dựa trên CNN, không phải Transformer.

Lời giải

Chọn đáp án B

Câu 3

A.

Nhận dạng thực thể có tên (Named Entity Recognition)

B.

Tóm tắt văn bản (Text Summarization)

C.

Phân tích cú pháp (Syntactic Parsing)

D.

Phân tích cảm xúc (Sentiment Analysis)

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 5

A.

Chọn lọc và kết hợp các câu quan trọng nhất từ văn bản gốc để tạo bản tóm tắt

B.

Diễn giải lại nội dung của văn bản gốc bằng ngôn ngữ khác

C.

Sử dụng mô hình sinh văn bản để tạo ra bản tóm tắt mới hoàn toàn

D.

Loại bỏ các thông tin không quan trọng và giữ lại các từ khóa chính

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

A.

Sinh văn bản (Text Generation)

B.

Dịch máy (Machine Translation)

C.

Trích xuất thông tin (Information Extraction)

D.

Phân loại văn bản (Text Classification)

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP