Trong bài toán dịch máy (Machine Translation), kỹ thuật "back-translation" (dịch ngược) được sử dụng để làm gì?
Đánh giá chất lượng bản dịch của mô hình.
Tăng cường dữ liệu huấn luyện bằng cách tạo ra các cặp câu song ngữ mới.
Cải thiện tốc độ dịch của mô hình dịch máy.
Chuẩn hóa định dạng văn bản đầu vào trước khi dịch.
Quảng cáo
Trả lời:
Chọn đáp án B
Hot: 1000+ Đề thi cuối kì 2 file word cấu trúc mới 2026 Toán, Văn, Anh... lớp 1-12 (chỉ từ 60k). Tải ngay
CÂU HỎI HOT CÙNG CHỦ ĐỀ
Câu 1
BERT chỉ có thể xử lý văn bản tiếng Anh, trong khi Word2Vec và GloVe có thể xử lý đa ngôn ngữ.
BERT tạo ra biểu diễn từ theo ngữ cảnh (contextualized word embeddings), trong khi Word2Vec và GloVe tạo ra biểu diễn từ tĩnh (static word embeddings).
BERT sử dụng mạng nơ-ron hồi quy (RNN), trong khi Word2Vec và GloVe sử dụng mạng nơ-ron tích chập (CNN).
BERT đòi hỏi ít dữ liệu huấn luyện hơn so với Word2Vec và GloVe.
Lời giải
Chọn đáp án B
Câu 2
Giảm kích thước dữ liệu huấn luyện để tăng tốc độ huấn luyện.
Loại bỏ dữ liệu nhiễu khỏi tập huấn luyện.
Tạo ra các biến thể của dữ liệu hiện có (ví dụ: thay thế từ đồng nghĩa, xáo trộn câu) để tăng tính đa dạng của tập huấn luyện.
Chia nhỏ dữ liệu huấn luyện thành các phần nhỏ hơn để huấn luyện song song.
Lời giải
Chọn đáp án C
Câu 3
Dịch văn bản giữa nhiều ngôn ngữ khác nhau.
Huấn luyện mô hình trên dữ liệu đa ngôn ngữ cùng một lúc.
Chuyển giao kiến thức học được từ một ngôn ngữ (thường là ngôn ngữ có nhiều tài nguyên) sang một ngôn ngữ khác (thường là ngôn ngữ ít tài nguyên hơn).
Đánh giá mô hình NLP trên nhiều ngôn ngữ.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 4
Phân tích cảm xúc trong văn bản.
Lưu trữ và truy xuất thông tin, hỗ trợ trả lời câu hỏi và suy luận.
Tạo ra văn bản tự động.
Dịch văn bản giữa các ngôn ngữ.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 5
Khả năng xử lý tốt hơn với các từ ngoài từ vựng (out-of-vocabulary words) và lỗi chính tả.
Tạo ra biểu diễn từ giàu ngữ nghĩa hơn.
Huấn luyện nhanh hơn và hiệu quả hơn.
Yêu cầu ít dữ liệu huấn luyện hơn.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 6
Phân loại văn bản thành các chủ đề khác nhau.
Phân tích cảm xúc và thái độ trong văn bản.
Xác định và phân loại các thực thể có tên như người, tổ chức, địa điểm trong văn bản.
Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 7
Phân tích cấu trúc cú pháp của câu để xác định mối quan hệ giữa các từ.
Đếm tần suất xuất hiện của các từ trong toàn bộ tập văn bản.
Dự đoán từ mục tiêu dựa trên các từ ngữ cảnh xung quanh hoặc ngược lại.
Sử dụng mạng nơ-ron tích chập để học biểu diễn từ.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.