1000+ câu Trắc nghiệm Nhập môn xử lý ngôn ngữ tự nhiên có đáp án - Phần 26
6 người thi tuần này 4.6 198 lượt thi 30 câu hỏi
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
🔥 Học sinh cũng đã học
10+ câu trắc nghiệm Đánh giá tác động môi trường có đáp án
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 6
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 5
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 4
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 3
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 2
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 1
Danh sách câu hỏi:
Câu 1/30
Token hóa (Tokenization)
Gán nhãn POS (Part-of-Speech Tagging)
Phân tích cú pháp (Parsing)
Chuẩn hóa văn bản (Text Normalization)
Lời giải
Chọn đáp án A
Câu 2/30
A. Tích cực
B. Trung tính
C. Tiêu cực
Lời giải
Chọn đáp án A
Câu 3/30
Biểu diễn văn bản dưới dạng đồ thị quan hệ giữa các từ.
Biểu diễn văn bản bằng cách mã hóa vị trí tương đối của các từ.
Biểu diễn văn bản dựa trên tần suất xuất hiện của mỗi từ trong toàn bộ văn bản.
Biểu diễn văn bản bằng cách sử dụng mạng nơ-ron để học ngữ nghĩa.
Lời giải
Chọn đáp án C
Câu 4/30
Số lượng từ vựng trong tập dữ liệu huấn luyện.
Độ dài trung bình của câu trong văn bản.
Số lượng lớp ẩn trong mạng nơ-ron của mô hình.
Số lượng từ liên tiếp được xem xét để dự đoán từ tiếp theo.
Lời giải
Chọn đáp án D
Câu 5/30
Kỹ thuật phân tích cú pháp câu.
Kỹ thuật biểu diễn từ dưới dạng vectơ (word embeddings).
Kỹ thuật giảm chiều dữ liệu văn bản.
Kỹ thuật sinh văn bản tự động.
Lời giải
Chọn đáp án B
Câu 6/30
Tăng cường tính đa dạng từ vựng trong văn bản.
Đảm bảo tính chính xác ngữ pháp của văn bản.
Giảm kích thước dữ liệu và loại bỏ các từ phổ biến không mang nhiều thông tin ngữ nghĩa.
Chuẩn hóa cách viết của các từ trong văn bản.
Lời giải
Chọn đáp án C
Câu 7/30
Phân loại văn bản theo chủ đề.
Phân tích cảm xúc và thái độ trong văn bản.
Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
Xác định và phân loại các thực thể có tên (ví dụ: người, tổ chức, địa điểm) trong văn bản.
Lời giải
Chọn đáp án D
Câu 8/30
Cả hai đều nhằm mục đích giảm các từ về dạng gốc của chúng.
Cả hai đều sử dụng từ điển để tra cứu dạng gốc của từ.
Cả hai đều loại bỏ hoàn toàn hậu tố và tiền tố của từ.
Cả hai đều giữ lại tất cả các dạng biến thể của từ để phân tích.
Lời giải
Chọn đáp án A
Câu 9/30
Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN).
Cơ chế tự chú ý (Self-attention).
Mạng nơ-ron tích chập (Convolutional Neural Network - CNN).
Mô hình Markov ẩn (Hidden Markov Model - HMM).
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 10/30
Đo tốc độ dịch của mô hình.
Đánh giá khả năng hiểu ngôn ngữ nguồn của mô hình.
Đo mức độ tương đồng giữa bản dịch của mô hình với bản dịch tham khảo.
Xác định ngôn ngữ nguồn và ngôn ngữ đích của văn bản.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 11/30
Mối quan hệ phụ thuộc giữa các từ trong câu.
Cấu trúc ngữ pháp tổng thể của câu.
Ý nghĩa ngữ nghĩa của từng từ trong câu.
Loại từ (part-of-speech) của mỗi từ trong câu.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 12/30
Phân cụm các văn bản tương tự nhau.
Đánh giá tầm quan trọng của từ trong một văn bản so với toàn bộ tập văn bản.
Giảm số chiều của dữ liệu văn bản.
Tăng cường tính biểu cảm của văn bản.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 13/30
Dữ liệu hình ảnh tĩnh.
Dữ liệu dạng bảng.
Dữ liệu âm thanh độc lập.
Dữ liệu chuỗi tuần tự (ví dụ: văn bản, chuỗi thời gian).
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 14/30
Contextual embeddings có kích thước vectơ cố định, static embeddings thì thay đổi.
Static embeddings учитывают ngữ cảnh của từ, contextual embeddings thì không.
Contextual embeddings tạo ra biểu diễn khác nhau cho cùng một từ tùy thuộc vào ngữ cảnh sử dụng, static embeddings thì tạo ra biểu diễn cố định.
Static embeddings yêu cầu lượng dữ liệu huấn luyện lớn hơn contextual embeddings.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 15/30
Trợ lý ảo (Chatbots).
Phân tích và nhận diện hình ảnh.
Phân tích tình cảm trên mạng xã hội.
Dịch máy tự động.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 16/30
Huấn luyện mô hình ngôn ngữ từ đầu với dữ liệu lớn.
Sử dụng mô hình ngôn ngữ đã huấn luyện sẵn mà không cần điều chỉnh gì thêm.
Nén kích thước của mô hình ngôn ngữ để triển khai hiệu quả hơn.
Huấn luyện tiếp mô hình ngôn ngữ tiền huấn luyện trên một tập dữ liệu nhỏ hơn, cụ thể cho một nhiệm vụ nhất định.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 17/30
Tiếng Việt có số lượng từ vựng ít hơn tiếng Anh.
Tiếng Việt có cấu trúc ngữ pháp đơn giản hơn tiếng Anh.
Tiếng Việt là ngôn ngữ đơn lập, có thanh điệu và không có dạng biến tố, đòi hỏi các phương pháp xử lý đặc thù.
Các công cụ NLP cho tiếng Việt phát triển hơn tiếng Anh.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 18/30
Quá trình tạo ra câu trả lời tự động từ chatbot.
Quá trình xác định mục đích hoặc ý định của người dùng dựa trên câu nói của họ.
Quá trình chuyển đổi văn bản thành giọng nói trong chatbot.
Quá trình ghi nhớ lịch sử hội thoại của người dùng với chatbot.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 19/30
Huấn luyện mô hình NLP với dữ liệu không nhãn.
Huấn luyện mô hình NLP chỉ với một lượng nhỏ dữ liệu.
Khả năng của mô hình NLP thực hiện nhiệm vụ trên các lớp hoặc nhãn mà nó chưa từng được huấn luyện trực tiếp.
Khả năng của mô hình NLP tự động sửa lỗi chính tả trong văn bản.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 20/30
Tăng cường dữ liệu huấn luyện cho các mô hình dịch máy bằng cách tạo ra các biến thể của dữ liệu gốc.
Đánh giá chất lượng của mô hình dịch máy.
Cải thiện khả năng hiểu ngôn ngữ nguồn của mô hình NLP.
Giảm độ phức tạp tính toán của mô hình dịch máy.
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Xem tiếp với tài khoản VIP
Còn 22/30 câu hỏi, đáp án và lời giải chi tiết.
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.