1000+ câu Trắc nghiệm Nhập môn xử lý ngôn ngữ tự nhiên có đáp án

🔥 Học sinh cũng đã học

2 câu bài tập Di tích lịch sử văn hóa (có đáp án)

0 lượt thi 2 câu hỏi

50+ câu Trắc nghiệm Di tích lịch sử văn hóa (có đáp án) - Phần 2

0 lượt thi 30 câu hỏi

50+ câu Trắc nghiệm Di tích lịch sử văn hóa (có đáp án) - Phần 1

0 lượt thi 22 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 8

0 lượt thi 29 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 7

0 lượt thi 30 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 6

0 lượt thi 30 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 5

0 lượt thi 29 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 4

0 lượt thi 29 câu hỏi

Danh sách câu hỏi:

Câu 1/30

Trong xử lý ngôn ngữ tự nhiên (NLP), quá trình nào liên quan đến việc phân tách văn bản thành các đơn vị nhỏ hơn, chẳng hạn như từ, cụm từ, ký hiệu hoặc các thành phần có ý nghĩa khác?

Token hóa (Tokenization)

Gán nhãn POS (Part-of-Speech Tagging)

Phân tích cú pháp (Parsing)

Chuẩn hóa văn bản (Text Normalization)

Lời giải

Chọn đáp án A

Câu 2/30

Xét câu: "Tôi rất thích bộ phim này, nhưng hơi dài.". Phân tích tình cảm (Sentiment Analysis) ở mức độ câu văn bản này sẽ đưa ra kết quả gì?

A. Tích cực

B. Trung tính

C. Tiêu cực

D. Không xác định

Lời giải

Chọn đáp án A

Câu 3/30

Phương pháp "Bag-of-Words" (BoW) biểu diễn văn bản bằng cách nào?

Biểu diễn văn bản dưới dạng đồ thị quan hệ giữa các từ.

Biểu diễn văn bản bằng cách mã hóa vị trí tương đối của các từ.

Biểu diễn văn bản dựa trên tần suất xuất hiện của mỗi từ trong toàn bộ văn bản.

Biểu diễn văn bản bằng cách sử dụng mạng nơ-ron để học ngữ nghĩa.

Lời giải

Chọn đáp án C

Câu 4/30

Trong các mô hình ngôn ngữ n-gram, điều gì quyết định kích thước của "n"?

Số lượng từ vựng trong tập dữ liệu huấn luyện.

Độ dài trung bình của câu trong văn bản.

Số lượng lớp ẩn trong mạng nơ-ron của mô hình.

Số lượng từ liên tiếp được xem xét để dự đoán từ tiếp theo.

Lời giải

Chọn đáp án D

Câu 5/30

Word2Vec và GloVe là những kỹ thuật gì trong NLP?

Kỹ thuật phân tích cú pháp câu.

Kỹ thuật biểu diễn từ dưới dạng vectơ (word embeddings).

Kỹ thuật giảm chiều dữ liệu văn bản.

Kỹ thuật sinh văn bản tự động.

Lời giải

Chọn đáp án B

Câu 6/30

Mục đích chính của việc sử dụng "stop words" (từ dừng) trong tiền xử lý văn bản là gì?

Tăng cường tính đa dạng từ vựng trong văn bản.

Đảm bảo tính chính xác ngữ pháp của văn bản.

Giảm kích thước dữ liệu và loại bỏ các từ phổ biến không mang nhiều thông tin ngữ nghĩa.

Chuẩn hóa cách viết của các từ trong văn bản.

Lời giải

Chọn đáp án C

Câu 7/30

Trong nhiệm vụ Nhận dạng Thực thể Có tên (Named Entity Recognition - NER), mục tiêu là gì?

Phân loại văn bản theo chủ đề.

Phân tích cảm xúc và thái độ trong văn bản.

Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

Xác định và phân loại các thực thể có tên (ví dụ: người, tổ chức, địa điểm) trong văn bản.

Lời giải

Chọn đáp án D

Câu 8/30

Kỹ thuật "stemming" (gốc từ) và "lemmatization" (từ gốc) có điểm chung nào?

Cả hai đều nhằm mục đích giảm các từ về dạng gốc của chúng.

Cả hai đều sử dụng từ điển để tra cứu dạng gốc của từ.

Cả hai đều loại bỏ hoàn toàn hậu tố và tiền tố của từ.

Cả hai đều giữ lại tất cả các dạng biến thể của từ để phân tích.

Lời giải

Chọn đáp án A

Câu 9/30

Mô hình Transformer, được sử dụng rộng rãi trong NLP, dựa trên cơ chế chính nào?

Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN).

Cơ chế tự chú ý (Self-attention).

Mạng nơ-ron tích chập (Convolutional Neural Network - CNN).

Mô hình Markov ẩn (Hidden Markov Model - HMM).

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 10/30

Trong bài toán dịch máy (Machine Translation), BLEU score được sử dụng để làm gì?

Đo tốc độ dịch của mô hình.

Đánh giá khả năng hiểu ngôn ngữ nguồn của mô hình.

Đo mức độ tương đồng giữa bản dịch của mô hình với bản dịch tham khảo.

Xác định ngôn ngữ nguồn và ngôn ngữ đích của văn bản.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 11/30

Phân tích cú pháp phụ thuộc (Dependency Parsing) trong NLP tập trung vào việc xác định điều gì?

Mối quan hệ phụ thuộc giữa các từ trong câu.

Cấu trúc ngữ pháp tổng thể của câu.

Ý nghĩa ngữ nghĩa của từng từ trong câu.

Loại từ (part-of-speech) của mỗi từ trong câu.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 12/30

Kỹ thuật "TF-IDF" (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì?

Phân cụm các văn bản tương tự nhau.

Đánh giá tầm quan trọng của từ trong một văn bản so với toàn bộ tập văn bản.

Giảm số chiều của dữ liệu văn bản.

Tăng cường tính biểu cảm của văn bản.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 13/30

Mạng nơ-ron hồi quy (RNN) đặc biệt phù hợp với việc xử lý loại dữ liệu nào?

Dữ liệu hình ảnh tĩnh.

Dữ liệu dạng bảng.

Dữ liệu âm thanh độc lập.

Dữ liệu chuỗi tuần tự (ví dụ: văn bản, chuỗi thời gian).

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 14/30

"Contextual word embeddings" (ví dụ: BERT, ELMo) khác biệt so với "static word embeddings" (ví dụ: Word2Vec, GloVe) như thế nào?

Contextual embeddings có kích thước vectơ cố định, static embeddings thì thay đổi.

Static embeddings учитывают ngữ cảnh của từ, contextual embeddings thì không.

Contextual embeddings tạo ra biểu diễn khác nhau cho cùng một từ tùy thuộc vào ngữ cảnh sử dụng, static embeddings thì tạo ra biểu diễn cố định.

Static embeddings yêu cầu lượng dữ liệu huấn luyện lớn hơn contextual embeddings.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 15/30

Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của NLP?

Trợ lý ảo (Chatbots).

Phân tích và nhận diện hình ảnh.

Phân tích tình cảm trên mạng xã hội.

Dịch máy tự động.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 16/30

"Fine-tuning" (tinh chỉnh) một mô hình ngôn ngữ tiền huấn luyện (pre-trained language model) là gì?

Huấn luyện mô hình ngôn ngữ từ đầu với dữ liệu lớn.

Sử dụng mô hình ngôn ngữ đã huấn luyện sẵn mà không cần điều chỉnh gì thêm.

Nén kích thước của mô hình ngôn ngữ để triển khai hiệu quả hơn.

Huấn luyện tiếp mô hình ngôn ngữ tiền huấn luyện trên một tập dữ liệu nhỏ hơn, cụ thể cho một nhiệm vụ nhất định.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 17/30

Khi xử lý văn bản tiếng Việt, điều gì cần đặc biệt lưu ý so với tiếng Anh?

Tiếng Việt có số lượng từ vựng ít hơn tiếng Anh.

Tiếng Việt có cấu trúc ngữ pháp đơn giản hơn tiếng Anh.

Tiếng Việt là ngôn ngữ đơn lập, có thanh điệu và không có dạng biến tố, đòi hỏi các phương pháp xử lý đặc thù.

Các công cụ NLP cho tiếng Việt phát triển hơn tiếng Anh.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 18/30

Trong ngữ cảnh của chatbot, "intent recognition" (nhận diện ý định) là gì?

Quá trình tạo ra câu trả lời tự động từ chatbot.

Quá trình xác định mục đích hoặc ý định của người dùng dựa trên câu nói của họ.

Quá trình chuyển đổi văn bản thành giọng nói trong chatbot.

Quá trình ghi nhớ lịch sử hội thoại của người dùng với chatbot.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 19/30

"Zero-shot learning" trong NLP có nghĩa là gì?

Huấn luyện mô hình NLP với dữ liệu không nhãn.

Huấn luyện mô hình NLP chỉ với một lượng nhỏ dữ liệu.

Khả năng của mô hình NLP thực hiện nhiệm vụ trên các lớp hoặc nhãn mà nó chưa từng được huấn luyện trực tiếp.

Khả năng của mô hình NLP tự động sửa lỗi chính tả trong văn bản.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 20/30

Phương pháp "back-translation" (dịch ngược) được sử dụng để làm gì trong NLP?

Tăng cường dữ liệu huấn luyện cho các mô hình dịch máy bằng cách tạo ra các biến thể của dữ liệu gốc.

Đánh giá chất lượng của mô hình dịch máy.

Cải thiện khả năng hiểu ngôn ngữ nguồn của mô hình NLP.

Giảm độ phức tạp tính toán của mô hình dịch máy.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Xem tiếp với tài khoản VIP

Còn 22/30 câu hỏi, đáp án và lời giải chi tiết.

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Lớp 12

Lớp 11

Lớp 10

Ôn vào 10

Lớp 9

Lớp 8

Lớp 7

Lớp 6

Ôn vào 6

Lớp 5

Lớp 4

Lớp 3

Lớp 2

Lớp 1

Đại học

ĐGNL - ĐGTD

Tốt nghiệp THPT

Ôn vào 10

Ôn vào 6

V-ACT

HSA

TSA

SPT

Toán

Văn

Tiếng Anh

Vật lý

Hóa học

Sinh học

Lịch sử

Địa lý

Giáo dục Kinh tế và Pháp luật

Tin học

Công nghệ

Toán

Văn

Tiếng Anh

Hóa học

Lịch sử

Địa lí

Toán

Văn

Toán

Văn

Tiếng Anh

Vật lý

Hóa học

Sinh học

Toán

Văn

Tiếng Anh

Vật lý

Hóa học

Sinh học

Khoa học tự nhiên

Tin học

Lịch sử

Địa lí

Toán

Văn

Tiếng Anh

Khoa học tự nhiên

Lịch sử & Địa lí

Giáo dục công dân

Tin học

Công nghệ

Toán

Tiếng Anh

Khoa học tự nhiên

Lịch sử & Địa lí

Giáo dục công dân

Tin học

Công nghệ

Toán

Văn

Tiếng Anh

Khoa học tự nhiên

Lịch sử & Địa lí

Giáo dục công dân

Tin học