1000+ câu Trắc nghiệm Nhập môn xử lý ngôn ngữ tự nhiên có đáp án

🔥 Học sinh cũng đã học

2 câu bài tập Di tích lịch sử văn hóa (có đáp án)

0 lượt thi 2 câu hỏi

50+ câu Trắc nghiệm Di tích lịch sử văn hóa (có đáp án) - Phần 2

0 lượt thi 30 câu hỏi

50+ câu Trắc nghiệm Di tích lịch sử văn hóa (có đáp án) - Phần 1

0 lượt thi 22 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 8

0 lượt thi 29 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 7

0 lượt thi 30 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 6

0 lượt thi 30 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 5

0 lượt thi 29 câu hỏi

200+ câu Trắc nghiệm Logistics vận tải hàng hóa (có đáp án) - Phần 4

0 lượt thi 29 câu hỏi

Danh sách câu hỏi:

Câu 1/30

Trong xử lý ngôn ngữ tự nhiên (NLP), bước tiền xử lý nào sau đây giúp giảm số chiều dữ liệu và tập trung vào các từ gốc bằng cách loại bỏ các hậu tố và tiền tố?

Tách từ (Tokenization)

Stemming (Cắt gốc từ)

Lemmatization (Lemma hóa)

Loại bỏ từ dừng (Stop word removal)

Lời giải

Chọn đáp án B

Câu 2/30

Mô hình Bag-of-Words (BoW) biểu diễn văn bản bằng cách nào?

Duy trì thứ tự từ và ngữ pháp trong câu

Mã hóa văn bản thành một chuỗi các embedding từ

Đếm tần suất xuất hiện của mỗi từ trong văn bản và bỏ qua thứ tự từ

Phân tích mối quan hệ ngữ nghĩa giữa các từ trong văn bản

Lời giải

Chọn đáp án C

Câu 3/30

Xét bài toán phân loại văn bản, kỹ thuật TF-IDF (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì?

Giảm số chiều của dữ liệu văn bản

Phân tích ngữ nghĩa của văn bản

Tìm kiếm các văn bản tương tự nhau

Đánh trọng số cho các từ trong văn bản dựa trên tần suất xuất hiện trong văn bản hiện tại và toàn bộ tập văn bản

Lời giải

Chọn đáp án D

Câu 4/30

Nhiệm vụ "Named Entity Recognition" (NER) trong NLP nhằm mục đích gì?

Xác định và phân loại các thực thể có tên (ví dụ: người, tổ chức, địa điểm) trong văn bản

Phân tích cảm xúc và thái độ thể hiện trong văn bản

Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác

Tóm tắt nội dung chính của văn bản

Lời giải

Chọn đáp án A

Câu 5/30

Word embedding (ví dụ: Word2Vec, GloVe) là gì và tại sao chúng hữu ích trong NLP?

Phương pháp mã hóa văn bản thành dạng số để máy tính có thể xử lý, giúp tăng tốc độ tính toán

Biểu diễn từ dưới dạng vectơ số trong không gian nhiều chiều, sao cho các từ có nghĩa tương tự nhau thì nằm gần nhau trong không gian vectơ, giúp mô hình hiểu được ngữ nghĩa

Kỹ thuật giảm kích thước dữ liệu văn bản bằng cách loại bỏ các từ ít quan trọng, giúp giảm độ phức tạp của mô hình

Mô hình ngôn ngữ dự đoán từ tiếp theo trong câu, giúp tạo ra văn bản tự nhiên và mạch lạc hơn

Lời giải

Chọn đáp án B

Câu 6/30

Trong các mô hình ngôn ngữ dựa trên mạng nơ-ron (neural network language models), cơ chế "attention" (chú ý) đóng vai trò gì?

A. Tăng tốc độ huấn luyện mô hình bằng cách song song hóa các phép tính

B. Giảm hiện tượng "vanishing gradient" trong quá trình huấn luyện mạng nơ-ron sâu

C. Cho phép mô hình tập trung có chọn lọc vào các phần khác nhau của dữ liệu đầu vào khi đưa ra dự đoán, đặc biệt quan trọng trong xử lý các chuỗi dài

D. Cải thiện khả năng khái quát hóa của mô hình bằng cách thêm nhiễu vào quá trình huấn luyện

Lời giải

Chọn đáp án C

Câu 7/30

Mô hình Transformer, đặc biệt là kiến trúc Transformer, đã cách mạng hóa lĩnh vực NLP như thế nào?

Transformer là mô hình ngôn ngữ đầu tiên sử dụng mạng nơ-ron tích chập (CNN) cho xử lý văn bản

Transformer giới thiệu khái niệm word embedding, giúp biểu diễn từ dưới dạng vectơ số

Transformer loại bỏ hoàn toàn việc sử dụng cơ chế "attention", giúp mô hình đơn giản và hiệu quả hơn

Transformer cho phép xử lý song song các phần của chuỗi đầu vào, khắc phục hạn chế của mạng RNN trong việc xử lý chuỗi dài và mở đường cho các mô hình lớn như BERT, GPT

Lời giải

Chọn đáp án D

Câu 8/30

"Sentiment analysis" (Phân tích cảm xúc) là gì và ứng dụng của nó trong thực tế?

Quá trình chuyển đổi văn bản từ dạng viết sang dạng nói, ứng dụng trong tổng hợp giọng nói

Xác định thái độ, cảm xúc (tích cực, tiêu cực, trung lập) thể hiện trong văn bản, ứng dụng trong đánh giá phản hồi khách hàng, theo dõi dư luận mạng xã hội

Phân loại văn bản theo chủ đề hoặc thể loại, ứng dụng trong tổ chức và quản lý tài liệu

Trích xuất thông tin quan trọng từ văn bản, ứng dụng trong tổng hợp tin tức, tạo báo cáo tự động

Lời giải

Chọn đáp án B

Câu 9/30

"Machine Translation" (Dịch máy) là một bài toán NLP phức tạp. Phương pháp dịch máy dựa trên thống kê (Statistical Machine Translation - SMT) khác biệt như thế nào so với dịch máy nơ-ron (Neural Machine Translation - NMT)?

SMT sử dụng mạng nơ-ron sâu, trong khi NMT dựa trên các mô hình thống kê truyền thống

NMT tập trung vào việc dịch từng từ một, còn SMT dịch cả câu cùng một lúc

SMT dựa trên các mô hình thống kê và quy tắc ngôn ngữ học, trong khi NMT học cách dịch trực tiếp từ dữ liệu song ngữ lớn thông qua mạng nơ-ron

NMT chỉ có thể dịch giữa các ngôn ngữ có cấu trúc tương tự nhau, còn SMT có thể dịch giữa mọi cặp ngôn ngữ

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 10/30

Trong NLP, "parsing" (phân tích cú pháp) là gì và tại sao nó quan trọng?

Quá trình loại bỏ các từ dừng (stop words) khỏi văn bản, giúp giảm nhiễu và tăng hiệu quả xử lý

Phân tích ý nghĩa của từ và cụm từ trong ngữ cảnh, giúp hiểu sâu hơn về nội dung văn bản

Chia văn bản thành các câu hoặc đoạn văn nhỏ hơn để dễ dàng xử lý

Phân tích cấu trúc ngữ pháp của câu, xác định vai trò và mối quan hệ giữa các thành phần câu (chủ ngữ, vị ngữ, tân ngữ...), giúp máy tính hiểu được cấu trúc và ý nghĩa của câu

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 11/30

"Coreference resolution" (Giải quyết đồng tham chiếu) là gì và tại sao nó cần thiết trong NLP?

Xác định các cụm từ (ví dụ: đại từ, danh từ chung) cùng tham chiếu đến một thực thể duy nhất trong văn bản, giúp mô hình hiểu được sự liên kết và mạch lạc của văn bản

Phân loại văn bản theo chủ đề chính, giúp tổ chức và tìm kiếm thông tin hiệu quả hơn

Dịch văn bản sang ngôn ngữ khác một cách chính xác và tự nhiên

Tóm tắt văn bản bằng cách chọn ra các câu quan trọng nhất, giúp tiết kiệm thời gian đọc

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 12/30

Kỹ thuật "topic modeling" (mô hình hóa chủ đề) như Latent Dirichlet Allocation (LDA) được sử dụng để làm gì trong NLP?

Phân tích cảm xúc và thái độ của tác giả văn bản

Khám phá các chủ đề tiềm ẩn trong một tập hợp văn bản lớn và phân loại văn bản theo chủ đề

Dự đoán từ tiếp theo trong một chuỗi văn bản

Nhận dạng và phân loại các thực thể có tên trong văn bản

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 13/30

"Question Answering" (Hỏi đáp tự động) là một lĩnh vực ứng dụng quan trọng của NLP. Hệ thống hỏi đáp tự động (QA system) hoạt động như thế nào?

Hệ thống QA dịch câu hỏi sang ngôn ngữ khác và tìm kiếm câu trả lời trong các văn bản dịch

Hệ thống QA tạo ra câu trả lời mới dựa trên thông tin được học từ tập dữ liệu huấn luyện lớn

Hệ thống QA phân tích câu hỏi và tìm kiếm thông tin liên quan trong một nguồn dữ liệu (ví dụ: tập văn bản, cơ sở tri thức) để trích xuất hoặc tổng hợp câu trả lời

Hệ thống QA sử dụng các quy tắc ngữ pháp và từ vựng để trả lời câu hỏi một cách chính xác

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 14/30

"Text summarization" (Tóm tắt văn bản) có hai phương pháp chính: extractive summarization và abstractive summarization. Sự khác biệt chính giữa hai phương pháp này là gì?

Extractive summarization tạo ra bản tóm tắt ngắn hơn bản gốc, còn abstractive summarization tạo ra bản tóm tắt dài hơn

Abstractive summarization tập trung vào việc tóm tắt các văn bản khoa học, còn extractive summarization phù hợp với văn bản báo chí

Extractive summarization cần dữ liệu huấn luyện song ngữ, còn abstractive summarization chỉ cần dữ liệu đơn ngữ

Extractive summarization chọn lọc và kết hợp các câu hoặc đoạn quan trọng từ văn bản gốc, còn abstractive summarization diễn giải lại và tạo ra bản tóm tắt bằng cách sử dụng từ ngữ và cấu trúc câu mới

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 15/30

Trong ngữ cảnh của mô hình ngôn ngữ, "perplexity" là gì và nó được sử dụng để đánh giá điều gì?

Độ phức tạp tính toán của mô hình ngôn ngữ, đo lường thời gian cần thiết để huấn luyện mô hình

Đo lường khả năng dự đoán của mô hình ngôn ngữ, perplexity thấp hơn cho thấy mô hình dự đoán tốt hơn (ít "bối rối" hơn) về chuỗi văn bản

Số lượng tham số trong mô hình ngôn ngữ, perplexity cao hơn cho thấy mô hình có nhiều tham số hơn

Tỷ lệ lỗi chính tả và ngữ pháp trong văn bản do mô hình ngôn ngữ tạo ra

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 16/30

"Zero-shot learning" trong NLP có nghĩa là gì?

Mô hình học cách dịch giữa hai ngôn ngữ mà không cần dữ liệu song ngữ

Mô hình có thể thực hiện nhiệm vụ phân tích cảm xúc mà không cần bất kỳ dữ liệu huấn luyện nào

Mô hình có khả năng thực hiện các nhiệm vụ hoặc phân loại các đối tượng mà nó chưa từng được huấn luyện trực tiếp trên dữ liệu của nhiệm vụ/đối tượng đó, dựa trên sự hiểu biết về ngôn ngữ và thế giới

Mô hình chỉ sử dụng dữ liệu không nhãn để học biểu diễn ngôn ngữ

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 17/30

"Few-shot learning" khác với "zero-shot learning" như thế nào trong NLP?

Few-shot learning cho phép mô hình học từ một số lượng nhỏ ví dụ huấn luyện cho nhiệm vụ mới, trong khi zero-shot learning không sử dụng bất kỳ ví dụ huấn luyện nào cho nhiệm vụ mới

Zero-shot learning chỉ áp dụng cho các bài toán phân loại văn bản, còn few-shot learning có thể áp dụng cho nhiều loại bài toán NLP khác nhau

Few-shot learning sử dụng mô hình Transformer, còn zero-shot learning sử dụng các mô hình thống kê truyền thống

Không có sự khác biệt nào đáng kể giữa few-shot learning và zero-shot learning

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 18/30

"Knowledge graph" (Đồ thị tri thức) là gì và ứng dụng của nó trong NLP?

Một loại mô hình ngôn ngữ được huấn luyện trên dữ liệu văn bản khổng lồ

Một mạng lưới các thực thể (ví dụ: người, địa điểm, sự kiện) và mối quan hệ giữa chúng, được sử dụng để lưu trữ và truy xuất tri thức, hỗ trợ các ứng dụng như hỏi đáp tự động, suy luận, và khám phá tri thức

Một kỹ thuật giảm chiều dữ liệu văn bản bằng cách loại bỏ các thông tin không liên quan

Một phương pháp đánh giá hiệu suất của mô hình dịch máy

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 19/30

"Dialogue system" (Hệ thống đối thoại) hay "chatbot" là gì và có những loại hệ thống đối thoại nào?

Hệ thống đối thoại là phần mềm dịch văn bản sang ngôn ngữ khác

Hệ thống đối thoại là công cụ phân tích cảm xúc văn bản

Hệ thống đối thoại là phần mềm tương tác với người dùng thông qua ngôn ngữ tự nhiên, có thể phân loại thành hệ thống định hướng nhiệm vụ (task-oriented) và hệ thống trò chuyện phiếm (chit-chat/conversational)

Hệ thống đối thoại là cơ sở dữ liệu lưu trữ tri thức về ngôn ngữ tự nhiên

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 20/30

"Text generation" (Sinh văn bản) là gì và một số ứng dụng của nó?

Quá trình chuyển đổi văn bản từ dạng viết sang dạng nói

Phân tích cấu trúc ngữ pháp của văn bản

Tóm tắt nội dung chính của văn bản

Quá trình tạo ra văn bản mới một cách tự động, ứng dụng trong tạo nội dung tự động, viết email, chatbot, và nhiều ứng dụng khác

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Xem tiếp với tài khoản VIP

Còn 22/30 câu hỏi, đáp án và lời giải chi tiết.

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Lớp 12

Lớp 11

Lớp 10

Ôn vào 10

Lớp 9

Lớp 8

Lớp 7

Lớp 6

Ôn vào 6

Lớp 5

Lớp 4

Lớp 3

Lớp 2

Lớp 1

Đại học

ĐGNL - ĐGTD

Tốt nghiệp THPT

Ôn vào 10

Ôn vào 6

V-ACT

HSA

TSA

SPT

Toán

Văn

Tiếng Anh

Vật lý

Hóa học

Sinh học

Lịch sử

Địa lý

Giáo dục Kinh tế và Pháp luật

Tin học

Công nghệ

Toán

Văn

Tiếng Anh

Hóa học

Lịch sử

Địa lí

Toán

Văn

Toán

Văn

Tiếng Anh

Vật lý

Hóa học

Sinh học

Toán

Văn

Tiếng Anh

Vật lý

Hóa học

Sinh học

Khoa học tự nhiên

Tin học

Lịch sử

Địa lí

Toán

Văn

Tiếng Anh

Khoa học tự nhiên

Lịch sử & Địa lí

Giáo dục công dân

Tin học

Công nghệ

Toán

Tiếng Anh

Khoa học tự nhiên

Lịch sử & Địa lí

Giáo dục công dân

Tin học

Công nghệ

Toán

Văn

Tiếng Anh

Khoa học tự nhiên

Lịch sử & Địa lí

Giáo dục công dân

Tin học