1000+ câu Trắc nghiệm Nhập môn xử lý ngôn ngữ tự nhiên có đáp án - Phần 27
7 người thi tuần này 4.6 198 lượt thi 30 câu hỏi
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
🔥 Học sinh cũng đã học
10+ câu trắc nghiệm Đánh giá tác động môi trường có đáp án
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 6
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 5
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 4
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 3
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 2
1000+ câu Trắc nghiệm Hệ điều hành Windows Server có đáp án - Phần 1
Danh sách câu hỏi:
Câu 1/30
Tách từ (Tokenization)
Stemming (Cắt gốc từ)
Lemmatization (Lemma hóa)
Loại bỏ từ dừng (Stop word removal)
Lời giải
Chọn đáp án B
Câu 2/30
Duy trì thứ tự từ và ngữ pháp trong câu
Mã hóa văn bản thành một chuỗi các embedding từ
Đếm tần suất xuất hiện của mỗi từ trong văn bản và bỏ qua thứ tự từ
Phân tích mối quan hệ ngữ nghĩa giữa các từ trong văn bản
Lời giải
Chọn đáp án C
Câu 3/30
Giảm số chiều của dữ liệu văn bản
Phân tích ngữ nghĩa của văn bản
Tìm kiếm các văn bản tương tự nhau
Đánh trọng số cho các từ trong văn bản dựa trên tần suất xuất hiện trong văn bản hiện tại và toàn bộ tập văn bản
Lời giải
Chọn đáp án D
Câu 4/30
Xác định và phân loại các thực thể có tên (ví dụ: người, tổ chức, địa điểm) trong văn bản
Phân tích cảm xúc và thái độ thể hiện trong văn bản
Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác
Tóm tắt nội dung chính của văn bản
Lời giải
Chọn đáp án A
Câu 5/30
Phương pháp mã hóa văn bản thành dạng số để máy tính có thể xử lý, giúp tăng tốc độ tính toán
Biểu diễn từ dưới dạng vectơ số trong không gian nhiều chiều, sao cho các từ có nghĩa tương tự nhau thì nằm gần nhau trong không gian vectơ, giúp mô hình hiểu được ngữ nghĩa
Kỹ thuật giảm kích thước dữ liệu văn bản bằng cách loại bỏ các từ ít quan trọng, giúp giảm độ phức tạp của mô hình
Mô hình ngôn ngữ dự đoán từ tiếp theo trong câu, giúp tạo ra văn bản tự nhiên và mạch lạc hơn
Lời giải
Chọn đáp án B
Câu 6/30
Lời giải
Chọn đáp án C
Câu 7/30
Transformer là mô hình ngôn ngữ đầu tiên sử dụng mạng nơ-ron tích chập (CNN) cho xử lý văn bản
Transformer giới thiệu khái niệm word embedding, giúp biểu diễn từ dưới dạng vectơ số
Transformer loại bỏ hoàn toàn việc sử dụng cơ chế "attention", giúp mô hình đơn giản và hiệu quả hơn
Transformer cho phép xử lý song song các phần của chuỗi đầu vào, khắc phục hạn chế của mạng RNN trong việc xử lý chuỗi dài và mở đường cho các mô hình lớn như BERT, GPT
Lời giải
Chọn đáp án D
Câu 8/30
Quá trình chuyển đổi văn bản từ dạng viết sang dạng nói, ứng dụng trong tổng hợp giọng nói
Xác định thái độ, cảm xúc (tích cực, tiêu cực, trung lập) thể hiện trong văn bản, ứng dụng trong đánh giá phản hồi khách hàng, theo dõi dư luận mạng xã hội
Phân loại văn bản theo chủ đề hoặc thể loại, ứng dụng trong tổ chức và quản lý tài liệu
Trích xuất thông tin quan trọng từ văn bản, ứng dụng trong tổng hợp tin tức, tạo báo cáo tự động
Lời giải
Chọn đáp án B
Câu 9/30
SMT sử dụng mạng nơ-ron sâu, trong khi NMT dựa trên các mô hình thống kê truyền thống
NMT tập trung vào việc dịch từng từ một, còn SMT dịch cả câu cùng một lúc
SMT dựa trên các mô hình thống kê và quy tắc ngôn ngữ học, trong khi NMT học cách dịch trực tiếp từ dữ liệu song ngữ lớn thông qua mạng nơ-ron
NMT chỉ có thể dịch giữa các ngôn ngữ có cấu trúc tương tự nhau, còn SMT có thể dịch giữa mọi cặp ngôn ngữ
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 10/30
Quá trình loại bỏ các từ dừng (stop words) khỏi văn bản, giúp giảm nhiễu và tăng hiệu quả xử lý
Phân tích ý nghĩa của từ và cụm từ trong ngữ cảnh, giúp hiểu sâu hơn về nội dung văn bản
Chia văn bản thành các câu hoặc đoạn văn nhỏ hơn để dễ dàng xử lý
Phân tích cấu trúc ngữ pháp của câu, xác định vai trò và mối quan hệ giữa các thành phần câu (chủ ngữ, vị ngữ, tân ngữ...), giúp máy tính hiểu được cấu trúc và ý nghĩa của câu
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 11/30
Xác định các cụm từ (ví dụ: đại từ, danh từ chung) cùng tham chiếu đến một thực thể duy nhất trong văn bản, giúp mô hình hiểu được sự liên kết và mạch lạc của văn bản
Phân loại văn bản theo chủ đề chính, giúp tổ chức và tìm kiếm thông tin hiệu quả hơn
Dịch văn bản sang ngôn ngữ khác một cách chính xác và tự nhiên
Tóm tắt văn bản bằng cách chọn ra các câu quan trọng nhất, giúp tiết kiệm thời gian đọc
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 12/30
Phân tích cảm xúc và thái độ của tác giả văn bản
Khám phá các chủ đề tiềm ẩn trong một tập hợp văn bản lớn và phân loại văn bản theo chủ đề
Dự đoán từ tiếp theo trong một chuỗi văn bản
Nhận dạng và phân loại các thực thể có tên trong văn bản
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 13/30
Hệ thống QA dịch câu hỏi sang ngôn ngữ khác và tìm kiếm câu trả lời trong các văn bản dịch
Hệ thống QA tạo ra câu trả lời mới dựa trên thông tin được học từ tập dữ liệu huấn luyện lớn
Hệ thống QA phân tích câu hỏi và tìm kiếm thông tin liên quan trong một nguồn dữ liệu (ví dụ: tập văn bản, cơ sở tri thức) để trích xuất hoặc tổng hợp câu trả lời
Hệ thống QA sử dụng các quy tắc ngữ pháp và từ vựng để trả lời câu hỏi một cách chính xác
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 14/30
Extractive summarization tạo ra bản tóm tắt ngắn hơn bản gốc, còn abstractive summarization tạo ra bản tóm tắt dài hơn
Abstractive summarization tập trung vào việc tóm tắt các văn bản khoa học, còn extractive summarization phù hợp với văn bản báo chí
Extractive summarization cần dữ liệu huấn luyện song ngữ, còn abstractive summarization chỉ cần dữ liệu đơn ngữ
Extractive summarization chọn lọc và kết hợp các câu hoặc đoạn quan trọng từ văn bản gốc, còn abstractive summarization diễn giải lại và tạo ra bản tóm tắt bằng cách sử dụng từ ngữ và cấu trúc câu mới
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 15/30
Độ phức tạp tính toán của mô hình ngôn ngữ, đo lường thời gian cần thiết để huấn luyện mô hình
Đo lường khả năng dự đoán của mô hình ngôn ngữ, perplexity thấp hơn cho thấy mô hình dự đoán tốt hơn (ít "bối rối" hơn) về chuỗi văn bản
Số lượng tham số trong mô hình ngôn ngữ, perplexity cao hơn cho thấy mô hình có nhiều tham số hơn
Tỷ lệ lỗi chính tả và ngữ pháp trong văn bản do mô hình ngôn ngữ tạo ra
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 16/30
Mô hình học cách dịch giữa hai ngôn ngữ mà không cần dữ liệu song ngữ
Mô hình có thể thực hiện nhiệm vụ phân tích cảm xúc mà không cần bất kỳ dữ liệu huấn luyện nào
Mô hình có khả năng thực hiện các nhiệm vụ hoặc phân loại các đối tượng mà nó chưa từng được huấn luyện trực tiếp trên dữ liệu của nhiệm vụ/đối tượng đó, dựa trên sự hiểu biết về ngôn ngữ và thế giới
Mô hình chỉ sử dụng dữ liệu không nhãn để học biểu diễn ngôn ngữ
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 17/30
Few-shot learning cho phép mô hình học từ một số lượng nhỏ ví dụ huấn luyện cho nhiệm vụ mới, trong khi zero-shot learning không sử dụng bất kỳ ví dụ huấn luyện nào cho nhiệm vụ mới
Zero-shot learning chỉ áp dụng cho các bài toán phân loại văn bản, còn few-shot learning có thể áp dụng cho nhiều loại bài toán NLP khác nhau
Few-shot learning sử dụng mô hình Transformer, còn zero-shot learning sử dụng các mô hình thống kê truyền thống
Không có sự khác biệt nào đáng kể giữa few-shot learning và zero-shot learning
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 18/30
Một loại mô hình ngôn ngữ được huấn luyện trên dữ liệu văn bản khổng lồ
Một mạng lưới các thực thể (ví dụ: người, địa điểm, sự kiện) và mối quan hệ giữa chúng, được sử dụng để lưu trữ và truy xuất tri thức, hỗ trợ các ứng dụng như hỏi đáp tự động, suy luận, và khám phá tri thức
Một kỹ thuật giảm chiều dữ liệu văn bản bằng cách loại bỏ các thông tin không liên quan
Một phương pháp đánh giá hiệu suất của mô hình dịch máy
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 19/30
Hệ thống đối thoại là phần mềm dịch văn bản sang ngôn ngữ khác
Hệ thống đối thoại là công cụ phân tích cảm xúc văn bản
Hệ thống đối thoại là phần mềm tương tác với người dùng thông qua ngôn ngữ tự nhiên, có thể phân loại thành hệ thống định hướng nhiệm vụ (task-oriented) và hệ thống trò chuyện phiếm (chit-chat/conversational)
Hệ thống đối thoại là cơ sở dữ liệu lưu trữ tri thức về ngôn ngữ tự nhiên
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 20/30
Quá trình chuyển đổi văn bản từ dạng viết sang dạng nói
Phân tích cấu trúc ngữ pháp của văn bản
Tóm tắt nội dung chính của văn bản
Quá trình tạo ra văn bản mới một cách tự động, ứng dụng trong tạo nội dung tự động, viết email, chatbot, và nhiều ứng dụng khác
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Xem tiếp với tài khoản VIP
Còn 22/30 câu hỏi, đáp án và lời giải chi tiết.
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.