Câu hỏi:

20/05/2026 2 Lưu

Kỹ thuật "Stemming" và "Lemmatization" có điểm chung gì trong tiền xử lý văn bản?

A.

Cả hai đều chuyển đổi văn bản thành dạng số

B.

Cả hai đều xác định cấu trúc ngữ pháp của câu

C.

Cả hai đều loại bỏ các từ dừng (stop words) khỏi văn bản

D.

Cả hai đều cố gắng đưa các từ về dạng gốc hoặc dạng cơ bản của chúng

Quảng cáo

Trả lời:

verified Giải bởi Vietjack

Chọn đáp án B

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

A.

Phân tích cảm xúc và thái độ trong văn bản

B.

Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác

C.

Tóm tắt nội dung chính của văn bản

D.

Xác định và phân loại các thực thể có tên trong văn bản, như tên người, tổ chức, địa điểm, thời gian, v.v.

Lời giải

Chọn đáp án D

Câu 2

A.

Xác định chủ đề chính của văn bản

B.

Phân loại văn bản dựa trên tình cảm

C.

Xác định cấu trúc ngữ pháp và mối quan hệ phụ thuộc giữa các từ trong câu

D.

Chuyển đổi văn bản thành dạng số để xử lý bằng máy

Lời giải

Chọn đáp án C

Câu 3

A.

Phân tích cấu trúc cú pháp của câu

B.

Xác định các thực thể có tên trong văn bản

C.

Dự đoán xác suất xuất hiện của một từ hoặc một chuỗi từ trong một ngữ cảnh nhất định

D.

Phân loại văn bản theo chủ đề

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 4

A.

Xác định cảm xúc, thái độ hoặc quan điểm được thể hiện trong văn bản

B.

Dịch văn bản sang ngôn ngữ khác

C.

Tóm tắt văn bản thành các ý chính

D.

Sửa lỗi chính tả và ngữ pháp trong văn bản

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 5

A.

Thay đổi tốc độ sinh văn bản

B.

Điều chỉnh độ dài của văn bản được sinh ra

C.

Kiểm soát tính ngẫu nhiên và đa dạng của văn bản được sinh ra; nhiệt độ cao hơn tạo ra văn bản ngẫu nhiên và sáng tạo hơn

D.

Cải thiện tính nhất quán ngữ pháp của văn bản

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

A.

Mạng nơ-ron hồi quy (Recurrent Neural Networks - RNNs) hoặc Transformer

B.

Mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs)

C.

Mạng tự mã hóa (Autoencoders)

D.

Mạng đối nghịch sinh (Generative Adversarial Networks - GANs)

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 7

A.

Một phương pháp huấn luyện mà trong đó mô hình được yêu cầu dự đoán các từ bị che ngẫu nhiên trong câu; được sử dụng trong BERT

B.

Một phương pháp để tăng cường dữ liệu huấn luyện bằng cách tạo ra các biến thể của câu gốc

C.

Một kỹ thuật để giảm thiểu overfitting bằng cách che giấu một số kết nối nơ-ron

D.

Một phương pháp để đánh giá hiệu suất của mô hình ngôn ngữ bằng cách che giấu một phần văn bản và xem mô hình có thể khôi phục nó tốt đến đâu

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP