Trong quá trình huấn luyện mô hình ngôn ngữ, "Masked Language Modeling" (mô hình hóa ngôn ngữ che mặt nạ) là gì và nó được sử dụng trong mô hình nào nổi tiếng?
Một phương pháp huấn luyện mà trong đó mô hình được yêu cầu dự đoán các từ bị che ngẫu nhiên trong câu; được sử dụng trong BERT
Một phương pháp để tăng cường dữ liệu huấn luyện bằng cách tạo ra các biến thể của câu gốc
Một kỹ thuật để giảm thiểu overfitting bằng cách che giấu một số kết nối nơ-ron
Một phương pháp để đánh giá hiệu suất của mô hình ngôn ngữ bằng cách che giấu một phần văn bản và xem mô hình có thể khôi phục nó tốt đến đâu
Quảng cáo
Trả lời:
Chọn đáp án A
Hot: 1000+ Đề thi cuối kì 2 file word cấu trúc mới 2026 Toán, Văn, Anh... lớp 1-12 (chỉ từ 60k). Tải ngay
CÂU HỎI HOT CÙNG CHỦ ĐỀ
Câu 1
Lemmatization
Tokenization
Stemming
Parsing
Lời giải
Chọn đáp án B
Câu 2
Phân tích cấu trúc cú pháp của câu
Xác định các thực thể có tên trong văn bản
Dự đoán xác suất xuất hiện của một từ hoặc một chuỗi từ trong một ngữ cảnh nhất định
Phân loại văn bản theo chủ đề
Lời giải
Chọn đáp án C
Câu 3
Thay đổi tốc độ sinh văn bản
Điều chỉnh độ dài của văn bản được sinh ra
Kiểm soát tính ngẫu nhiên và đa dạng của văn bản được sinh ra; nhiệt độ cao hơn tạo ra văn bản ngẫu nhiên và sáng tạo hơn
Cải thiện tính nhất quán ngữ pháp của văn bản
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 4
Stemming
Lemmatization
Sử dụng Byte-Pair Encoding (BPE) hoặc WordPiece
Loại bỏ các từ hiếm gặp khỏi văn bản
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 5
Cả hai đều chuyển đổi văn bản thành dạng số
Cả hai đều xác định cấu trúc ngữ pháp của câu
Cả hai đều loại bỏ các từ dừng (stop words) khỏi văn bản
Cả hai đều cố gắng đưa các từ về dạng gốc hoặc dạng cơ bản của chúng
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 6
Word2Vec sử dụng ma trận đồng xuất hiện toàn cục, trong khi GloVe sử dụng cửa sổ trượt
GloVe dựa trên mạng nơ-ron, còn Word2Vec dựa trên phân tích ma trận
Word2Vec chỉ học được ngữ nghĩa, còn GloVe học được cả ngữ nghĩa và cú pháp
Word2Vec dự đoán ngữ cảnh từ từ trung tâm hoặc ngược lại, trong khi GloVe trực tiếp học các vectơ từ dựa trên ma trận đồng xuất hiện toàn cục
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.
Câu 7
Một tập hợp không có thứ tự các từ, trong đó chỉ quan tâm đến tần suất xuất hiện của mỗi từ
Một chuỗi các vectơ từ được sắp xếp theo thứ tự xuất hiện trong văn bản
Một đồ thị biểu diễn mối quan hệ ngữ nghĩa giữa các từ
Một cây cú pháp thể hiện cấu trúc câu
Lời giải
Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.