khoahoc.vietjack.com

Câu hỏi:

20/05/2026 40 Lưu

Tokenization trong NLP là quá trình:

A.

Chuyển đổi văn bản thành giọng nói.

B.

Chia văn bản thành các đơn vị nhỏ hơn, ví dụ như từ hoặc cụm từ.

C.

Loại bỏ các từ dừng (stop words) khỏi văn bản.

D.

Gán nhãn từ loại (part-of-speech tagging) cho các từ.

Quảng cáo

Trả lời:

verified Giải bởi Vietjack

Chọn đáp án B

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

A.

Huấn luyện mô hình với rất ít dữ liệu có nhãn.

B.

Huấn luyện mô hình trên dữ liệu đa ngôn ngữ.

C.

Giảm số lượng tham số của mô hình.

D.

Tăng tốc độ huấn luyện mô hình.

Lời giải

Chọn đáp án A

Câu 2

A.

Khả năng ngôn ngữ thay đổi theo thời gian.

B.

Việc một từ hoặc cụm từ có thể có nhiều nghĩa khác nhau.

C.

Sự khác biệt giữa ngôn ngữ nói và ngôn ngữ viết.

D.

Khó khăn trong việc thu thập dữ liệu văn bản đủ lớn.

Lời giải

Chọn đáp án B

Câu 3

A.

Học từ dữ liệu không có nhãn.

B.

Thực hiện tác vụ mà không cần được huấn luyện trực tiếp cho tác vụ đó.

C.

Huấn luyện mô hình trên dữ liệu tổng hợp (synthetic data).

D.

Đưa ra dự đoán với độ chính xác bằng 0.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 4

A.

Các phương pháp cải thiện độ chính xác của mô hình NLP.

B.

Các kỹ thuật tấn công mô hình NLP bằng cách tạo ra các đầu vào được thiết kế đặc biệt để đánh lừa mô hình.

C.

Các phương pháp phát hiện lỗi sai trong dữ liệu văn bản.

D.

Các kỹ thuật tăng cường dữ liệu huấn luyện.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 5

A.

Biểu diễn mối quan hệ ngữ nghĩa giữa các từ.

B.

Biểu diễn cấu trúc cú pháp của một câu.

C.

Biểu diễn các thực thể có tên trong văn bản.

D.

Biểu diễn tần suất xuất hiện của các từ.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

A.

Tự động tạo sinh dữ liệu huấn luyện.

B.

Chọn lọc các mẫu dữ liệu 'thông tin' nhất để con người gán nhãn, nhằm tối ưu hóa hiệu quả huấn luyện.

C.

Huấn luyện mô hình trên dữ liệu từ nhiều nguồn khác nhau.

D.

Sử dụng phản hồi của người dùng để cải thiện mô hình.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 7

A.

Thiết kế phần cứng máy tính.

B.

Tương tác giữa máy tính và ngôn ngữ con người.

C.

Phát triển các thuật toán toán học thuần túy.

D.

Nghiên cứu về tâm lý học hành vi.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP