Câu hỏi:

20/05/2026 2 Lưu

Mục đích chính của việc 'tách từ' (tokenization) trong NLP là gì?

A.

Giảm kích thước dữ liệu văn bản.

B.

Chia văn bản thành các đơn vị nhỏ hơn, thường là từ hoặc cụm từ, để máy tính có thể xử lý.

C.

Tìm ra chủ đề chính của văn bản.

D.

Chuyển đổi văn bản sang dạng số.

Quảng cáo

Trả lời:

verified Giải bởi Vietjack

Chọn đáp án B

CÂU HỎI HOT CÙNG CHỦ ĐỀ

Câu 1

A.

Phân tích cấu trúc ngữ pháp của câu.

B.

Xác định và phân loại các thực thể có tên riêng trong văn bản (ví dụ: tên người, tổ chức, địa điểm).

C.

Tìm ra mối quan hệ giữa các câu trong văn bản.

D.

Tóm tắt nội dung chính của văn bản.

Lời giải

Chọn đáp án B

Câu 2

A.

Tách từ (Tokenization).

B.

Chuẩn hóa văn bản (Normalization).

C.

Phân tích cảm xúc (Sentiment Analysis).

D.

Loại bỏ stop words.

Lời giải

Chọn đáp án C

Câu 3

A.

Mô hình được huấn luyện mà không cần bất kỳ dữ liệu huấn luyện nào.

B.

Mô hình có khả năng thực hiện các tác vụ hoặc phân loại các lớp mà nó chưa từng được huấn luyện trực tiếp trên dữ liệu của các lớp đó.

C.

Mô hình được huấn luyện trên dữ liệu tổng hợp.

D.

Mô hình chỉ được huấn luyện trên một lượng dữ liệu rất nhỏ.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 4

A.

Các từ mang ý nghĩa quan trọng nhất trong văn bản.

B.

Các từ phổ biến, ít mang lại thông tin ngữ nghĩa trong nhiều ngữ cảnh, và thường được loại bỏ.

C.

Các từ khóa được sử dụng để tìm kiếm thông tin.

D.

Các từ mới xuất hiện gần đây trong ngôn ngữ.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 5

A.

Biểu diễn văn bản dưới dạng đồ thị.

B.

Lưu trữ và quản lý thông tin dưới dạng các thực thể và mối quan hệ giữa chúng, hỗ trợ suy luận và trả lời câu hỏi.

C.

Phân tích mạng xã hội.

D.

Trực quan hóa dữ liệu văn bản.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 6

A.

Phân tích cấu trúc ngữ pháp của câu.

B.

Tìm ra các thực thể có tên riêng trong văn bản.

C.

Chuẩn hóa các từ về dạng gốc của chúng.

D.

Đếm tần suất xuất hiện của các từ trong văn bản.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP

Câu 7

A.

Số lượng từ vựng ít hơn.

B.

Ngữ pháp đơn giản hơn.

C.

Tính đa dạng về phương ngữ và cách diễn đạt vùng miền.

D.

Ít tài liệu và nguồn dữ liệu huấn luyện hơn.

Lời giải

Bạn cần đăng ký gói VIP ( giá chỉ từ 250K ) để làm bài, xem đáp án và lời giải chi tiết không giới hạn.

Nâng cấp VIP