Đề thi thử đánh giá tư duy Đại học Bách khoa Hà Nội năm 2024 có đáp án (Đề 13)

  • 29 lượt thi

  • 60 câu hỏi

  • 150 phút

Câu 1:

Đọc văn bản sau và trả lời các câu hỏi từ 1 đến 10: 

NGHIÊN CỨU THUẬT TOÁN PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG DỰA TRÊN THỊ GIÁC MÁY TÍNH

[1] Có thể thấy, tắc nghẽn giao thông làm lãng phí thời gian, tiêu hao nhiên liệu và ô nhiễm môi trường; theo khảo sát năm 2020 thì chi phí do tắc nghẽn gây ra ở các thành phố lớn của Việt Nam là 1 - 2,3 tỉ USD mỗi năm. Trước những ảnh hưởng nghiêm trọng của tắc nghẽn giao thông, ngày càng nhiều các biện pháp được nghiên cứu và áp dụng, việc ứng dụng khoa học máy tính càng được chú ý nhiều hơn. Các nhà nghiên cứu tại Phòng thí nghiệm Oak Ridge đã sử dụng trí tuệ nhân tạo (AI) và máy học (Machine Learing) để thiết kế hệ thống thị giác máy tính thu thập và xử lý dữ liệu nhận được từ các camera giao thông giúp tránh xung đột tại các giao lộ, đồng thời giảm thiểu tổng lượng tiêu hao nhiên liệu. Thông qua việc nhận diện và phân loại phương tiện giao thông tại Việt Nam, hệ thống sẽ xác định số lượng phương tiện và tính toán mật độ lưu thông trên đường trong một khoảng thời gian xác định và từ đó đưa các dự báo cần thiết.

[2] Yolo là một mô hình mạng neural tích chập (CNN) dùng cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các lớp phức tạp (convolutional layers) cho phép trích xuất ra các đặc tính của ảnh và lớp kết nối (connected layers) dự đoán ra xác suất đó và tọa độ của đối tượng. Yolo phân chia hình ảnh thành một mạng lưới 7x7 ô (grid size=7x7). Từ đó sẽ dự đoán xem trong mỗi ô liệu có đối tượng (object) mà điểm trung tâm rơi vào ô đó không, dự đoán điểm trung tâm, kích thước của đối tượng và xác suất là đối tượng nào trong số các đối tượng cần xác định. Mỗi ô này có trách nhiệm dự đoán hai hộp (boxes number=2) bao quanh, mỗi một hộp mô tả hình chữ nhật bao quanh một đối tượng. Hiện nay phiên bản đang được sử dụng là thế hệ thứ 4, gọi là Yolov4. 

[3] Sort là sự phát triển của khung theo dõi nhiều đối tượng trực quan dựa trên các kỹ thuật ước lượng trạng thái và liên kết dữ liệu thô. Sort là một thuật toán thuộc dạng theo dõi và phát hiện (Tracking-by-detection), được thiết kế cho các ứng dụng theo dõi thời gian thực và phương pháp này tạo ra nhận dạng đối tượng một cách nhanh chóng. Một đặc điểm của lớp các thuật toán Tracking-by- detection là tách đối tượng cần xác định ra như một bài toán riêng biệt và cố gắng tối ưu kết quả trong bài toán này. Công việc sau đó là tìm cách liên kết các hộp giới hạn thu được ở mỗi khung và gán ID cho từng đối tượng. 

[4] Nghiên cứu sẽ dựa trên thuật toán xác định vật thể của Yolo, thuật toán theo dõi vật thể của SORT, từ đó gán địa chỉ nhận dạng ID cho từng phương tiện lưu thông và phân loại chúng, xác định số lượng xe theo từng khoảng thời gian cụ thể. Các phương tiện được gán địa chỉ ở đây là: xe ô tô, xe tải, xe buýt, xe máy và xe đạp. Mở luồng video trực tiếp từ camera và tiến hành xử lý từng khung hình. Sau quá trình khởi tạo thư viện, khởi tạo các biến và chạy mô hình thuật toán Yolov4, tiến hành phát luồng video trực tiếp từ camera hoặc lựa chọn các tệp video. Từng khung hình sẽ được chụp và kiểm tra theo vòng lặp while, nếu khung đọc được không chính xác, vòng lặp sẽ bị phá vỡ. Do góc nhìn camera ở mỗi đoạn đường được thiết lập là khác nhau nên nhóm nghiên cứu đã tạo ra các điểm chọn thủ công để thiết lập vùng nhận diện nhất định trên toàn bộ khung hình, giúp cho thuật toán tối ưu hơn, loại bỏ các vùng không chứa phương tiện lưu thông.

[5] Sau quá trình thực nghiệm, nhóm nghiên cứu thấy rằng, với xe ô tô, xe tải và xe buýt thì tỉ lệ chính xác tương đối cao và ổn định do đặc điểm kích thước và nhận dạng của chúng; còn với xe máy và xe đạp có kích thước nhỏ, đặc điểm nhận dạng khó khăn hơn thì tỉ lệ chính xác chưa ổn định và giảm mạnh khi mật độ lưu thông tăng cao. Ngoài ra, độ chính xác còn phụ thuộc vào các yếu tố như góc quan sát của camera, điều kiện thời tiết, ánh sáng… Tại Việt Nam, giao thông với đặc thù lượng xe máy lớn và mật độ lưu thông cao, để có thuật toán phân loại chính xác và ổn định là rất phức tạp. Để khắc phục vấn đề, nhóm nghiên cứu sẽ cải thiện về lượng dữ liệu đầu vào cho quá trình tập huấn mô hình Yolov4 với xe máy và xe đạp.

[6] Thông qua quá trình nghiên cứu và thực nghiệm với video thực tế trên các đoạn đường tại các thành phố lớn của Việt Nam như Hà Nội, Hải Phòng, nhóm nghiên cứu nhận thấy khi mật độ lưu thông thấp, thuật toán cho kết quả phân loại và kiểm đếm tương đối chính xác. Với mật độ lưu thông trung bình và cao, kết quả bắt đầu có độ chênh lệch và mất ổn định hơn ở loại phương tiện là xe đạp và xe máy. Các số liệu của từng loại xe lưu thông tại các thời điểm cụ thể có thể được áp dụng vào việc tính toán mật độ lưu thông trên từng khoảng thời gian, từ đó đưa ra các kết luận về mật độ lưu thông thấp, trung bình hay cao để phục vụ quá trình phân tích và điều tiết giao thông nhằm trực tiếp giảm thiểu tình trạng ùn tắc giao thông và các hậu quả của nó gây ra.

(Theo Báo cáo “Nghiên cứu thuật toán phân loại phương tiện giao thông dựa trên thị giác máy tính” của nhóm tác giả của trường Đại học Hàng Hải Việt Nam)

Phần tư duy đọc hiểu

Đâu KHÔNG phải là hậu quả của việc tắc nghẽn giao thông? 

Xem đáp án

Giải thích

Đọc lại nội dung của đoạn [1], xác định các thông tin quan trọng liên quan tới hậu quả của tình trạng tắc nghẽn giao thông: “lãng phí thời gian, tiêu hao nhiên liệu và ô nhiễm môi trường”; từ các thông tin trong bài viết cần đưa ra suy luận để tiến hành loại trừ Từ khóa: việc lãng phí thời gian và tiền bạc sẽ làm mất đi cơ hội phát triển của con người, tiêu hao nhiên liệu và ô nhiễm môi trường sẽ gây ra hậu quả về sức khỏe và việc khai thác chất đốt trong tự nhiên; Từ khóa đúng là C.

 Chọn C


Câu 2:

Đọc văn bản sau và trả lời các câu hỏi từ 1 đến 10: 

NGHIÊN CỨU THUẬT TOÁN PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG DỰA TRÊN THỊ GIÁC MÁY TÍNH

[1] Có thể thấy, tắc nghẽn giao thông làm lãng phí thời gian, tiêu hao nhiên liệu và ô nhiễm môi trường; theo khảo sát năm 2020 thì chi phí do tắc nghẽn gây ra ở các thành phố lớn của Việt Nam là 1 - 2,3 tỉ USD mỗi năm. Trước những ảnh hưởng nghiêm trọng của tắc nghẽn giao thông, ngày càng nhiều các biện pháp được nghiên cứu và áp dụng, việc ứng dụng khoa học máy tính càng được chú ý nhiều hơn. Các nhà nghiên cứu tại Phòng thí nghiệm Oak Ridge đã sử dụng trí tuệ nhân tạo (AI) và máy học (Machine Learing) để thiết kế hệ thống thị giác máy tính thu thập và xử lý dữ liệu nhận được từ các camera giao thông giúp tránh xung đột tại các giao lộ, đồng thời giảm thiểu tổng lượng tiêu hao nhiên liệu. Thông qua việc nhận diện và phân loại phương tiện giao thông tại Việt Nam, hệ thống sẽ xác định số lượng phương tiện và tính toán mật độ lưu thông trên đường trong một khoảng thời gian xác định và từ đó đưa các dự báo cần thiết.

[2] Yolo là một mô hình mạng neural tích chập (CNN) dùng cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các lớp phức tạp (convolutional layers) cho phép trích xuất ra các đặc tính của ảnh và lớp kết nối (connected layers) dự đoán ra xác suất đó và tọa độ của đối tượng. Yolo phân chia hình ảnh thành một mạng lưới 7x7 ô (grid size=7x7). Từ đó sẽ dự đoán xem trong mỗi ô liệu có đối tượng (object) mà điểm trung tâm rơi vào ô đó không, dự đoán điểm trung tâm, kích thước của đối tượng và xác suất là đối tượng nào trong số các đối tượng cần xác định. Mỗi ô này có trách nhiệm dự đoán hai hộp (boxes number=2) bao quanh, mỗi một hộp mô tả hình chữ nhật bao quanh một đối tượng. Hiện nay phiên bản đang được sử dụng là thế hệ thứ 4, gọi là Yolov4. 

[3] Sort là sự phát triển của khung theo dõi nhiều đối tượng trực quan dựa trên các kỹ thuật ước lượng trạng thái và liên kết dữ liệu thô. Sort là một thuật toán thuộc dạng theo dõi và phát hiện (Tracking-by-detection), được thiết kế cho các ứng dụng theo dõi thời gian thực và phương pháp này tạo ra nhận dạng đối tượng một cách nhanh chóng. Một đặc điểm của lớp các thuật toán Tracking-by- detection là tách đối tượng cần xác định ra như một bài toán riêng biệt và cố gắng tối ưu kết quả trong bài toán này. Công việc sau đó là tìm cách liên kết các hộp giới hạn thu được ở mỗi khung và gán ID cho từng đối tượng. 

[4] Nghiên cứu sẽ dựa trên thuật toán xác định vật thể của Yolo, thuật toán theo dõi vật thể của SORT, từ đó gán địa chỉ nhận dạng ID cho từng phương tiện lưu thông và phân loại chúng, xác định số lượng xe theo từng khoảng thời gian cụ thể. Các phương tiện được gán địa chỉ ở đây là: xe ô tô, xe tải, xe buýt, xe máy và xe đạp. Mở luồng video trực tiếp từ camera và tiến hành xử lý từng khung hình. Sau quá trình khởi tạo thư viện, khởi tạo các biến và chạy mô hình thuật toán Yolov4, tiến hành phát luồng video trực tiếp từ camera hoặc lựa chọn các tệp video. Từng khung hình sẽ được chụp và kiểm tra theo vòng lặp while, nếu khung đọc được không chính xác, vòng lặp sẽ bị phá vỡ. Do góc nhìn camera ở mỗi đoạn đường được thiết lập là khác nhau nên nhóm nghiên cứu đã tạo ra các điểm chọn thủ công để thiết lập vùng nhận diện nhất định trên toàn bộ khung hình, giúp cho thuật toán tối ưu hơn, loại bỏ các vùng không chứa phương tiện lưu thông.

[5] Sau quá trình thực nghiệm, nhóm nghiên cứu thấy rằng, với xe ô tô, xe tải và xe buýt thì tỉ lệ chính xác tương đối cao và ổn định do đặc điểm kích thước và nhận dạng của chúng; còn với xe máy và xe đạp có kích thước nhỏ, đặc điểm nhận dạng khó khăn hơn thì tỉ lệ chính xác chưa ổn định và giảm mạnh khi mật độ lưu thông tăng cao. Ngoài ra, độ chính xác còn phụ thuộc vào các yếu tố như góc quan sát của camera, điều kiện thời tiết, ánh sáng… Tại Việt Nam, giao thông với đặc thù lượng xe máy lớn và mật độ lưu thông cao, để có thuật toán phân loại chính xác và ổn định là rất phức tạp. Để khắc phục vấn đề, nhóm nghiên cứu sẽ cải thiện về lượng dữ liệu đầu vào cho quá trình tập huấn mô hình Yolov4 với xe máy và xe đạp.

[6] Thông qua quá trình nghiên cứu và thực nghiệm với video thực tế trên các đoạn đường tại các thành phố lớn của Việt Nam như Hà Nội, Hải Phòng, nhóm nghiên cứu nhận thấy khi mật độ lưu thông thấp, thuật toán cho kết quả phân loại và kiểm đếm tương đối chính xác. Với mật độ lưu thông trung bình và cao, kết quả bắt đầu có độ chênh lệch và mất ổn định hơn ở loại phương tiện là xe đạp và xe máy. Các số liệu của từng loại xe lưu thông tại các thời điểm cụ thể có thể được áp dụng vào việc tính toán mật độ lưu thông trên từng khoảng thời gian, từ đó đưa ra các kết luận về mật độ lưu thông thấp, trung bình hay cao để phục vụ quá trình phân tích và điều tiết giao thông nhằm trực tiếp giảm thiểu tình trạng ùn tắc giao thông và các hậu quả của nó gây ra.

(Theo Báo cáo “Nghiên cứu thuật toán phân loại phương tiện giao thông dựa trên thị giác máy tính” của nhóm tác giả của trường Đại học Hàng Hải Việt Nam)

Từ thông tin của đoạn [1] hãy hoàn thành câu sau bằng cách kéo thả các từ vào đúng vị trí

ứng dụng, xây dựng, thiết kế, áp dụng

Theo đánh giá từ Viện chiến lược và phát triển Giao thông vận tải, tình trạng tắc nghẽn giao thông đang gây ảnh hưởng nghiêm trọng tới đời sống, vậy nên, các cơ quan tổ chức đang ______ nhiều biện pháp và ______ khoa học máy tính vào việc ______ các hệ thống thu thập và xử lý dữ liệu.

Xem đáp án

Đáp án

Từ thông tin của đoạn [1] hãy hoàn thành câu sau bằng cách kéo thả các từ vào đúng vị trí:

Theo đánh giá từ Viện chiến lược và phát triển Giao thông vận tải, tình trạng tắc nghẽn giao thông đang gây ảnh hưởng nghiêm trọng tới đời sống, vậy nên, các cơ quan tổ chức đang áp dụng nhiều biện pháp và ứng dụng khoa học máy tính vào việc thiết kế các hệ thống thu thập và xử lý dữ liệu.

Giải thích

Đọc lại thông tin trong đoạn [1] để tìm ra được một số từ khóa quan trọng: “nhiều các biện pháp được nghiên cứu và áp dụng”, “ứng dụng khoa học máy tính càng được chú ý”, “thiết kế hệ thống thị giác máy tính thu thập và xử lý dữ liệu”. Câu văn đầy đủ là: “Theo đánh giá từ Viện chiến lược và phát triển Giao thông vận tải, tình trạng tắc nghẽn giao thông đang gây ảnh hưởng nghiêm trọng tới đời sống, vậy nên, các cơ quan tổ chức đang [áp dụng] nhiều biện pháp và [ứng dụng] khoa học máy tính vào việc [thiết kế] các hệ thống thu thập và xử lý dữ liệu.”

 


Câu 3:

Đọc văn bản sau và trả lời các câu hỏi từ 1 đến 10: 

NGHIÊN CỨU THUẬT TOÁN PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG DỰA TRÊN THỊ GIÁC MÁY TÍNH

[1] Có thể thấy, tắc nghẽn giao thông làm lãng phí thời gian, tiêu hao nhiên liệu và ô nhiễm môi trường; theo khảo sát năm 2020 thì chi phí do tắc nghẽn gây ra ở các thành phố lớn của Việt Nam là 1 - 2,3 tỉ USD mỗi năm. Trước những ảnh hưởng nghiêm trọng của tắc nghẽn giao thông, ngày càng nhiều các biện pháp được nghiên cứu và áp dụng, việc ứng dụng khoa học máy tính càng được chú ý nhiều hơn. Các nhà nghiên cứu tại Phòng thí nghiệm Oak Ridge đã sử dụng trí tuệ nhân tạo (AI) và máy học (Machine Learing) để thiết kế hệ thống thị giác máy tính thu thập và xử lý dữ liệu nhận được từ các camera giao thông giúp tránh xung đột tại các giao lộ, đồng thời giảm thiểu tổng lượng tiêu hao nhiên liệu. Thông qua việc nhận diện và phân loại phương tiện giao thông tại Việt Nam, hệ thống sẽ xác định số lượng phương tiện và tính toán mật độ lưu thông trên đường trong một khoảng thời gian xác định và từ đó đưa các dự báo cần thiết.

[2] Yolo là một mô hình mạng neural tích chập (CNN) dùng cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các lớp phức tạp (convolutional layers) cho phép trích xuất ra các đặc tính của ảnh và lớp kết nối (connected layers) dự đoán ra xác suất đó và tọa độ của đối tượng. Yolo phân chia hình ảnh thành một mạng lưới 7x7 ô (grid size=7x7). Từ đó sẽ dự đoán xem trong mỗi ô liệu có đối tượng (object) mà điểm trung tâm rơi vào ô đó không, dự đoán điểm trung tâm, kích thước của đối tượng và xác suất là đối tượng nào trong số các đối tượng cần xác định. Mỗi ô này có trách nhiệm dự đoán hai hộp (boxes number=2) bao quanh, mỗi một hộp mô tả hình chữ nhật bao quanh một đối tượng. Hiện nay phiên bản đang được sử dụng là thế hệ thứ 4, gọi là Yolov4. 

[3] Sort là sự phát triển của khung theo dõi nhiều đối tượng trực quan dựa trên các kỹ thuật ước lượng trạng thái và liên kết dữ liệu thô. Sort là một thuật toán thuộc dạng theo dõi và phát hiện (Tracking-by-detection), được thiết kế cho các ứng dụng theo dõi thời gian thực và phương pháp này tạo ra nhận dạng đối tượng một cách nhanh chóng. Một đặc điểm của lớp các thuật toán Tracking-by- detection là tách đối tượng cần xác định ra như một bài toán riêng biệt và cố gắng tối ưu kết quả trong bài toán này. Công việc sau đó là tìm cách liên kết các hộp giới hạn thu được ở mỗi khung và gán ID cho từng đối tượng. 

[4] Nghiên cứu sẽ dựa trên thuật toán xác định vật thể của Yolo, thuật toán theo dõi vật thể của SORT, từ đó gán địa chỉ nhận dạng ID cho từng phương tiện lưu thông và phân loại chúng, xác định số lượng xe theo từng khoảng thời gian cụ thể. Các phương tiện được gán địa chỉ ở đây là: xe ô tô, xe tải, xe buýt, xe máy và xe đạp. Mở luồng video trực tiếp từ camera và tiến hành xử lý từng khung hình. Sau quá trình khởi tạo thư viện, khởi tạo các biến và chạy mô hình thuật toán Yolov4, tiến hành phát luồng video trực tiếp từ camera hoặc lựa chọn các tệp video. Từng khung hình sẽ được chụp và kiểm tra theo vòng lặp while, nếu khung đọc được không chính xác, vòng lặp sẽ bị phá vỡ. Do góc nhìn camera ở mỗi đoạn đường được thiết lập là khác nhau nên nhóm nghiên cứu đã tạo ra các điểm chọn thủ công để thiết lập vùng nhận diện nhất định trên toàn bộ khung hình, giúp cho thuật toán tối ưu hơn, loại bỏ các vùng không chứa phương tiện lưu thông.

[5] Sau quá trình thực nghiệm, nhóm nghiên cứu thấy rằng, với xe ô tô, xe tải và xe buýt thì tỉ lệ chính xác tương đối cao và ổn định do đặc điểm kích thước và nhận dạng của chúng; còn với xe máy và xe đạp có kích thước nhỏ, đặc điểm nhận dạng khó khăn hơn thì tỉ lệ chính xác chưa ổn định và giảm mạnh khi mật độ lưu thông tăng cao. Ngoài ra, độ chính xác còn phụ thuộc vào các yếu tố như góc quan sát của camera, điều kiện thời tiết, ánh sáng… Tại Việt Nam, giao thông với đặc thù lượng xe máy lớn và mật độ lưu thông cao, để có thuật toán phân loại chính xác và ổn định là rất phức tạp. Để khắc phục vấn đề, nhóm nghiên cứu sẽ cải thiện về lượng dữ liệu đầu vào cho quá trình tập huấn mô hình Yolov4 với xe máy và xe đạp.

[6] Thông qua quá trình nghiên cứu và thực nghiệm với video thực tế trên các đoạn đường tại các thành phố lớn của Việt Nam như Hà Nội, Hải Phòng, nhóm nghiên cứu nhận thấy khi mật độ lưu thông thấp, thuật toán cho kết quả phân loại và kiểm đếm tương đối chính xác. Với mật độ lưu thông trung bình và cao, kết quả bắt đầu có độ chênh lệch và mất ổn định hơn ở loại phương tiện là xe đạp và xe máy. Các số liệu của từng loại xe lưu thông tại các thời điểm cụ thể có thể được áp dụng vào việc tính toán mật độ lưu thông trên từng khoảng thời gian, từ đó đưa ra các kết luận về mật độ lưu thông thấp, trung bình hay cao để phục vụ quá trình phân tích và điều tiết giao thông nhằm trực tiếp giảm thiểu tình trạng ùn tắc giao thông và các hậu quả của nó gây ra.

(Theo Báo cáo “Nghiên cứu thuật toán phân loại phương tiện giao thông dựa trên thị giác máy tính” của nhóm tác giả của trường Đại học Hàng Hải Việt Nam)

Mục đích của nhóm nghiên cứu khi tìm kiếm giải pháp phân loại phương tiện giao thông là gì?

Xem đáp án

Giải thích

Đọc lại nội dung của đoạn [1]: Khi triển khai nghiên cứu giải pháp từ việc thu thập dữ liệu của camera giao thông để “xác định số lượng phương tiện lưu thông trên đường và tính toán mật độ lưu lượng phương tiện tham gia giao thông trong một khoảng thời gian xác định”; vậy mục tiêu cốt lõi sẽ là dự báo về tình trạng giao thông để giảm thiểu tình trạng tắc nghẽn. 

 Chọn D


Câu 4:

Đọc văn bản sau và trả lời các câu hỏi từ 1 đến 10: 

NGHIÊN CỨU THUẬT TOÁN PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG DỰA TRÊN THỊ GIÁC MÁY TÍNH

[1] Có thể thấy, tắc nghẽn giao thông làm lãng phí thời gian, tiêu hao nhiên liệu và ô nhiễm môi trường; theo khảo sát năm 2020 thì chi phí do tắc nghẽn gây ra ở các thành phố lớn của Việt Nam là 1 - 2,3 tỉ USD mỗi năm. Trước những ảnh hưởng nghiêm trọng của tắc nghẽn giao thông, ngày càng nhiều các biện pháp được nghiên cứu và áp dụng, việc ứng dụng khoa học máy tính càng được chú ý nhiều hơn. Các nhà nghiên cứu tại Phòng thí nghiệm Oak Ridge đã sử dụng trí tuệ nhân tạo (AI) và máy học (Machine Learing) để thiết kế hệ thống thị giác máy tính thu thập và xử lý dữ liệu nhận được từ các camera giao thông giúp tránh xung đột tại các giao lộ, đồng thời giảm thiểu tổng lượng tiêu hao nhiên liệu. Thông qua việc nhận diện và phân loại phương tiện giao thông tại Việt Nam, hệ thống sẽ xác định số lượng phương tiện và tính toán mật độ lưu thông trên đường trong một khoảng thời gian xác định và từ đó đưa các dự báo cần thiết.

[2] Yolo là một mô hình mạng neural tích chập (CNN) dùng cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các lớp phức tạp (convolutional layers) cho phép trích xuất ra các đặc tính của ảnh và lớp kết nối (connected layers) dự đoán ra xác suất đó và tọa độ của đối tượng. Yolo phân chia hình ảnh thành một mạng lưới 7x7 ô (grid size=7x7). Từ đó sẽ dự đoán xem trong mỗi ô liệu có đối tượng (object) mà điểm trung tâm rơi vào ô đó không, dự đoán điểm trung tâm, kích thước của đối tượng và xác suất là đối tượng nào trong số các đối tượng cần xác định. Mỗi ô này có trách nhiệm dự đoán hai hộp (boxes number=2) bao quanh, mỗi một hộp mô tả hình chữ nhật bao quanh một đối tượng. Hiện nay phiên bản đang được sử dụng là thế hệ thứ 4, gọi là Yolov4. 

[3] Sort là sự phát triển của khung theo dõi nhiều đối tượng trực quan dựa trên các kỹ thuật ước lượng trạng thái và liên kết dữ liệu thô. Sort là một thuật toán thuộc dạng theo dõi và phát hiện (Tracking-by-detection), được thiết kế cho các ứng dụng theo dõi thời gian thực và phương pháp này tạo ra nhận dạng đối tượng một cách nhanh chóng. Một đặc điểm của lớp các thuật toán Tracking-by- detection là tách đối tượng cần xác định ra như một bài toán riêng biệt và cố gắng tối ưu kết quả trong bài toán này. Công việc sau đó là tìm cách liên kết các hộp giới hạn thu được ở mỗi khung và gán ID cho từng đối tượng. 

[4] Nghiên cứu sẽ dựa trên thuật toán xác định vật thể của Yolo, thuật toán theo dõi vật thể của SORT, từ đó gán địa chỉ nhận dạng ID cho từng phương tiện lưu thông và phân loại chúng, xác định số lượng xe theo từng khoảng thời gian cụ thể. Các phương tiện được gán địa chỉ ở đây là: xe ô tô, xe tải, xe buýt, xe máy và xe đạp. Mở luồng video trực tiếp từ camera và tiến hành xử lý từng khung hình. Sau quá trình khởi tạo thư viện, khởi tạo các biến và chạy mô hình thuật toán Yolov4, tiến hành phát luồng video trực tiếp từ camera hoặc lựa chọn các tệp video. Từng khung hình sẽ được chụp và kiểm tra theo vòng lặp while, nếu khung đọc được không chính xác, vòng lặp sẽ bị phá vỡ. Do góc nhìn camera ở mỗi đoạn đường được thiết lập là khác nhau nên nhóm nghiên cứu đã tạo ra các điểm chọn thủ công để thiết lập vùng nhận diện nhất định trên toàn bộ khung hình, giúp cho thuật toán tối ưu hơn, loại bỏ các vùng không chứa phương tiện lưu thông.

[5] Sau quá trình thực nghiệm, nhóm nghiên cứu thấy rằng, với xe ô tô, xe tải và xe buýt thì tỉ lệ chính xác tương đối cao và ổn định do đặc điểm kích thước và nhận dạng của chúng; còn với xe máy và xe đạp có kích thước nhỏ, đặc điểm nhận dạng khó khăn hơn thì tỉ lệ chính xác chưa ổn định và giảm mạnh khi mật độ lưu thông tăng cao. Ngoài ra, độ chính xác còn phụ thuộc vào các yếu tố như góc quan sát của camera, điều kiện thời tiết, ánh sáng… Tại Việt Nam, giao thông với đặc thù lượng xe máy lớn và mật độ lưu thông cao, để có thuật toán phân loại chính xác và ổn định là rất phức tạp. Để khắc phục vấn đề, nhóm nghiên cứu sẽ cải thiện về lượng dữ liệu đầu vào cho quá trình tập huấn mô hình Yolov4 với xe máy và xe đạp.

[6] Thông qua quá trình nghiên cứu và thực nghiệm với video thực tế trên các đoạn đường tại các thành phố lớn của Việt Nam như Hà Nội, Hải Phòng, nhóm nghiên cứu nhận thấy khi mật độ lưu thông thấp, thuật toán cho kết quả phân loại và kiểm đếm tương đối chính xác. Với mật độ lưu thông trung bình và cao, kết quả bắt đầu có độ chênh lệch và mất ổn định hơn ở loại phương tiện là xe đạp và xe máy. Các số liệu của từng loại xe lưu thông tại các thời điểm cụ thể có thể được áp dụng vào việc tính toán mật độ lưu thông trên từng khoảng thời gian, từ đó đưa ra các kết luận về mật độ lưu thông thấp, trung bình hay cao để phục vụ quá trình phân tích và điều tiết giao thông nhằm trực tiếp giảm thiểu tình trạng ùn tắc giao thông và các hậu quả của nó gây ra.

(Theo Báo cáo “Nghiên cứu thuật toán phân loại phương tiện giao thông dựa trên thị giác máy tính” của nhóm tác giả của trường Đại học Hàng Hải Việt Nam)

Yolov4 là phiên bản nâng cấp, có cơ chế hoạt động của mô hình mạng dùng cho việc phát hiện, nhận dạng, phân loại đối tượng; phân chia và xử lý hình ảnh sau đó đưa ra các dự đoán theo một yêu cầu xác định là đúng hay sai?

Xem đáp án

Đáp án

A. Đúng

Giải thích

Đọc lại nội dung đoạn [2] để tìm hiểu định nghĩa về Yolo: “mô hình mạng dùng cho việc phát hiện, nhận dạng, phân lại đối tượng”, “dự đoán xem trong mỗi ô liệu có đối tượng (object) mà điểm trung tâm rơi vào ô đó không, dự đoán điểm trung tâm, kích thước của đối tượng và xác suất là đối tượng nào trong số các đối tượng cần xác định”; chú ý câu “phiên bản đang được sử dụng là thế hệ thứ 4, gọi là Yolov4”. 


Câu 5:

Đọc văn bản sau và trả lời các câu hỏi từ 1 đến 10: 

NGHIÊN CỨU THUẬT TOÁN PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG DỰA TRÊN THỊ GIÁC MÁY TÍNH

[1] Có thể thấy, tắc nghẽn giao thông làm lãng phí thời gian, tiêu hao nhiên liệu và ô nhiễm môi trường; theo khảo sát năm 2020 thì chi phí do tắc nghẽn gây ra ở các thành phố lớn của Việt Nam là 1 - 2,3 tỉ USD mỗi năm. Trước những ảnh hưởng nghiêm trọng của tắc nghẽn giao thông, ngày càng nhiều các biện pháp được nghiên cứu và áp dụng, việc ứng dụng khoa học máy tính càng được chú ý nhiều hơn. Các nhà nghiên cứu tại Phòng thí nghiệm Oak Ridge đã sử dụng trí tuệ nhân tạo (AI) và máy học (Machine Learing) để thiết kế hệ thống thị giác máy tính thu thập và xử lý dữ liệu nhận được từ các camera giao thông giúp tránh xung đột tại các giao lộ, đồng thời giảm thiểu tổng lượng tiêu hao nhiên liệu. Thông qua việc nhận diện và phân loại phương tiện giao thông tại Việt Nam, hệ thống sẽ xác định số lượng phương tiện và tính toán mật độ lưu thông trên đường trong một khoảng thời gian xác định và từ đó đưa các dự báo cần thiết.

[2] Yolo là một mô hình mạng neural tích chập (CNN) dùng cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các lớp phức tạp (convolutional layers) cho phép trích xuất ra các đặc tính của ảnh và lớp kết nối (connected layers) dự đoán ra xác suất đó và tọa độ của đối tượng. Yolo phân chia hình ảnh thành một mạng lưới 7x7 ô (grid size=7x7). Từ đó sẽ dự đoán xem trong mỗi ô liệu có đối tượng (object) mà điểm trung tâm rơi vào ô đó không, dự đoán điểm trung tâm, kích thước của đối tượng và xác suất là đối tượng nào trong số các đối tượng cần xác định. Mỗi ô này có trách nhiệm dự đoán hai hộp (boxes number=2) bao quanh, mỗi một hộp mô tả hình chữ nhật bao quanh một đối tượng. Hiện nay phiên bản đang được sử dụng là thế hệ thứ 4, gọi là Yolov4. 

[3] Sort là sự phát triển của khung theo dõi nhiều đối tượng trực quan dựa trên các kỹ thuật ước lượng trạng thái và liên kết dữ liệu thô. Sort là một thuật toán thuộc dạng theo dõi và phát hiện (Tracking-by-detection), được thiết kế cho các ứng dụng theo dõi thời gian thực và phương pháp này tạo ra nhận dạng đối tượng một cách nhanh chóng. Một đặc điểm của lớp các thuật toán Tracking-by- detection là tách đối tượng cần xác định ra như một bài toán riêng biệt và cố gắng tối ưu kết quả trong bài toán này. Công việc sau đó là tìm cách liên kết các hộp giới hạn thu được ở mỗi khung và gán ID cho từng đối tượng. 

[4] Nghiên cứu sẽ dựa trên thuật toán xác định vật thể của Yolo, thuật toán theo dõi vật thể của SORT, từ đó gán địa chỉ nhận dạng ID cho từng phương tiện lưu thông và phân loại chúng, xác định số lượng xe theo từng khoảng thời gian cụ thể. Các phương tiện được gán địa chỉ ở đây là: xe ô tô, xe tải, xe buýt, xe máy và xe đạp. Mở luồng video trực tiếp từ camera và tiến hành xử lý từng khung hình. Sau quá trình khởi tạo thư viện, khởi tạo các biến và chạy mô hình thuật toán Yolov4, tiến hành phát luồng video trực tiếp từ camera hoặc lựa chọn các tệp video. Từng khung hình sẽ được chụp và kiểm tra theo vòng lặp while, nếu khung đọc được không chính xác, vòng lặp sẽ bị phá vỡ. Do góc nhìn camera ở mỗi đoạn đường được thiết lập là khác nhau nên nhóm nghiên cứu đã tạo ra các điểm chọn thủ công để thiết lập vùng nhận diện nhất định trên toàn bộ khung hình, giúp cho thuật toán tối ưu hơn, loại bỏ các vùng không chứa phương tiện lưu thông.

[5] Sau quá trình thực nghiệm, nhóm nghiên cứu thấy rằng, với xe ô tô, xe tải và xe buýt thì tỉ lệ chính xác tương đối cao và ổn định do đặc điểm kích thước và nhận dạng của chúng; còn với xe máy và xe đạp có kích thước nhỏ, đặc điểm nhận dạng khó khăn hơn thì tỉ lệ chính xác chưa ổn định và giảm mạnh khi mật độ lưu thông tăng cao. Ngoài ra, độ chính xác còn phụ thuộc vào các yếu tố như góc quan sát của camera, điều kiện thời tiết, ánh sáng… Tại Việt Nam, giao thông với đặc thù lượng xe máy lớn và mật độ lưu thông cao, để có thuật toán phân loại chính xác và ổn định là rất phức tạp. Để khắc phục vấn đề, nhóm nghiên cứu sẽ cải thiện về lượng dữ liệu đầu vào cho quá trình tập huấn mô hình Yolov4 với xe máy và xe đạp.

[6] Thông qua quá trình nghiên cứu và thực nghiệm với video thực tế trên các đoạn đường tại các thành phố lớn của Việt Nam như Hà Nội, Hải Phòng, nhóm nghiên cứu nhận thấy khi mật độ lưu thông thấp, thuật toán cho kết quả phân loại và kiểm đếm tương đối chính xác. Với mật độ lưu thông trung bình và cao, kết quả bắt đầu có độ chênh lệch và mất ổn định hơn ở loại phương tiện là xe đạp và xe máy. Các số liệu của từng loại xe lưu thông tại các thời điểm cụ thể có thể được áp dụng vào việc tính toán mật độ lưu thông trên từng khoảng thời gian, từ đó đưa ra các kết luận về mật độ lưu thông thấp, trung bình hay cao để phục vụ quá trình phân tích và điều tiết giao thông nhằm trực tiếp giảm thiểu tình trạng ùn tắc giao thông và các hậu quả của nó gây ra.

(Theo Báo cáo “Nghiên cứu thuật toán phân loại phương tiện giao thông dựa trên thị giác máy tính” của nhóm tác giả của trường Đại học Hàng Hải Việt Nam)

Theo đoạn [3], Tracking-by-dectection là: 

Xem đáp án

Giải thích

Đọc kĩ nội dung của đoạn [3], cần phân biệt Sort và Tracking-by-detection; trong đó, Tracking-by-dectection là thuật toán để giải quyết từng đối tượng (xác định, dự đoán) còn Sort là “sự phát triển của khung theo dõi nhiều đối tượng”. 

 Chọn B


Các bài thi hot trong chương:

0

Đánh giá trung bình

0%

0%

0%

0%

0%

Bình luận


Bình luận