Vừa qua, “Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin” (The 24nd National Conference on Electronics, Communications and Information Technology, viết tắt là REV-ECIT) chấp nhận đăng bài báo khoa học “PHÁT HIỆN PHƯƠNG TIỆN GIAO THÔNG Ở MÔI TRƯỜNG ĐÔ THỊ VIỆT NAM TRONG ẢNH CHỤP TỪ DRONE” của Ngô Minh Phú và Lê Minh Phước (sinh viên năm thứ tư, ngành Công nghệ thông tin chất lượng cao định hướng Nhật Bản, trường ĐH Công nghệ thông tin, ĐHQG-HCM).
Theo Minh Phú, dự án “Phát hiện phương tiện giao thông ở môi trường đô thị Việt Nam trong ảnh chụp từ drone” chính là đồ án cuối kỳ của môn Học máy thống kê. Đây là một trong những đề tài được các giảng viên gợi ý cho sinh viên tại lớp.
Lý giải về sự lựa chọn đề tài, Minh Phú cho biết: “Mình nhận thấy ngày nay việc phát hiện đối tượng trong không ảnh đang ngày càng trở nên phổ biến trong nhiều lĩnh vực quân sự cũng như dân sự. Đánh giá được vai trò của dự án đối với tình hình thực tiễn của nước ta, mình cùng cộng sự đã cùng nhau thực hiện dự án này”.
Dự án nghiên cứu được thực hiện từ tháng 12/2020. Sau gần 1 năm nghiên cứu, dự án đã được “Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin” chấp nhận đăng. Minh Phú chia sẻ: “Thời gian nghiên cứu của nhóm diễn ra trong lúc dịch bệnh hoành hành, nước ta thực hiện lệnh giãn cách. Chính vì lẽ đó, chúng mình không thể trực tiếp làm việc với nhau. Điều này gây nên rất nhiều khó khăn trong vệc trao đổi, cập nhật và báo cáo tiến độ”.
Tuy nhiên, nhờ đợt giãn cách này mà Minh Phú cũng có thêm nhiều thời gian để tìm hiểu nâng cao kiến thức, đồng thời thích nghi với việc học tập, nghiên cứu và làm việc nhóm online, đây có thể sẽ là một xu hướng làm việc trong tương lai. Bên cạnh đó, những người thầy, người cô, các cộng sự cũng đã chung tay giúp đỡ để nhóm dự án có thể vượt qua những khó khăn trong quá trình nghiên cứu.
Được biết, trong bài báo, nhóm dự án tiến hành đánh giá hiệu quả của hai phương pháp đại diện cho hai hướng tiếp cận phổ biến là Faster RCNN và YOLOv4. “Việc dự đoán của các mô hình hai giai đoạn đại diện là Faster-RCNN cho kết quả tốt hơn so với các mô hình một giai đoạn đại diện là YOLOv4. Tuy nhiên bù lại thì tốc độ xử lí của các mô hình hai giai đoạn lại tốn nhiều thời gian hơn” – Minh Phú nói.
Khi được hỏi về quá trình đánh giá, Minh Phú cho biết: “Tương tự như cách thức đánh giá trong tập dữ liệu MS COCO benchmark. Nhóm áp dụng các chỉ số bao gồm mAP, AP50 và AP75 để đánh giá các mô hình bằng cách bắt phạt các lỗi như bỏ qua các phát hiện và phát hiện sai. Cụ thể, mean Average Precision (mAP) được đo bằng cách lấy giá trị trung bình của tất cả 10 ngưởng giao nhau (IoU) trong phạm vi [0,50: 0,95] với các bước là 0.05. Đồng thời so sánh tốc độ xử lý của mô hình (FPS) giữa hai phương pháp”.
Minh Phú bày tỏ: “ Khi bài báo khoa học được duyệt đăng, cảm xúc đầu tiên của mình là thật sự rất bất ngờ và vui sướng. Mình trân quý thành quả này. Đây sẽ là một cơ hội vô cùng quý giá đối với mình, cũng chính là khởi đầu mới cho cuộc hành trình sắp tới.”
“Trong tương lai, nhóm mình sẽ mở rộng bộ dữ liệu đa dạng hơn về ngữ nghĩa của ảnh, các điều kiện góc quay, độ cao bay và sự xuất hiện của các đối tượng trong môi trường quan sát, hình ảnh bị mờ do rung và các biến thể về điều kiện ánh sáng, thời tiết và môi trường xung quanh… Bên cạnh đó, nhóm cũng hướng tới giải quyết các vấn đề khác nhau như phát hiện và đếm số lượng phương tiện tham gia giao thông, theo dõi truy vết phương tiện giao thông… và có thể ứng dụng triển khai vào thực tế như giám sát các phương tiện giao thông trong khu đô thị Đại học Quốc gia” – Minh Phú thông tin.
Phượng An