Mới đây, đội thi UIT - Saviors (ngành Khoa học Dữ liệu, CLB Khoa học Dữ liệu UIT) đã xuất sắc giành giải nhất cuộc thi MedVQA-GI 2023. Đội thi bao gồm các thành viên: Sinh viên Thái Minh Triết - 19522397 - KHDL2019; Sinh viên Võ Tuấn Anh - 19521226 - KHDL2019; Sinh viên Tiêu Kim Hảo - 19521480 - KHDL2019; Sinh viên Bùi Nguyên Phương Linh - 20521527 - KHDL2020 ; Giảng viên hướng dẫn: TS. Nguyễn Tất Bảo Thiện
Được biết, cuộc thi “Medical Visual Question Answering (MedVQA-GI)” diễn ra trong khuôn khổ Hội nghị quốc tế CLEF 2023. Đây là sự kiện hàng năm quy tụ những nhà nghiên cứu hàng đầu trong lĩnh vực đánh giá hệ thống truy xuất thông tin, đặc biệt là qua việc tham gia các nhiệm vụ chung (shared-tasks).
Cuộc thi tập trung vào tác vụ hỏi đáp trực quan trong hệ tiêu hóa, đặc biệt là trên hình ảnh nội soi dạ dày và nội soi đại trực tràng. Đội thi đã xuất sắc nhận diện và cảnh báo các dấu hiệu bệnh lý tiềm ẩn như viêm thực quản, polyp và viêm loét đại tràng qua hỏi đáp trực quan. UIT-Saviors đã ghi điểm bằng phương pháp đa mô hình (multimodal), kết hợp thông tin văn bản và hình ảnh để trả lời câu hỏi trực quan và tạo câu hỏi mới. Điều này đem lại tiện ích lớn cho các chuyên gia y tế trong việc phân tích hình ảnh nội soi và cung cấp thông tin về tổn thương trong hệ tiêu hóa.
Bài báo cáo của UIT-Saviors được chấp nhận tại CLEF và sẽ được đăng trong Kỷ yếu Hội nghị thuộc tuyển tập CEUR Workshop Proceedings có chỉ mục tại Scopus và Google Scholar. Bên cạnh đó, các kết quả tốt nhất sẽ được đề cử xuất bản trong Tuyển tập Lecture Notes in Computer Science.
Là nhóm sinh viên lĩnh vực dữ liệu, khi tham gia một cuộc thi về Y khoa, các bạn sinh viên đã đối mặt với rất nhiều khó khăn. Một trong những khó khăn đáng kể là tính phức tạp và đa dạng của dữ liệu y tế, đặc biệt là hình ảnh nội soi đường tiêu hóa. “Để hiểu rõ và phân tích những hình ảnh này, nhóm đã phải nghiên cứu kỹ về lĩnh vực y khoa và các kỹ thuật xử lý hình ảnh, đồng thời cần hiểu rõ ngữ cảnh và thông tin y tế cụ thể để có thể trả lời câu hỏi một cách chính xác và hiệu quả. Khó khăn thứ hai là áp lực thời gian. Cuộc thi yêu cầu chúng tôi phải hoàn thành nhiệm vụ trong một thời gian giới hạn, và điều này đòi hỏi phải làm việc hiệu quả và quản lý thời gian một cách thông minh. Việc chia sẻ công việc và thảo luận trong nhóm đã giúp chúng tôi đối phó tốt hơn với áp lực thời gian và đảm bảo hoàn thành nhiệm vụ đúng hạn. Ngoài ra, xử lý hình ảnh y tế cũng là một thách thức. Dữ liệu y tế thường có kích thước lớn và chất lượng cao, đòi hỏi các kỹ thuật xử lý hình ảnh và trí tuệ nhân tạo phức tạp để trích xuất thông tin ý nghĩa. Việc xử lý dữ liệu đa dạng và phân tích hình ảnh y tế chính xác đã đòi hỏi kiến thức chuyên sâu trong lĩnh vực này, Phương Linh - thành viên nhóm chia sẻ.
Để có được thành tích hiện tại, Linh chia sẻ nhóm đã bỏ rất nhiều thời gian để nghiên cứu lĩnh vực Dữ liệu và Y khoa. Ngoài ra, tinh thần hợp tác và làm việc nhóm cùng sự nỗ lực không ngừng nghỉ. Những thành quả mà các bạn có được đều rất xứng đáng. Linh cho biết: “Nhóm được tiếp cận và làm việc trực tiếp với dữ liệu y tế thực tế từ bộ dữ liệu Hyper Kvasir. Cuộc thi cũng mở ra cơ hội để chúng tôi kết nối và học hỏi từ các chuyên gia y tế và các nhà nghiên cứu hàng đầu trong lĩnh vực phân tích hình ảnh y tế và trí tuệ nhân tạo. Hơn nữa, việc tham gia giúp tụi mình rèn luyện kỹ năng làm việc nhóm và gắn kết đội ngũ”.
Theo Phương Linh, nhà trường và thầy cô đóng một vai trò rất quan trọng trong quá trình đội tham gia thi. Từ giúp đỡ, tư vấn trong đề tài nghiên cứu, đến cung cấp các tài nguyên và công cụ hỗ trợ. Từ đó, đội thi hiểu rõ hơn về yêu cầu của cuộc thi, phân tích bài toán và xác định các phương pháp tiếp cận phù hợp. Không chỉ giúp đỡ về mặt chuyên môn, nhà trường và thầy cô còn tạo điều kiện tài chính cho nhóm tham gia cuộc thi.
Thu Hoài