Qinghua Hu on sis-arxiv-vad-papers

Qinghua Hu on sis-arxiv-vad-papershttps://phuchoang2603.github.io/sis-arxiv-vad-papers/authors/qinghua-hu/Recent content in Qinghua Hu on sis-arxiv-vad-papersHugo -- gohugo.ioenFri, 20 Jun 2025 00:00:00 +0000Multimodal VAD: Visual Anomaly Detection in Intelligent Monitoring System via Audio-Vision-Languagehttps://phuchoang2603.github.io/sis-arxiv-vad-papers/papers/multimodal_vad_visual_anomaly_detection_in_intelligent_monitoring_system_via_audio-vision-language/Fri, 20 Jun 2025 00:00:00 +0000https://phuchoang2603.github.io/sis-arxiv-vad-papers/papers/multimodal_vad_visual_anomaly_detection_in_intelligent_monitoring_system_via_audio-vision-language/The paper proposes a dual-stream multimodal video anomaly detection network that leverages video, audio, and text modalities to achieve reliable and precise anomaly detection. It introduces effective multimodal fusion, abnormal-aware context prompts (ACPs), and a coarse-support-fine strategy to enhance anomaly discrimination and description, demonstrating superior performance on large-scale datasets.