多模态 8
-
论文笔记《Modality-Collaborative Test-Time Adaptation for Action Recognition》
论文 - 《Modality-Collaborative Test-Time Adaptation for Action Recognition》 关键词 - CVPR、多模态、视频动作识别、TTA 摘要 研究背景 基于视频的无监督领域自适应(UDA)方法提升了视频模型的泛化能力,然而,它们在自适应
-
论文笔记《Towards Robust Multimodal Open-set TTA via Adaptive Entropy-aware Optimization》
论文 - 《Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization》 代码 - Github 关键词 - 开放集、TTA、多模态、熵、LiDAR 摘要 研究问题 T
-
论文笔记《Attention Bootstrapping for Multi-Modal Test-Time Adaptation》
论文 - 《Attention Bootstrapping for Multi-Modal Test-Time Adaptation》 关键词 - 多模态(视频+音频)、TTA、主成分熵最小化 摘要 问题背景:测试时间自适应(Test-time adaptation)以往的研究主要集中在单一模态上,
-
论文笔记《Unsupervised Domain Adaptive Visual Question Answering in the era of MLLMs》
论文笔记 - 《Unsupervised Domain Adaptive Visual Question Answering in the era of Multi-modal Large Language Models》 关键词 - 问答、特征对齐、多模态、域适应、WACV2025 1 介绍 研究
-
论文笔记《Test-Time Adaptation for Combating Missing Modalities in Egocentric Videos》
论文 - 《Test-Time Adaptation for Combating Missing Modalities in Egocentric Videos》 代码 - Github 关键词 - ICLR2025、模态缺失、多模态(视频+音频)、TTA 摘要 问题背景 理解包含多种模态的视频任务
-
论文笔记《Test-Time Model Adaptation for Visual Question Answering...》
论文 - 《Test-Time Model Adaptation for Visual Question Answering With Debiased Self-Supervisions》 代码 - Github 关键词 - VQA、测试时适应TTA、偏差biases 摘要 问题背景 视觉问答 (
-
论文笔记《Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises》
论文 - 《SMOOTHING THE SHIFT: TOWARDS STABLE TEST-TIME ADAPTATION UNDER COMPLEX MULTIMODAL NOISES》 代码 - Github 关键词 - 多模态、Test-Time Adaptation、音频、视频、ICLR2
-
论文笔记《Test-time Adaptation against Multi-modal Reliability Bias》
论文 - 《TEST-TIME ADAPTATION AGAINST MULTI-MODAL RELIABILITY BIAS》 代码 - Github 关键词 - 多模态、Test-Time Adaptation、音频、视频、ICLR2024 摘要 研究背景 现有的 TTA 方法主要集中于单模态任