Matcha

Abstract 现有 TTA 方法在处理图数据时,对节点属性偏移有效,但是对图结构偏移(同质性、节点度的变化)效果很差。原因是结构偏移会严重破坏节点表示的质量,使不同类别的节点在特征空间中混在一起。为此论文提出了 Matcha 框架,通过在测试的时候自适应地调整 GNN 的“跳数聚合参数 (hop-aggregation parameters)”,并且引入了新的预测感知的聚类损失函数来表示恢复节点表示的质量,从而有效应对结构偏移,并能和现有 TTA 方法相结合,进一步提高性能。 Introduction GNN 的脆弱性:GNNs 在各类图任务上的表现依赖于训练数据和测试数据分布相同的假设,然而在现实世界中,图的分布常常会发生变化(分布偏移),分为: 属性偏移 (Attribute Shift):节点的特征发生变化。例如不同社交平台,即使用户一样,其账号的内容也会因为平台差异而不同。 结构偏移 (Structure Shift):节点的连接方式发生变化。比如工作平台用户倾向于连接同事,生活平台用户倾向于连接家人朋友。这种连接模式的变化就是结构偏移,具体表现为同质性 (Homophily) 和 节点度 (Degree) 的变化。 TTA 的局限性:TTA 允许一个预训练好的模型在不访问原始训练数据的情况下,利用无标签的测试数据进行自适应调整 。目前 TTA 在计算机视觉领域处理图像损坏、风格变化等属性偏移问题上很成功 。然而为图像处理设计的 TTA 方法直接应用到图上时,其在处理图结构偏移时的性能提升非常有限,几乎失效。 Analysis 两种偏移方式对 GNN 的影响存在本质不同。 Perliminaries 论文聚焦于 GTTA 任务。一个 GNN 模型可以被看成两个部分的组合,一个特征提取器 $ f_{S} $ ,一个分类器 $ g_{S} $ ,通常是一个线性层。 两种偏移的正式定义: 属性偏移:源图和目标图中,节点的条件概率分布不同 $ \mathbb{P}^{S}_{x | y} \neq \mathbb{P}^{T}_{x | y} $ 。 结构偏移:图的邻接矩阵和标签的联合分布不同,即 $ \mathbb{P}^{S}_{A \times Y} \neq \mathbb{P}^{T}_{A \times Y} $ 。论文主要关注两种具体的结构偏移: 度偏移:源图和目标图的平均节点度数不同。 同质性偏移:源图和目标图的同质性水平不同。其中图的所有节点同质性的平均值 $ h(\mathcal{G}) = \dfrac{1}{N}\sum_{i}h_{i} $ ,单个节点 $ v_{i} $ 的同质性计算公式为: $$ h_{i} = \dfrac{\left| \{ v_{j} \in \mathbb{N}(v_{i}): y_{j} = y_{i} \} \right|}{d_{i}} $$ 其中 $ y $ 表示节点标签,$ d $ 表示节点度数。 Impact of Distribution Shifts 通过数学建模来显示两种偏移的不同影响机制。 ...

August 28, 2025 · 3 min · diefish

EmT

Abstract 问题:现有 EEG 情绪识别方法对长期上下文信息关注不足,导致跨被试泛化能力减弱 方案:提出 Emotion Transformer (EmT) ,为 Graph-Transformer 混和架构 核心模块: TGC:将 EEG 信号转换为时序图序列 RMPG:使用残差多视图金字塔 GCN,学习动态、多尺度的空间连接模式,生成 token(核心) TCT:使用任务自适应的 Transformer,学习 token 序列上下文(核心) TSO:输出分类/回归结果 成果:在多个公开数据集的广义跨被试任务上面超过了 baseline Introduction & Related Work 为什么 EEG 难以使用跨被试 (cross-subject) 的场景? 个体差异:不同被试生理结构和认知策略差异,导致 EEG 模式不同 低信噪比:EEG 信号容易受到外源噪声干扰(肌电、眼电……) 目标是学习一种跨被试共享、具有泛化能力的情绪表征 Gpaph Neural Networks 核心思想:EEG 数据具有非欧图结构,适合使用 GNN 来处理 代表工作: ChebyNet:使用切比雪夫多项式近似光谱滤波,EmT 模型中采用其作为 GCN 层 GCN:通过局部一阶聚合近似光谱滤波 DGCNN / RGNN:使用 GNNs 提取 EEG 空间信息;依赖单一的邻接矩阵,忽略时序上下文,具有局限性;而 EmT 通过多视图可学习邻接矩阵和时序图来弥补 Temporal Context Learning 核心理念:情绪是连续认知过程,EEG 信号中嵌入时序上下文信息 代表工作: LSTM / TCN / TESANet / Conformer / AMDET 局限性:这些方法通常从扁平化的 EEG 特征向量学习,可能未能有效学习空间关系;EmT 则通过并行 GCN 和 STA 层更有效地捕捉时空信息 EEG Emotion Recognition 核心理念:EEG 情绪识别面临个体差异大、信噪比低等挑战,需提取光谱、空间、时序特征 代表工作: GCB-Net / TSception 局限性:没有关注长时序上下文信息 Method EmT 是一个端到端的框架,包含四大模块: ...

July 30, 2025 · 6 min · diefish