按度数分布划分区间,总隐私预算以区间
Yuan Y, Lei D, Fan Q, et al. Achieving Adaptive Privacy-Preserving Graph Neural Networks Training in Cloud Environment[C]//2024 IEEE 12th International Conference on Information, Communication and Networks (ICICN). IEEE, 2024: 181-186.
Yuan Y, Lei D, Zhang C, et al. Personalized differential privacy graph neural network[J]. IEEE/CAA Journal of Automatica Sinica, 2025.
给出一个总体区间 $[ε_1, ε_2]$,再按节点度数把用户分桶,并把 $[ε_1, ε_2]$切成多个子区间;每个用户的“初始”隐私预算 $ε_s$ 会从对应子区间里随机采样(按指数分布采样),因此不同用户拿到的起始预算彼此不同
根据度数的大小,我们可以将这些节点划分成几个区间。例如:
- 区间1:度数小于等于 10
- 区间2:度数大于 10 且小于等于 50
- 区间3:度数大于 50
根据区间的划分,隐私预算会在区间 $[ε₁, ε₂]$ 内进行分配。假设$ε₁ = 0.1$,$ε₂ = 1$,并且使用指数分布来决定隐私预算的具体值:
- 对于区间1,为其分配较高的隐私预算(如接近$ε₂ = 1$)。
- 对于区间,隐私预算会适中。
- 对于区间3,隐私预算会较低(接近$ε₁ = 0.1$)。
隐私预算的分配在度数区间的划分上使用了指数分布。其公式为:
$$ \text{Sample from exponential distribution } f(y, \lambda) = \lambda e^{-\lambda y}, \, (y \geq 0) $$之后用户用各自的 $ε_s$ 加噪:$\hat X_s=f(X_s)+\mathrm{Lap}(\Delta f/ε_s)$,
APPGNN按照节点度数划分为若干个区间,并将 隐私预算区间 对应划分,根据节点度数的 比例分布,将其 映射到指数分布的分位数区间,从中 采样出个性化的隐私预算。
拓扑重要性个性化,总隐私预算以区间
Lei D, Song Z, Yuan Y, et al. Achieving Personalized Privacy-Preserving Graph Neural Network via Topology Awareness[C]//Proceedings of the ACM on Web Conference 2025. 2025: 3552-3560.
提出“邻接信息熵”(Adjacency Information Entropy, AIE)来衡量节点拓扑重要性,既考虑直连邻居也考虑间接关系:先算邻接度 $AD_u=\sum_{v\in \mathcal N_u} D_v$,再定义概率 $p_u=D_u/AD_v$,最后得信息熵式的 $AIE_u=-\sum_{v\in \mathcal N_u}(p_u\log_2 p_u),p_v$(式(4)–(6))。重要性越高→隐私敏感度越高。
将总预算区间 $[,\epsilon_b,\epsilon_e,]$ 按节点隐私敏感度分成 $M$ 个等级与对应子区间,并假设预算在该区间内服从指数分布(真实网络度分布常呈幂律,少数节点很重要)。通过指数分布分位点把 $[,\epsilon_b,\epsilon_e,]$ 切成 $(\epsilon_b,\epsilon_1],(\epsilon_1,\epsilon_2],\dots,(\epsilon_{M-2},\epsilon_e]$,切分边界用式(7)(8)的分位数关系确定;重要节点→分到更小的 $\epsilon$(更强保护/更大噪声),不太重要的节点→更大的 $\epsilon$(更少噪声)。每个节点最终从其子区间随机采样得到个性化预算 $\epsilon_i$。
各节点用自己的 $\epsilon_i$ 做拉普拉斯机制:$\hat X_i=f(X_i)+\mathrm{Lap}(\Delta f/\epsilon_i)$(式(3)、(9)),并用随机响应扰动标签(式(12)),实现特征+标签双重保护。
因不同邻居被加的噪声强度不同,直接平均会放大高噪声邻居的负面影响。论文据“越重要→预算越小→噪声越大”的链条,给重要邻居更小权重:
$$ W_{u,v}=1+\frac{1}{D_u}-\frac{AIE_v}{\sum_{i\in Ner_u}AIE_{u,i}+AIE_u}, $$再做加权聚合(式(10)(11))。这样能抑制差异化DP噪声对表示学习的影响。
TDP-GNN 通过拓扑结构识别节点重要性,划分为多个隐私敏感度等级,映射到指数分布的预算区间并采样个性化预算,再结合加权聚合抑制噪声。
上下文多臂赌博机(CMAB)算法分配(区间)
Zhang X, Zhou Y, Hu M, et al. BGTplanner: Maximizing Training Accuracy for Differentially Private Federated Recommenders via Strategic Privacy Budget Allocation[J]. IEEE Transactions on Services Computing, 2025.
-
步骤 1:生成奖励的预测
- 对于每个动作 $a_t$ 和上下文 $X_t$,BGTplanner使用高斯过程回归模型预测奖励 $r_t$: $$ \mu(z_t) = \text{GPR}(a_t, X_t) $$
-
步骤 2:计算动作的评分
- 根据预测的奖励 $\mu(z_t)$,为每个可能的动作(隐私预算分配方案)计算一个评分 $\beta_t(a)$,公式如下:
其中,$\lambda_t$ 是用于长期隐私预算约束的拉格朗日乘子,确保在整个训练过程中不会超出总预算。
- 步骤 3:选择最优的隐私预算分配方案
- $\gamma$ 是探索和利用的权衡参数,控制着系统是否偏向于选择当前最优的动作(利用)或探索其他可能的动作。
- $A$ 是动作空间的大小,表示可能的隐私预算分配方案的数量。
- 步骤 4:更新隐私预算消耗
- 在每轮训练之后,BGTplanner通过隐私预算消耗函数来计算实际消耗的隐私预算 $\epsilon_t$,并更新剩余预算。
$$ \mu(z_t) = 0.8 \quad (\text{基于历史信息和上下文的奖励预测}) $$假设我们有如下参数:
- 总隐私预算 $\epsilon_{\text{total}} = 10$
- 隐私预算区间:$\epsilon_{\text{min}} = 1, \epsilon_{\text{max}} = 5$
- 每轮的隐私预算分配动作是从区间 $[1, 5]$ 中选择的。
在某个训练回合中,BGTplanner预测奖励为:
接着,BGTplanner计算所有可能动作的评分,并选择评分最高的动作。例如,假设动作 $a_1$ 得分为 0.9,动作 $a_2$ 得分为 0.7,最终选择 $a_1$ 作为隐私预算分配方案。
BGTplanner 每轮都用 CMAB 从一组预算选项中,智能选一个最合适的隐私预算来用
探讨隐私预算的推荐值
Du W, Ma X, Dong W, et al. Calibrating privacy budgets for locally private graph neural networks[C]//2021 International Conference on Networking and Network Applications (NaNA). IEEE, 2021: 23-29.
采用了 Multi-bit LDP Mechanism (LPGNN的方法)对用户特征进行扰动:
输入:
- 用户特征向量$ x∈[α,β]^d$
- 隐私预算$\epsilon$
- 控制参数 m(每次扰动的特征维度数)
输出:
- 扰动后的特征向量 $ x∈{-1,0,1}^d$
通过链路预测准确率和加入属性推断攻击后的F1-score值推荐隐私预算值
| 项目 | 内容 |
|---|---|
| 目标 | 在 LDP 保护的 GNN 中合理选择隐私预算 ε |
| 方法 | 利用属性推断攻击效果作为隐私度量,结合链路预测准确率评估效用 |
| 隐私机制 | Multi-bit LDP 机制,用户本地扰动特征,服务器无偏重构 |
| 推荐 ε 值 | 0.5 ~ 1(视具体业务对隐私和效用的需求) |
基于遗传算法(GA)的隐私预算分配
Li Y, Song X, Tu Y, et al. GAPBAS: Genetic algorithm-based privacy budget allocation strategy in differential privacy K-means clustering algorithm[J]. Computers & Security, 2024, 139: 103697.
通过分析噪声对质心的影响,推导出 最小隐私预算$ε_m$:
$$ ε_m=(\frac{200k^3d+(1+d)^2}{N^2}(1+ρ^2))^{1/2} $$其中:
- k:聚类数;d:数据维度;N:样本数量;ρ:噪声相关系数(通常取 0.225);
每轮预算必须满足:$ε_t$≥$ε_m$,否则噪声过大导致质心不收敛。
- 每个个体是一个长度为 $T$ 的浮点数组:${ε_1,ε_2,…,ε_T}$
GAPBAS 将每轮隐私预算组合成序列,作为遗传算法的个体,在满足总预算和最小预算约束下,优化出使聚类效果(NICV)最优的预算分配策略。
基于隐私安全等级(Privacy Security Level, PSL)
Shen Z, He S, Wang H, et al. A differential privacy budget allocation method combining privacy security level[J]. Journal of Communications and Information Networks, 2023, 8(1): 90-98.
提出 PSL 方法:为每个位置分配一个“隐私安全等级”,并据此动态分配隐私预算 $ε$,实现 个性化、拓扑感知的隐私保护。
步骤:
-
使用 P-series(p-级数) 为初始敏感位置分配隐私预算
-
使用 P-series 为初始敏感位置分配预算:
$$ \varepsilon_{m} = \frac{\varepsilon}{\zeta(p)} \times \frac{1}{m^{p}}, \quad m \in \mathbb{N}^{+}, \quad p > 1 $$- $\varepsilon$:总隐私预算;
- $\zeta(p)$:P级数收敛值(如 p=2 时,$\zeta(2)= π²/6$;
- m:敏感位置编号(按重要性排序);
- 结果:重要位置(m 小)获得更大预算(更小噪声)
-
-
根据 距离与节点度 为敏感点的邻居分配预算,并支持 动态时间调整
-
PSL定义:
$$ \mathrm{PSL}(k_{m}) = \lambda \times \varepsilon_{m} = \lambda \times \frac{\varepsilon}{\zeta(p)} \times m^{p} $$- PSL 与预算$\varepsilon$ 成反比;
- $\lambda$ 为调节参数;
- 用于衡量位置的“隐私敏感度”。
-
-
将 PSL 映射为隐私预算$ε$,满足 $\epsilon × PSL = \gamma$($\gamma$ 为常数)
假设:
- 敏感节点 $k_1$ 的 PSL = 0.6079;
- 邻居 A 距离为 1,邻居 B 距离为 2;
- NPS = {A, B};
则:
$$ \mathrm{PSL}_{A} = \frac{1/1}{(1/1 + 1/2)} \times 0.6079 = 0.4053, \\ \mathrm{PSL}_{B} = \frac{1/2}{(1/1 + 1/2)} \times 0.6079 = 0.2026 $$再映射回预算:
$$ \epsilon_{A} = \frac{\gamma}{\mathrm{PSL}_{A}} = \frac{0.5}{0.4053} \approx 1.23 , \\ \epsilon_{B} = \frac{\gamma}{\mathrm{PSL}_{B}} = \frac{0.5}{0.2026} \approx 2.47 $$PSL 方法通过 P-series 为敏感位置分配递减预算,再结合距离与节点度为邻居分配个性化预算,并支持时间动态调整,实现“重要位置多留数据,敏感位置多加噪声”的精细化隐私保护。