当前位置: 首页 > >

GAN异常检测论文笔记(一)《GANomaly: Semi-Supervised Anomaly Detection via Adversarial Training》

发布时间:

0 Abstract:


通过使用一个联合学*高维图像空间的生成和潜伏空间的推理的生成对抗性网络,引入了这种新型的异常检测模型。在生成器网络中采用编码器-解码器-编码器子网络,使模型能够将输入图像映射为低维向量,然后用于重建生成的输出图像。额外的编码器网络的使用将这个生成器生成的图像映射到它的潜在表示。在训练期间,最小化这些图像和潜伏向量之间的距离,有助于学*正态样本的数据分布。因此,在推理时,从这个学*的数据分布的较大的距离度量表明该分布的离群点--异常点。


1 Introduction



概述了异常检测方法在X射线安检问题背景下的异常检测方法。在正常样本上训练一个模型(图A),并对正常和异常样本进行测试。当模型的输出大于一定的阈值时,异常值就会被检测出来.


2?Background of GAN.


逆向自动编码器(Adversarial Auto-Encoders,AAE)由两个子网络组成,即编码器和解码器。?这种结构将输入映射到潜伏空间,再映射回输入数据空间,称为重构。训练具有对抗性设置的自动编码器不仅可以实现更好的重构,还可以控制潜伏空间。


3?Proposed Approach



模型包含两个编码器、一个解码器和判别器网络,在三个子网络中使用。
第一个子网络是一个蝴蝶结自动编码器网络,作为模型的生成器部分。生成器通过编码器和解码器网络分别学*输入数据表示,并通过使用编码器和解码器网络重建输入图像。该子网络的形式原理如下。生成器G首先读取一个输入图像X,其中X ∈ R ,并将其前向传递给其编码器网络GE。通过使用卷积层,然后分别使用卷积层、批处理-正态和漏泄的ReLU()激活,G E将X压缩成一个向量z,其中z∈R d。这种方法将向量z进行放大,以重建图像X为?X。基于这些,生成器网络G通过?X = G D (z)生成图像?X,其中z = G E (X)。E对?X进行降维,找到它的特征表示?z = E( ?X)(图2B)。为了一致比较,向量? z的维度与z的维度相同。
第三个子网络是判别器网络D,其目标是将输入?X和输出?X分别分类为真假。这个子网络是DCGAN[31]中介绍的标准判别器网络。


4 model training


我们假设,当异常图像被正向传递到网络G中时,尽管G E设法将输入X映射到潜伏向量z,但G D却无法重构异常。
这是因为在训练过程中,网络只对正常样本进行建模,而它的参数设置不适合生成异常样本。当输入图像X的潜伏向量空间内存在这种差异性时,模型会将X分类为异常图像。为了验证这个假设,我们通过组合三个损失函数来制定我们的目标函数,每一个函数都对各个子网络进行了优化。


Adversarial Loss:遵循目前新的异常检测方法中的趋势[4,15],我们也使用特征匹配损失进行对抗性学*。由Salimans等[29]提出,特征匹配被证明可以减少GAN训练的不稳定性。与vanilla GAN不同的是,G是基于D(真/假)的输出来更新G,这里我们基于D的内部表示来更新G。因此,我们的对抗性损失就变成了下面的结果。



Contextual Loss:?逆向损失足以用生成的样本来欺骗判别器。然而,只有逆向损失,生成器并没有对学*输入数据的上下文信息进行优化。已经表明,通过测量输入和生成的图像之间的距离来惩罚生成器可以弥补这个问题。Isola等表明,使用L 1产生的模糊结果比L 2产生的模糊结果要少。因此,如方程2所示,我们也可以通过惩罚生成器来惩罚



Encoder Loss:上面介绍的两个损失可以强制生成器产生的图像不仅是真实的,而且是符合语境的图像。此外,我们采用了一个额外的编码器损耗来最小化输入的瓶颈特征(z = G E(x))和生成的图像的编码特征(? z = E(G(x)))之间的距离。通过这样做,生成器会学*如何对生成的图像的特征进行编码。然而,对于异常输入,它将无法将输入和生成的图像在特征空间中的距离最小化。



总的损失:



5 Evaluate model


使用了三种类型的数据集,MNIST、CIFAR和X射线安全异常检测(University Baggage Anomaly Dataset - (UBA))。?将数据集种类的一类视为异常数据,其余种类视为正常数据训练。


6 Result



?





?





6 Conclusion



?
我们介绍了一种新型的编码器
-
解码器
-
编码器架构模型,通过对抗性训练框架实现了一般异常检测。在不同复杂度的数据集基准上进行实验,并在
X
射线安全筛查的操作异常检测背景下进行实验,结果表明,所提出的方法优于当代最先进的基于
GAN
的异常检测方法,具有对任何异常检测任务的通用化能力。未来的工作将考虑采用当代新兴的
GAN
优化方法,以提高广义对抗性训练。



友情链接: