日前,苹果公布了其首份关于人工智能(AI)的学术论文——“通过对付网络用于仿真和非监督图像训练”(LearningfromSimulatedandUnsupervisedImagesthroughAdversarialTraining),其中主要叙述了在计算机视觉系统中提升图像识别的方法,而这也许也标志着苹果公司研究的新方向。查阅这篇论文的英文原版,请求在智东西(公众号:zhidxcom)恢复“苹果AI论文”iTunes。下面就是这篇报告的全文:概要随着图形技术不断进步,利用制备图像训练机器学习模型显得更加更容易,这可以协助防止注解图像的便宜开支。然而,通过制备图像训练机器学习模型有可能无法超过令人满意的效果,因为制备图像与现实图像之间却是不存在区别。
为了增加这种差异,我们明确提出“仿真+无监督”自学方法,即通过计算机分解图像或制备图像来训练算法的图像识别能力。事实上,这种“仿真+无监督”自学必须将无标示的现实图像数据与早已注解的制备图像结合。在相当大程度上,它必须倚赖生成式对付网络(GAN)的新机器学习技术,它可通过两个神经网络互相对付以分解更为现实的图像。我们对标准GAN算法展开了多处关键性改动,以保有注解、防止伪影以及稳定性训练:自正则化(self-regularization)-局部对抗性损失-用于提炼图像升级鉴别器。
我们找到,这个过程可以产生高度细致的图像,在质量上和用户研究方面都早已取得证实。我们早已通过训练模型评估视线水平和手势姿态,对计算机分解图像展开定量评估。
通过用于制备图像,我们的图像识别算法早已获得了巨大进步。在没用于任何标准现实数据的情况下,我们在MPIIGaze数据集中于取得了最低水平的结果。章节随着最近高容量深度神经自学网络的兴起,大规模标示训练数据集正显得日益最重要。
可是,标准数量可观的数据构建本十分低,而且非常花费时间。为此,用于制备图像而非现实图像训练算法的点子开始经常出现,因为注解早已可实现自动化。利用XBOX360外设Kinect评估人体姿势以及其他任务,都是用于制备数据已完成的。
(图1:“仿真+无监督”自学:通过计算机分解图像或制备图像来训练算法的图像识别能力)然而,由于制备图像与现实图像之间不存在差距,用于制备图像训练算法有可能产生很多问题。因为制备图像一般来说过于现实,造成神经网络自学意味着需要了解到制备图像中的细节,并无法原始地辨识出有现实图像,进而也无法为算法获取准确的自学。
一种解决方案就是改良模拟器,可是减少真实性的计算出来往往十分便宜,RenderMan的设计也更为艰难。此外,即使最顶级的RenderMan有可能也无法仿效现实图像中的所有特征。因此,缺乏真实性有可能造成算法过度数值制备图像中不现实的细节。
在这篇论文中,我们明确提出“仿真+无监督”自学的方法,其目的就是用于并未标示现实数据的模拟器提升制备图像的真实性。提升真实性可更佳地协助训练机器学习模型,而且需要搜集任何数据,也需要人类之后标示图像。除了减少真实性,“仿真+无监督”自学还应当保有注解信息以用作训练机器学习模型,比如图一中的身旁方向不应被保有下来。
此外,由于机器学习模型对制备数据中的伪影十分脆弱,“仿真+无监督”自学也应当产生没伪影的图像。我们为“仿真+无监督”自学研发出有新的方法,我们称作SimGAN,它可以利用我们称作“提炼器网络(refinernetwork)”的神经网络从模拟器中萃取制备图像。图二中展出了这种方法的阐述:第一,黑盒子模拟器中分解制备图像,然后利用“提炼器网络”对其展开萃取。
为了减少真实性,也就是“仿真+无监督”自学算法的首要市场需求,我们必须利用类似于生成式对付网络(GAN)来训练“提炼器网络”,进而产生判断网络无法区分真假的提炼图像。第二,为了保有制备图像上的注解信息,我们必须利用“自正则化损失”填补对抗性损失,在制备图像和提炼图像之间展开改动。此外,我们还利用几乎卷积神经网络,在像素水平方面展开操作者,并保有全局结构,而非整体改动图像的内容。
第三,GAN框架拒绝训练2个神经网络展开对付,它们的目标往往过于平稳,偏向于产生伪影。为了防止飘移和产生更加强劲的伪影,造成筛选更加艰难,我们必须限定版鉴别器的接管区域为局部接管,而非整张图片接管,这造成每张图像都会产生多个局部对抗性损失。
此外,我们还引进提升训练稳定性的方法,即通过用于提炼图像而非当前“提炼器网络”中的现有图像升级鉴别器。
本文来源:星空app官方下载-www.mangantei.com
电话:400-123-4567
传 真:+86-123-4567
手 机:11801830487
邮 箱:admin@mangantei.com
地 址:广东省肇庆市通山县会和大楼8993号