Facebook利用10亿张社交软件图片

发布时间：2021-03-31 13:08:35 所属栏目：动态来源：互联网

导读：识别照片里的对象，或翻译一段文字等任务。自我监督学习最近在科学界受到大量关注，因为这个方法，意味着对人类标注数据的需要少很多，标注数据是一项费力费时的任务，是大多数研究人员都不愿做的事情。同时，由于自监督模型不需要经人工策划的数据集，因此

识别照片里的对象，或翻译一段文字等任务。

自我监督学习最近在科学界受到大量关注，因为这个方法，意味着对人类标注数据的需要少很多，标注数据是一项费力费时的任务，是大多数研究人员都不愿做的事情。同时，由于自监督模型不需要经人工策划的数据集，因此可以利用更大、更多样化的数据集。

在某些领域(尤其是自然语言处理领域)，自我监督学习方法已经取得了突破性的进展。许多利用无标记文本训练的算法使得诸如答疑、机器翻译、自然语言推理等应用取得了各种进展。

相比之下，计算机视觉还没有完全投入自我监督学习的革命之中。Facebook AI Research的软件工程师Priya Gopal称，SEER标志着计算机视觉领域的第一次。她告诉记者，"SEER是第一个完全自我监督的计算机视觉模型，是利用互联网的随机图像进行训练的，而相比之下，计算机视觉领域现有的自我监督方面的工作，都是利用经大量编辑过的ImageNet数据集进行训练。"

ImageNet实际上是个由数百万张图片组成的大规模数据库，这些图片都被研究人员标注了标签，ImageNet面向广大计算机视觉界开放，目的是推动人工智能的发展。

Facebook的研究人员以该项目的数据库，作为基准评估SEER的性能，他们发现，自监督模型在低照、物体检测、分割和图像分类等任务上的表现优于最先进的监督型AI系统。

Goyal表示，"SEER仅利用随机图像进行训练，性能却优于现有的自我监督模型。这个结果基本上表明，我们在计算机视觉中不需要像ImageNet这种经高度策划过的数据集，利用随机图像进行自我监督学习已经可以产生非常高质量的模型。"

由于自我监督学习需要的精密程度较高，研究人员在这方面的工作也并非没有挑战。在涉及到文本时，人工智能模型要做的是赋予单词特定的意思;但对于图像而言，算法必须给每个像素赋予一个对应的概念，同时要考虑同一个概念在不同图片中的各种角度、视图和形状。

换句话说，研究人员处理图像时，需要大量的数据以及可以复杂的信息库中推导出所有可能的视觉概念的模型。

Goyal和她的团队为了达到这个目的，在Facebook AI自我监督学习方面的现有基础上，开发了名为「SwAV」的新算法，SwAV算法将那些显示相似概念的图像分类为不同的组。Facebook科学家们还设计了一个深度学习算法的卷积网络，该卷积网络可以模拟人脑中神经元的连接模式，以及为图像中的不同对象赋予不同的重要性。

该系统用了10亿instagram图的强大数据集，至少规模是够大了。Facebook的团队用了V100 Nvidia GPU和32GB内存，模型规模增大后，团队也只得用模

（编辑：东莞站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

神舟十四号载人飞行任	微软 Visual Studio 2
FCC 文件揭示苹果神秘	欧洲首家本土电池厂 N