SAM来了,计算机视觉领域迎来了它的“GPT

您所在的位置:网站首页 视觉绘画 SAM来了,计算机视觉领域迎来了它的“GPT

SAM来了,计算机视觉领域迎来了它的“GPT

#SAM来了,计算机视觉领域迎来了它的“GPT| 来源: 网络整理| 查看: 265

这两天,Facebook的母公司Meta发布了Segment Anything Model这款图像分割基础模型,他可以从图像中准确地识别和区分单个物体,简称SAM。

之前有玩过Stable Diffusion的同学,在用到ControlNet这个插件时,有接触过“语义分割”的,或许对这个SAM的图像识别会有更深的感触。

自动分割图像中的所有内容https://www.zhihu.com/video/1627721934363414528

因为,有了更精准的对图像的识别能力后,对之后的创作就意味着更加可控和更大的创作空间。相比起现在刚热起来的Midjourney和Stable Diffusion为代表的AI绘画,SAM无疑是再次颠覆了我们对AI绘画的认知,对他们实现了类似弯道超车的效果。英伟达的人工智能科学家Jim Fan称它为,这是计算机视觉领域的“GPT-3 时刻”之一。

用交互点和框提示它https://www.zhihu.com/video/1627722192787030016

SAM是一种通用的图像分割模型,可以生成任何图像或视频中任何对象的掩码,并且可以适应不同的图像域。该项目的目标是建立一个基础的分割模型,类似于自然语言处理模型中的提示模型,使得更多人能够使用和定制该技术。

为不明确的提示生成多个有效掩码https://www.zhihu.com/video/1627722290019143680

例如,理解网页的视觉和文本内容。在 AR/VR 领域,SAM 可以根据用户的视线(眼动追踪)选择对象,然后将其“提升”为 3D。对于内容创作者,SAM 可以改进创意应用,例如提取图像区域以进行拼贴或视频编辑。SAM 可以成为AR/VR、内容创作、科学领域和更普遍的AI 系统等领域的强大组件。

SAM官网地址:https://segment-anything.com

===========================

不论是Adobe的全家桶也好,还是Midjourney也罢,抑或是Stable Diffusion,乃至今天出现的SAM。归根结底,这些都只是工具,为人类提供使用的技术工具而已。既然是工具,自然也就有不断被更新更犀利的新技术新工具所取代。如今的SAM的出现,就很可能让我们在学习AI绘画过程中,有一种,还没开始(学习Midjourney),就已经结束了(或许有了SAM,让AI绘画有了新的更便利的工具)的感觉。

在道、法、术、器的四个层面来说,上述的AI工具,都只是属于器的层面。“君子不器”,古人也告诫过我们,不要被单一的器所局限和束缚,需要的是更高层面的掌握,更多的是需要学习其工作原理和其内在逻辑,才不会因为“器”的更替而陷入被动。并不是不鼓励大家投入时间学习这些工具,而是我们需要思考在有限的时间里如何学,学到什么程度,需要斟酌是否all in,还是先“让子弹飞一会儿”呢?如今的AI爆发,带来层出不断的各方面的技术发布,更需要我们保持学习,多思考,更加重视自身底层的能力学习、培养和沉淀。在学习新技术新工具的同时,依然不要落下自己底层能力的培养,比如创造力、审美能力、思考能力、提问的能力、沟通的能力、听说读写等能力。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3