SAM来了，计算机视觉领域迎来了它的“GPT

您所在的位置：网站首页 › 视觉绘画 › SAM来了，计算机视觉领域迎来了它的“GPT

SAM来了，计算机视觉领域迎来了它的“GPT

#SAM来了，计算机视觉领域迎来了它的“GPT| 来源: 网络整理| 查看: 265

这两天，Facebook的母公司Meta发布了Segment Anything Model这款图像分割基础模型，他可以从图像中准确地识别和区分单个物体，简称SAM。

之前有玩过Stable Diffusion的同学，在用到ControlNet这个插件时，有接触过“语义分割”的，或许对这个SAM的图像识别会有更深的感触。

自动分割图像中的所有内容https://www.zhihu.com/video/1627721934363414528

因为，有了更精准的对图像的识别能力后，对之后的创作就意味着更加可控和更大的创作空间。相比起现在刚热起来的Midjourney和Stable Diffusion为代表的AI绘画，SAM无疑是再次颠覆了我们对AI绘画的认知，对他们实现了类似弯道超车的效果。英伟达的人工智能科学家Jim Fan称它为，这是计算机视觉领域的“GPT-3 时刻”之一。

用交互点和框提示它https://www.zhihu.com/video/1627722192787030016

SAM是一种通用的图像分割模型，可以生成任何图像或视频中任何对象的掩码，并且可以适应不同的图像域。该项目的目标是建立一个基础的分割模型，类似于自然语言处理模型中的提示模型，使得更多人能够使用和定制该技术。

为不明确的提示生成多个有效掩码https://www.zhihu.com/video/1627722290019143680

例如，理解网页的视觉和文本内容。在 AR/VR 领域，SAM 可以根据用户的视线（眼动追踪）选择对象，然后将其“提升”为 3D。对于内容创作者，SAM 可以改进创意应用，例如提取图像区域以进行拼贴或视频编辑。SAM 可以成为AR/VR、内容创作、科学领域和更普遍的AI 系统等领域的强大组件。

SAM官网地址：https://segment-anything.com

===========================

不论是Adobe的全家桶也好，还是Midjourney也罢，抑或是Stable Diffusion，乃至今天出现的SAM。归根结底，这些都只是工具，为人类提供使用的技术工具而已。既然是工具，自然也就有不断被更新更犀利的新技术新工具所取代。如今的SAM的出现，就很可能让我们在学习AI绘画过程中，有一种，还没开始（学习Midjourney），就已经结束了（或许有了SAM，让AI绘画有了新的更便利的工具）的感觉。

在道、法、术、器的四个层面来说，上述的AI工具，都只是属于器的层面。“君子不器”，古人也告诫过我们，不要被单一的器所局限和束缚，需要的是更高层面的掌握，更多的是需要学习其工作原理和其内在逻辑，才不会因为“器”的更替而陷入被动。并不是不鼓励大家投入时间学习这些工具，而是我们需要思考在有限的时间里如何学，学到什么程度，需要斟酌是否all in，还是先“让子弹飞一会儿”呢？如今的AI爆发，带来层出不断的各方面的技术发布，更需要我们保持学习，多思考，更加重视自身底层的能力学习、培养和沉淀。在学习新技术新工具的同时，依然不要落下自己底层能力的培养，比如创造力、审美能力、思考能力、提问的能力、沟通的能力、听说读写等能力。

【本文地址】

SAM来了，计算机视觉领域迎来了它的“GPT

SAM来了，计算机视觉领域迎来了它的“GPT

今日新闻

推荐新闻