NVIDIA 发布 DAM 模型:通过点击即可生成图像区域详细描述

https://describe-anything.github.io/ NVIDIA 推出的 Describe Anything Model (DAM) 是一款创新的多模态大语言模型。它能够为图像或视频中的特定区域生成详细描述,支持通过点击、框选、涂鸦或遮罩等多种交互方式指定目标区域。该模型生成的描述不仅内容丰富,还能保持出色的上下文连贯性。

目前官方提供了[在线体验 demo](https://hug