我们的通用模型
DINO-XSeek
基于多模态大语言模型进行指代目标检测,能够根据用户输入的自然语言描述,精准定位目标物体。
DINO-X
支持开放集目标检测与分割,通过文本、视觉等多种提示方式,精准输出边界框、分割掩码、关键点和文本描述等多维信息。
Grounding DINO
基于文本提示智能定位物体位置和置信度,轻松应对常见、长尾及密集场景的目标检测。
T-Rex
通过视觉提示实现目标检测与计数,无需训练,适用于多场景,在密集与重叠场景中尤为出色。
我们的定制服务
通过少量样本数据训练,即可生成高质量视觉Embedding,实现特定目标的精准识别与检测。适用于长尾类别识别、工业定制、非标物体检测等复杂场景,助力业务高效验证与落地。
我们的应用场景
服装换色
支持精准更改图片中的衣服颜色,指定目标区域和RGB值即可快速生成更改后的图片。
DINO-X 开放平台:一站式计算机视觉模型服务平台