产品信息
什么是 Plonk?
基于扩散和流匹配引入第一个生成地理位置方法!我们通过将随机位置定为图像,了解视觉内容与位置之间的关系。
OpenStreetView-5M,YFCC-100M和INAT-21的新SOTA用于视觉地理位置
生成全局概率密度图并量化可本质性
引入概率视觉地理位置的问题
我们的模型预测了来自三个主要视觉地理位置数据集的图像的位置分布:INAT-21(野生动物),YFCC-100M(自然图像)和OSV-5M(街道视图)。该模型可以通过输出适当的概率分布来处理不同级别的位置歧义。
如何使用 Plonk?
Plonk 是一种基于扩散和流匹配的生成式地理定位方法,通过对图像进行条件去噪来学习视觉内容与位置的关系,从而预测图像的地理位置分布,并在视觉地理定位方面达到了新的SOTA水平。
Plonk 的核心功能
AI驱动
Plonk 的使用场景
- 预测野生动物图像的地理位置分布。
- 预测自然图像的地理位置分布。
- 预测街景图像的地理位置分布。
Plonk 的常见问题
Plonk做什么的?
我如何使用Plonk?
Plonk有哪些核心功能?
Plonk有哪些应用场景?





















