Why is image embeddings as queries? #5

gcy-211 · 2024-12-06T08:35:53Z

I’m confused about using image information as queries. Why would the attention map of image-text correlation be weighted towards the text information? In fact, text-to-image diffusion models all use text as the query.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Why is image embeddings as queries? #5

Why is image embeddings as queries? #5

gcy-211 commented Dec 6, 2024

Why is image embeddings as queries? #5

Why is image embeddings as queries? #5

Comments

gcy-211 commented Dec 6, 2024