Computer Vision - a youali Collection

youali 's Collections

Multimodal/Vision LLMs

Standalone Neural Modules

Diffusion Modles

Computer Vision

Computer Vision

updated Nov 13, 2023

Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks

Paper • 2311.06242 • Published Nov 10, 2023 • 96
FMViT: A multiple-frequency mixing Vision Transformer

Paper • 2311.05707 • Published Nov 9, 2023 • 7
PolyMaX: General Dense Prediction with Mask Transformer

Paper • 2311.05770 • Published Nov 9, 2023 • 8