SciOL and MuLMS-Img: introducing a large-scale multimodal scientific dataset and models for image-text tasks in the scientific domain

Export metadata

Statistics

Number of document requests

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Tim Tarsi, Heike Adel, Jan Hendrik Metzen, Dan Zhang, Matteo Finco, Annemarie FriedrichORCiDGND
Frontdoor URLhttps://opus.bibliothek.uni-augsburg.de/opus4/126483
ISBN:979-8-3503-1892-0OPAC
Parent Title (English):2024 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 3-8 January 2024, Waikoloa, HI, USA
Publisher:IEEE
Place of publication:Piscataway, NJ
Editor:Richard Souvenir, Tal Hassner, Luisa Verdoliva, Eric Mortensen
Type:Conference Proceeding
Language:English
Year of first Publication:2024
Publishing Institution:Universität Augsburg
Release Date:2025/11/26
First Page:4548
Last Page:4559
DOI:https://doi.org/10.1109/wacv57701.2024.00450
Institutes:Fakultät für Angewandte Informatik
Fakultät für Angewandte Informatik / Institut für Informatik
Fakultät für Angewandte Informatik / Institut für Informatik / Lehrstuhl für Computerlinguistik
Dewey Decimal Classification:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik