VideoCLIP: An Interactive CLIP-based Video Retrieval System at VBS2023
Conference proceedings article
ผู้เขียน/บรรณาธิการ
กลุ่มสาขาการวิจัยเชิงกลยุทธ์
รายละเอียดสำหรับงานพิมพ์
รายชื่อผู้แต่ง: Nguyen, Thao-Nhu; Puangthamawathanakun, Bunyarit; Caputo, Annalina; Healy, Graham; Nguyen, Binh T.;
Arpnikanondt, Chonlameth; Gurrin, Cathal;
ผู้เผยแพร่: Springer Science and Business Media Deutschland GmbH
ปีที่เผยแพร่ (ค.ศ.): 2023
Volume number: 13833 LNCS
หน้าแรก: 671
หน้าสุดท้าย: 677
จำนวนหน้า: 7
ISBN: 9783031270765
นอก: 3029743
ภาษา: English-Great Britain (EN-GB)
ดูในเว็บของวิทยาศาสตร์ | ดูบนเว็บไซต์ของสำนักพิมพ์ | บทความในเว็บของวิทยาศาสตร์
บทคัดย่อ
In this paper, we present an interactive video retrieval system named VideoCLIP developed for the Video Browser Showdown 2023. To support users in solving retrieval tasks, the system enables search using a variety of modalities, such as rich text, dominant colour, OCR, and query-by-image. Moreover, a new search modality has been added to empower our core engine, which is inherited from the Contrastive Language-Image Pre-training (CLIP) model. Finally, the user interface is enhanced to display results in groups in order to reduce the effort for a user when locating potentially relevant targets. © 2023, The Author(s), under exclusive license to Springer Nature Switzerland AG.
คำสำคัญ
Embedding model, Interactive video retrieval, Video browser showdown