VideoCLIP: An Interactive CLIP-based Video Retrieval System at VBS2023

Conference proceedings article


ผู้เขียน/บรรณาธิการ


กลุ่มสาขาการวิจัยเชิงกลยุทธ์


รายละเอียดสำหรับงานพิมพ์

รายชื่อผู้แต่งNguyen, Thao-Nhu; Puangthamawathanakun, Bunyarit; Caputo, Annalina; Healy, Graham; Nguyen, Binh T.;
Arpnikanondt, Chonlameth; Gurrin, Cathal;

ผู้เผยแพร่Springer Science and Business Media Deutschland GmbH

ปีที่เผยแพร่ (ค.ศ.)2023

Volume number13833 LNCS

หน้าแรก671

หน้าสุดท้าย677

จำนวนหน้า7

ISBN9783031270765

นอก3029743

URLhttps://www.scopus.com/inward/record.uri?eid=2-s2.0-85152586672&doi=10.1007%2f978-3-031-27077-2_57&partnerID=40&md5=b5b8bfe02eab30709d5a210ccafcf1ce

ภาษาEnglish-Great Britain (EN-GB)


ดูในเว็บของวิทยาศาสตร์ | ดูบนเว็บไซต์ของสำนักพิมพ์ | บทความในเว็บของวิทยาศาสตร์


บทคัดย่อ

In this paper, we present an interactive video retrieval system named VideoCLIP developed for the Video Browser Showdown 2023. To support users in solving retrieval tasks, the system enables search using a variety of modalities, such as rich text, dominant colour, OCR, and query-by-image. Moreover, a new search modality has been added to empower our core engine, which is inherited from the Contrastive Language-Image Pre-training (CLIP) model. Finally, the user interface is enhanced to display results in groups in order to reduce the effort for a user when locating potentially relevant targets. © 2023, The Author(s), under exclusive license to Springer Nature Switzerland AG.


คำสำคัญ

Embedding modelInteractive video retrievalVideo browser showdown


อัพเดทล่าสุด 2023-29-09 ถึง 07:37