Toward Improving Robustness of Coreference Resolution for Thai Language

Conference proceedings article


ผู้เขียน/บรรณาธิการ


กลุ่มสาขาการวิจัยเชิงกลยุทธ์


รายละเอียดสำหรับงานพิมพ์

รายชื่อผู้แต่งPoomphob Suwannapichat, Sansiri Tarnpradab, Santitham Prom-On

ปีที่เผยแพร่ (ค.ศ.)2024

หน้าแรก102

หน้าสุดท้าย106

จำนวนหน้า5

URLhttps://ieeexplore.ieee.org/document/10692844


ดูบนเว็บไซต์ของสำนักพิมพ์


บทคัดย่อ

Coreference resolution aims to identify expressions in a text that refer to the same entity and establish connections between them. This paper presents an improved method for Thai coreference resolution, extending the F-coref architecture with two key enhancements. First, to handle the absence of explicit word boundaries in Thai, a pre-tokenization step is implemented before applying the model tokenizer. This ensures accurate alignment between gold coreference labels and resulting tokens. Second, an improved loss function is proposed to overcome a challenge encountered by F-coref during training. This modification prevents the model from solely optimizing coreference to null spans, ensuring a more balanced training trajectory. Empirical evaluations demonstrate the effectiveness of these modifications in boosting the robustness of Thai coreference resolution.


คำสำคัญ

ไม่พบข้อมูลที่เกี่ยวข้อง


อัพเดทล่าสุด 2024-11-10 ถึง 00:00