การศึกษาวิธีการจับคู่ที่อยู่โดยใช้เทคนิคการจับคู่ข้อความ กรณีศึกษาในบริษัทโทรคมนาคม
Poster
ผู้เขียน/บรรณาธิการ
กลุ่มสาขาการวิจัยเชิงกลยุทธ์
รายละเอียดสำหรับงานพิมพ์
รายชื่อผู้แต่ง: สุทธิพงศ์ อริยมงคลชัย, ปรมี วิทยานุพงศ์, พรทิพย์ เดชพิชัย, ฐิติมา โฆษิตพันธวงศ์
ปีที่เผยแพร่ (ค.ศ.): 2023
หน้าแรก: 83
หน้าสุดท้าย: 84
จำนวนหน้า: 2
ภาษา: Thai (TH)
บทคัดย่อ
โครงงานนี้มีวัตถุประสงค์เพื่อเตรียมข้อมูลและทำความสะอาดข้อมูลที่อยู่ลูกค้าของฐานข้อมูลลูกค้าและศึกษาวิธีการจับคู่ข้อความ เพื่อจำแนกลูกค้าที่ยังไม่เคยใช้บริการอินเทอร์เน็ตบรอดแบนด์ประจำที่ออกจากผู้ใช้บริการโทรศัพท์เคลื่อนที่ในฐานข้อมูลลูกค้า โดยใช้ฐานข้อมูลที่อยู่ลูกค้าที่ใช้บริการโทรศัพท์เคลื่อนที่แบบรายเดือน (mobile) จำนวน 9,958,474 ราย ฐานข้อมูลที่อยู่ลูกค้าที่ใช้บริการอินเทอร์เน็ตบรอดแบนด์ บริการอินเทอร์เน็ตความเร็วสูง โทรศัพท์ประจำที่ ชุมสาย คู่ค้าอินเทอร์เน็ต (non-mobile) จำนวน 1,996,765 ราย และฐานข้อมูลที่อยู่ลูกค้าที่ใช้บริการอินเทอร์เน็ตบรอดแบนด์ประจำที่ (fbb) จำนวน 2,100,957 ราย และวัดประสิทธิภาพของการจับคู่โดยใช้ค่าความถูกต้องจากตาราง Confusion Matrix
จากการเตรียมข้อมูลและทำความสะอาดข้อมูลด้วยฟังก์ชัน regexp_replace กำจัดข้อมูลที่สูญหาย กำจัดข้อมูลที่ซ้ำซ้อน และการจับคู่ข้อความที่อยู่แบบสมบูรณ์ สามารถลดจำนวนของข้อมูลลงไปได้ 23.33% และ 12.8% ตามลำดับ และผลการจับคู่ข้อความแบบมีเงื่อนไข บ้านเลขที่ ตำบลและอำเภอเหมือนกันแบบ one-to-many จำนวน 6,533,241 คู่ จะถูกพิจารณาโดยใช้เทคนิคการจับคู่ข้อความได้แก่ ระยะห่างเลเวนชเตย์น ความคล้ายคลึงโคไซน์ และความคล้ายคลึงแจ๊คการ์ด พบว่า ไม่ใช่ที่อยู่เดียวกัน 6,351,338 คู่ คิดเป็นร้อยละ 97.22 และผลการวัดประสิทธิภาพการใช้เทคนิคการจับคู่ข้อความด้วยการสุ่มตัวอย่างแบบชั้นภูมิ พบว่า มีความถูกต้องอยู่ระหว่าง 87.60% ถึง 93.36% ที่ระดับความเชื่อมั่นที่ 95%
คำสำคัญ
การเตรียมข้อมูล, ความคล้ายคลึงโคไซน์, ความคล้ายคลึงแจ็คการ์ด, ความถูกต้อง, ฟังก์ชัน, ระยะห่างเลเวนชเตย์น, อินเทอร์เน็ตบรอดแบนด์