การศึกษาวิธีการจับคู่ที่อยู่โดยใช้เทคนิคการจับคู่ข้อความ กรณีศึกษาในบริษัทโทรคมนาคม

Poster


ผู้เขียน/บรรณาธิการ


กลุ่มสาขาการวิจัยเชิงกลยุทธ์


รายละเอียดสำหรับงานพิมพ์

รายชื่อผู้แต่งสุทธิพงศ์ อริยมงคลชัย, ปรมี วิทยานุพงศ์, พรทิพย์ เดชพิชัย, ฐิติมา โฆษิตพันธวงศ์

ปีที่เผยแพร่ (ค.ศ.)2023

หน้าแรก83

หน้าสุดท้าย84

จำนวนหน้า2

ภาษาThai (TH)


บทคัดย่อ

โครงงานนี้มีวัตถุประสงค์เพื่อเตรียมข้อมูลและทำความสะอาดข้อมูลที่อยู่ลูกค้าของฐานข้อมูลลูกค้าและศึกษาวิธีการจับคู่ข้อความ เพื่อจำแนกลูกค้าที่ยังไม่เคยใช้บริการอินเทอร์เน็ตบรอดแบนด์ประจำที่ออกจากผู้ใช้บริการโทรศัพท์เคลื่อนที่ในฐานข้อมูลลูกค้า โดยใช้ฐานข้อมูลที่อยู่ลูกค้าที่ใช้บริการโทรศัพท์เคลื่อนที่แบบรายเดือน (mobile) จำนวน 9,958,474 ราย ฐานข้อมูลที่อยู่ลูกค้าที่ใช้บริการอินเทอร์เน็ตบรอดแบนด์ บริการอินเทอร์เน็ตความเร็วสูง โทรศัพท์ประจำที่ ชุมสาย คู่ค้าอินเทอร์เน็ต (non-mobile) จำนวน 1,996,765 ราย และฐานข้อมูลที่อยู่ลูกค้าที่ใช้บริการอินเทอร์เน็ตบรอดแบนด์ประจำที่  (fbb) จำนวน 2,100,957 ราย และวัดประสิทธิภาพของการจับคู่โดยใช้ค่าความถูกต้องจากตาราง Confusion Matrix

จากการเตรียมข้อมูลและทำความสะอาดข้อมูลด้วยฟังก์ชัน regexp_replace กำจัดข้อมูลที่สูญหาย กำจัดข้อมูลที่ซ้ำซ้อน และการจับคู่ข้อความที่อยู่แบบสมบูรณ์ สามารถลดจำนวนของข้อมูลลงไปได้ 23.33% และ 12.8% ตามลำดับ และผลการจับคู่ข้อความแบบมีเงื่อนไข บ้านเลขที่ ตำบลและอำเภอเหมือนกันแบบ one-to-many จำนวน 6,533,241 คู่  จะถูกพิจารณาโดยใช้เทคนิคการจับคู่ข้อความได้แก่ ระยะห่างเลเวนชเตย์น ความคล้ายคลึงโคไซน์ และความคล้ายคลึงแจ๊คการ์ด  พบว่า ไม่ใช่ที่อยู่เดียวกัน 6,351,338 คู่ คิดเป็นร้อยละ 97.22 และผลการวัดประสิทธิภาพการใช้เทคนิคการจับคู่ข้อความด้วยการสุ่มตัวอย่างแบบชั้นภูมิ พบว่า มีความถูกต้องอยู่ระหว่าง 87.60% ถึง 93.36% ที่ระดับความเชื่อมั่นที่ 95%


คำสำคัญ

การเตรียมข้อมูลความคล้ายคลึงโคไซน์ความคล้ายคลึงแจ็คการ์ดความถูกต้องฟังก์ชันระยะห่างเลเวนชเตย์นอินเทอร์เน็ตบรอดแบนด์


อัพเดทล่าสุด 2023-15-08 ถึง 17:08