Modeling a generic web classification system using design patterns
บทความในวารสาร
ผู้เขียน/บรรณาธิการ
กลุ่มสาขาการวิจัยเชิงกลยุทธ์
ไม่พบข้อมูลที่เกี่ยวข้อง
รายละเอียดสำหรับงานพิมพ์
รายชื่อผู้แต่ง: Sukakanya U., Porkaew K.
ปีที่เผยแพร่ (ค.ศ.): 2011
Volume number: 6
Issue number: 10
หน้าแรก: 2212
หน้าสุดท้าย: 2220
จำนวนหน้า: 9
นอก: 1796-203X
eISSN: 1796-203X
ภาษา: English-Great Britain (EN-GB)
บทคัดย่อ
In order to save time in extracting specific information from high volume of data in web documents, this paper proposes an architectural model of generic web document classification system using design patterns for classifying web documents. This work implements two classification techniques for classifying Thai web documents, namely centroid classification and neural network classification, based on the proposed model and compares their classification effectiveness empirically. The training data sets in this experiment consist of 500 web documents of the following five categories (100 documents for each category): mobile phone sales, book sales, travel sales, education information and company profile. Another two hundred and fifty web documents were then used to test the two classifiers. The experiment results showed that the centroid classifier outperforms the neural network classifier both in term of efficiency and effectiveness. ฉ 2011 ACADEMY PUBLISHER.
คำสำคัญ
Centroid, Document analyzer, text classification, Web classification modeling