DEVELOPMENT OF THAI LANGUAGE PROFANITY INVESTIGATION MODEL FOR ONLINE MEDIA USING DATA MINING TECHNIQUE
Abstract
This research aims to comparatively study the process of Thai language profanity investigation for online media with data mining techniques. These models were used to investigate Thai language profanity by using a profanity dictionary that improved by Term Frequency-Inverse Class Frequency technique (or TFICF). According to this research, the comparatively study process of Thai profanity investigation with data mining techniques such as decision tree technique which gave the accuracy at 0.96 and root mean square error (RMSE) equal to 0.19, followed by Naive Bayes technique which gave the accuracy at 0.96 and RMSE equal to 0.21, and K-Nearest Neighbor technique which gave the lowest accuracy at 0.95 and RMSE equal to 0.22. Although the decision tree and Naive Bayes techniques gave the similar accuracy, profanity investigation using decision tree technique had the lowest RMSE and easy analysis pattern to more understand when compared with the other techniques.
- บทความทุกเรื่องที่ตีพิมพ์เผยแพร่ได้ผ่านการพิจารณาทางวิชาการโดยผู้ทรงคุณวุฒิในสาขาวิชา (Peer review) ในรูปแบบไม่มีชื่อผู้เขียน (Double-blind peer review) อย่างน้อย ๓ ท่าน
- บทความวิจัยที่ตีพิมพ์เป็นข้อค้นพบ ข้อคิดเห็นและความรับผิดชอบของผู้เขียนเจ้าของผลงาน และผู้เขียนเจ้าของผลงาน ต้องรับผิดชอบต่อผลที่อาจเกิดขึ้นจากบทความและงานวิจัยนั้น
- ต้นฉบับที่ตีพิมพ์ได้ผ่านการตรวจสอบคำพิมพ์และเครื่องหมายต่างๆ โดยผู้เขียนเจ้าของบทความก่อนการรวมเล่ม