การวัดประสิทธิภาพโมเดลของ Data Mining(ดาต้า ไมนิ่ง)
การที่จะนำ Model(โมเดล) ไปใช้งานจริงได้นั้น จำเป็นต้องมีการวัดประสิทธิภาพ Model(โมเดล) เสียก่อนว่า Model(โมเดล) นั้นมีประสิทธิภาพเพียงพอที่จะนำ Model(โมเดล) ดังกล่าวมาพัฒนา หรือนำ Model(โมเดล) ที่ได้ ไปใช้งานด้านต่างๆ ซึ่งการวัดประสิทธิภาพนั้นส่วนใหญ่จะวัดค่าจากใน Table(ตาราง) ข้อมูลที่มี
โดยทั่วไปแล้วจะมีตัววัดที่นิยมใช้กันในงานวิจัยและการทำงานต่างๆ อยู่ 3 ค่า และสมการคือ
Precision(พีสิชั่น) เป็นการวัดความแม่นยำของข้อมูล โดยพิจารณาแยกทีละคลาส
Recall(รีคอล) เป็นการวัดความถูกต้องของ Model(โมเดล) โดยพิจารณาแยกทีละคลาส
Accuracy(แอคคูเลซี่) เป็นการวัดความถูกต้องของ Model(โมเดล) โดยพิจารณารวมทุกคลาส
True Positive(ทรู โพสสิทีฟ) (TP) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาสซึ่งกำลังสนใจอยู่
True Negative(ทรู เน็กกาทีฟ) (TN) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาสซึ่งไม่ได้สนใจอยู่
False Positive(ฟอล โพสสิทีฟ) (FP) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาสซึ่งกำลังสนใจอยู่
False Negative(ฟอล เน็กกาทีฟ) (FN) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาสซึ่งไม่ได้สนใจอยู่
โดยตัววัดนี้จะมาใช้ กับตาราง Confusion Matrix(คอนฟูชั่น แมททริก)
Confusion Matrix(คอนฟูชั่น แมททริก)
คือ ตารางแบบจัตุรัสโดยมีจำนวนแถวเท่ากับจำนวนคอลัมน์และเท่ากับจำนวนคลาส ดังภาพ มีคลาสคำตอบอยู่ 2 ค่า คือ yes และ no ฉะนั้นตาราง
นี้จะสร้างได้เป็นตารางขนาด 2x2 โดยข้อมูลด้านคอลัมน์คือ คลาสที่อยู่ในข้อมูลดาต้าของเรา และข้อมูลในแนวแถว คือ คลาสที่โมเดลทำนายมาได้
ตาราง Confusion Matrix(คอนฟูชั่น แมททริก) คลาสที่อยู่ในข้อมูลดาต้า actual(แอ๊คทูอาว) และข้อมูลในแนวแถว คือ คลาสที่โมเดลทำนายมาได้ predicted(พีดิกเต็ด)
ข้อมูลที่นำไปพยากรณ์
ตารางนี้จะเป็นนำข้อมูลต่างๆในตารางมาพยากรณ์ว่า Class Play(คลาสเพย์)
ตัวอย่างตารางข้อมูลที่นำไปพยากรณ์แล้ว
True Positive(ทรู โพสสิทีฟ) (TP) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาส Play = yes
- มีจำนวน 3 ตัว (แถวที่เป็นตัวหนา คือ แถวที่ 4, 7 และ 10)
True Negative(ทรู เน็กกาทีฟ) (TN) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาส Play = no
- มีจำนวน 3 ตัว (แถวที่เป็นตัวเอียง คือ แถวที่ 1, 2 และ 8
False Positive (ฟอล โพสสิทีฟ)(FP) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาส Play = yes
- มีจำนวน 1 ตัว (แถวที่ขีดเส้นใต้ คือ แถวที่ 6)
False Negative(ฟอล เน็กกาทีฟ) (FN) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาส Play = no
- มีจำนวน 3 ตัว (แถวที่ตัวอักษรปกติ คือ แถวที่ 3, 5 และ 9)
ดังนั้นจึงสร้างตาราง Confusion Matrix(คอนฟูชั่น แมททริก)
การวัดประสิทธิภาพข้อมูลของตาราง Confusion Matrix(คอนฟูชั่น แมททริก)
ค่า Precision(พิสิชั่น) ของคลาส yes คือ Precision(พิสิชั่น) (Play=yes) = 3/4 = 75%
ค่า Recall(รีคอล) ของคลาส yes คือ Recall(รีคอล) (Play=yes) = 3/6 = 50%
ค่า Accuracy(แอคคูลูซี่) เป็นการวัดความถูกต้องของโมเดล โดยพิจารณารวมทุกคลาส คือ จำนวน
True Positive(ทู โพสสิทีฟ) ของทุกคลาสรวมกันได้เท่ากับ 6/10 = 60%
อ้างอิงเนื้อหา dataminingtrend.com
การวัดประสิทธิภาพโมเดลของ (Data Mining)
Moderator: mindphp, ผู้ดูแลกระดาน
-
- PHP Hero Member
- โพสต์: 125
- ลงทะเบียนเมื่อ: 02/10/2017 10:27 am
-
- Similar Topics
- ตอบกลับ
- แสดง
- โพสต์ล่าสุด
-
- 0 ตอบกลับ
- 1605 แสดง
-
โพสต์ล่าสุด โดย md040
19/11/2016 5:21 pm
-
-
โพสต์ใหม่ ทำไมจึงต้องมี Data Mining (เหมืองข้อมูล) ?
โดย birdkritsna » 17/09/2019 6:04 pm » ใน พูดคุยเรื่องทั่วไป จับฉ่าย - 0 ตอบกลับ
- 2963 แสดง
-
โพสต์ล่าสุด โดย birdkritsna
17/09/2019 6:04 pm
-
-
-
โพสต์ใหม่ สอบถามขั้นตอนการทำ Data Mining ด้วยโปรแกรม Weka
โดย Tusaphom » 24/08/2021 8:28 pm » ใน Programming - PHP - 0 ตอบกลับ
- 1008 แสดง
-
โพสต์ล่าสุด โดย Tusaphom
24/08/2021 8:28 pm
-
-
-
โพสต์ใหม่ Data Mining (ดาต้า ไมน์นิ่ง) เหมืองข้อมูล
โดย nuattawoot » 23/08/2017 3:15 pm » ใน Share Knowledge - 0 ตอบกลับ
- 1589 แสดง
-
โพสต์ล่าสุด โดย nuattawoot
23/08/2017 3:15 pm
-
-
-
โพสต์ใหม่ การทำ Text Mining เพื่อช่วยหาคำตอบ ในการตัดสินใจ
โดย rangsan » 11/05/2018 11:38 am » ใน Python Knowledge - 0 ตอบกลับ
- 2195 แสดง
-
โพสต์ล่าสุด โดย rangsan
11/05/2018 11:38 am
-
-
-
โพสต์ใหม่ export data จาก data grid view ข้อมูลแสน row c# winform
โดย bbibbi » 29/05/2023 5:29 pm » ใน Programming - C/C++ & java & Python - 0 ตอบกลับ
- 3812 แสดง
-
โพสต์ล่าสุด โดย bbibbi
29/05/2023 5:29 pm
-
ผู้ใช้งานขณะนี้
สมาชิกกำลังดูบอร์ดนี้: ไม่มีสมาชิกใหม่ และบุคลทั่วไป 64