การวัดประสิทธิภาพโมเดลของ (Data Mining)

หมวดสำหรับแบ่งบันความ รู้ต่างๆ จะมีหมวดย่อยๆ ในหมวดนี้ เช่น php, SQL, XML, CSS

Moderator: mindphp, ผู้ดูแลกระดาน

paoonline
PHP Hero Member
PHP Hero Member
โพสต์: 125
ลงทะเบียนเมื่อ: 02/10/2017 10:27 am

การวัดประสิทธิภาพโมเดลของ (Data Mining)

โพสต์โดย paoonline » 02/10/2017 5:35 pm

การวัดประสิทธิภาพโมเดลของ Data Mining(ดาต้า ไมนิ่ง)
การที่จะนำ Model(โมเดล) ไปใช้งานจริงได้นั้น จำเป็นต้องมีการวัดประสิทธิภาพ Model(โมเดล) เสียก่อนว่า Model(โมเดล) นั้นมีประสิทธิภาพเพียงพอที่จะนำ Model(โมเดล) ดังกล่าวมาพัฒนา หรือนำ Model(โมเดล) ที่ได้ ไปใช้งานด้านต่างๆ ซึ่งการวัดประสิทธิภาพนั้นส่วนใหญ่จะวัดค่าจากใน Table(ตาราง) ข้อมูลที่มี

โดยทั่วไปแล้วจะมีตัววัดที่นิยมใช้กันในงานวิจัยและการทำงานต่างๆ อยู่ 3 ค่า และสมการคือ
Precision(พีสิชั่น) เป็นการวัดความแม่นยำของข้อมูล โดยพิจารณาแยกทีละคลาส
Selection_013.png

Recall(รีคอล) เป็นการวัดความถูกต้องของ Model(โมเดล) โดยพิจารณาแยกทีละคลาส
Selection_011.png

Accuracy(แอคคูเลซี่) เป็นการวัดความถูกต้องของ Model(โมเดล) โดยพิจารณารวมทุกคลาส
Selection_009.png

True Positive(ทรู โพสสิทีฟ) (TP) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาสซึ่งกำลังสนใจอยู่
True Negative(ทรู เน็กกาทีฟ) (TN) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาสซึ่งไม่ได้สนใจอยู่
False Positive(ฟอล โพสสิทีฟ) (FP) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาสซึ่งกำลังสนใจอยู่
False Negative(ฟอล เน็กกาทีฟ) (FN) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาสซึ่งไม่ได้สนใจอยู่
โดยตัววัดนี้จะมาใช้ กับตาราง Confusion Matrix(คอนฟูชั่น แมททริก)

Confusion Matrix(คอนฟูชั่น แมททริก)
คือ ตารางแบบจัตุรัสโดยมีจำนวนแถวเท่ากับจำนวนคอลัมน์และเท่ากับจำนวนคลาส ดังภาพ มีคลาสคำตอบอยู่ 2 ค่า คือ yes และ no ฉะนั้นตาราง
นี้จะสร้างได้เป็นตารางขนาด 2x2 โดยข้อมูลด้านคอลัมน์คือ คลาสที่อยู่ในข้อมูลดาต้าของเรา และข้อมูลในแนวแถว คือ คลาสที่โมเดลทำนายมาได้

ตาราง Confusion Matrix(คอนฟูชั่น แมททริก) คลาสที่อยู่ในข้อมูลดาต้า actual(แอ๊คทูอาว) และข้อมูลในแนวแถว คือ คลาสที่โมเดลทำนายมาได้ predicted(พีดิกเต็ด)
Selection_005.png

ข้อมูลที่นำไปพยากรณ์
รูปภาพ
ตารางนี้จะเป็นนำข้อมูลต่างๆในตารางมาพยากรณ์ว่า Class Play(คลาสเพย์)

ตัวอย่างตารางข้อมูลที่นำไปพยากรณ์แล้ว
รูปภาพ
True Positive(ทรู โพสสิทีฟ) (TP) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาส Play = yes
- มีจำนวน 3 ตัว (แถวที่เป็นตัวหนา คือ แถวที่ 4, 7 และ 10)
True Negative(ทรู เน็กกาทีฟ) (TN) คือ จำนวนข้อมูลที่ทำนายถูกว่าเป็นคลาส Play = no
- มีจำนวน 3 ตัว (แถวที่เป็นตัวเอียง คือ แถวที่ 1, 2 และ 8
False Positive (ฟอล โพสสิทีฟ)(FP) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาส Play = yes
- มีจำนวน 1 ตัว (แถวที่ขีดเส้นใต้ คือ แถวที่ 6)
False Negative(ฟอล เน็กกาทีฟ) (FN) คือ จำนวนข้อมูลที่ทำนายผิดมาเป็นคลาส Play = no
- มีจำนวน 3 ตัว (แถวที่ตัวอักษรปกติ คือ แถวที่ 3, 5 และ 9)
ดังนั้นจึงสร้างตาราง Confusion Matrix(คอนฟูชั่น แมททริก)

การวัดประสิทธิภาพข้อมูลของตาราง Confusion Matrix(คอนฟูชั่น แมททริก)
รูปภาพ
ค่า Precision(พิสิชั่น) ของคลาส yes คือ Precision(พิสิชั่น) (Play=yes) = 3/4 = 75%
ค่า Recall(รีคอล) ของคลาส yes คือ Recall(รีคอล) (Play=yes) = 3/6 = 50%
ค่า Accuracy(แอคคูลูซี่) เป็นการวัดความถูกต้องของโมเดล โดยพิจารณารวมทุกคลาส คือ จำนวน
True Positive(ทู โพสสิทีฟ) ของทุกคลาสรวมกันได้เท่ากับ 6/10 = 60%

อ้างอิงเนื้อหา dataminingtrend.com
คุณไม่มีสิทธิ์ดูไฟล์ที่แนบมาในกระทู้

  • Similar Topics
    ตอบกลับ
    แสดง
    โพสต์ล่าสุด

ย้อนกลับไปยัง

ผู้ใช้งานขณะนี้

กำลังดูบอร์ดนี้: 2 และ บุคคลทั่วไป 0 ท่าน