การใช้โปรแกรม SPSS ในการวิเคราะห์ข้อมูลทางสถิติ
ความหมายของสถิติ
สถิติ (statistics) ให้ความหมายกว้าง ๆ ได้ 2 ประการ คือ
1. สถิติ หมายถึง ข้อความจริง หรือตัวเลขซึ่งได้รวบรวมไว้เพื่อความหมายที่แน่นอน
เช่น สถิติพลเมือง สถิติจำนวนอุบัติเหตุในรอบปี สถิติจำนวนผู้ป่วยที่มารักการรักษาพยาบาลในโรงพยาบาลหนึ่ง สถิติคนไข้เป็นโรคมะเร็ง สถิติชีพ สถิติอนามัย และดรรชนีอนามัย เป็นต้น
2. สถิติ หมายถึง ศาสตร์ที่ว่าด้วยวิธีการเก็บรวบรวมข้อความจริงและตัวเลขที่แสดง
ข้อเท็จจริงซึ่งเรียกว่า ข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการตีความตลอดจนการสรุปผลข้อมูล เพื่อใช้เป็นประโยชน์ในการตัดสินใจที่มีเหตุผล
สถิติในความหมายแรก จะหมายถึง สถิติในฐานะที่เป็นตัวเลขซึ่งเรียกว่า ข้อมูลทางสถิติ ส่วนสถิติในความหมายที่สอง จะเป็นศาสตร์ที่เรียกว่า สถิติศาสตร์ ซึ่งเป็นศาสตร์แขนกหนึ่งที่ประยุกต์มาจากคณิตศาสตร์ ทฤษฎีทางสถิติจึงมีความเกี่ยวข้องกับคณิตศาสตร์อย่างมาก เช่น ทฤษฎีความน่าจะเป็น ทฤษฎีการแจกแจง ทฤษฎีการประมาณ ทฤษฎีการทดสอบสมมติฐาน ในทางปฏิบัติ กระบวนการทางสถิติ จะต้องดำเนินการตามระเบียบวิธีทางสถิติ ได้แก่ การเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการแปลความหมายหรือการตีความข้อมูล
สถิติชีพ (vital statistics)
สถิติชีพ หมายถึง ข้อมูล ข่าวสารที่เกี่ยวกับการดำรงชีวิตของประชาชน เพื่อให้ทราบถึงสภาพการณ์ของสุขอนามัยของประชาชน และการเปลี่ยนแปลงของประชากรที่อาจจะเกิดขึ้น และสามารถนำมาพิจารณาเปรียบเทียบกันได้ ได้แก่ ประชากร การเกิด การตาย การย้ายถิ่นฐาน และการหย่าร้าง สถิติชีพจึงจัดเป็นแขนงที่สำคัญแขนงหนึ่งของสถิติพรรณนา (descriptive statistics) เพื่อใช้เป็นหลักสำคัญในการอธิบายสภาวะสุขภาพ และอนามัยของประชากร โดยมีการอธิบายในรูปแบบของตัวเลข หรืออัตราต่าง ๆ
ประโยชน์ของสถิติชีพ
1. ทำให้ทราบถึงภาวะสุขภาพอนามัยของประชาชน ทราบความแตกต่างของภาวะ
สุขอนามัยระหว่างกลุ่มบุคคล สถานที่ ช่วงเวลา เมื่อมีการนำมาเปรียบเทียบกัน
2. เป็นเครื่องชี้วัดปัญหาสาธารณสุข และความรุนแรงของปัญหานั้น ๆ ทำให้
สามารถจัดลำดับความสำคัญของปัญหาสาธารณสุขเพื่อหามาตรการ แนวทางในการแก้ไขปัญหาต่อไป
สถิติอนามัย (health statistics)
สถิติอนามัย หมายถึง ข้อมูลข่าวสารที่เกี่ยวกับสาเหตุที่ทำให้ประชาชนเจ็บป่วย ตาย โดยจะประกอบด้วยข้อมูลสถิติด้านการเจ็บป่วย สาเหตุของการตาย
ประโยชน์ของสถิติอนามัย
1. ข้อมูลข่าวสารที่ได้จากสถิติอนามัยใช้เพื่อให้ความรู้เกี่ยวกับปัญหาสาธารณสุขแก่
ประชาชน ปัญหาความรุนแรงของการเจ็บป่วย เพื่อให้ประชาชนเกิดความระมัดระวัง และมีการปฏิบัติเพื่อป้องกันการเจ็บป่วยได้อย่างถูกต้อง
2. เป็นเครื่องมือชี้วัดความรุนแรงของปัญหาทั้งการเจ็บป่วยและการตาย ทำให้
สามารถจัดลำดับความสำคัญของปัญหาได้ เมื่อนำความรุนแรงของปัญหามาเปรียบเทียบกัน
3. เป็นแนวทางในการหาวิธีป้องกันการเกิดปัญหาเหล่านั้น ตลอดจนการหาวิธีเพื่อ
ลดความรุนแรงของปัญหา วิธีป้องกันการเจ็บป่วยหรือจำกัดความรุนแรงของการเจ็บป่วยไว้ไม่ให้ถึงแก่ชีวิต
ดรรชนีอนามัย (health indices)
ดรรชนีอนามัย เป็นการวัดด้านปริมาณเพื่อแสดงถึงสุขภาพของประชาชนในชุมชน ในด้านต่าง ๆ กันที่เกี่ยวข้องกับสุขภาพอนามัย โดยมีการอธิบายในรูปแบบอัตรา อัตราส่วน และสัดส่วน
ดรรชนีอนามัย เป็นเครื่องมือบ่งชี้ความถี่ของการเกิดโรค การเจ็บป่วย การตาย และภาวะสุขภาพอนามัยต่าง ๆ ที่เกี่ยวข้อง
ข้อมูลต่าง ๆ ที่รวบรวมมาเพื่อจัดทำสถิติชีพ สถิติอนามัย หรือดรรชนีอนามัย นั้น มักเป็นการนำข้อมูลมาสรุปและนำเสนอในรูปของค่าอัตรา (rate) อัตราส่วน (ratio) หรือสัดส่วน (proportion) ดังนั้น จึงควรเข้าใจลักษณะการคิดคำนวณ และการนำไปใช้งานเสียก่อน
ประโยชน์ของดรรชนีอนามัย
1. ใช้วัดการกระจายและแนวโน้มการเกิดโรคในชุมชน
2. ใช้วิเคราะห์สถานการณ์ด้านอนามัย ปัญหาด้านสุขภาพของชุมชน ความเจ็บป่วย
การตายโดยสามารถนำดรรชนีอนามัยไปเปรียบเทียบกันภายในประเทศ ระหว่างประเทศ เพื่อประเมินสถานการณ์ด้านอนามัยได้
3. เป็นแนวทางในการวางแผนงานสาธารณสุข การกำหนดเป้าหมาย และ
การประเมินผลแผนงาน
4. ใช้ประเมินการจัดบริการสาธารณสุขและวัดผลการดำเนินงานตามโครงการต่าง ๆ
5. เป็นประโยชน์ในงานวิจัย และการศึกษาทางด้านระบาดวิทยา
ระเบียบวิธีการทางสถิติ
ระเบียบวิธีการทางสถิติ ประกอบด้วย 4 ขั้นตอน คือ
1. การเก็บรวบรวมข้อมูล (data collection) เป็นการรวบรวมข้อมูลจากแหล่งข้อมูล
ตามที่ได้มีการวางแผนไว้ ซึ่งอาจเป็นได้ทั้งข้อมูลปฐมภูมิ หรือทุติยภูมิ
2. การนำเสนอข้อมูล (data presentation) เป็นการจัดทำข้อมูลที่รวบรวมได้ให้อยู่ใน
รูปแบบที่กะทัดรัด เช่น ตาราง กราฟ แผนภูมิ ข้อความ เพื่อความสะดวกในการอ่านข้อมูล ให้เข้าใจง่ายและเพื่อประโยชน์ในการวิเคราะห์ต่อไป
3. การวิเคราะห์ข้อมูล (data analysis) เป็นขั้นตอนการประมวลผลข้อมูล ซึ่งใน
การวิเคราะห์จำเป็นต้องใช้สูตรทางสถิติต่าง ๆ หรือใช้การอ้างอิงทางสถิติ ขึ้นกับวัตถุประสงค์ของงานนั้น ๆ เช่น การวิเคราะห์แนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย การทดสอบสมมติฐาน การประมาณค่า เป็นต้น
4. การแปลความหมาย (interpretation) เป็นขั้นตอนของการนำผลการวิเคราะห์มา
อธิบายให้บุคคลทั่วไปเข้าใจ อาจจำเป็นต้องมีการขยายความในการอธิบาย เพื่อให้งานที่ศึกษาเป็นประโยชน์ต่อคนทั่วไปได้
จากกระบวนการทางสถิติดังกล่าว เราสามารถจำแนกเป็นสถิติศาสตร์ ที่สอดคล้องกับขั้นตอนต่าง ๆ ได้ 2 ลักษณะ คือ สถิติบรรยาย (หรือสถิติเชิงพรรณนา) และสถิติอ้างอิง (หรือสถิติเชิงอนุมาน) 1. สถิติบรรยาย หรือสถิติเชิงพรรณนา (descriptive statistics) เป็นการอธิบายลักษณะของข้อมูลในรูปของการบรรยายลักษณะทั่ว ๆ ไปของข้อมูล โดยจัดนำเสนอ เป็นบทความ บทความกึ่งตาราง แสดงด้วยกราฟหรือแผนภูมิ ตลอดจนทำเป็นรูปภาพต่าง ๆ มีการคำนวณหาความหมายของข้อมูลโดยวิธีทางสถิติอย่างง่าย ๆ เพื่อให้เป็นรูปแบบของข้อมูลในเบื้องต้นให้สามารถตีความหมายของข้อมูลได้ตามความจริง
สถิติบรรยายนี้อาจทำการศึกษากับข้อมูลที่เป็นกลุ่มเล็ก ๆ หรือกลุ่มใหญ่โดยทั่ว ๆ ไปก็ได้ และผลการวิเคราะห์จะใช้อธิบายเฉพาะกลุ่มที่นำมาศึกษาเท่านั้น
สถิติบรรยายที่ใช้ในงานวิจัย เช่น การแจกแจงความถี่ ร้อยละ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย เป็นต้น
2. สถิติอ้างอิง หรือสถิติเชิงอนุมาน (inferential statistics) เป็นเทคนิคที่นำข้อมูลเพียงส่วนหนึ่งไปอธิบายเกี่ยวกับข้อมูลส่วนใหญ่โดยทั่ว ๆไป โดยใช้พื้นฐานความน่าจะเป็น เป็นหลักในการอนุมาน หรือทำนายไปยังกลุ่มประชากรเป้าหมาย การใช้สถิติอ้างอิงทำได้ 2 ลักษณะ คือ การประมาณค่าประชากร และการทดสอบสมมติฐาน
เพื่อให้มองเห็นข้อแตกต่างระหว่างสถิติบรรยาย และสถิติอ้างอิง และมองเห็นลักษณะของสถิติอ้างอิงได้อย่างเด่นชัดขึ้น จะขออธิบายความหมายของคำที่เกี่ยวข้องต่อไปนี้
1. ประชากร (population) หมายถึง ขอบเขตของข้อมูลทั้งหมดที่เรากำลัง
ทำการศึกษาหรืออาจหมายถึง กลุ่มของสิ่งของทั้งหมดที่ให้ข้อมูลตามที่เราต้องการศึกษา
ลักษณะของประชากรที่ศึกษา อาจมีจำนวนจำกัด (finite population) หรืออาจ
มีจำนวนอนันต์ (infinite population) เช่น การศึกษาเกี่ยวกับประสิทธิภาพของยาชนิดหนึ่ง ประชากรจะเป็นผลการทดสอบประสิทธิภาพของยาในผู้ป่วยที่ใช้ยานี้ ซึ่งไม่สามารถบอกถึงจำนวนทั้งหมดได้
ค่าที่ประมวลได้จากข้อมูลทั้งหมดของประชากร โดยวิธีการทางสถิติจะเรียกว่า พารามิเตอร์ (parameter) และนิยมใช้สัญลักษณ์อักษรกริกแทน เช่น
- ค่าเฉลี่ยของประชากร แทนด้วย อ่านว่า มิว (mu)
- ส่วนเบี่ยงเบนมาตรฐานของประชากร แทนด้วย อ่านว่า ซิกม่า (sigma)
- ค่าสัมประสิทธิ์สหสัมพันธ์ของประชากร แทนด้วย อ่านว่า โร (rho)
2. ตัวอย่าง (sample) หมายถึง ส่วนหนึ่งของประชากรซึ่งถูกเลือกมาศึกษา
เนื่องจากในบางครั้งพบว่า การศึกษาบางอย่างไม่อาจทำทั้งหมดของประชากรได้ เพราะต้องเสียค่าใช้จ่ายมาก เสียเวลา อาจหาประชากรทั้งหมดไม่ได้ หรือไม่สามารถกระทำกับประชากรทั้งหมดได้ จึงจำเป็นต้องเลือกตัวอย่างมาศึกษา
ค่าที่ประมวลได้จากข้อมูลของตัวอย่าง โดยวิธีการทางสถิติ จะเรียกว่า ค่าสถิติ (statistic) เช่น
- ค่าเฉลี่ยของตัวอย่าง แทนด้วย
- ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง แทนด้วย
- ค่าสัมประสิทธิ์สหสัมพันธ์ของตัวอย่าง แทนด้วย
สถิติบรรยาย (descriptive statistics)
การแจกแจงความถี่
เป็นการนำเสนอข้อมูลทั้งหมดที่รวบรวมได้ให้อยู่ในรูปแบบที่กะทัดรัด เพื่อความสะดวกในการอ่านข้อมูล เข้าใจง่าย และเพื่อประโยชน์ในการวิเคราะห์ข้อมูลต่อไป โดยทั่วไปการสร้างตารางแจกแจงความถี่ข้อมูล จะแบ่งเป็นตารางแจกแจงความถี่ข้อมูลเชิงคุณภาพ และตารางแจกแจงความถี่ข้อมูลเชิงปริมาณ
ตารางแจกแจงความถี่เชิงปริมาณ มีการคำนวณค่าที่เกี่ยวข้องต่าง ๆ ได้แก่
- พิสัย (range) เป็นความแตกต่างระหว่างค่าสังเกตสูงสุดและค่าสังเกตต่ำสุด
- อันตรภาคชั้น (class interval) เป็นความกว้างของชั้นคะแนนของค่าสังเกต
(ความแตกต่างขอบเขตบนและขอบเขตล่าง ของแต่ละอันตรภาคชั้น ความแตกต่างนี้ใช้แทนขนาดของอันตรภาคชั้น)
- ขีดจำกัดชั้น (class limit) เป็นตัวเลขเริ่มต้นและลงท้ายของแต่ละชั้น เลขที่มีค่าน้อย
กว่า เรียกว่า ขีดจำกัดล่าง (low limit) และเลขที่มีค่ามากกว่า เรียกว่า ขีดจำกัดบน (upper limit)
- ขอบเขตชั้น (class boundary) เป็นค่าที่แบ่งแยกอาณาเขตของแต่ละอันตรภาคชั้น
หาได้โดยเฉลี่ยขีดจำกัดบน และขีดจำกัดล่าง ของชั้นที่ติดกัน เรียกเลขที่มีค่าน้อยกว่าว่า ขอบเขตล่าง หรือขีดจำกัดล่างจริง (true lower limit) และเลขที่มีค่ามากกว่า ขอบเขตบน หรือขีดจำกัดบนจริง (true upper limit)
- จุดกึ่งกลาง (mid point) เป็นค่าเฉลี่ยของขอบเขตบน และขอบเขตล่าง ใช้เป็น
ตัวแทนของค่าสังเกตต่าง ๆ ในแต่ละอันตรภาคชั้น
- การแสดงจำนวนชุดข้อมูล หรือความถี่ของข้อมูลนั้น สามารถแสดงความถี่ในรูป
ของความถี่สะสม ความถี่สัมพัทธ์ และความถี่สะสมสัมพัทธ์
- ความถี่สะสม เป็นการรวมความถี่จากอันตรภาคชั้นที่มีค่าสังเกตน้อยไปยังชั้นที่มีค่า
สังเกตมาก หรือเป็นการรวบรวมในทางตรงข้ามก็ได้
- ความถี่สัมพัทธ์ เป็นสัดส่วนของความถี่ของอันตรภาคชั้น กับจำนวนค่าสังเกต
ทั้งหมด โดยทั่วไปนิยมนำเสนอในรูปร้อยละ
- ความถี่สะสมสัมพัทธ์ เป็นการสะสมความถี่สัมพัทธ์ โดยมีลักษณะเช่นเดียวกันกับ
ความถี่สะสม
แผนภูมิกราฟ
เป็นการแบ่งการนำเสนอข้อมูลเชิงคุณภาพในรูปแผนภูมิกราฟ โดยทั่วไปนิยมใช้ กราฟวงกลม กราฟแท่ง ส่วนการนำเสนอข้อมูลเชิงปริมาณ นิยมนำเสนอเป็นฮิสโตแกรม รูปหลายเหลี่ยมความถี่สัมพัทธ์
การวัดแนวโน้มเข้าสู่ส่วนกลาง
ในการนำเสนอข้อมูล เพื่อให้เห็นลักษณะของข้อมูลจากค่าตัวแทนของข้อมูลค่าใดค่าหนึ่ง ค่าตัวแทนของข้อมูลหรือการวัดแนวโน้มเข้าสู่กลาง ที่นิยมใช้ ได้แก่ ค่าเฉลี่ยเลขคณิต (arithmetic mean, ) ค่ามัธยฐาน (median) และค่าฐานนิยม (mode)
คุณสมบัติของค่าเฉลี่ย
1. เป็นตัวแทนข้อมูล ที่ใช้ข้อมูลทุกค่ามาทำการคำนวณหาขนาดของค่าเฉลี่ย
2. เนื่องจากมีการนำข้อมูลทุกค่ามาคำนวณ ตามหลักคณิตศาสตร์ จึงสามารถใช้ใน
การวิเคราะห์สถิติชั้นสูงได้
3. เนื่องจากมีการใช้ข้อมูลทุกค่ามาคำนวณ ดังนั้น หากมีข้อมูลบางตัวมีขนาดใหญ่
มาก ๆ หรือเล็กมาก ๆ ผิดปกติ จะมีผลต่อการคำนวณขนาดของค่าเฉลี่ยด้วย
4. ข้อมูลที่มีมาตรวัดเป็นนามบัญญัติ (norminal scale) และเรียงอันดัง (ordinal
scale) ไม่สามารถใช้คำนวณค่าเฉลี่ยได้
ค่ามัธยฐาน (median) เป็นค่าที่อยู่ตำแหน่งตรงกลางของข้อมูล เมื่อเรียงลำดับตามปริมาณข้อมูลทั้งหมด จากน้อยไปมาก หรือจากมากไปน้อย
คุณสมบัติของค่ามัธยฐาน
1. มัธยฐาน เป็นการใช้ค่าของข้อมูลที่อยู่ตำแหน่งตรงกลาง มาเป็นตัวแทน ดังนั้น
ข้อมูลที่มีค่ามาก หรือน้อยผิดปกติ จะไม่มีผลกระทบต่อค่ามัธยฐาน และถ้ามีการเปลี่ยนแปลงข้อมูลบางตัวในกลุ่มจะมีผลกระทบต่อค่ามัธยฐานน้อยมาก
2. มัธยฐานจะเป็นค่าตัวแทนของข้อมูลได้ใกล้เคียงกับประชากรส่วนใหญ่มากกว่า
ค่าเฉลี่ย หากการแจกแจงข้อมูลเป้ไปทางใดทางหนึ่ง
3. ข้อมูลที่มีมาตรวัดเป็นนามบัญญัติ (norminal scale) ไม่สามารถคำนวณ
ค่ามัธยฐานได้
4. กรณีที่มีข้อมูลกระจุกอยู่ค่าต่ำสุด หรือสูงสุดมากเกินไป จะไม่สามารถหา
ค่ามัธยฐานได้
ฐานนิยม (mode) เป็นค่าที่มีความถี่สูงสุดในข้อมูลชุดหนึ่ง ฐานนิยมอาจมีค่าเดียวในชุดข้อมูลนั้น หรืออาจมีหลายค่าได้ กรณีที่มีข้อมูลที่ความถี่สูงสุดเท่ากันหลายค่า
คุณสมบัติของฐานนิยม
1. สามารถคำนวณได้ง่าย รวดเร็ว
2. ใช้กับข้อมูลที่มีมาตรวัดนามบัญญัติ (norminal scale)
3. ข้อมูลที่มีค่ามาก หรือน้อยผิดปกติ จะไม่มีผลกระทบต่อค่าฐานนิยม และถ้ามี
การเปลี่ยนแปลงข้อมูลบางตัวในกลุ่มจะไม่มีผลกระทบต่อค่าฐานนิยม หรือมีน้อยมาก
ในการเลือกใช้การวัดแนวโน้มเข้าสู่ส่วนกลาง ตัวใด (ค่าเฉลี่ย มัธยฐาน ฐานนิยม) จะขึ้นกับลักษณะการกระจายของข้อมูล จุดประสงค์ของการนำไปใช้ และมาตรวัดของข้อมูลนั้น ๆ
การวัดการกระจายข้อมูล
การกระจายของข้อมูลเป็นคุณลักษณะอย่างหนึ่งที่ใช้วัดความแตกต่างของค่าของข้อมูลทั้งหมด ข้อมูลที่มีการกระจายแสดงถึงข้อมูลมีการเกาะกลุ่มอยู่ที่ค่าใกล้เคียงกัน ส่วนข้อมูลที่มีการกระจายมากแสดงว่าข้อมูลเกาะกลุ่มไม่ดี มีค่าความแตกต่างกันมาก
วิธีการวัดการกระจายมีทั้งหมด 4 วิธี ได้แก่ พิสัย ส่วนเบี่ยงเบนควอร์ไตล์ ส่วนเบี่ยงเบนเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน
1. พิสัย (range) เป็นความแตกต่างระหว่างค่าสังเกตสูงสุดและค่าสังเกตต่ำสุด
พิสัย = ค่าสูงสุด - ค่าต่ำสุด
2. ส่วนเบี่ยงเบนควอร์ไตล์ (quartile deviation : QD) หมายถึง ครึ่งหนึ่งของผลต่าง
ระหว่างข้อมูลที่ Q3 กับ Q1
3. ส่วนเบี่ยงเบนเฉลี่ย (mean deviation : MD) เป็นค่าเฉลี่ยความแตกต่างระหว่าง
ข้อมูลทุกตัวกับค่าเฉลี่ย
4. ส่วนเบี่ยงเบนมาตรฐาน (standard deviation : SD) เป็นรากที่ 2 ของค่าเฉลี่ยของ
กำลังสองของผลต่างระหว่างข้อมูลทุกตัวกับค่าเฉลี่ย
สถิติอ้างอิง (Inferential statistics)
สถิติอ้างอิง คือ การนำความรู้หรือข้อเท็จจริงที่ได้จากกลุ่มตัวอย่างซึ่งสุ่มมาจากประชากรที่ต้องการศึกษา ไปช่วยในการตัดสินใจหรือสรุปเกี่ยวกับคุณลักษณะของประชากร เรียกว่า การอนุมาน (inferential) เนื่องจากการที่จะศึกษาคุณลักษณะของประชากรโดยใช้วิธีการรวบรวมข้อมูล ข้อเท็จจริงจากทั้งประชากร เป็นไปได้ยากหรือไม่สามารถทำได้เลย
กลุ่มตัวอย่างที่ใช้ในการอนุมานเชิงสถิติ จะต้องเป็นกลุ่มตัวอย่างที่ดี ซึ่งมีคุณสมบัติเป็นตัวแทนที่ดีของประชากร กระบวนการที่จะได้มาซึ่งตัวอย่างที่ดีนั้น เรียกว่า การสุ่มตัวอย่าง (sampling) ค่าที่ได้จากกลุ่มตัวอย่าง เรียกว่า ค่าสถิติ ส่วนค่าที่ได้จากประชากร เรียกว่า พารามิเตอร์ ในการนำเอาค่าที่ได้จากกลุ่มตัวอย่าง (ค่าสถิติ) ไปสรุปผลเกี่ยวกับคุณลักษณะของประชากร (พารามิเตอร์) มี 2 วิธี คือ การประมาณค่า และการทดสอบสมมติฐาน
การประมาณค่า หมายถึง วิธีการใช้ค่าสถิติที่ได้จากตัวอย่างไปประมาณค่าพารามิเตอร์ เป็นการหาข้อสรุปที่เกี่ยวกับพารามิเตอร์ ในลักษณะของการประมาณ ซึ่งมักแสดงในรูปตัวเลข เช่น ประมาณค่าเฉลี่ยของประชากร ประมาณค่าสัดส่วนของประชากร เป็นต้น
การทดสอบสมมติฐาน
สมมติฐาน (hypothesis) คือ คำตอบที่คาดคะเนไว้ล่วงหน้า และคำตอบนี้ได้มาจากหลักการทางเหตุผล ซึ่งมาจากความรู้เดิม ประสบการณ์ เอกสาร ตำรา หรือทฤษฎีที่เกี่ยวข้อง
สมมติฐานการวิจัย คือ ความเชื่อของผู้วิจัยว่า เรื่องที่สนใจศึกษาจะมีลักษณะอย่างใดอย่างหนึ่ง ความเชื่อนั้นจะเป็นจริงหรือไม่ก็ได้
การทดสอบสมมติฐานทางสถิติ (alternative hypothesis) แบ่งเป็น 2 วิธี คือ
1. สมมติฐานเพื่อการทดสอบ (null hypothesis) เขียนแทนด้วยสัญลักษณ์ H0 เป็น
สมมติฐานที่มีลักษณะเป็นการกำหนดค่าพารามิเตอร์ที่แน่นอน ต้องการทดสอบว่าเป็นความจริงหรือไม่
2. สมมติฐานแย้ง (alternative hypothesis) เขียนแทนด้วยสัญลักษณ์ H1 เป็น
สมมติฐานที่ตั้งขึ้นมาควบคู่กับ H0 เพื่อเป็นทางเลือกหรือข้อแย้งกับ H0 ในกรณีที่ต้องปฏิเสธ H0
ขั้นตอนการทดสอบสมมติฐาน
1. กำหนดสมมติฐานเพื่อการทอสบ (H0) และสมมติฐานแย้ง (H1)
2. พิจารณาเลือกตัวสถิติที่ใช้ในการทดสอบ ที่เหมาะสมกับพารามิเตอร์ที่ต้องการ
ทดสอบ
3. กำหนดระดับนัยสำคัญ ( ) และหาอาณาเขตวิกฤตของตัวสถิติที่ใช้ในการทดสอบ
ภายใต้สมติฐานที่กำหนด
4. คำนวณค่าสถิติทดสอบจากข้อมูล
5. เปรียบเทียบค่าสถิติทดสอบที่คำนวณได้กับค่าวิกฤต (ที่ได้จากการเปิดตาราง
ค่าวิกฤตตามชนิดของสถิติต่าง ๆ) ถ้าค่าสถิติทดสอบตกอยู่ในอาณาเขตวิกฤต จะสรุปว่าปฏิเสธ H0
การใช้โปรแกรม Spss for Windows
Spss Version 10 นี้สิ่งที่เพิ่มขึ้นมาคือ View หรือ มุมมอง โดยแบ่งเป็น 2 มุมมองด้วยกัน คือ ดังภาพ
1. Variable view เป็นส่วนกำหนดคุณสมบัติของตัวแปร Variable โดยการสร้างและแก้ไขโครงสร้างตัวแปร ดังภาพ
Name = กำหนดชื่อตัวแปร
Type = กำหนดชนิดของตัวแปร
Width = กำหนดจำนวนของค่าตัวแปรหรือจำนวนความกว้างของค่าตัวแปร
Decimals= กำหนดจำนวนของจุดทศนิยม
Label= กำหนดชื่อของตัวแปรจะมีผลเมื่อเราออกแบบรายงานเป็นกราฟ
Value= กำหนดค่าตัวแปรโดยมิต้องไปกำหนดที่ Variable view
Missing = กำหนดเมื่อไม่พบค่าตัวแปรของชุดตัวแปรนั้น
Columns = กำหนดความกว้างของช่อง Columns สำหรับกรอกข้อมูล
Aligh = จัดค่าของชุดตัวแปรให้ชิดซ้าย กลาง หรือ ขวา
Measure = กำหนดมาตราวัดของตัวแปร
2. Data view เป็นส่วนกำหนดค่าชุดของตัวแปรในแต่ละชุดหรือ Data entry ดังภาพ
แบบสอบถาม
ตัวอย่าง แบบสอบถามความพึงพอใจในการจัดการศึกษาระดับบัณฑิตศึกษา มหาวิทยาลัยนเรศวร
ข้อตกลง การจัดแบ่งค่าระดับความพึงพอใจดังนี้
5 = พึงพอใจมากที่สุด4 = พึงพอใจมาก3 = พึงพอใจปานกลาง2 = พึงพอใจน้อย1 = ไม่พึงพอใจ
1. เพศ [ ] ชาย [ ] หญิง
2. สาขาวิชา [ ] เทคโนโลยีและการสื่อสาร [ ] อุตสาหกรรม [ ] จิตวิทยา
[ ] ภาษาไทย [ ] ภาษาอังกฤษ [ ] บริหารการศึกษา
3. ระดับความคิดเห็น ให้ทำเครื่องหมายถูกลงบนค่าระดับความพึงพอใจที่สอดคล้องกับท่านมากที่สุด โดยใช้ข้อมูลตามข้อตกลงข้างต้น
ข้อคำถาม
5
4
3
2
1
1.การจัดเก็บเงินเพื่อการจัดกิจกรรมที่เกี่ยวข้อง
2. การเลี้ยงพบปะสังสรรค์ตามวาระ
3. การแบ่งจำนวนนิสิตในชั้นเรียน
4. การจัดการศึกษาดูงานนอกสถานที่
5. การส่งเสริมให้ทำ IS ตามแนวโน้มของเทคโนโลยี
เริ่มใช้โปรแกรม โดยท่านสามารถเปิดใช้โปรแกรมโดยไปที่ Start => Programs => Spss for Windows ดังภาพ
เมื่อเปิดโปรแกรมมาแล้วจะพบกรอบ Spss for Windows ดังภาพ
การกำหนดตัวแปร
การกำหนดตัวแปรและคุณลักษณะของตัวแปร ตัวแปร คือ ข้อคำถามต่างๆ ในแบบสอบถาม
1. การกำหนดชื่อ (Name) กำหนด ดังนี้
ข้อ 1 เพศ = Sex ข้อ 2 สาขาวิชา = Major ข้อ 3 ระดับความคิดเห็น
ข้อ 3.1 = Topic1 ข้อ 3.2 = Topic2 ข้อ 3.3 = Topic3 ข้อ 3.4 = Topic4 ข้อ 3.5 = Topic5
2. กำหนดค่าตัวแปร (Value) ดังต่อไปนี้
- Sex มีได้ 2 ค่าคือ ชาย, หญิง
- Major มี 6 ค่าคือ เทคโนโลยีและการสื่อสาร, อุตสาหกรรม , จิตวิทยา ,ภาษาไทย
ภาษาอังกฤษ , บริหารการศึกษา
- Topic 1,Topic 2,Topic 3,Topic 4,Topic 5 มีค่าตัวแปรที่เหมือนกัน 5 ค่า คือ
พึงพอใจมากที่สุด , พึงพอใจมาก , พึงพอใจปานกลาง , พึงพอใจน้อย และไม่พึงพอใจ
การวิเคราะห์ข้อมูล
1. คลิกที่เมนู Analyze เลือก Descriptive Statistic และเลือก Frequencies ดังภาพ
2. จากนั้นเราจะได้กรอบ Frequencies ดังภาพ กรอบ Frequencies ทางช่องซ้ายมือเป็น
ตัวแปรต่างๆ ที่ได้จากแบบสอบถาม ทางช่องขวามือจะเป็นส่วนเลือกตัวแปรเพื่อวิเคราะห์ข้อมูล
3. เราจะเลือกตัวแปรโดยการคลิกที่ตัวแปรที่ต้องการวิเคราะห์ทางซ้ายมือ จากนั้นคลิกปุ่มเลือก(สามเหลี่ยมสีดำ)ตัวแปรที่ต้องการวิเคราะห์ก็จะตกไปอยู่ทางช่องขวามือ ในที่นี้ให้เลือกทั้งหมดทุกตัวแปร ดังภาพ
4.คลิกปุ่ม Statistics แล้วจะได้กรอบ Frequencies Statistics ดังภาพ
5. เลือกประเภทการวิเคราะห์ข้อมูล ในที่นี้เราจะวิเคราะห์ Central Tendency และ Dispersion โดยส่วน Central Tendency เลือก Mean, Median, Mode, Sum และส่วน Dispersion เลือก Std. deviation, Minimum, Maximum ดังภาพ แล้วเลือกเสร็จเรียบร้อยแล้วให้คลิกปุ่ม Continue
จะกลับมาที่กรอบ Frequencies Statistics ดังภาพ
6. ต่อไปให้คลิกปุ่ม Charts จะได้กรอบ Frequencies Charts ดังภาพ
ในส่วน Frequencies Charts นี้ท่านสามารถเลือก Chart Type ว่าต้องการเป็น Charts ชนิดใด ในที่นี้ให้เลือก Bar charts แล้วคลิก Continue
7. เมื่อคลิกปุ่ม Continue จะกลับมาที่กรอบ Frequencies Statistics ดังภาพ จากนั้นคลิกปุ่ม OK ก็เป็นอันเสร็จสิ้นขั้นตอนการวิเคราะห์ข้อมูล
ผลการวิเคราะห์
โปรแกรม Spss จะเปิดส่วน Output Analyze มาอีกส่วนหนึ่ง ซึ่งเป็นส่วนแยกต่างหากจากส่วนโปรแกรม Spass หลัก เมื่อได้ผลการวิเคราะห์ข้อมูลเรียบร้อยแล้วให้ทำการ Save ข้อมูลโดยคลิกปุ่ม Save ดังภาพ
ในช่อง Save in กำหนดสถานที่จัดเก็บ และในช่อง File name ให้กำหนดชื่อ file ข้อมูล
นำผลที่ได้จากการวิเคราะห์ข้อมูลทางสถิติ ไปแปลงผลเป็นข้อมูลเชิงบรรยาย เพื่อประกอบการวิจัยหรือตามวัตถุประสงค์การวิเคราะห์นั้นๆ ของท่าน จำเป็นต้องมีพื้นฐานความรู้
ด้านสถิติเบื้องต้นมาก่อน จึงจะสามารถแปลงผลการวิเคราะห์ได้อย่างถูกต้องและเข้าใจ
วันพุธที่ 2 ธันวาคม พ.ศ. 2552

ชื่อ – สกุล นายพงษ์เทพ อินทร์อำคา
ชื่อเล่น เทพ
วันเดือนปีเกิด 2 เมษายน 2521
ที่อยู่(ภูมิลำเนา) 79 หมู่ที่ 8 บ้านคำพัฒนา ตำบลบ้านผือ อำเภอโพนพิสัย
จังหวัดหนองคาย 43120
ที่อยู่(ปัจจุบัน) 79 หมู่ที่ 8 บ้านคำพัฒนา ตำบลบ้านผือ อำเภอโพนพิสัย
จังหวัดหนองคาย 43120
ที่ทำงาน โรงเรียนวังหลวงพิทยาสรรพ์ ตำบลวังหลวง อำเภอเฝ้าไร่
จังหวัดหนองคาย 43120
ตำแหน่งหน้าที่การงาน ครู อันดับ คศ. 1
ประวัติการศึกษา 2543 ศึกษาศาสตรบัณฑิต สาขาการสอนคณิตศาสตร์
มหาวิทยาลัยเกษตรศาสตร์ บางเขน กรุงเทพ
คติประจำใจ เป็นคนที่ธรรมดา แต่เป็นส่วนหนึ่งที่มีค่าของสังคม
เบอร์โทรศัพท์ 087-8586768
อีเมล์ phongtepines@hotmail.com
สมัครสมาชิก:
บทความ (Atom)