สถิติ (Statistic)

สถิติ

                    ปัญหาต่างๆที่เกี่ยวข้องกับชีวิตประจำวันหรือเกี่ยวกับการทำงาน  มีหลายปัญหาที่ต้องใช้สถิติช่วยในการแก้ปัญหา  หาข้อสรุป  และช่วยในการตัดสินใจ  เช่น
1.
   โอกาสที่ฝนจะตกในวันหนึ่งๆ - การพยากรณ์ของกรมอุตุนิยมวิทยาอาศัยข้อมูลที่เก็บสะสมไว้ในอดีต 
และข้อมูลปัจจุบัน
2.
   การทดสอบประสิทธิผลของยารักษาโรค - บริษัทที่ผลิตยาต้องนำไปทดลองใช้ 
และวิจัยผลการใช้
3.
   การควบคุมสินค้าที่ผลิต - จะมีการสุ่มนำสิ้นค้าไปทดสอบ  เช่น 
หลอดไฟฟ้า
4.
   การสำรวจความคิดเห็น (Poll) – ใช้แบบสอบถามทดสอบกับกลุ่มตัวอย่าง  นำผลที่ได้มาทดสอบโดยใช้ค่าสถิติเชื่อถือได้ 95% – 99%

แต่ปัญหาที่พบก็คือ
 
1)  กลุ่มตัวอย่างเป็นตัวแทนที่ดีหรือไม่
2)
 
การตอบคำถามจริงใจหรือไม่
3)
 การแปลผล  ผู้สำรวจซื่อตรงเพียงใด  ไม่แปลผลตามจริง

ความหมายของสถิติความหมายของสถิติมี 2 ความหมาย  คือ
1.
 สถิติหมายถึง  ตัวเลขที่บอกข้อเท็จจริงต่างๆ ของข้อมูล 
และเป็นตัวเลขที่อยู่ในลักษณะสรุปรวบยอด
2.
 สถิติหมายถึง  ศาสตร์ที่ว่าด้วยการเก็บข้อมูลและการวิเคราะห์ข้อมูล  เพื่อหาข้อสรุปจากข้อมูลที่แล้ว  นำมาอธิบายปัญหาหรือ   ปรากฏการณ์อย่างใดอย่างหนึ่ง



ประกอบด้วย
(1) การเก็บข้อมูล
(2)
 
การวิเคราะห์ข้อมูล
(3)
 การนำเสนอข้อมูล  การตัดสินใจของบุคคล  อาจมีความหมายแตกต่างกัน 
การตัดสินใจต้องอาศัยเครื่องมือในการช่วยเหลือการใช้สถิติในการตัดสินใจและวางแผนควรประกอบด้วย
ก.
 ข้อมูล  ข.
 สารสนเทศ
วิธีการเก็บรวบรวมข้อมูลเพื่อทำสถิติ
1. วิธีเก็บรวบรวมข้อมูลปฐมภูมิ  การเก็บรวบรวมข้อมูลไม่ว่าจะเป็นการสำมะโนหรือการสำรวจจากกลุ่มตัวอย่าง  ซึ่งมีหลายวิธี  คือ                   
    (1) การสัมภาษณ์  คือ  การสอบถามจากผู้ถูกสัมภาษณ์โดยตรง  ซึ่งผู้สัมภาษณ์จะเป็นผู้จดบันทึกคำตอบในแบบสอบถาม  การเก็บรวบรวมข้อมูลวิธีนี้จะได้ข้อมูลที่รวดเร็ว  นิยมใช้กันมากที่สุด  แต่ถ้าผู้สัมภาษณ์ไม่มีความซื่อสัตย์  ข้อมูลที่รวบรวมได้จะมีความคาดเคลื่อน                  
     (2) การสอบถามทางไปรษณีย์  วิธีนี้ผู้ตอบแบบสอบถามจะได้รับความสะดวกในการตอบแบบสอบถาม  จะตอบเวลาใดก็ได้  เสียค่าใช้จ่ายน้อย  แต่มีข้อเสีย คือ  ถ้าผู้ตอบแบบสอบถามไม่เข้าใจคำถาม  อาจตอบผิดพลาดได้  และผู้ตรวจไม่สามารถประมวณจำนวนแบบสอบถามที่ได้รับคืนมาว่ามีจำนวนมากน้อยเพียงใด                   
    (3) การสอบถามทางโทรศัพท์  เป็นแบบสอบถามที่มีค่าใช้จ่ายต่ำและทำได้ง่าย  แต่ไม่เป็นที่นิยมเพราะคำถามที่ใช้มักเป็นคำถามสั้นๆ  และต้องเป็นคำถามที่ผู้ตอบสามารถตอบได้ทันที                    
    (4) การสังเกต  ข้อมูลมีความน่าเชื่อถือสูง  มักใช้ประกอบกับการเก็บรวบรวมข้อมูลโดยวิธีอื่นๆ  แต่ข้อมูลอาจมีความผิดพลาดโดยเกิดจากผู้สังเกตผลของการสังเกตขึ้นอยู่กับความรู้  ความสามารถ  และประสบการณ์ของผู้สังเกต           
   (5) การทดลอง  ข้อมูลที่ได้จะถูกต้องหรือไม่ขึ้นอยู่กับสิ่งที่ทดลอง  เช่น  การเปรียบเทียบคุณภาพของยาลดความอ้วน 4 ชนิด  ก่อนการทดลองจะต้องมีการวางแผน  และกำจัดอิทธิพลของปัจจัยอื่นๆออกไป
2. วิธีการเก็บรวบรวมข้อมูลทุติยภูมิ  ส่วนใหญ่มักอยู่ในหนังสือ  รายงาน  บทความ  หรือเอกสารขององค์กรต่างๆ  ทั้งภาครัฐและเอกชน  ผู้ใช้ต้องคำนึงถึงข้อมูลต่อไปนี้                    
(1) ผู้เขียนรายงานบทความหรือเอกสารเหล่านั้นมีความรู้และความชำนาญเพียงใดน่าเชื่อถือมากน้อยเพียงใด                   
(2) พิจารณาลักษณะของข้อมูลว่ามีความน่าเชื่อถือมากน้อยเพียงใดข้อมูลที่เป็นความลับจะมีความน่าเชื่อถือน้อย                    
(3) ถ้าข้อมูลที่ผ่านการวิเคราะห์ขั้นต้นหรือขั้นสูงทางสถิติมาแล้วควรตรวจสอบการดำเนินการว่าถูกต้องเหมาะสมเพียงใด

การนำเสนอข้อมูล  ทำได้ 2 ลักษณะ
1.
 การนำเสนอข้อมูลอย่างไม่เป็นแบบแผน- การนำเสนอข้อมูลที่ไม่เป็นแบบแผน  มี 2 วิธี
1)
 
การนำเสนอข้อมูลในรูปแบบข้อความ
2)
  การนำเสนอข้อมูลในรูปแบบข้อความกึ่งตาราง
2. การนำเสนอข้อมูลอย่างเป็นแบบแผน- การนำเสนอข้อมูลที่เป็นแบบแผน
1)
 
การนำเสนอข้อมูลในรูปตาราง
2)
 
การนำเสนอข้อมูลในแผนภูมิรูปภาพ
3)
 
การนำเสนอข้อมูลในแผนภูมิรูปวงกลม
4)
 
การนำเสนอข้อมูลในแผนภูมิแท่ง
5)
  การนำเสนอข้อมูลในกราฟเส้น

การวิเคราะห์ข้อมูลเบื้องต้นเป็นการวิเคราะห์เพื่อทราบลักษณะโดยรวมของข้อมูลเกี่ยวกับเรื่องนั้นๆ  แบ่งเป็น
1.
 
การแจกแจงความถี่ของข้อมูล
2.
 
การหาค่ากลางของข้อมูล
3.
 การหาค่าการกระจายของข้อมูล

การแจกแจงความถี่ของข้อมูล (Frequency distribution)
                  เป็นวิธีการทางสถิติอย่างหนึ่งที่ใช้ในการวัดข้อมูลที่มีอยู่หรือเก็บรวบรวมได้ให้อยู่เป็นพวกๆ  เพื่อสะดวกในการนำเสนอข้อมูลและวิเคราะห์ข้อมูลเหล่านั้น
ตัวอย่าง  จงสร้างตารางแจกแจงความถี่ของคะแนนสอบของนักเรียนจำนวน 50 คน  โดยมี 7 อันตรภาคชั้น  คะแนนสอบดังนี้

59
  68  84  75  88  79  73  61  65
94
  78  89  67  62  79  65  80 
73
86
  67  73  81  72  63  76  75 
85
60
  64  59  74  70  68  92  79 
86
78
  90  62  88  93  76  85  59 
75
75
  58  77  63  62

             สร้างอันตรภาคชั้นจำนวน 7 ชั้น             
             ความกว้างของอันตรภาคชั้น = พิสัย / จำนวนชั้น 
             พิสัย = คะแนนสูงสุด - คะแนนต่ำสุด     94 58 = 36            













เทคนิคการสุ่มเก็บรวบรวมข้อมูล , เทคนิคการสุ่มตัวอย่าง

                    เนื่องจากการเก็บข้อมูลจากประชากรทุกหน่วย สามารถทำได้ยาก(ประชากรมีขนาดใหญ่) จึงจำเป็นต้องเก็บบางส่วนของประชากร ซึ่งเรียกว่าตัวอย่าง การเก็บรวบรวมข้อมูลจากตัวอย่างหรือการสุ่มตัวอย่างมีวิธีการต่างๆ ซึ่งสามารถจำแนกออกเป็น 2 กลุ่มใหญ่ๆ ได้คือ

• การสุ่มตัวอย่างโดยไม่ใช้ความน่าจะเป็น
                    - การสุ่มโดยการกำหนดโควตา (Quota Sampling) เป็นการรวบรวมข้อมูลโดยการกำหนดจำนวนหรือจัดสรรจำนวนที่มีอยู่เช่น การสุ่มนักศึกษาทั้ง 6 คณะ โดยกำหนดโควตาคณะละ 100 คน หรือกำหนดโควตาคณะละ 10% จากนักศึกษาทั้งหมดของแต่ละคณะ เป็นต้น                    - การสุ่มตัวอย่างตามสะดวก เป็นการเก็บรวบรวมข้อมูลที่ไม่มีกฎเกณฑ์ เมื่อเจอหน่วยตัวอย่างของประชากรที่ต้องการก็เพียงแต่ทำการเลือกมาตามสะดวก
• การสุ่มตัวอย่างโดยใช้ความน่าจะเป็น
                    - การสุ่มตัวอย่างอย่างง่าย (Simple Random Sampling) หมายถึงการเก็บข้อมูลจากตัวอย่างโดยที่ให้แต่ละหน่วยของประชากรมีโอกาสถูกเลือกเท่าๆ กัน การสุ่มอย่างง่ายอาจทำได้หลายวิธี เช่น
การจับฉลาก คือ การให้เบอร์หรือเลข กับทุกหน่วยของประชากรแล้วทำการสุ่มหยิบขึ้นมา ซึ่งอาจจะเป็นการสุ่มแบบใส่คืน หรือไม่ใส่คืนก็ได้
การใช้ตารางเลขสุ่ม (Table of Random Number) ทำได้โดยการกำหนดตัวเลขให้กับประชากรทุกหน่วย เช่น ประชากร 2,500 หน่วย เลขสุ่มก็จะต้องเริ่มตั้งแต่ 0001 ถึง 2500 แล้วทำการเลือกเลข 4 หลัก จากตารางเลขสุ่ม โดยอาจจะใช้เลข 4 ตัวแรก หรือ 4 ตัวท้าย ของแต่ละชุดเลขสุ่มก็ได้ การกำหนดชุดเลขสุ่มที่จะทำการเริ่มสุ่มชุดแรกและวิธีการนับเรียงตามแถวหรือเรียงตามหลักของชุดเลขสุ่มนั้นขึ้นอยู่กับผู้เก็บข้อมูลว่าจะเริ่มนับ ณ จุดใด และเรียงตามแถวและตามหลัก
การสุ่มตัวอย่างโดยใช้โปรแกรมคอมพิวเตอร์ การสุ่มโดยใช้คอมพิวเตอร์นั้นก็จะมีวิธีคล้ายๆ กับตารางเลขสุ่ม ทั้งนี้ขึ้นอยู่กับโปรแกรมที่ใช้
                    - การสุ่มตัวอย่างแบบมีระบบ (Simple Systematic Sampling)
(1)
   ในกรณีที่จำนวนประชากรหารจำนวนตัวอย่าง (N/n) แล้วมีค่าเป็นจำนวนเต็ม ในกรณีนี้ถ้าให้ k คือช่วงห่างของหน่วยตัวที่ต่อเนื่องกัน และ r คือเลขสุ่มคงที่ ที่อยู่ในช่วง 1 ถึง k (1<r< k) จะได้ว่า            หน่วยตัวอย่างที่ 1 = r (1< r <k)

            หน่วยตัวอย่างที่ 2 = r + k
            หน่วยตัวอย่างที่ 3 = r + 2k
                           . . .                           . . .
                           . . .            หน่วยตัวอย่างที่ n = r + (n-1)k

ตัวอย่าง
         หน่วยตัวอย่างที่ 1 = 4 
         หน่วยตัวอย่างที่ 2 = 4 + 5 = 9 
         หน่วยตัวอย่างที่ 3 = 4 + 10 = 14
ดังนั้น หน่วยตัวอย่างที่เป็นตัวอย่างของประชากรทั้ง 15 หน่วย คือ หน่วยที่ 4
, 9 และ 14
   จำนวนประชากร 15 หน่วย ต้องการสุ่มตัวอย่าง 3 หน่วย (N=15 , n=3)  จะได้ว่า k = 15/3 = 5  เมื่อ r คือเลขสุ่มของ 1 , 2 , 3 , 4 และ 5 ถ้าสมมุติสุ่ม (อาจจะโดยการจับฉลากหรือใช้ตารางเลขสุ่ม) เลขทั้ง 5 ตัวแล้วได้เลข 4 ดังนั้นหน่วยตัวอย่างที่ได้จะเป็น
*** การสุ่มตัวอย่างลักษณะนี้จะเรียกว่าการสุ่มตัวอย่างแบบเส้นตรง***

(2)
          หน่วยตัวอย่างที่ 1 = c (1<c<N)
          หน่วยตัวอย่างที่ 2 = c + k
          หน่วยตัวอย่างที่ 3 = c + 2k
                         . . .
          หน่วยตัวอย่างที่ n = c + (n-1)k
  ในกรณีที่จำนวนประชากรหารจำนวนตัวอย่าง (N/n) แล้วไม่เป็นจำนวนเต็ม
ในกรณีนี้จะถือว่าหน่วยที่ 1 ถึง
n ของประชากรจัดเรียงเป็นวงกลม ถ้าให้ k คือจำนวนเต็มที่มีค่าใกล้เคียงกับค่า N/n มากที่สุดและ c คือตัวเลขสุ่มที่มีค่าตั้งแต่ 1 ถึง N (1<c<N) จะได้ว่า

ตัวอย่าง
          หน่วยตัวอย่างที่ 1 = 9                 
          หน่วยตัวอย่างที่ 2 = 9 + 3 = 12               
          หน่วยตัวอย่างที่ 3 = 12 + 3 = 15                
          หน่วยตัวอย่างที่ 4 = 15 + 3 = 18 = 18 16 = 2                
          หน่วยตัวอย่างที่ 5 = 2 + 3 = 5               
จะเห็นได้ว่า จากการสุ่มหน่วยตัวอย่างที่ 3 มาหน่วยตัวอย่างที่ 4 ตัวเลขจะเกินจำนวนประชากร ดังนั้นจึงจำเป็นต้องนำเลขที่คำนวณได้ลบกับจำนวนประชากร จึงจะได้ตัวเลขที่เป็นตัวอย่าง
    มีประชากร 16 หน่วย ต้องการสุ่มตัวอย่าง 5 หน่วย (N=16 , n=5)                 จะได้ว่า k = 16/5 = 3.2 ~ 3                เมื่อ c คือเลขสุ่มตั้งแต่ 1ถึง 16 ถ้าสมมุติสุ่ม (อาจจะโดยการจับฉลากหรือใช้ตารางเลขสุ่ม) แล้วได้เลข 9 ดังนั้นหน่วยที่ 9 ดังนั้นหน่วยตัวอย่างที่ได้จะเป็น                
*** การสุ่มตัวอย่างแบบนี้จะเรียกว่าการสุ่มตัวอย่างแบบวงกลม***
- การสุ่มตัวอย่างแบบชั้นภูมิ (Stratified Sampling) 
                    การสุ่มตัวอย่างแบบชั้นภูมิ จะใช้ในกรณีที่ลักษณะของประชากรมีการกระจายตัวกันมาก เช่น รายได้ของคนไทย,อายุของประชาชนในจังหวัดพิษณุโลก ฯลฯ การสุ่มตัวอย่าง จะต้องทำการกำหนดชั้นหรือกลุ่ม ซึ่งเรียกแต่ละชั้นหรือกลุ่มว่าชั้นภูมิ(Stratum) การกำหนดชั้นภูมิจะต้องให้ข้อมูลที่อยู่ในชั้นภูมิเดียวกันมีลักษณะที่เหมือนกันหรือใกล้เคียงกันมากที่สุด แต่จะต้องทำให้ข้อมูลที่อยู่ต่างชั้นภูมิมีความแตกต่างกันมากที่สุดด้วย และการสุ่มตัวอย่างจะต้องสุ่มจากแต่ละชั้นภูมิอย่างเป็นอิสระจากกัน

ตัวอย่าง
           - การกำหนดสัดส่วน(Quota) ให้แต่ละชั้นภูมิ โดยเทียบกับจำนวนประชากร เช่น ถ้าประชากรในชั้นภูมิที่มีขนาดใหญ่เป็นอันดับ 1 จำนวนตัวอย่างที่จัดสรรก็จะต้องมีจำนวนมากเป็นอันดับ 1 ด้วย ในขณะที่ชั้นภูมิที่มีจำนวนประชากรมีขนาดเล็ก จำนวนตัวอย่างที่จัดสรรก็จะต้องมีจำนวนน้อย เป็นต้น                 
           - การกำหนดขนาดตัวอย่างโดยให้แต่ละชั้นภูมิมีจำนวนตัวอย่างเท่าๆ กัน เช่น ถ้ากำหนดตัวอย่างจำนวน n ตัว โดยมีชั้นภูมิทั้งหมด k ชั้นภูมิ ดังนั้นในแต่ละชั้นภูมิจะต้องได้จำนวนตัวอย่างที่เท่าๆกันคือ เท่ากับ n / k ตัวอย่าง
 ต้องการหาค่าเฉลี่ยรายได้ของประชาชนในจังหวัดพิษณุโลก วิธีการเก็บข้อมูลจะกำหนดให้เป็นแบบชั้นภูมิ ซึ่งอาจจะจัดได้เป็นชั้นภูมิที่ 1 ต่ำกว่า 1,000 บาท  ชั้นภูมิที่ 2 1,000 ถึง 4,999 บาท ชั้นภูมิที่ 3 5,000 ถึง 9,999 บาท                   ชั้นภูมิที่ 4 10,000 ถึง 49,999 บาท  ชั้นภูมิที่ 5 50,000 ถึง 99,999 บาท  ชั้นภูมิที่ 6 ตั้งแต่ 100,000 บาทขึ้นไป  ในแต่ละชั้นภูมิที่จัด อาจมีจำนวนประชากรไม่เท่ากัน ดังนั้นการสุ่มตัวอย่างในแต่ละชั้นภูมิ จึงสามารถกระทำได้ 2 กรณี คือ                   
      - การสุ่มตัวอย่างแบบแบ่งกลุ่ม (Cluster Sampling) การสุ่มตัวอย่างแบบแบ่งกลุ่ม จะมีลักษณะแตกต่างกับการสุ่มตัวอย่างแบบชั้นภูมิ โดยที่การสุ่มตัวอย่างแบบแบ่งกลุ่มจะต้องให้ข้อมูลที่อยู่ภายในกลุ่มมีความหลากหลายมากที่สุด (คือการทำให้ทุกหน่วยลักษณะของประชากรอยู่ภายในกลุ่มเดียวกัน)
ตัวอย่าง     การสุ่มตัวอย่างเพื่อหยั่งเสียงคะแนนเลือกตั้งสมาชิกวุฒิสภาในจังหวัดพิษณุโลก ซึ่งมีทั้งหมด 9 อำเภอ   วิธีการสุ่มตัวอย่างจะทำการสุ่มตัวอย่างแบบแบ่งกลุ่ม โดยจัดให้แต่ละอำเภอซึ่งประกอบด้วยประชากรที่มีลักษณะเหมือนๆกันเป็นกลุ่มประชากร
ดังนั้นการสุ่มตัวอย่างจึงกำหนดให้แต่ละอำเภอเป็นกลุ่ม แล้วทำการสุ่มกลุ่ม(อำเภอ)ขึ้นมาเพื่อกำหนดให้เป็นตัวอย่างของประชากรจังหวัดพิษณุโลก ซึ่งจะใช้กี่กลุ่มก็ได้ ทั้งนี้ขึ้นอยู่กับงบประมาณของผู้จัดทำ ในที่นี้ให้สุ่ม 3 อำเภอ โดยการจับฉลาก
- การสุ่มตัวอย่างแบบหลายขั้นตอน (Multi - Stage Sampling) 
               การสุ่มตัวอย่างแบบหลายขั้นตอน โดยมากจะใช้ในกรณีที่ประชากรมีขนาดใหญ่ แล้วสามารถแบ่งย่อยเป็นหน่วยต่างๆได้อีกหลายหน่วย

ตัวอย่าง
         ต้องการหารายได้เฉลี่ยต่อปีของคนไทย ซึ่งประเทศไทยมีประชากรมากกว่า 60 ล้านคน จะเห็นได้ว่าจำนวนประชากรมีขนาดใหญ่และหลากหลายทั้งอายะ อาชีพ เชื้อชาติ ฯลฯ วิธีการที่จะได้มาซึ่งข้อมูลก็จำเป็นต้องแบ่งย่อยข้อมูลออกเป็นลักษณะต่างๆ ซึ่งอาจจะสามารถทำได้ดังนี้
ขั้นที่ 1 กำหนดลักษณะชั้นความเจริญของเมือง
- เมืองหลวงและปริมณฑล
- เมืองที่มีความเจริญชั้น 1
- เมืองที่มีความเจริญชั้น 2
- เมืองที่มีความเจริญชั้น 3
- เมืองที่มีความเจริญชั้น 4

ขั้นที่ 2 สุ่มจังหวัดในแต่ละชั้นความเจริญของเมืองที่กำหนด

ขั้นที่ 3 สุ่มเลือก เขตการปกครอง หรือ อำเภอ
- อำเภอเมือง
- อำเภอชั้น 1
- อำเภอชั้น 2
- อำเภอชั้น 3

ขั้นที่ 4 สุ่มเลือกตำบล
- เขตเทศบาล
- ตำบลชั้น 1
- ตำบลชั้น 2

ขั้นที่ 5 สุ่มเลือกหมู่บ้าน

ขั้นที่ 6 สุ่มเลือกครัวเรือน

ขั้นที่ 7 สุ่มเลือกบุคคลในครัวเรือน
การกำหนดการสุ่มในแต่ละขั้นตอน จะทำโดยเทคนิคใดก็ได้ ทั้งนี้ขึ้นอยู่กับความเหมาะสมและข้อจำกัดของงานวิจัยนั้นๆ
 
คำสำคัญเกี่ยวกับสถิติ
·         สถิติเชิงพรรณนา (Descriptive  statistics)  หมายถึงสถิติที่ว่าด้วยการเก็บรวบรวมการนำเสนอ  การวิเคราะห์  และการตีความหมายของข้อมูล  ซึ่งสถิติที่จะได้จะแสดงลักษณะของข้อมูลนั้น  ไม่ได้ใช้การทำนายหรือคาดคะเนลักษณะประชากร
ตัวอย่าง
  การวิเคราะห์ข้อมูล  เช่น  การวัดแนวโน้มสู่ส่วนกลาง (ค่าเฉลี่ยเลขคณิต  ฐานนิยม  มัธยฐาน)  และการวัดการกระจาย (พิสัย  ส่วนเบี่ยงเบนมาตรฐาน  ฯลฯ)
·         สถิติเชิงอนุมาน (Inferential  statistics)  หมายถึง  สถิติที่ว่าด้วยกระบวนการทั้ง 4 อย่างดังกล่าว  แต่มีการนำค่าสถิติที่ได้ไปดำเนินการตามวิธีการทบสถิติ  เพื่อทำนายหรือคาดคะเนเกี่ยวกับประชากรต่อไป
- คะแนนสอบวิชาคณิตศาสตร์ของนักเรียน 5 จำนวน  4 ห้อง  นำคะแนนมาหาคะแนนเฉลี่ย  ครูไม่ได้นำมาดำเนินการต่อไป  เรียกกระบวนการที่ครูวิเคราะห์ว่า  สถิติเชิงพรรณนา- แต่ถ้าครูนำคะแนนเฉลี่ยของนักเรียนชั้น ม. 5/4  ไปดำเนินการทางสถิติบางอย่างแล้วนำผลที่ได้มาทำนายคะแนนของนักเรียนชั้น ม.5  จำนวน 4 ห้อง  เรียกกระบวนการวิเคราะห์ของครูว่า  สถิติเชิงอนุมานฃ
·         ประชากร (Population)
 ประชากร  หมายถึง  จำนวนทั้งหมดของคน  สัตว์  หรือสิ่งของที่เราหาข้อมูล 
·         ตัวอย่าง (Sample)
 ตัวอย่าง  คือ  ประชากรส่วนหนึ่งที่เราเลือกเก็บข้อมูลมาศึกษาจากประชากรทั้งหมด  ตัวอย่างเป็นตัวแทนของประชากร
·         ค่าสถิติ (Statistics)
 ค่าสถิติ  หมายถึง  ตัวเลขที่อธิบายลักษณะของกลุ่มตัวอย่าง  ซึ่งคำนวณหรือวิเคราะห์มาจากกลุ่มตัวอย่าง
·         พารามิเตอร์ (Parameter)
 พารามิเตอร์  หมายถึง  ตัวเลขที่อธิบายลักษณะของประชากร  ซึ่งคำนวณหรือวิเคราะห์ประชากร                             ในทางปฏิบัติการคำนวณหาพารามิเตอร์โดยตรงจะกระทำได้ยาก  เพราะประชากรมีจำนวนมากจนยากแก่การวิเคราะห์  จึงต้องมีการคัดเลือกตัวอย่างจากประชากร  อย่างมีหลักเกณฑ์  เพื่อให้ได้ตัวอย่างที่แท้จริงของประชากร 
·         ทฤษฎีตัวอย่าง (Sampling Thery)
 ทฤษฎีตัวอย่าง  คือ  ทฤษฎีคัดเลือกตัวอย่าง  ซึ่งค่าสถิติที่ได้มาสามารถใช้ประมาณค่าพารามิเตอร์ได้
  • ตัวแปร (Variable)
     ตัวแปร  หมายถึง  ลักษณะหรือคุณสมบัติบางอย่างของประชากรที่เราสนใจศึกษา  ซึ่งเปลี่ยนค่าได้  ไม่ว่าจะเป็นเชิงคุณภาพหรือปริมาณ   เช่น  การศึกษาชนิดของโรคที่เป็นกันมาในภาคอีสาน        การศึกษาน้ำหนักของเด็กแรกเกิดในโรงพยาบาลแห่งหนึ่ง ตัวแปรแบ่งออกเป็น 2 ชนิด  คือ
    1.
     ตัวแปรต่อเนื่อง  คือ  ตัวแปรที่สามารถวัดค่าออกมาบนช่องที่กำหนด  เช่น  อายุของ      แบตเตอรี่ 
    รายได้
    2.
     ตัวแปรไม่ต่อเนื่อง  คือ  ตัวแปรที่มีค่าออกเป็นจำนวนนับหรือจำนวนเต็ม  เช่น 
    จำนวน
    คนงาน
     
    จำนวนสินค้า
    ค่าที่เป็นไปได้
      หมายถึง  ค่าที่ข้อมูลอาจมีค่าที่เป็นไปได้ทั้งหมดที่สามารถแทนตัวแปรได้  เช่น  คะแนนสอบวิชาคณิตศาสตร์ซึ่งเต็ม 10 คะแนน - ค่าที่เป็นไปได้  คือ  0,1,2,……,
    10
    ค่าจากการสังเกต
      หมายถึง  ค่าที่เกิดขึ้นจริงๆ ของตัวแปร  ค่าที่ได้มาจริงๆ จากการเก็บรวบรวมข้อมูล  เช่น  คะแนนสอบของนักเรียนจำนวน 8 คน  คือ  6,5,7,9,4,5,8,7
  • พิสัย  =  คะแนนสูงสุด คะแนนต่ำสุด
  • อันตรภาคชั้น  =  ช่วงแต่ละช่วงที่เราแบ่งค่าที่เป็นไปได้ 
  • ขีดจำกัดล่างของอันตรภาคชั้น (Lower limit)  =  ค่าที่เป็นไปได้น้อยที่สุดในอันตรภาคชั้นนั้น
  • ขีดจำกัดบนของอันตรภาคชั้น (Upper limit)  =  ค่าที่เป็นไปได้มากที่สุดในอันตรภาคชั้นนั้น
  • ขอบล่างของอันตรภาคชั้น (Lower boundary)  =  ค่ากึ่งกลางระหว่างขีดจำกัดล่างของอันตรภาคชั้นนั้นกับขีดจำกัดบนของ  อันตรภาคชั้นที่อยู่ติดกัน  และเป็นค่าที่เป็นไปได้ที่น้อยกว่า
  • ขอบบนของอันตรภาคชั้น (Upper boundary)  =  ค่ากึ่งกลางระหว่างขีดจำกัดบนของอันตรภาคชั้นนั้นกับขีดจำกัดล่างของอันตรภาคชั้นที่อยู่ติดกัน
  • ความกว้างของอันตรภาคชั้น (Width)  =  หาได้จากผลต่างระหว่างขอบบนและขอบล่าง
  • จุดกึ่งกลางของอันตรภาคชั้น (Midpoint)  =  ค่ากึ่งกลางระหว่างขีดจำกัดล่างและขีดจำกัดบน
  • จำนวนชั้นของอันตรภาคชั้น  =  อัตราส่วนระหว่างพิสัยกับความกว้างของอันตรภาคชั้น
  • ความกว้างของอันตรภาคชั้น =  อัตราส่วนระหว่างพิสัยกับจำนวนชั้นของอันตรภาคชั้น 
  • ความถี่สะสม  =  ผลรวมของความถี่ในอันตรภาคชั้นนั้นกัHบความถี่ในชั้นที่อยู่ต่ำกว่า
  • ความถี่สัมพัทธ์  =  อัตราส่วนระหว่างความถี่ในชั้นนั้นกับผลรวมความถี่ทั้งหมด
  • ความถี่สะสมสัมพัทธ์  =  อัตราส่วนระหว่างความถี่สะสมในชั้นนั้นกับผลรวมของความถี่ทั้งหมด


ไม่มีความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็น