ช่วงความเชื่อมั่น 90 ช่วงความเชื่อมั่น ใช้การแจกแจงแบบปกติ
วิธีการประเมินข้อผิดพลาดแบบสุ่มขึ้นอยู่กับบทบัญญัติของทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ เป็นไปได้ที่จะประมาณข้อผิดพลาดแบบสุ่มเฉพาะในกรณีที่ทำการวัดซ้ำในปริมาณเดียวกัน
ให้เป็นผลมาจากการวัด ป ค่าของปริมาณ x: x 1 , x 2 , …, x น ... ให้เราแสดงด้วยค่าเฉลี่ยเลขคณิต
ในทฤษฎีความน่าจะเป็นพิสูจน์แล้วว่าด้วยจำนวนการวัดที่เพิ่มขึ้น ป ค่าเฉลี่ยเลขคณิตของค่าที่วัดได้เข้าใกล้ค่าจริง:
ด้วยการวัดจำนวนน้อย ( ป 10 ปอนด์) ค่าเฉลี่ยอาจแตกต่างจากค่าจริงอย่างมาก เพื่อให้ทราบว่าค่านั้นแสดงลักษณะของค่าที่วัดได้แม่นยำเพียงใดจำเป็นต้องกำหนดช่วงเวลาความเชื่อมั่นที่เรียกว่าของผลลัพธ์
เนื่องจากการวัดที่แม่นยำอย่างแท้จริงเป็นไปไม่ได้ความน่าจะเป็นของความถูกต้องของข้อความ " ปริมาณ x มีค่าเท่ากับ »เท่ากับศูนย์ ความน่าจะเป็นของคำสั่ง“ ปริมาณ x มีความหมาย»เท่ากับหนึ่ง (100%) ดังนั้นความน่าจะเป็นของความถูกต้องของคำสั่งกลางใด ๆ จึงอยู่ในช่วงตั้งแต่ 0 ถึง 1 จุดประสงค์ของการวัดคือการหาช่วงเวลาซึ่งด้วยความน่าจะเป็นที่กำหนดไว้ล่วงหน้า ก(0 < ก < 1) находится истинное значение измеряемой величины. Этот интервал называется ช่วงความเชื่อมั่น และปริมาณที่เชื่อมโยงอย่างแยกไม่ออก ก – ระดับความเชื่อมั่น (หรือ ปัจจัยด้านความปลอดภัย). สำหรับช่วงกลางของช่วงเวลาจะใช้ค่าเฉลี่ยที่คำนวณโดยสูตร (3) ความกว้างครึ่งหนึ่งของช่วงความเชื่อมั่นคือข้อผิดพลาดแบบสุ่ม D s x (รูปที่ 1)
|
เห็นได้ชัดว่าความกว้างของช่วงความเชื่อมั่น (และด้วยเหตุนี้ข้อผิดพลาด D s x) ขึ้นอยู่กับความรุนแรงของการวัดปริมาณแต่ละครั้ง x ผม จากค่าเฉลี่ย "การกระจาย" ของผลการวัดเทียบกับค่าเฉลี่ยมีลักษณะดังนี้ รูทค่าเฉลี่ยกำลังสองข้อผิดพลาด s ซึ่งพบได้จากสูตร
, (4)
ความกว้างของช่วงความเชื่อมั่นที่ต้องการเป็นสัดส่วนโดยตรงกับข้อผิดพลาดรูท - ค่าเฉลี่ย - กำลังสอง:
. (5)
อัตราส่วนภาพ เสื้อ n, a เรียกว่า ค่าสัมประสิทธิ์ของนักเรียน; ขึ้นอยู่กับจำนวนการทดลอง ป และระดับความมั่นใจ ก.
ในรูป 1, ก, ขแสดงให้เห็นอย่างชัดเจนว่าสิ่งอื่น ๆ ที่เท่าเทียมกันเพื่อเพิ่มความน่าจะเป็นของมูลค่าที่แท้จริงที่ตกอยู่ในช่วงความเชื่อมั่นจำเป็นต้องเพิ่มความกว้างของค่าหลัง (ความน่าจะเป็นของ "ครอบคลุม" ค่า X ระยะห่างที่กว้างขึ้นด้านบน) ดังนั้นปริมาณ เสื้อ n, a ควรยิ่งมากระดับความเชื่อมั่นก็จะยิ่งสูงขึ้น ก.
เมื่อจำนวนการทดลองเพิ่มขึ้นค่าเฉลี่ยจะเข้าใกล้ค่าจริง ดังนั้นด้วยความน่าจะเป็นเท่ากัน ก สามารถกำหนดช่วงความเชื่อมั่นให้แคบลงได้ (ดูรูปที่ 1, a, ใน). ดังนั้นด้วยการเพิ่มขึ้น ป ค่าสัมประสิทธิ์ของนักเรียนควรลดลง ตารางค่าสัมประสิทธิ์ของนักเรียนขึ้นอยู่กับ ป และ ก ให้ไว้ในภาคผนวกของคู่มือนี้
ควรสังเกตว่าระดับความเชื่อมั่นไม่มีส่วนเกี่ยวข้องกับความแม่นยำของผลการวัด มูลค่า กกำหนดไว้ล่วงหน้าตามข้อกำหนดสำหรับความน่าเชื่อถือ ในการทดลองทางเทคนิคส่วนใหญ่และในการปฏิบัติในห้องปฏิบัติการค่า กเท่ากับ 0.95
การคำนวณข้อผิดพลาดแบบสุ่มในการวัดปริมาณ xดำเนินการตามลำดับต่อไปนี้:
1) คำนวณผลรวมของค่าที่วัดได้จากนั้นจึงคำนวณค่าเฉลี่ยของมูลค่าตามสูตร (3)
2) สำหรับทุกคน ผมการทดลองความแตกต่างระหว่างค่าที่วัดได้และค่าเฉลี่ยคำนวณรวมทั้งกำลังสองของความแตกต่างนี้ (ส่วนเบี่ยงเบน) (D x ผม) 2 ;
3) พบผลรวมของกำลังสองของส่วนเบี่ยงเบนจากนั้นพบข้อผิดพลาดกำลังสองเฉลี่ย เอส ตามสูตร (4);
4) สำหรับระดับความเชื่อมั่นที่กำหนด กและจำนวนการทดลองที่ดำเนินการ ป จากตารางบนหน้า 149 แอปพลิเคชั่นเลือกค่าสัมประสิทธิ์ของนักเรียนที่สอดคล้องกัน เสื้อ n, a และข้อผิดพลาดแบบสุ่มง s x ตามสูตร (5)
เพื่อความสะดวกในการคำนวณและการตรวจสอบผลลัพธ์ระดับกลางข้อมูลจะถูกป้อนลงในตารางซึ่งสามคอลัมน์สุดท้ายจะถูกกรอกตามตัวอย่างในตารางที่ 1
ตารางที่ 1
จำนวนประสบการณ์ | … | x | ง x | (ง x) 2 |
… | ||||
… | ||||
… | … | |||
ป | … | |||
S \u003d | S \u003d |
ในแต่ละกรณีค่า x มีความหมายทางกายภาพบางอย่างและหน่วยการวัดที่สอดคล้องกัน ตัวอย่างเช่นความเร่งโน้มถ่วง ก (นางสาว 2) ค่าสัมประสิทธิ์ความหนืดของของเหลว ซ (Pa × s) เป็นต้น ไม่มีคอลัมน์ในตาราง 1 อาจมีค่ากลางที่วัดได้ซึ่งจำเป็นในการคำนวณค่าที่เกี่ยวข้อง x.
ตัวอย่าง 1. เพื่อกำหนดอัตราเร่ง และ วัดเวลาเคลื่อนไหวร่างกาย t ผ่านทางของพวกเขา ส ไม่มีความเร็วเริ่มต้น ใช้อัตราส่วนที่ทราบเราได้สูตรการออกแบบ
ผลการวัดระยะทาง ส และเวลา t จะได้รับในคอลัมน์ที่สองและสามของตาราง 2. หลังจากคำนวณตามสูตร (6) แล้วให้กรอก
คอลัมน์ที่สี่พร้อมค่าความเร่ง ฉัน และหาผลรวมซึ่งเราเขียนไว้ใต้คอลัมน์นี้ในเซลล์ "S \u003d" จากนั้นเราคำนวณค่าเฉลี่ยโดยใช้สูตร (3)
.
ตารางที่ 2
จำนวนประสบการณ์ | S, ม | เสื้อ, ค | และ, นางสาว 2 | ง และ, นางสาว 2 | (ง และ) 2 , (นางสาว 2) 2 |
2,20 | 2,07 | 0,04 | 0,0016 | ||
2,68 | 1,95 | -0,08 | 0,0064 | ||
2,91 | 2,13 | 0,10 | 0,0100 | ||
3,35 | 1,96 | -0,07 | 0,0049 | ||
S \u003d | 8,11 | S \u003d | 0,0229 |
ลบออกจากแต่ละค่า ฉัน หมายถึงค้นหาความแตกต่างง ฉันและวางไว้ในคอลัมน์ที่ห้าของตาราง เรากรอกข้อมูลในคอลัมน์สุดท้ายด้วยการยกกำลังสองความแตกต่างเหล่านี้ จากนั้นเราคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบนและเขียนลงในเซลล์ที่สอง "S \u003d" ใช้สูตร (4) กำหนดข้อผิดพลาดรูท - ค่าเฉลี่ยกำลังสอง:
.
มีการตั้งค่าระดับความเชื่อมั่น ก \u003d 0.95 สำหรับจำนวนการทดลอง ป \u003d 4 จากตารางในภาคผนวก (น. 149) เลือกค่าสัมประสิทธิ์ของนักเรียน เสื้อ n, a \u003d 3.18; โดยใช้สูตร (5) เราประเมินข้อผิดพลาดแบบสุ่มในการวัดความเร่ง
ง s ก \u003d 3.18 × 0.0437 "0.139 ( นางสาว 2) .
ช่วงความเชื่อมั่นสำหรับมูลค่าที่คาดหวัง - นี่คือช่วงเวลาดังกล่าวที่คำนวณจากข้อมูลซึ่งด้วยความน่าจะเป็นที่ทราบแล้วมีความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป ค่าประมาณตามธรรมชาติสำหรับความคาดหวังทางคณิตศาสตร์คือค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้ ดังนั้นตลอดบทเรียนเราจะใช้คำว่า "average" "mean value" ในงานคำนวณช่วงความเชื่อมั่นคำตอบของประเภท "ช่วงความเชื่อมั่นของค่าเฉลี่ย [ค่าในปัญหาเฉพาะ] คือจาก [ค่าต่ำกว่า] ถึง [ค่าที่สูงกว่า]" เป็นส่วนใหญ่ ด้วยความช่วยเหลือของช่วงความเชื่อมั่นจึงเป็นไปได้ที่จะประมาณไม่เพียง แต่ค่าเฉลี่ยเท่านั้น แต่ยังรวมถึงน้ำหนักเฉพาะของคุณลักษณะเฉพาะของประชากรทั่วไปด้วย ค่าเฉลี่ยความแปรปรวนค่าเบี่ยงเบนมาตรฐานและข้อผิดพลาดซึ่งเราจะมาถึงคำจำกัดความและสูตรใหม่จะกล่าวถึงในบทเรียน ตัวอย่างและลักษณะประชากรทั่วไป .
จุดและช่วงเวลาโดยประมาณของค่าเฉลี่ย
หากค่าเฉลี่ยของประชากรทั่วไปประมาณด้วยตัวเลข (จุด) ดังนั้นการประมาณค่าเฉลี่ยที่ไม่รู้จักของประชากรทั่วไปจะถูกนำมาเป็นค่าเฉลี่ยเฉพาะซึ่งคำนวณจากตัวอย่างของการสังเกต ในกรณีนี้ค่าของค่าเฉลี่ยตัวอย่างซึ่งเป็นตัวแปรสุ่มไม่ตรงกับค่าเฉลี่ยของประชากรทั่วไป ดังนั้นเมื่อระบุค่าเฉลี่ยของตัวอย่างจึงจำเป็นต้องระบุข้อผิดพลาดในการสุ่มตัวอย่างพร้อมกัน ในการวัดข้อผิดพลาดในการสุ่มตัวอย่างข้อผิดพลาดมาตรฐานจะถูกใช้ซึ่งแสดงในหน่วยการวัดเดียวกันกับค่าเฉลี่ย ดังนั้นจึงมักใช้สัญกรณ์ต่อไปนี้:.
หากจำเป็นต้องมีการประมาณค่าเฉลี่ยเพื่อเชื่อมโยงกับความน่าจะเป็นที่แน่นอนพารามิเตอร์ที่น่าสนใจสำหรับประชากรทั่วไปจะต้องประมาณไม่ใช่ด้วยตัวเลขเดียว แต่เป็นช่วงเวลา ช่วงความเชื่อมั่นคือช่วงเวลาที่มีความน่าจะเป็นที่แน่นอน ป พบค่าของตัวบ่งชี้โดยประมาณของประชากรทั่วไป ช่วงความเชื่อมั่นซึ่งความน่าจะเป็น ป = 1 - α พบตัวแปรสุ่มคำนวณได้ดังนี้:
,
α = 1 - ป ซึ่งสามารถพบได้ในภาคผนวกของหนังสือเกี่ยวกับสถิติเกือบทุกเล่ม
ในทางปฏิบัติไม่ทราบค่าเฉลี่ยประชากรและความแปรปรวนดังนั้นความแปรปรวนของประชากรจะถูกแทนที่ด้วยความแปรปรวนของกลุ่มตัวอย่างและค่าเฉลี่ยประชากรจะถูกแทนที่ด้วยค่าเฉลี่ยตัวอย่าง ดังนั้นช่วงความเชื่อมั่นในกรณีส่วนใหญ่คำนวณได้ดังนี้:
.
สามารถใช้สูตรช่วงความเชื่อมั่นเพื่อประมาณค่าเฉลี่ยประชากร if
- ทราบค่าเบี่ยงเบนมาตรฐานของประชากรทั่วไป
- หรือไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร แต่ขนาดของกลุ่มตัวอย่างมากกว่า 30
ค่าเฉลี่ยตัวอย่างคือค่าประมาณที่เป็นกลางของค่าเฉลี่ยประชากร ในทางกลับกันความแปรปรวนตัวอย่าง ไม่ใช่การประมาณค่าความแปรปรวนของประชากรที่เป็นกลาง เพื่อให้ได้ค่าประมาณที่เป็นกลางของความแปรปรวนของประชากรในสูตรความแปรปรวนตัวอย่างขนาดตัวอย่าง n ควรแทนที่ด้วย n-1.
ตัวอย่าง 1. รวบรวมข้อมูลจากร้านกาแฟที่สุ่มเลือก 100 แห่งในเมืองที่จำนวนพนักงานโดยเฉลี่ยอยู่ที่ 10.5 โดยมีค่าเบี่ยงเบนมาตรฐาน 4.6 กำหนดช่วงความเชื่อมั่น 95% ของจำนวนพนักงานร้านกาแฟ
ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,05 .
ดังนั้นช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานคาเฟ่โดยเฉลี่ยจึงอยู่ระหว่าง 9.6 ถึง 11.4
ตัวอย่าง 2. สำหรับกลุ่มตัวอย่างสุ่มจากการสังเกตการณ์ทั่วไป 64 ค่าคำนวณค่าทั้งหมดต่อไปนี้:
ผลรวมของค่าในการสังเกต
ผลรวมของกำลังสองของการเบี่ยงเบนของค่าจากค่าเฉลี่ย .
คำนวณช่วงความเชื่อมั่น 95% สำหรับความคาดหวัง
คำนวณค่าเบี่ยงเบนมาตรฐาน:
,
คำนวณค่าเฉลี่ย:
.
แทนค่าลงในนิพจน์สำหรับช่วงความเชื่อมั่น:
ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,05 .
เราได้รับ:
ดังนั้นช่วงความเชื่อมั่น 95% สำหรับความคาดหวังทางคณิตศาสตร์ของตัวอย่างนี้อยู่ระหว่าง 7.484 ถึง 11.266
ตัวอย่างที่ 3. สำหรับกลุ่มตัวอย่างสุ่มจากการสังเกตโดยประชากรทั่วไป 100 คนค่าเฉลี่ยเท่ากับ 15.2 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 3.2 คำนวณช่วงความเชื่อมั่น 95% สำหรับความคาดหวังจากนั้นช่วงความเชื่อมั่น 99% ถ้าขนาดตัวอย่างและรูปแบบยังคงไม่เปลี่ยนแปลงและค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้นช่วงความเชื่อมั่นจะแคบลงหรือกว้างขึ้นหรือไม่
เราแทนที่ค่าเหล่านี้ในนิพจน์สำหรับช่วงความเชื่อมั่น:
ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,05 .
เราได้รับ:
.
ดังนั้นช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้อยู่ระหว่าง 14.57 ถึง 15.82
เราแทนที่ค่าเหล่านี้อีกครั้งในนิพจน์สำหรับช่วงความเชื่อมั่น:
ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,01 .
เราได้รับ:
.
ดังนั้นช่วงความเชื่อมั่น 99% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้อยู่ระหว่าง 14.37 ถึง 16.02
อย่างที่คุณเห็นเมื่อค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้นค่าวิกฤตของการแจกแจงปกติมาตรฐานก็จะเพิ่มขึ้นด้วยดังนั้นจุดเริ่มต้นและจุดสิ้นสุดของช่วงเวลาจึงอยู่ห่างจากค่าเฉลี่ยดังนั้นช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์จึงเพิ่มขึ้น
จุดและช่วงเวลาโดยประมาณของความถ่วงจำเพาะ
น้ำหนักเฉพาะของคุณสมบัติบางอย่างของตัวอย่างสามารถตีความได้ว่าเป็นการประมาณค่าจุดของน้ำหนักเฉพาะ น คุณลักษณะเดียวกันในประชากรทั่วไป หากค่านี้จำเป็นต้องเกี่ยวข้องกับความน่าจะเป็นควรคำนวณช่วงความเชื่อมั่นของความถ่วงจำเพาะ น ลักษณะในประชากรทั่วไปที่มีความน่าจะเป็น ป = 1 - α :
.
ตัวอย่างที่ 4. มีผู้สมัครสองคนในบางเมือง ก และ ข วิ่งไปหานายกเทศมนตรี ชาวเมือง 200 คนถูกสุ่มสัมภาษณ์โดย 46% ตอบว่าพวกเขาจะลงคะแนนให้กับผู้สมัคร ก, 26% - สำหรับผู้สมัคร ข และ 28% ไม่รู้ว่าพวกเขาจะโหวตให้ใคร กำหนดช่วงความเชื่อมั่น 95% สำหรับสัดส่วนของชาวเมืองที่สนับสนุนผู้สมัคร ก.
การประมาณช่วงความเชื่อมั่น
วัตถุประสงค์การเรียนรู้
สถิติพิจารณาสิ่งต่อไปนี้ สองงานหลัก:
เรามีค่าประมาณจากข้อมูลตัวอย่างและเราต้องการสร้างคำสั่งความน่าจะเป็นเกี่ยวกับค่าที่แท้จริงของพารามิเตอร์โดยประมาณ
เรามีสมมติฐานเฉพาะที่ต้องทดสอบจากข้อมูลตัวอย่าง
ในหัวข้อนี้เราพิจารณางานแรก เรายังแนะนำนิยามของช่วงความเชื่อมั่น
ช่วงความเชื่อมั่นคือช่วงเวลาที่สร้างขึ้นจากค่าพารามิเตอร์โดยประมาณและแสดงตำแหน่งที่ค่าที่แท้จริงของพารามิเตอร์โดยประมาณโดยมีค่าความน่าจะเป็นที่กำหนด
หลังจากศึกษาเนื้อหาในหัวข้อนี้แล้วคุณ:
ค้นหาว่าช่วงความเชื่อมั่นของการประมาณการคืออะไร
เรียนรู้ที่จะจำแนกงานทางสถิติ
เชี่ยวชาญเทคนิคการสร้างช่วงความเชื่อมั่นทั้งการใช้สูตรทางสถิติและการใช้เครื่องมือซอฟต์แวร์
เรียนรู้การกำหนดขนาดตัวอย่างที่ต้องการเพื่อให้ได้พารามิเตอร์ที่แน่นอนของความแม่นยำทางสถิติ
การแจกแจงลักษณะตัวอย่าง
การกระจาย T
ดังที่กล่าวไว้ข้างต้นการแจกแจงของตัวแปรสุ่มนั้นใกล้เคียงกับการแจกแจงปกติมาตรฐานที่มีพารามิเตอร์ 0 และ 1 เนื่องจากเราไม่ทราบค่าของσเราจึงแทนที่ด้วยค่าประมาณ s ปริมาณมีการกระจายที่แตกต่างกันอยู่แล้วกล่าวคือหรือ การแจกแจงของนักเรียนซึ่งกำหนดโดยพารามิเตอร์ n -1 (จำนวนองศาอิสระ) การแจกแจงนี้มีค่าใกล้เคียงกับการแจกแจงแบบปกติ (ยิ่ง n ยิ่งมีการแจกแจงเข้าใกล้มากขึ้น)
ในรูป 95
มีการนำเสนอการแจกแจงของนักเรียนด้วยความอิสระ 30 องศา อย่างที่คุณเห็นมันใกล้เคียงกับการแจกแจงปกติมาก
เช่นเดียวกับฟังก์ชันสำหรับการทำงานกับการแจกแจงปกติ NORMDIST และ NORMINV มีฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบ t - TDIST และ TINV... ตัวอย่างการใช้ฟังก์ชันเหล่านี้สามารถดูได้ในไฟล์ TDIST.XLS (เทมเพลตและโซลูชัน) และในรูปที่ 96
.
การแจกแจงลักษณะอื่น ๆ
ดังที่เราทราบแล้วในการพิจารณาความแม่นยำของการประมาณค่าความคาดหวังทางคณิตศาสตร์เราจำเป็นต้องมีการแจกแจง t ในการประมาณค่าพารามิเตอร์อื่น ๆ เช่นความแปรปรวนจำเป็นต้องมีการแจกแจงที่แตกต่างกัน สองคนคือการแจกแจงแบบ F และ x 2 - กระจาย.
ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย
ช่วงความเชื่อมั่น คือช่วงเวลาที่สร้างขึ้นจากค่าพารามิเตอร์โดยประมาณและแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณตั้งอยู่โดยมีค่าความน่าจะเป็นที่กำหนด
การสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยเกิดขึ้น ด้วยวิธีต่อไปนี้:
ตัวอย่าง
ร้านอาหารฟาสต์ฟู้ดกำลังวางแผนที่จะขยายการแบ่งประเภทด้วยแซนวิชรูปแบบใหม่ เพื่อประมาณความต้องการผู้จัดการวางแผนที่จะสุ่มเลือกผู้เยี่ยมชม 40 คนจากผู้ที่ได้ทดลองใช้แล้วและเชิญชวนให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่เป็นคะแนนตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณจำนวนคะแนนที่คาดว่าจะได้รับผลิตภัณฑ์ใหม่และ พล็อตช่วงความเชื่อมั่น 95% สำหรับการประมาณนี้ จะทำได้อย่างไร? (ดูไฟล์ SANDWICH1.XLS (เทมเพลตและโซลูชัน)
การตัดสินใจ
ในการแก้ปัญหานี้คุณสามารถใช้. ผลลัพธ์จะแสดงในรูปที่ 97
.
ช่วงความเชื่อมั่นสำหรับมูลค่าสะสม
บางครั้งจากข้อมูลตัวอย่างจำเป็นต้องประมาณค่าไม่ใช่ความคาดหวังทางคณิตศาสตร์ แต่เป็นผลรวมของค่า ตัวอย่างเช่นในสถานการณ์ที่มีผู้สอบบัญชีอาจไม่สนใจที่จะประมาณมูลค่าบัญชีโดยเฉลี่ย แต่เป็นผลรวมของบัญชีทั้งหมด
ให้ N เป็นจำนวนองค์ประกอบทั้งหมด n คือขนาดตัวอย่าง T 3 คือผลรวมของค่าในตัวอย่าง T "คือค่าประมาณสำหรับผลรวมของประชากรทั้งหมดจากนั้นช่วงความเชื่อมั่นจะคำนวณโดยสูตรโดยที่ s คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานสำหรับตัวอย่างคือค่าประมาณ ค่าเฉลี่ยสำหรับกลุ่มตัวอย่าง
ตัวอย่าง
สมมติว่าสำนักงานสรรพากรบางแห่งต้องการประเมินการขอคืนภาษีทั้งหมดสำหรับผู้เสียภาษี 10,000 ราย ผู้เสียภาษีจะได้รับเงินคืนหรือจ่ายภาษีเพิ่มเติม ค้นหาช่วงความเชื่อมั่น 95% สำหรับจำนวนเงินที่คืนโดยสมมติว่ามีขนาดตัวอย่าง 500 คน (ดู RETURNS SUM.XLS (เทมเพลตและโซลูชัน)
การตัดสินใจ
ไม่มีขั้นตอนพิเศษใน StatPro สำหรับกรณีนี้คุณจะเห็นว่าขอบเขตสามารถหาได้จากขอบเขตสำหรับค่าเฉลี่ยตามสูตรข้างต้น (รูปที่ 98
).
ช่วงความเชื่อมั่นสำหรับสัดส่วน
ให้ p เป็นความคาดหวังทางคณิตศาสตร์ของส่วนแบ่งของลูกค้าและ p ในการประมาณของส่วนแบ่งนี้ที่ได้จากตัวอย่างขนาด n สามารถแสดงให้เห็นได้ว่ามีขนาดใหญ่เพียงพอ การแจกแจงของค่าประมาณจะใกล้เคียงปกติโดยมีค่าเฉลี่ย p และส่วนเบี่ยงเบนมาตรฐาน ... ในกรณีนี้ข้อผิดพลาดมาตรฐานของการประมาณจะแสดงเป็น และช่วงความเชื่อมั่นเป็น .
ตัวอย่าง
ร้านอาหารฟาสต์ฟู้ดกำลังวางแผนที่จะขยายการจัดประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประมาณความต้องการผู้จัดการได้สุ่มเลือกผู้เยี่ยมชม 40 คนจากผู้ที่ได้ทดลองใช้แล้วและเชิญให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่เป็นคะแนนตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณส่วนแบ่งที่คาดหวังของลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่เป็นอย่างน้อย มากกว่า 6 คะแนน (เขาคาดว่าลูกค้าเหล่านี้จะเป็นผู้บริโภคผลิตภัณฑ์ใหม่)
การตัดสินใจ
ในขั้นต้นเราสร้างคอลัมน์ใหม่โดยยึดตาม 1 หากคะแนนของลูกค้ามากกว่า 6 คะแนนและ 0 เป็นอย่างอื่น (ดูไฟล์ SANDWICH2.XLS (เทมเพลตและโซลูชัน)
วิธีที่ 1
การนับจำนวน 1 เราจะประมาณส่วนแบ่งจากนั้นเราใช้สูตร
ค่า z cr นำมาจากตารางพิเศษของการแจกแจงปกติ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)
การใช้แนวทางนี้และข้อมูลเฉพาะเพื่อสร้างช่วงเวลา 95% เราได้ผลลัพธ์ดังต่อไปนี้ (รูปที่ 99
). ค่าวิกฤตของพารามิเตอร์ z cr คือ 1.96 ข้อผิดพลาดมาตรฐานของการประมาณคือ 0.077 ขีด จำกัด ล่างของช่วงความเชื่อมั่นคือ 0.475 ขีด จำกัด บนของช่วงความเชื่อมั่นคือ 0.775 ดังนั้นผู้จัดการจึงมีสิทธิ์ที่จะเชื่อด้วยความมั่นใจ 95% ว่าเปอร์เซ็นต์ของลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่ 6 คะแนนขึ้นไปจะอยู่ระหว่าง 47.5 ถึง 77.5
วิธีที่ 2
งานนี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการทำเช่นนี้ก็เพียงพอที่จะสังเกตว่าส่วนแบ่งในกรณีนี้เกิดขึ้นพร้อมกับค่าเฉลี่ยของคอลัมน์ Type จากนั้นเราก็นำไปใช้ StatPro / การอนุมานทางสถิติ / การวิเคราะห์ตัวอย่างเดียว เพื่อสร้างช่วงความเชื่อมั่นของค่าเฉลี่ย (ค่าประมาณของค่าที่คาดหวัง) สำหรับคอลัมน์ Type ผลลัพธ์ที่ได้ในกรณีนี้จะใกล้เคียงกับผลลัพธ์ของวิธีที่ 1 มาก (รูปที่ 99)
ช่วงความเชื่อมั่นสำหรับส่วนเบี่ยงเบนมาตรฐาน
ในฐานะที่เป็นค่าประมาณของค่าเบี่ยงเบนมาตรฐานจะใช้ s (สูตรได้รับในส่วนที่ 1) ฟังก์ชันความหนาแน่นของค่าประมาณ s คือฟังก์ชันไคสแควร์ซึ่งเช่นเดียวกับการแจกแจง t มีองศาอิสระ n-1 มีฟังก์ชันพิเศษสำหรับการทำงานกับการกระจาย CHIDIST และ CHIINV นี้
ช่วงความเชื่อมั่นในกรณีนี้จะไม่สมมาตรอีกต่อไป แผนผังของขอบเขตแสดงในรูปที่ 100.
ตัวอย่าง
เครื่องต้องผลิตชิ้นส่วนที่มีเส้นผ่านศูนย์กลาง 10 ซม. อย่างไรก็ตามเนื่องจากสถานการณ์ต่างๆเกิดข้อผิดพลาด ตัวควบคุมคุณภาพมีความกังวลเกี่ยวกับสองสิ่งประการแรกค่าเฉลี่ยควรอยู่ที่ 10 ซม. ประการที่สองแม้ในกรณีนี้หากการเบี่ยงเบนมีขนาดใหญ่หลายส่วนจะถูกปฏิเสธ ทุกวันเขาทำตัวอย่าง 50 ส่วน (ดูไฟล์ QUALITY CONTROL.XLS (เทมเพลตและโซลูชัน) ตัวอย่างดังกล่าวสามารถให้ข้อสรุปอะไรได้บ้าง
การตัดสินใจ
พล็อตช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานโดยใช้ StatPro / การอนุมานทางสถิติ / การวิเคราะห์ตัวอย่างเดียว (รูปที่ 101
).
นอกจากนี้โดยใช้สมมติฐานของการแจกแจงแบบปกติของเส้นผ่านศูนย์กลางเราคำนวณสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องโดยตั้งค่าเบี่ยงเบนสูงสุด 0.065 ใช้ความสามารถของตารางการทดแทน (กรณีของพารามิเตอร์สองตัว) เราสร้างการพึ่งพาของอัตราการแต่งงานกับค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน (รูปที่ 102
).
ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสองวิธี
นี่เป็นหนึ่งในการประยุกต์ใช้วิธีการทางสถิติที่สำคัญที่สุด ตัวอย่างสถานการณ์
ผู้จัดการร้านขายเสื้อผ้าต้องการทราบว่านักช้อปหญิงโดยเฉลี่ยใช้จ่ายในร้านมากกว่าผู้ชายมากหรือน้อยเพียงใด
ทั้งสองสายการบินบินเส้นทางที่คล้ายกัน องค์กรผู้บริโภคต้องการเปรียบเทียบความแตกต่างระหว่างความล่าช้าของเที่ยวบินโดยเฉลี่ยที่คาดว่าจะเกิดขึ้นสำหรับทั้งสองสายการบิน
บริษัท ส่งคูปองสำหรับสินค้าบางประเภทในเมืองหนึ่งและไม่ส่งอีก ผู้จัดการต้องการเปรียบเทียบปริมาณการซื้อโดยเฉลี่ยของสินค้าเหล่านี้ในช่วงสองเดือนข้างหน้า
ตัวแทนจำหน่ายรถยนต์มักเกี่ยวข้องกับคู่แต่งงานในการนำเสนอ คู่รักมักถูกสัมภาษณ์แยกกันเพื่อทำความเข้าใจปฏิกิริยาส่วนตัวต่อการนำเสนอ ผู้จัดการต้องการประเมินความแตกต่างของการให้คะแนนที่รายงานโดยชายและหญิง
กรณีตัวอย่างอิสระ
ความแตกต่างของค่าเฉลี่ยจะมีการแจกแจง t โดยมี n 1 + n 2 - 2 องศาอิสระ ช่วงความเชื่อมั่นสำหรับμ 1 - μ 2 แสดงโดยอัตราส่วน:
งานนี้สามารถแก้ไขได้ไม่เพียง แต่ด้วยสูตรข้างต้นเท่านั้น แต่ยังสามารถแก้ไขได้ด้วยเครื่องมือ StatPro มาตรฐานอีกด้วย สำหรับสิ่งนี้ก็เพียงพอที่จะสมัคร
ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วน
ให้เป็นความคาดหวังทางคณิตศาสตร์ของหุ้น ให้เป็นค่าประมาณตัวอย่างที่สร้างจากตัวอย่างขนาด n 1 และ n 2 ตามลำดับ จากนั้นจึงเป็นค่าประมาณสำหรับความแตกต่าง ดังนั้นช่วงความเชื่อมั่นสำหรับความแตกต่างนี้จึงแสดงเป็น:
ในที่นี้ z cr คือค่าที่ได้จากการแจกแจงปกติตามตารางพิเศษ (ตัวอย่างเช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)
ข้อผิดพลาดมาตรฐานของการประมาณจะแสดงในกรณีนี้โดยอัตราส่วน:
.
ตัวอย่าง
ร้านค้าได้ทำการวิจัยตลาดดังต่อไปนี้เพื่อเตรียมพร้อมสำหรับการขายครั้งใหญ่ ผู้ซื้อ 300 อันดับแรกได้รับการคัดเลือกซึ่งจะสุ่มแบ่งออกเป็นสองกลุ่มกลุ่มละ 150 คน ผู้ซื้อที่เลือกทั้งหมดได้รับคำเชิญให้เข้าร่วมการขาย แต่มีเพียงสมาชิกของกลุ่มแรกเท่านั้นที่มาพร้อมกับคูปองเพื่อให้พวกเขาได้รับส่วนลด 5% ในระหว่างการขายมีการบันทึกการซื้อของผู้ซื้อที่เลือกทั้งหมด 300 ราย ผู้จัดการจะตีความผลลัพธ์และสรุปเกี่ยวกับประสิทธิผลของการจัดส่งคูปองได้อย่างไร (ดูไฟล์ COUPONS.XLS (เทมเพลตและโซลูชัน))
การตัดสินใจ
สำหรับกรณีเฉพาะของเราผู้ซื้อจาก 150 รายที่ได้รับคูปองส่วนลด 55 รายซื้อสินค้าจากการขายและในจำนวน 150 รายที่ไม่ได้รับคูปองมีเพียง 35 รายที่ทำการซื้อ (รูปที่ 103
). จากนั้นค่าของสัดส่วนตัวอย่างคือ 0.3667 และ 0.2333 ตามลำดับ และตัวอย่างความแตกต่างระหว่างพวกเขาคือ 0.1333 ตามลำดับ สมมติว่าช่วงความเชื่อมั่นคือ 95% เราจะพบ z cr \u003d 1.96 จากตารางการแจกแจงปกติ การคำนวณข้อผิดพลาดมาตรฐานของความแตกต่างของตัวอย่างคือ 0.0524 สุดท้ายเราพบว่าขีด จำกัด ล่างของช่วงความเชื่อมั่น 95% คือ 0.0307 และขีด จำกัด บนคือ 0.2359 ตามลำดับ ผลลัพธ์สามารถตีความได้ว่าสำหรับลูกค้าทุก 100 คนที่ได้รับคูปองส่วนลดคุณสามารถคาดหวังได้จากลูกค้าใหม่ 3 ถึง 23 คน อย่างไรก็ตามควรระลึกไว้เสมอว่าข้อสรุปในตัวมันเองยังไม่ได้หมายถึงประสิทธิภาพของการใช้คูปอง (เนื่องจากการให้ส่วนลดทำให้เราสูญเสียกำไร!) มาสาธิตสิ่งนี้ด้วยข้อมูลเฉพาะ สมมติว่าขนาดการซื้อโดยเฉลี่ยคือ 400 รูเบิลซึ่ง 50 รูเบิล มีกำไรจากร้านค้า จากนั้นผลกำไรที่คาดว่าจะได้รับต่อผู้ซื้อ 100 รายที่ไม่ได้รับคูปองคือ:
50 0.2333 100 \u003d 1166.50 รูเบิล
การคำนวณที่คล้ายกันสำหรับผู้ซื้อ 100 รายที่ได้รับคูปองให้:
30 0.3667 100 \u003d 1100.10 รูเบิล
การลดลงของกำไรเฉลี่ยถึง 30 นั้นเกิดจากการใช้ส่วนลดลูกค้าที่ได้รับคูปองโดยเฉลี่ยจะทำการซื้อในราคา 380 รูเบิล
ดังนั้นข้อสรุปสุดท้ายจึงพูดถึงความไม่มีประสิทธิผลของการใช้คูปองดังกล่าวในสถานการณ์เฉพาะนี้
แสดงความคิดเห็น. งานนี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการทำเช่นนี้ก็เพียงพอที่จะลดปัญหานี้ให้เป็นปัญหาในการประมาณความแตกต่างของสองวิธีโดยวิธีการแล้วนำไปใช้ StatPro / การอนุมานทางสถิติ / การวิเคราะห์สองตัวอย่าง เพื่อสร้างช่วงความเชื่อมั่นของความแตกต่างระหว่างค่าเฉลี่ยสองค่า
การควบคุมความยาวช่วงความมั่นใจ
ความยาวของช่วงความเชื่อมั่นขึ้นอยู่กับ เงื่อนไขต่อไปนี้:
ข้อมูลโดยตรง (ส่วนเบี่ยงเบนมาตรฐาน);
ระดับนัยสำคัญ
ขนาดตัวอย่าง.
ขนาดตัวอย่างในการประมาณค่าเฉลี่ย
ขั้นแรกให้พิจารณาปัญหาในกรณีทั่วไป ให้เรากำหนดค่าของครึ่งหนึ่งของความยาวของช่วงความเชื่อมั่นที่ให้กับเราเป็น B (รูปที่ 104
). เรารู้ว่าช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของตัวแปรสุ่ม X บางตัวแสดงเป็น ที่ไหน ... สมมติว่า:
และแสดง n เราได้
น่าเสียดายที่เราไม่ทราบค่าที่แน่นอนของความแปรปรวนของตัวแปรสุ่ม X นอกจากนี้เราไม่ทราบค่าของ t cr เนื่องจากมันขึ้นอยู่กับ n ผ่านจำนวนองศาอิสระ ในสถานการณ์เช่นนี้เราสามารถดำเนินการได้ดังนี้ แทนที่จะใช้ความแปรปรวนเราใช้การประมาณค่าความแปรปรวนตามการรับรู้ที่มีอยู่ของตัวแปรสุ่มที่อยู่ระหว่างการศึกษา แทนที่จะใช้ค่า t cr เราใช้ค่า z cr สำหรับการแจกแจงปกติ สิ่งนี้เป็นที่ยอมรับได้เนื่องจากฟังก์ชันความหนาแน่นของการกระจายสำหรับการแจกแจงแบบปกติและการแจกแจง t อยู่ใกล้กันมาก (ยกเว้นกรณีของ n ขนาดเล็ก) ดังนั้นสูตรที่ต้องการจึงอยู่ในรูปแบบ:
.
เนื่องจากสูตรให้ผลลัพธ์ที่พูดโดยทั่วไปไม่ใช่จำนวนเต็มขนาดตัวอย่างที่ต้องการจึงถูกนำมาใช้เพื่อปัดเศษส่วนเกินของผลลัพธ์
ตัวอย่าง
ร้านอาหารฟาสต์ฟู้ดกำลังวางแผนที่จะขยายการจัดประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการผู้จัดการวางแผนที่จะสุ่มเลือกผู้เยี่ยมชมจำนวนหนึ่งจากผู้ที่ได้ทดลองใช้แล้วและเชิญให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่เป็นคะแนนตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณจำนวนคะแนนที่คาดว่าจะได้รับใหม่ ผลิตภัณฑ์และสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณนี้ ในขณะเดียวกันเขาต้องการให้ความกว้างครึ่งหนึ่งของช่วงความมั่นใจไม่เกิน 0.3 เขาควรสัมภาษณ์ผู้เยี่ยมชมกี่คน?
ดังต่อไปนี้:
ที่นี่ r ots คือค่าประมาณของเศษส่วน p และ B คือครึ่งหนึ่งของความยาวช่วงความเชื่อมั่น การประเมินค่าสูงเกินไปสำหรับ n สามารถหาได้โดยใช้ค่า r ots \u003d 0.5 ในกรณีนี้ความยาวของช่วงความเชื่อมั่นจะไม่เกินค่า B ที่กำหนดสำหรับค่าที่แท้จริงของ p
ตัวอย่าง
ให้ผู้จัดการจากตัวอย่างก่อนหน้านี้วางแผนประมาณสัดส่วนของลูกค้าที่ชอบผลิตภัณฑ์ประเภทใหม่ เขาต้องการสร้างช่วงความมั่นใจ 90% โดยครึ่งหนึ่งของความยาวจะต้องไม่เกิน 0.05 ตัวอย่างสุ่มควรมีลูกค้ากี่ราย
การตัดสินใจ
ในกรณีของเราค่า z cr \u003d 1.645 ดังนั้นจำนวนเงินที่ต้องการคำนวณเป็น .
หากผู้จัดการมีเหตุผลที่จะเชื่อว่าค่า p ที่ต้องการเช่นประมาณ 0.3 จากนั้นแทนที่ค่านี้ในสูตรข้างต้นเราจะได้ค่าที่น้อยกว่าของตัวอย่างสุ่มคือ 228
สูตรสำหรับการพิจารณา ขนาดตัวอย่างสุ่มในกรณีที่มีความแตกต่างระหว่างสองวิธี เขียนเป็น:
.
ตัวอย่าง
บริษัท คอมพิวเตอร์บางแห่งมีศูนย์บริการลูกค้า เมื่อเร็ว ๆ นี้จำนวนข้อร้องเรียนของลูกค้าเกี่ยวกับคุณภาพการบริการที่ไม่ดีได้เพิ่มขึ้น ศูนย์บริการส่วนใหญ่จ้างพนักงานสองประเภทคือผู้ที่ไม่มีประสบการณ์มากนัก แต่จบหลักสูตรเตรียมความพร้อมพิเศษและมีประสบการณ์ในทางปฏิบัติมากมาย แต่ยังไม่สำเร็จหลักสูตรพิเศษ บริษัท ต้องการวิเคราะห์ข้อร้องเรียนของลูกค้าในช่วงหกเดือนที่ผ่านมาและเปรียบเทียบตัวเลขเฉลี่ยของพนักงานแต่ละกลุ่มจากทั้งสองกลุ่ม สันนิษฐานว่าปริมาณในตัวอย่างของทั้งสองกลุ่มจะเท่ากัน ตัวอย่างควรรวมพนักงานกี่คนเพื่อให้ได้ช่วงเวลา 95% โดยมีความยาวครึ่งหนึ่งไม่เกิน 2
การตัดสินใจ
ในที่นี้цоцคือค่าประมาณของค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มทั้งสองภายใต้สมมติฐานว่าใกล้เคียงกัน ดังนั้นในงานของเราเราต้องได้ค่าประมาณนี้ ซึ่งสามารถทำได้เช่นดังต่อไปนี้ เมื่อดูข้อมูลเกี่ยวกับการร้องเรียนของลูกค้าในช่วงหกเดือนที่ผ่านมาผู้จัดการอาจสังเกตเห็นว่าสำหรับพนักงานแต่ละคนมีข้อร้องเรียน 6 ถึง 36 เรื่องเป็นหลัก เมื่อรู้ว่าสำหรับการแจกแจงแบบปกติค่าเกือบทั้งหมดจะถูกลบออกจากค่าเฉลี่ยโดยไม่เกินสามส่วนเบี่ยงเบนมาตรฐานเขาสามารถเชื่อได้อย่างสมเหตุสมผลว่า:
เพราะอะไรσоц \u003d 5.
เราจะได้ค่านี้แทนค่านี้ .
สูตรสำหรับการพิจารณา ขนาดของตัวอย่างสุ่มในกรณีของการประมาณความแตกต่างระหว่างหุ้น ดูเหมือน:
ตัวอย่าง
บริษัท บางแห่งมีโรงงานสองแห่งที่ผลิตผลิตภัณฑ์ที่คล้ายคลึงกัน ผู้จัดการ บริษัท ต้องการเปรียบเทียบสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องในโรงงานทั้งสองแห่ง จากข้อมูลที่มีอยู่อัตราเศษเหล็กของทั้งสองโรงงานอยู่ระหว่าง 3 ถึง 5% ควรสร้างช่วงความเชื่อมั่น 99% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.005 (หรือ 0.5%) ควรนำสินค้าจากโรงงานละกี่ชิ้น?
การตัดสินใจ
ในที่นี้ p 1ots และ p 2ots เป็นค่าประมาณของอัตราเศษเหล็กที่ไม่รู้จักสองแห่งในโรงงานที่ 1 และ 2 ถ้าเราใส่ p 1ots \u003d p 2ots \u003d 0.5 เราจะได้ค่าที่สูงเกินไปสำหรับ n แต่เนื่องจากในกรณีของเราเรามีข้อมูลเบื้องต้นเกี่ยวกับหุ้นเหล่านี้เราจึงใช้ค่าประมาณส่วนบนสำหรับหุ้นเหล่านี้คือ 0.05 เราได้รับ
เมื่อพารามิเตอร์บางตัวของประชากรถูกประมาณจากข้อมูลตัวอย่างไม่เพียง แต่จะมีประโยชน์ในการให้ค่าประมาณแบบจุดของพารามิเตอร์เท่านั้น แต่ยังระบุช่วงความเชื่อมั่นซึ่งจะแสดงตำแหน่งที่แน่นอนของค่าพารามิเตอร์โดยประมาณ
ในบทนี้เราได้ทำความคุ้นเคยกับความสัมพันธ์เชิงปริมาณที่ช่วยให้เราสร้างช่วงเวลาดังกล่าวสำหรับพารามิเตอร์ต่างๆ เรียนรู้วิธีควบคุมความยาวของช่วงความเชื่อมั่น
โปรดทราบว่าปัญหาในการประมาณขนาดตัวอย่าง (ปัญหาในการวางแผนการทดลอง) สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐานคือ StatPro / การอนุมานทางสถิติ / การเลือกขนาดตัวอย่าง.
ตัวอย่างใด ๆ ให้เพียงแนวคิดโดยประมาณของประชากรทั่วไปและคุณลักษณะทางสถิติของตัวอย่างทั้งหมด (ค่าเฉลี่ยโหมดความแปรปรวน ... ) เป็นการประมาณหรือกล่าวว่าเป็นค่าประมาณของพารามิเตอร์ทั่วไปซึ่งในกรณีส่วนใหญ่ไม่สามารถคำนวณได้เนื่องจากประชากรทั่วไปไม่พร้อมใช้งาน (รูปที่ 20) ...
รูปที่ 20. ข้อผิดพลาดในการสุ่มตัวอย่าง
แต่คุณสามารถระบุช่วงเวลาที่ค่าจริง (ทั่วไป) ของลักษณะทางสถิติอยู่ในระดับหนึ่งของความน่าจะเป็น ช่วงเวลานี้เรียกว่า ง ช่วงความเชื่อมั่น (CI)
ดังนั้นค่าเฉลี่ยทั่วไปที่มีความน่าจะเป็น 95% อยู่ภายใน
จากถึง, (20)
ที่ไหน t - ค่าตารางของเกณฑ์นักเรียนสำหรับ α \u003d 0.05 และ ฉ= n-1
สามารถพบ CI ได้ 99% ในกรณีนี้ t เลือกสำหรับ α =0,01.
ความสำคัญในทางปฏิบัติของช่วงความเชื่อมั่นคืออะไร?
ช่วงความเชื่อมั่นที่กว้างบ่งชี้ว่าค่าเฉลี่ยตัวอย่างไม่ได้สะท้อนถึงค่าเฉลี่ยทั่วไปอย่างถูกต้อง ซึ่งมักเกิดจากขนาดตัวอย่างไม่เพียงพอหรือความแตกต่างกันเช่น ความแปรปรวนสูง ทั้งสองให้ค่าเฉลี่ยผิดพลาดมากและดังนั้น CI ที่กว้างขึ้น และนี่คือพื้นฐานสำหรับการกลับไปสู่ขั้นตอนการวางแผนของการศึกษา
ขีด จำกัด บนและล่างของ CI ประเมินว่าผลลัพธ์จะมีนัยสำคัญทางคลินิกหรือไม่
ให้เราพิจารณารายละเอียดเพิ่มเติมเกี่ยวกับคำถามเกี่ยวกับความสำคัญทางสถิติและทางคลินิกของผลการศึกษาคุณสมบัติของกลุ่ม จำไว้ว่างานของสถิติคือการตรวจจับความแตกต่างของประชากรอย่างน้อยที่สุดโดยพิจารณาจากข้อมูลตัวอย่าง เป็นหน้าที่ของแพทย์ในการระบุความแตกต่าง (แต่ไม่ใช่ทั้งหมด) ที่จะช่วยในการวินิจฉัยหรือการรักษา และไม่ใช่ว่าการค้นพบทางสถิติจะเป็นพื้นฐานสำหรับข้อสรุปทางคลินิกเสมอไป ดังนั้นการลดลงอย่างมีนัยสำคัญทางสถิติของฮีโมโกลบิน 3 กรัม / ลิตรจึงไม่เป็นสาเหตุให้กังวล และในทางกลับกันหากปัญหาบางอย่างในร่างกายมนุษย์ไม่มีลักษณะที่ใหญ่โตในระดับของประชากรทั้งหมดนี่ไม่ใช่เหตุผลที่จะไม่จัดการกับปัญหานี้
เราจะพิจารณาบทบัญญัตินี้ที่ ตัวอย่าง. นักวิจัยสงสัยว่าเด็กผู้ชายที่เป็นโรคติดเชื้อนั้นล้าหลังกว่าเพื่อนหรือไม่ เพื่อจุดประสงค์นี้จึงได้ทำการศึกษาตัวอย่างโดยมีเด็กชาย 10 คนที่เป็นโรคนี้เข้าร่วม ผลลัพธ์แสดงไว้ในตารางที่ 23 ตารางที่ 23. ผลการประมวลผลทางสถิติ
จากการคำนวณเหล่านี้พบว่าความสูงโดยเฉลี่ยที่คัดเลือกได้ของเด็กชายอายุ 10 ปีที่เป็นโรคติดเชื้อบางอย่างใกล้เคียงกับปกติ (132.5 ซม.) อย่างไรก็ตามขีด จำกัด ล่างของช่วงความเชื่อมั่น (126.6 ซม.) บ่งชี้ว่ามีความเป็นไปได้ 95% ที่ความสูงเฉลี่ยที่แท้จริงของเด็กเหล่านี้สอดคล้องกับแนวคิดของ "ความสูงสั้น" นั่นคือ เด็กเหล่านี้แคระแกรน ในตัวอย่างนี้ผลการคำนวณ CI มีความสำคัญทางคลินิก |
สมมติว่าเรามีสินค้าจำนวนมากที่มีการแจกแจงลักษณะบางอย่างตามปกติ (ตัวอย่างเช่นผักชนิดเดียวกันเต็มโกดังขนาดและน้ำหนักแตกต่างกันไป) คุณต้องการทราบลักษณะโดยเฉลี่ยของสินค้าทั้งชุด แต่คุณไม่มีเวลาหรือความปรารถนาที่จะวัดและชั่งน้ำหนักผักแต่ละชนิด คุณเข้าใจว่าสิ่งนี้ไม่จำเป็น แต่จะต้องสุ่มตัวอย่างมากแค่ไหน? ก่อนที่จะให้สูตรที่มีประโยชน์สำหรับสถานการณ์นี้เราจะนึกถึงสัญกรณ์บางอย่าง อันดับแรกหากเรายังคงวัดปริมาณผักทั้งหมด (ชุดขององค์ประกอบนี้เรียกว่าประชากรทั่วไป) เราก็จะรู้ว่าน้ำหนักเฉลี่ยของทั้งชุดมีความแม่นยำทั้งหมด ขอเรียกค่าเฉลี่ยนี้ ยีนเฉลี่ย X... - ค่าเฉลี่ยทั่วไป เรารู้แล้วว่าอะไรถูกกำหนดอย่างสมบูรณ์หากทราบค่าเฉลี่ยและค่าเบี่ยงเบน s จริงอยู่จนถึงตอนนี้เราไม่ทราบทั้ง X เฉลี่ย gen หรือ s ของประชากรทั่วไป เราสามารถใช้ตัวอย่างบางตัวอย่างวัดค่าที่เราต้องการและคำนวณสำหรับตัวอย่างนี้ทั้งค่าเฉลี่ย X เฉลี่ยและค่าเบี่ยงเบนมาตรฐาน S เลือก เป็นที่ทราบกันดีว่าหากการตรวจสอบตัวอย่างของเรามีองค์ประกอบจำนวนมาก (โดยปกติ n จะมากกว่า 30) และพวกมันถูกสุ่มตัวอย่างจริงๆดังนั้น s ของประชากรทั่วไปแทบจะไม่แตกต่างจาก S select นอกจากนี้สำหรับกรณีของการแจกแจงแบบปกติเราสามารถใช้สูตรต่อไปนี้
มีความน่าจะเป็น 95%
มีความน่าจะเป็น 99%
.
ในรูปแบบทั่วไปด้วยความน่าจะเป็นР (t)ความสัมพันธ์ระหว่างค่า t และค่าของความน่าจะเป็น P (t) ซึ่งเราต้องการทราบช่วงความเชื่อมั่นสามารถนำมาจากตารางต่อไปนี้:
P (เสื้อ) | 0,683 | 0,950 | 0,954 | 0,990 | 0,997 |
t | 1,00 | 1,96 | 2,00 | 2,58 | 3,00 |
ดังนั้นเราจึงพิจารณาได้ว่าค่าเฉลี่ยสำหรับประชากรทั่วไป (ด้วยความน่าจะเป็นที่กำหนด) อยู่ในช่วงใด
หากเราไม่มีกลุ่มตัวอย่างมากพอเราไม่สามารถโต้แย้งได้ว่าประชากรทั่วไปมีทางเลือก s \u003d S นอกจากนี้ในกรณีนี้ความใกล้ชิดของตัวอย่างกับการแจกแจงปกติเป็นปัญหา ในกรณีนี้จะใช้ S select แทน s ในสูตรด้วย:
แต่ค่า t สำหรับความน่าจะเป็นคงที่ Р (t) จะขึ้นอยู่กับจำนวนองค์ประกอบในตัวอย่าง n ยิ่ง n มีขนาดใหญ่เท่าใดช่วงความเชื่อมั่นที่ได้รับจะเข้าใกล้ค่าที่กำหนดโดยสูตร (1) มากขึ้นเท่านั้น ค่าของ t ในกรณีนี้นำมาจากตารางอื่น (t-test ของนักเรียน) ซึ่งเราให้ไว้ด้านล่าง:
ค่า t-test ของนักเรียนสำหรับความน่าจะเป็น 0.95 และ 0.99& nbsp
n | ป | n | ป | ||
0.95 | 0.99 | 0.95 | 0.99 | ||
2 | 12.71 | 63.66 | 18 | 2.11 | 2.90 |
3 | 4.30 | 9.93 | 19 | 2.10 | 2.88 |
4 | 3.18 | 5.84 | 20 | 2.093 | 2.861 |
5 | 2.78 | 4.60 | 25 | 2.064 | 2.797 |
6 | 2.57 | 4.03 | 30 | 2.045 | 2.756 |
7 | 2.45 | 3.71 | 35 | 2.032 | 2.720 |
8 | 2.37 | 3.50 | 40 | 2.022 | 2.708 |
9 | 2.31 | 3.36 | 45 | 2.016 | 2.692 |
10 | 2.26 | 3.25 | 50 | 2.009 | 2.679 |
11 | 2.23 | 3.17 | 60 | 2.001 | 2.662 |
12 | 2.20 | 3.11 | 70 | 1.996 | 2.649 |
13 | 2.18 | 3.06 | 80 | 1.991 | 2.640 |
14 | 2.16 | 3.01 | 90 | 1.987 | 2.633 |
15 | 2.15 | 2.98 | 100 | 1.984 | 2.627 |
16 | 2.13 | 2.95 | 120 | 1.980 | 2.617 |
17 | 2.12 | 2.92 | >120 | 1.960 | 2.576 |
ตัวอย่างที่ 3. 30 คนถูกสุ่มเลือกจากพนักงานของ บริษัท สำหรับตัวอย่างปรากฎว่าเงินเดือนเฉลี่ย (ต่อเดือน) คือ 10,000 รูเบิลโดยมีค่าเบี่ยงเบนกำลังสองเฉลี่ย 3 พันรูเบิล ด้วยความน่าจะเป็นที่ 0.99 กำหนดเงินเดือนเฉลี่ยใน บริษัท การตัดสินใจ:ตามสมมติฐานเรามี n \u003d 30, X cf \u003d 10000, S \u003d 3000, P \u003d 0.99 ในการหาช่วงความเชื่อมั่นเราจะใช้สูตรที่สอดคล้องกับเกณฑ์ของนักเรียน ตามตารางสำหรับ n \u003d 30 และ P \u003d 0.99 เราพบ t \u003d 2.756 ดังนั้น
เหล่านั้น ช่วงความเชื่อมั่นที่ต้องการคือ 27484< Х ср.ген < 32516.
ดังนั้นด้วยความน่าจะเป็น 0.99 จึงสามารถเป็นที่ถกเถียงกันอยู่ว่าช่วงเวลา (27484; 32516) มีเงินเดือนเฉลี่ยใน บริษัท
เราหวังว่าคุณจะใช้วิธีนี้ แต่คุณไม่จำเป็นต้องมีโต๊ะกับคุณทุกครั้ง การคำนวณสามารถทำได้ใน Excel โดยอัตโนมัติ ขณะอยู่ในไฟล์ Excel ให้คลิกปุ่ม fx ที่เมนูด้านบน จากนั้นเลือกระหว่างฟังก์ชันประเภท "สถิติ" และจากรายการที่เสนอในหน้าต่าง - STYUDRESIST จากนั้นตามคำแนะนำโดยวางเคอร์เซอร์ในช่อง "ความน่าจะเป็น" ให้พิมพ์ค่าของความน่าจะเป็นผกผัน (เช่นในกรณีของเราแทนที่จะเป็นความน่าจะเป็น 0.95 คุณต้องพิมพ์ความน่าจะเป็น 0.05) เห็นได้ชัดว่าสเปรดชีตได้รับการออกแบบมาเพื่อให้ผลลัพธ์ตอบคำถามว่าเรามีโอกาสผิดพลาดได้อย่างไร ในช่อง "ระดับอิสระ" ให้ป้อนค่า (n-1) สำหรับการเลือกของคุณ