ช่วงความเชื่อมั่น 90 ช่วงความเชื่อมั่น ใช้การแจกแจงแบบปกติ

วิธีการประเมินข้อผิดพลาดแบบสุ่มขึ้นอยู่กับบทบัญญัติของทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ เป็นไปได้ที่จะประมาณข้อผิดพลาดแบบสุ่มเฉพาะในกรณีที่ทำการวัดซ้ำในปริมาณเดียวกัน

ให้เป็นผลมาจากการวัด ป ค่าของปริมาณ x: x 1 , x 2 , …, x น ... ให้เราแสดงด้วยค่าเฉลี่ยเลขคณิต

ในทฤษฎีความน่าจะเป็นพิสูจน์แล้วว่าด้วยจำนวนการวัดที่เพิ่มขึ้น ป ค่าเฉลี่ยเลขคณิตของค่าที่วัดได้เข้าใกล้ค่าจริง:

ด้วยการวัดจำนวนน้อย ( ป 10 ปอนด์) ค่าเฉลี่ยอาจแตกต่างจากค่าจริงอย่างมาก เพื่อให้ทราบว่าค่านั้นแสดงลักษณะของค่าที่วัดได้แม่นยำเพียงใดจำเป็นต้องกำหนดช่วงเวลาความเชื่อมั่นที่เรียกว่าของผลลัพธ์

เนื่องจากการวัดที่แม่นยำอย่างแท้จริงเป็นไปไม่ได้ความน่าจะเป็นของความถูกต้องของข้อความ " ปริมาณ x มีค่าเท่ากับ »เท่ากับศูนย์ ความน่าจะเป็นของคำสั่ง“ ปริมาณ x มีความหมาย»เท่ากับหนึ่ง (100%) ดังนั้นความน่าจะเป็นของความถูกต้องของคำสั่งกลางใด ๆ จึงอยู่ในช่วงตั้งแต่ 0 ถึง 1 จุดประสงค์ของการวัดคือการหาช่วงเวลาซึ่งด้วยความน่าจะเป็นที่กำหนดไว้ล่วงหน้า ก(0 < ก < 1) находится истинное значение измеряемой величины. Этот интервал называется ช่วงความเชื่อมั่น และปริมาณที่เชื่อมโยงอย่างแยกไม่ออก ก – ระดับความเชื่อมั่น (หรือ ปัจจัยด้านความปลอดภัย). สำหรับช่วงกลางของช่วงเวลาจะใช้ค่าเฉลี่ยที่คำนวณโดยสูตร (3) ความกว้างครึ่งหนึ่งของช่วงความเชื่อมั่นคือข้อผิดพลาดแบบสุ่ม D s x (รูปที่ 1)

เห็นได้ชัดว่าความกว้างของช่วงความเชื่อมั่น (และด้วยเหตุนี้ข้อผิดพลาด D s x) ขึ้นอยู่กับความรุนแรงของการวัดปริมาณแต่ละครั้ง x ผม จากค่าเฉลี่ย "การกระจาย" ของผลการวัดเทียบกับค่าเฉลี่ยมีลักษณะดังนี้ รูทค่าเฉลี่ยกำลังสองข้อผิดพลาด s ซึ่งพบได้จากสูตร

, (4)

ความกว้างของช่วงความเชื่อมั่นที่ต้องการเป็นสัดส่วนโดยตรงกับข้อผิดพลาดรูท - ค่าเฉลี่ย - กำลังสอง:

. (5)

อัตราส่วนภาพ เสื้อ n, a เรียกว่า ค่าสัมประสิทธิ์ของนักเรียน; ขึ้นอยู่กับจำนวนการทดลอง ป และระดับความมั่นใจ ก.

ในรูป 1, ก, ขแสดงให้เห็นอย่างชัดเจนว่าสิ่งอื่น ๆ ที่เท่าเทียมกันเพื่อเพิ่มความน่าจะเป็นของมูลค่าที่แท้จริงที่ตกอยู่ในช่วงความเชื่อมั่นจำเป็นต้องเพิ่มความกว้างของค่าหลัง (ความน่าจะเป็นของ "ครอบคลุม" ค่า X ระยะห่างที่กว้างขึ้นด้านบน) ดังนั้นปริมาณ เสื้อ n, a ควรยิ่งมากระดับความเชื่อมั่นก็จะยิ่งสูงขึ้น ก.

เมื่อจำนวนการทดลองเพิ่มขึ้นค่าเฉลี่ยจะเข้าใกล้ค่าจริง ดังนั้นด้วยความน่าจะเป็นเท่ากัน ก สามารถกำหนดช่วงความเชื่อมั่นให้แคบลงได้ (ดูรูปที่ 1, a, ใน). ดังนั้นด้วยการเพิ่มขึ้น ป ค่าสัมประสิทธิ์ของนักเรียนควรลดลง ตารางค่าสัมประสิทธิ์ของนักเรียนขึ้นอยู่กับ ป และ ก ให้ไว้ในภาคผนวกของคู่มือนี้

ควรสังเกตว่าระดับความเชื่อมั่นไม่มีส่วนเกี่ยวข้องกับความแม่นยำของผลการวัด มูลค่า กกำหนดไว้ล่วงหน้าตามข้อกำหนดสำหรับความน่าเชื่อถือ ในการทดลองทางเทคนิคส่วนใหญ่และในการปฏิบัติในห้องปฏิบัติการค่า กเท่ากับ 0.95

การคำนวณข้อผิดพลาดแบบสุ่มในการวัดปริมาณ xดำเนินการตามลำดับต่อไปนี้:

1) คำนวณผลรวมของค่าที่วัดได้จากนั้นจึงคำนวณค่าเฉลี่ยของมูลค่าตามสูตร (3)

2) สำหรับทุกคน ผมการทดลองความแตกต่างระหว่างค่าที่วัดได้และค่าเฉลี่ยคำนวณรวมทั้งกำลังสองของความแตกต่างนี้ (ส่วนเบี่ยงเบน) (D x ผม) 2 ;

3) พบผลรวมของกำลังสองของส่วนเบี่ยงเบนจากนั้นพบข้อผิดพลาดกำลังสองเฉลี่ย เอส ตามสูตร (4);

4) สำหรับระดับความเชื่อมั่นที่กำหนด กและจำนวนการทดลองที่ดำเนินการ ป จากตารางบนหน้า 149 แอปพลิเคชั่นเลือกค่าสัมประสิทธิ์ของนักเรียนที่สอดคล้องกัน เสื้อ n, a และข้อผิดพลาดแบบสุ่มง s x ตามสูตร (5)

เพื่อความสะดวกในการคำนวณและการตรวจสอบผลลัพธ์ระดับกลางข้อมูลจะถูกป้อนลงในตารางซึ่งสามคอลัมน์สุดท้ายจะถูกกรอกตามตัวอย่างในตารางที่ 1

ตารางที่ 1

จำนวนประสบการณ์	…	x	ง x	(ง x) 2
	…
	…
…	…
ป	…
	S \u003d		S \u003d

ในแต่ละกรณีค่า x มีความหมายทางกายภาพบางอย่างและหน่วยการวัดที่สอดคล้องกัน ตัวอย่างเช่นความเร่งโน้มถ่วง ก (นางสาว 2) ค่าสัมประสิทธิ์ความหนืดของของเหลว ซ (Pa × s) เป็นต้น ไม่มีคอลัมน์ในตาราง 1 อาจมีค่ากลางที่วัดได้ซึ่งจำเป็นในการคำนวณค่าที่เกี่ยวข้อง x.

ตัวอย่าง 1. เพื่อกำหนดอัตราเร่ง และ วัดเวลาเคลื่อนไหวร่างกาย t ผ่านทางของพวกเขา ส ไม่มีความเร็วเริ่มต้น ใช้อัตราส่วนที่ทราบเราได้สูตรการออกแบบ

ผลการวัดระยะทาง ส และเวลา t จะได้รับในคอลัมน์ที่สองและสามของตาราง 2. หลังจากคำนวณตามสูตร (6) แล้วให้กรอก

คอลัมน์ที่สี่พร้อมค่าความเร่ง ฉัน และหาผลรวมซึ่งเราเขียนไว้ใต้คอลัมน์นี้ในเซลล์ "S \u003d" จากนั้นเราคำนวณค่าเฉลี่ยโดยใช้สูตร (3)

ตารางที่ 2

จำนวนประสบการณ์	S, ม	เสื้อ, ค	และ, นางสาว 2	ง และ, นางสาว 2	(ง และ) 2 , (นางสาว 2) 2
		2,20	2,07	0,04	0,0016
		2,68	1,95	-0,08	0,0064
		2,91	2,13	0,10	0,0100
		3,35	1,96	-0,07	0,0049
		S \u003d	8,11	S \u003d	0,0229

ลบออกจากแต่ละค่า ฉัน หมายถึงค้นหาความแตกต่างง ฉันและวางไว้ในคอลัมน์ที่ห้าของตาราง เรากรอกข้อมูลในคอลัมน์สุดท้ายด้วยการยกกำลังสองความแตกต่างเหล่านี้ จากนั้นเราคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบนและเขียนลงในเซลล์ที่สอง "S \u003d" ใช้สูตร (4) กำหนดข้อผิดพลาดรูท - ค่าเฉลี่ยกำลังสอง:

มีการตั้งค่าระดับความเชื่อมั่น ก \u003d 0.95 สำหรับจำนวนการทดลอง ป \u003d 4 จากตารางในภาคผนวก (น. 149) เลือกค่าสัมประสิทธิ์ของนักเรียน เสื้อ n, a \u003d 3.18; โดยใช้สูตร (5) เราประเมินข้อผิดพลาดแบบสุ่มในการวัดความเร่ง

ง s ก \u003d 3.18 × 0.0437 "0.139 ( นางสาว 2) .

ช่วงความเชื่อมั่นสำหรับมูลค่าที่คาดหวัง - นี่คือช่วงเวลาดังกล่าวที่คำนวณจากข้อมูลซึ่งด้วยความน่าจะเป็นที่ทราบแล้วมีความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป ค่าประมาณตามธรรมชาติสำหรับความคาดหวังทางคณิตศาสตร์คือค่าเฉลี่ยเลขคณิตของค่าที่สังเกตได้ ดังนั้นตลอดบทเรียนเราจะใช้คำว่า "average" "mean value" ในงานคำนวณช่วงความเชื่อมั่นคำตอบของประเภท "ช่วงความเชื่อมั่นของค่าเฉลี่ย [ค่าในปัญหาเฉพาะ] คือจาก [ค่าต่ำกว่า] ถึง [ค่าที่สูงกว่า]" เป็นส่วนใหญ่ ด้วยความช่วยเหลือของช่วงความเชื่อมั่นจึงเป็นไปได้ที่จะประมาณไม่เพียง แต่ค่าเฉลี่ยเท่านั้น แต่ยังรวมถึงน้ำหนักเฉพาะของคุณลักษณะเฉพาะของประชากรทั่วไปด้วย ค่าเฉลี่ยความแปรปรวนค่าเบี่ยงเบนมาตรฐานและข้อผิดพลาดซึ่งเราจะมาถึงคำจำกัดความและสูตรใหม่จะกล่าวถึงในบทเรียน ตัวอย่างและลักษณะประชากรทั่วไป .

จุดและช่วงเวลาโดยประมาณของค่าเฉลี่ย

หากค่าเฉลี่ยของประชากรทั่วไปประมาณด้วยตัวเลข (จุด) ดังนั้นการประมาณค่าเฉลี่ยที่ไม่รู้จักของประชากรทั่วไปจะถูกนำมาเป็นค่าเฉลี่ยเฉพาะซึ่งคำนวณจากตัวอย่างของการสังเกต ในกรณีนี้ค่าของค่าเฉลี่ยตัวอย่างซึ่งเป็นตัวแปรสุ่มไม่ตรงกับค่าเฉลี่ยของประชากรทั่วไป ดังนั้นเมื่อระบุค่าเฉลี่ยของตัวอย่างจึงจำเป็นต้องระบุข้อผิดพลาดในการสุ่มตัวอย่างพร้อมกัน ในการวัดข้อผิดพลาดในการสุ่มตัวอย่างข้อผิดพลาดมาตรฐานจะถูกใช้ซึ่งแสดงในหน่วยการวัดเดียวกันกับค่าเฉลี่ย ดังนั้นจึงมักใช้สัญกรณ์ต่อไปนี้:.

หากจำเป็นต้องมีการประมาณค่าเฉลี่ยเพื่อเชื่อมโยงกับความน่าจะเป็นที่แน่นอนพารามิเตอร์ที่น่าสนใจสำหรับประชากรทั่วไปจะต้องประมาณไม่ใช่ด้วยตัวเลขเดียว แต่เป็นช่วงเวลา ช่วงความเชื่อมั่นคือช่วงเวลาที่มีความน่าจะเป็นที่แน่นอน ป พบค่าของตัวบ่งชี้โดยประมาณของประชากรทั่วไป ช่วงความเชื่อมั่นซึ่งความน่าจะเป็น ป = 1 - α พบตัวแปรสุ่มคำนวณได้ดังนี้:

α = 1 - ป ซึ่งสามารถพบได้ในภาคผนวกของหนังสือเกี่ยวกับสถิติเกือบทุกเล่ม

ในทางปฏิบัติไม่ทราบค่าเฉลี่ยประชากรและความแปรปรวนดังนั้นความแปรปรวนของประชากรจะถูกแทนที่ด้วยความแปรปรวนของกลุ่มตัวอย่างและค่าเฉลี่ยประชากรจะถูกแทนที่ด้วยค่าเฉลี่ยตัวอย่าง ดังนั้นช่วงความเชื่อมั่นในกรณีส่วนใหญ่คำนวณได้ดังนี้:

สามารถใช้สูตรช่วงความเชื่อมั่นเพื่อประมาณค่าเฉลี่ยประชากร if

ทราบค่าเบี่ยงเบนมาตรฐานของประชากรทั่วไป
หรือไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร แต่ขนาดของกลุ่มตัวอย่างมากกว่า 30

ค่าเฉลี่ยตัวอย่างคือค่าประมาณที่เป็นกลางของค่าเฉลี่ยประชากร ในทางกลับกันความแปรปรวนตัวอย่าง ไม่ใช่การประมาณค่าความแปรปรวนของประชากรที่เป็นกลาง เพื่อให้ได้ค่าประมาณที่เป็นกลางของความแปรปรวนของประชากรในสูตรความแปรปรวนตัวอย่างขนาดตัวอย่าง n ควรแทนที่ด้วย n-1.

ตัวอย่าง 1. รวบรวมข้อมูลจากร้านกาแฟที่สุ่มเลือก 100 แห่งในเมืองที่จำนวนพนักงานโดยเฉลี่ยอยู่ที่ 10.5 โดยมีค่าเบี่ยงเบนมาตรฐาน 4.6 กำหนดช่วงความเชื่อมั่น 95% ของจำนวนพนักงานร้านกาแฟ

ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,05 .

ดังนั้นช่วงความเชื่อมั่น 95% สำหรับจำนวนพนักงานคาเฟ่โดยเฉลี่ยจึงอยู่ระหว่าง 9.6 ถึง 11.4

ตัวอย่าง 2. สำหรับกลุ่มตัวอย่างสุ่มจากการสังเกตการณ์ทั่วไป 64 ค่าคำนวณค่าทั้งหมดต่อไปนี้:

ผลรวมของค่าในการสังเกต

ผลรวมของกำลังสองของการเบี่ยงเบนของค่าจากค่าเฉลี่ย .

คำนวณช่วงความเชื่อมั่น 95% สำหรับความคาดหวัง

คำนวณค่าเบี่ยงเบนมาตรฐาน:

คำนวณค่าเฉลี่ย:

แทนค่าลงในนิพจน์สำหรับช่วงความเชื่อมั่น:

ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,05 .

เราได้รับ:

ดังนั้นช่วงความเชื่อมั่น 95% สำหรับความคาดหวังทางคณิตศาสตร์ของตัวอย่างนี้อยู่ระหว่าง 7.484 ถึง 11.266

ตัวอย่างที่ 3. สำหรับกลุ่มตัวอย่างสุ่มจากการสังเกตโดยประชากรทั่วไป 100 คนค่าเฉลี่ยเท่ากับ 15.2 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 3.2 คำนวณช่วงความเชื่อมั่น 95% สำหรับความคาดหวังจากนั้นช่วงความเชื่อมั่น 99% ถ้าขนาดตัวอย่างและรูปแบบยังคงไม่เปลี่ยนแปลงและค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้นช่วงความเชื่อมั่นจะแคบลงหรือกว้างขึ้นหรือไม่

เราแทนที่ค่าเหล่านี้ในนิพจน์สำหรับช่วงความเชื่อมั่น:

ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,05 .

เราได้รับ:

ดังนั้นช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้อยู่ระหว่าง 14.57 ถึง 15.82

เราแทนที่ค่าเหล่านี้อีกครั้งในนิพจน์สำหรับช่วงความเชื่อมั่น:

ค่าวิกฤตของการแจกแจงปกติมาตรฐานสำหรับระดับนัยสำคัญอยู่ที่ใด α = 0,01 .

เราได้รับ:

ดังนั้นช่วงความเชื่อมั่น 99% สำหรับค่าเฉลี่ยของกลุ่มตัวอย่างนี้อยู่ระหว่าง 14.37 ถึง 16.02

อย่างที่คุณเห็นเมื่อค่าสัมประสิทธิ์ความเชื่อมั่นเพิ่มขึ้นค่าวิกฤตของการแจกแจงปกติมาตรฐานก็จะเพิ่มขึ้นด้วยดังนั้นจุดเริ่มต้นและจุดสิ้นสุดของช่วงเวลาจึงอยู่ห่างจากค่าเฉลี่ยดังนั้นช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์จึงเพิ่มขึ้น

จุดและช่วงเวลาโดยประมาณของความถ่วงจำเพาะ

น้ำหนักเฉพาะของคุณสมบัติบางอย่างของตัวอย่างสามารถตีความได้ว่าเป็นการประมาณค่าจุดของน้ำหนักเฉพาะ น คุณลักษณะเดียวกันในประชากรทั่วไป หากค่านี้จำเป็นต้องเกี่ยวข้องกับความน่าจะเป็นควรคำนวณช่วงความเชื่อมั่นของความถ่วงจำเพาะ น ลักษณะในประชากรทั่วไปที่มีความน่าจะเป็น ป = 1 - α :

ตัวอย่างที่ 4. มีผู้สมัครสองคนในบางเมือง ก และ ข วิ่งไปหานายกเทศมนตรี ชาวเมือง 200 คนถูกสุ่มสัมภาษณ์โดย 46% ตอบว่าพวกเขาจะลงคะแนนให้กับผู้สมัคร ก, 26% - สำหรับผู้สมัคร ข และ 28% ไม่รู้ว่าพวกเขาจะโหวตให้ใคร กำหนดช่วงความเชื่อมั่น 95% สำหรับสัดส่วนของชาวเมืองที่สนับสนุนผู้สมัคร ก.

การประมาณช่วงความเชื่อมั่น

วัตถุประสงค์การเรียนรู้

สถิติพิจารณาสิ่งต่อไปนี้ สองงานหลัก:

เรามีค่าประมาณจากข้อมูลตัวอย่างและเราต้องการสร้างคำสั่งความน่าจะเป็นเกี่ยวกับค่าที่แท้จริงของพารามิเตอร์โดยประมาณ

เรามีสมมติฐานเฉพาะที่ต้องทดสอบจากข้อมูลตัวอย่าง

ในหัวข้อนี้เราพิจารณางานแรก เรายังแนะนำนิยามของช่วงความเชื่อมั่น

ช่วงความเชื่อมั่นคือช่วงเวลาที่สร้างขึ้นจากค่าพารามิเตอร์โดยประมาณและแสดงตำแหน่งที่ค่าที่แท้จริงของพารามิเตอร์โดยประมาณโดยมีค่าความน่าจะเป็นที่กำหนด

หลังจากศึกษาเนื้อหาในหัวข้อนี้แล้วคุณ:

ค้นหาว่าช่วงความเชื่อมั่นของการประมาณการคืออะไร

เรียนรู้ที่จะจำแนกงานทางสถิติ

เชี่ยวชาญเทคนิคการสร้างช่วงความเชื่อมั่นทั้งการใช้สูตรทางสถิติและการใช้เครื่องมือซอฟต์แวร์

เรียนรู้การกำหนดขนาดตัวอย่างที่ต้องการเพื่อให้ได้พารามิเตอร์ที่แน่นอนของความแม่นยำทางสถิติ

การแจกแจงลักษณะตัวอย่าง

การกระจาย T

ดังที่กล่าวไว้ข้างต้นการแจกแจงของตัวแปรสุ่มนั้นใกล้เคียงกับการแจกแจงปกติมาตรฐานที่มีพารามิเตอร์ 0 และ 1 เนื่องจากเราไม่ทราบค่าของσเราจึงแทนที่ด้วยค่าประมาณ s ปริมาณมีการกระจายที่แตกต่างกันอยู่แล้วกล่าวคือหรือ การแจกแจงของนักเรียนซึ่งกำหนดโดยพารามิเตอร์ n -1 (จำนวนองศาอิสระ) การแจกแจงนี้มีค่าใกล้เคียงกับการแจกแจงแบบปกติ (ยิ่ง n ยิ่งมีการแจกแจงเข้าใกล้มากขึ้น)

ในรูป 95
มีการนำเสนอการแจกแจงของนักเรียนด้วยความอิสระ 30 องศา อย่างที่คุณเห็นมันใกล้เคียงกับการแจกแจงปกติมาก

เช่นเดียวกับฟังก์ชันสำหรับการทำงานกับการแจกแจงปกติ NORMDIST และ NORMINV มีฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบ t - TDIST และ TINV... ตัวอย่างการใช้ฟังก์ชันเหล่านี้สามารถดูได้ในไฟล์ TDIST.XLS (เทมเพลตและโซลูชัน) และในรูปที่ 96
.

การแจกแจงลักษณะอื่น ๆ

ดังที่เราทราบแล้วในการพิจารณาความแม่นยำของการประมาณค่าความคาดหวังทางคณิตศาสตร์เราจำเป็นต้องมีการแจกแจง t ในการประมาณค่าพารามิเตอร์อื่น ๆ เช่นความแปรปรวนจำเป็นต้องมีการแจกแจงที่แตกต่างกัน สองคนคือการแจกแจงแบบ F และ x 2 - กระจาย.

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย

ช่วงความเชื่อมั่น คือช่วงเวลาที่สร้างขึ้นจากค่าพารามิเตอร์โดยประมาณและแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณตั้งอยู่โดยมีค่าความน่าจะเป็นที่กำหนด

การสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยเกิดขึ้น ด้วยวิธีต่อไปนี้:

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดกำลังวางแผนที่จะขยายการแบ่งประเภทด้วยแซนวิชรูปแบบใหม่ เพื่อประมาณความต้องการผู้จัดการวางแผนที่จะสุ่มเลือกผู้เยี่ยมชม 40 คนจากผู้ที่ได้ทดลองใช้แล้วและเชิญชวนให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่เป็นคะแนนตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณจำนวนคะแนนที่คาดว่าจะได้รับผลิตภัณฑ์ใหม่และ พล็อตช่วงความเชื่อมั่น 95% สำหรับการประมาณนี้ จะทำได้อย่างไร? (ดูไฟล์ SANDWICH1.XLS (เทมเพลตและโซลูชัน)

การตัดสินใจ

ในการแก้ปัญหานี้คุณสามารถใช้. ผลลัพธ์จะแสดงในรูปที่ 97
.

ช่วงความเชื่อมั่นสำหรับมูลค่าสะสม

บางครั้งจากข้อมูลตัวอย่างจำเป็นต้องประมาณค่าไม่ใช่ความคาดหวังทางคณิตศาสตร์ แต่เป็นผลรวมของค่า ตัวอย่างเช่นในสถานการณ์ที่มีผู้สอบบัญชีอาจไม่สนใจที่จะประมาณมูลค่าบัญชีโดยเฉลี่ย แต่เป็นผลรวมของบัญชีทั้งหมด

ให้ N เป็นจำนวนองค์ประกอบทั้งหมด n คือขนาดตัวอย่าง T 3 คือผลรวมของค่าในตัวอย่าง T "คือค่าประมาณสำหรับผลรวมของประชากรทั้งหมดจากนั้นช่วงความเชื่อมั่นจะคำนวณโดยสูตรโดยที่ s คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานสำหรับตัวอย่างคือค่าประมาณ ค่าเฉลี่ยสำหรับกลุ่มตัวอย่าง

ตัวอย่าง

สมมติว่าสำนักงานสรรพากรบางแห่งต้องการประเมินการขอคืนภาษีทั้งหมดสำหรับผู้เสียภาษี 10,000 ราย ผู้เสียภาษีจะได้รับเงินคืนหรือจ่ายภาษีเพิ่มเติม ค้นหาช่วงความเชื่อมั่น 95% สำหรับจำนวนเงินที่คืนโดยสมมติว่ามีขนาดตัวอย่าง 500 คน (ดู RETURNS SUM.XLS (เทมเพลตและโซลูชัน)

การตัดสินใจ

ไม่มีขั้นตอนพิเศษใน StatPro สำหรับกรณีนี้คุณจะเห็นว่าขอบเขตสามารถหาได้จากขอบเขตสำหรับค่าเฉลี่ยตามสูตรข้างต้น (รูปที่ 98
).

ช่วงความเชื่อมั่นสำหรับสัดส่วน

ให้ p เป็นความคาดหวังทางคณิตศาสตร์ของส่วนแบ่งของลูกค้าและ p ในการประมาณของส่วนแบ่งนี้ที่ได้จากตัวอย่างขนาด n สามารถแสดงให้เห็นได้ว่ามีขนาดใหญ่เพียงพอ การแจกแจงของค่าประมาณจะใกล้เคียงปกติโดยมีค่าเฉลี่ย p และส่วนเบี่ยงเบนมาตรฐาน ... ในกรณีนี้ข้อผิดพลาดมาตรฐานของการประมาณจะแสดงเป็น และช่วงความเชื่อมั่นเป็น .

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดกำลังวางแผนที่จะขยายการจัดประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประมาณความต้องการผู้จัดการได้สุ่มเลือกผู้เยี่ยมชม 40 คนจากผู้ที่ได้ทดลองใช้แล้วและเชิญให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่เป็นคะแนนตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณส่วนแบ่งที่คาดหวังของลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่เป็นอย่างน้อย มากกว่า 6 คะแนน (เขาคาดว่าลูกค้าเหล่านี้จะเป็นผู้บริโภคผลิตภัณฑ์ใหม่)

การตัดสินใจ

ในขั้นต้นเราสร้างคอลัมน์ใหม่โดยยึดตาม 1 หากคะแนนของลูกค้ามากกว่า 6 คะแนนและ 0 เป็นอย่างอื่น (ดูไฟล์ SANDWICH2.XLS (เทมเพลตและโซลูชัน)

วิธีที่ 1

การนับจำนวน 1 เราจะประมาณส่วนแบ่งจากนั้นเราใช้สูตร

ค่า z cr นำมาจากตารางพิเศษของการแจกแจงปกติ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)

การใช้แนวทางนี้และข้อมูลเฉพาะเพื่อสร้างช่วงเวลา 95% เราได้ผลลัพธ์ดังต่อไปนี้ (รูปที่ 99
). ค่าวิกฤตของพารามิเตอร์ z cr คือ 1.96 ข้อผิดพลาดมาตรฐานของการประมาณคือ 0.077 ขีด จำกัด ล่างของช่วงความเชื่อมั่นคือ 0.475 ขีด จำกัด บนของช่วงความเชื่อมั่นคือ 0.775 ดังนั้นผู้จัดการจึงมีสิทธิ์ที่จะเชื่อด้วยความมั่นใจ 95% ว่าเปอร์เซ็นต์ของลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่ 6 คะแนนขึ้นไปจะอยู่ระหว่าง 47.5 ถึง 77.5

วิธีที่ 2

งานนี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการทำเช่นนี้ก็เพียงพอที่จะสังเกตว่าส่วนแบ่งในกรณีนี้เกิดขึ้นพร้อมกับค่าเฉลี่ยของคอลัมน์ Type จากนั้นเราก็นำไปใช้ StatPro / การอนุมานทางสถิติ / การวิเคราะห์ตัวอย่างเดียว เพื่อสร้างช่วงความเชื่อมั่นของค่าเฉลี่ย (ค่าประมาณของค่าที่คาดหวัง) สำหรับคอลัมน์ Type ผลลัพธ์ที่ได้ในกรณีนี้จะใกล้เคียงกับผลลัพธ์ของวิธีที่ 1 มาก (รูปที่ 99)

ช่วงความเชื่อมั่นสำหรับส่วนเบี่ยงเบนมาตรฐาน

ในฐานะที่เป็นค่าประมาณของค่าเบี่ยงเบนมาตรฐานจะใช้ s (สูตรได้รับในส่วนที่ 1) ฟังก์ชันความหนาแน่นของค่าประมาณ s คือฟังก์ชันไคสแควร์ซึ่งเช่นเดียวกับการแจกแจง t มีองศาอิสระ n-1 มีฟังก์ชันพิเศษสำหรับการทำงานกับการกระจาย CHIDIST และ CHIINV นี้

ช่วงความเชื่อมั่นในกรณีนี้จะไม่สมมาตรอีกต่อไป แผนผังของขอบเขตแสดงในรูปที่ 100.

ตัวอย่าง

เครื่องต้องผลิตชิ้นส่วนที่มีเส้นผ่านศูนย์กลาง 10 ซม. อย่างไรก็ตามเนื่องจากสถานการณ์ต่างๆเกิดข้อผิดพลาด ตัวควบคุมคุณภาพมีความกังวลเกี่ยวกับสองสิ่งประการแรกค่าเฉลี่ยควรอยู่ที่ 10 ซม. ประการที่สองแม้ในกรณีนี้หากการเบี่ยงเบนมีขนาดใหญ่หลายส่วนจะถูกปฏิเสธ ทุกวันเขาทำตัวอย่าง 50 ส่วน (ดูไฟล์ QUALITY CONTROL.XLS (เทมเพลตและโซลูชัน) ตัวอย่างดังกล่าวสามารถให้ข้อสรุปอะไรได้บ้าง

การตัดสินใจ

พล็อตช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานโดยใช้ StatPro / การอนุมานทางสถิติ / การวิเคราะห์ตัวอย่างเดียว (รูปที่ 101
).

นอกจากนี้โดยใช้สมมติฐานของการแจกแจงแบบปกติของเส้นผ่านศูนย์กลางเราคำนวณสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องโดยตั้งค่าเบี่ยงเบนสูงสุด 0.065 ใช้ความสามารถของตารางการทดแทน (กรณีของพารามิเตอร์สองตัว) เราสร้างการพึ่งพาของอัตราการแต่งงานกับค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน (รูปที่ 102
).

ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสองวิธี

นี่เป็นหนึ่งในการประยุกต์ใช้วิธีการทางสถิติที่สำคัญที่สุด ตัวอย่างสถานการณ์

ผู้จัดการร้านขายเสื้อผ้าต้องการทราบว่านักช้อปหญิงโดยเฉลี่ยใช้จ่ายในร้านมากกว่าผู้ชายมากหรือน้อยเพียงใด

ทั้งสองสายการบินบินเส้นทางที่คล้ายกัน องค์กรผู้บริโภคต้องการเปรียบเทียบความแตกต่างระหว่างความล่าช้าของเที่ยวบินโดยเฉลี่ยที่คาดว่าจะเกิดขึ้นสำหรับทั้งสองสายการบิน

บริษัท ส่งคูปองสำหรับสินค้าบางประเภทในเมืองหนึ่งและไม่ส่งอีก ผู้จัดการต้องการเปรียบเทียบปริมาณการซื้อโดยเฉลี่ยของสินค้าเหล่านี้ในช่วงสองเดือนข้างหน้า

ตัวแทนจำหน่ายรถยนต์มักเกี่ยวข้องกับคู่แต่งงานในการนำเสนอ คู่รักมักถูกสัมภาษณ์แยกกันเพื่อทำความเข้าใจปฏิกิริยาส่วนตัวต่อการนำเสนอ ผู้จัดการต้องการประเมินความแตกต่างของการให้คะแนนที่รายงานโดยชายและหญิง

กรณีตัวอย่างอิสระ

ความแตกต่างของค่าเฉลี่ยจะมีการแจกแจง t โดยมี n 1 + n 2 - 2 องศาอิสระ ช่วงความเชื่อมั่นสำหรับμ 1 - μ 2 แสดงโดยอัตราส่วน:

งานนี้สามารถแก้ไขได้ไม่เพียง แต่ด้วยสูตรข้างต้นเท่านั้น แต่ยังสามารถแก้ไขได้ด้วยเครื่องมือ StatPro มาตรฐานอีกด้วย สำหรับสิ่งนี้ก็เพียงพอที่จะสมัคร

ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วน

ให้เป็นความคาดหวังทางคณิตศาสตร์ของหุ้น ให้เป็นค่าประมาณตัวอย่างที่สร้างจากตัวอย่างขนาด n 1 และ n 2 ตามลำดับ จากนั้นจึงเป็นค่าประมาณสำหรับความแตกต่าง ดังนั้นช่วงความเชื่อมั่นสำหรับความแตกต่างนี้จึงแสดงเป็น:

ในที่นี้ z cr คือค่าที่ได้จากการแจกแจงปกติตามตารางพิเศษ (ตัวอย่างเช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)

ข้อผิดพลาดมาตรฐานของการประมาณจะแสดงในกรณีนี้โดยอัตราส่วน:

ตัวอย่าง

ร้านค้าได้ทำการวิจัยตลาดดังต่อไปนี้เพื่อเตรียมพร้อมสำหรับการขายครั้งใหญ่ ผู้ซื้อ 300 อันดับแรกได้รับการคัดเลือกซึ่งจะสุ่มแบ่งออกเป็นสองกลุ่มกลุ่มละ 150 คน ผู้ซื้อที่เลือกทั้งหมดได้รับคำเชิญให้เข้าร่วมการขาย แต่มีเพียงสมาชิกของกลุ่มแรกเท่านั้นที่มาพร้อมกับคูปองเพื่อให้พวกเขาได้รับส่วนลด 5% ในระหว่างการขายมีการบันทึกการซื้อของผู้ซื้อที่เลือกทั้งหมด 300 ราย ผู้จัดการจะตีความผลลัพธ์และสรุปเกี่ยวกับประสิทธิผลของการจัดส่งคูปองได้อย่างไร (ดูไฟล์ COUPONS.XLS (เทมเพลตและโซลูชัน))

การตัดสินใจ

สำหรับกรณีเฉพาะของเราผู้ซื้อจาก 150 รายที่ได้รับคูปองส่วนลด 55 รายซื้อสินค้าจากการขายและในจำนวน 150 รายที่ไม่ได้รับคูปองมีเพียง 35 รายที่ทำการซื้อ (รูปที่ 103
). จากนั้นค่าของสัดส่วนตัวอย่างคือ 0.3667 และ 0.2333 ตามลำดับ และตัวอย่างความแตกต่างระหว่างพวกเขาคือ 0.1333 ตามลำดับ สมมติว่าช่วงความเชื่อมั่นคือ 95% เราจะพบ z cr \u003d 1.96 จากตารางการแจกแจงปกติ การคำนวณข้อผิดพลาดมาตรฐานของความแตกต่างของตัวอย่างคือ 0.0524 สุดท้ายเราพบว่าขีด จำกัด ล่างของช่วงความเชื่อมั่น 95% คือ 0.0307 และขีด จำกัด บนคือ 0.2359 ตามลำดับ ผลลัพธ์สามารถตีความได้ว่าสำหรับลูกค้าทุก 100 คนที่ได้รับคูปองส่วนลดคุณสามารถคาดหวังได้จากลูกค้าใหม่ 3 ถึง 23 คน อย่างไรก็ตามควรระลึกไว้เสมอว่าข้อสรุปในตัวมันเองยังไม่ได้หมายถึงประสิทธิภาพของการใช้คูปอง (เนื่องจากการให้ส่วนลดทำให้เราสูญเสียกำไร!) มาสาธิตสิ่งนี้ด้วยข้อมูลเฉพาะ สมมติว่าขนาดการซื้อโดยเฉลี่ยคือ 400 รูเบิลซึ่ง 50 รูเบิล มีกำไรจากร้านค้า จากนั้นผลกำไรที่คาดว่าจะได้รับต่อผู้ซื้อ 100 รายที่ไม่ได้รับคูปองคือ:

50 0.2333 100 \u003d 1166.50 รูเบิล

การคำนวณที่คล้ายกันสำหรับผู้ซื้อ 100 รายที่ได้รับคูปองให้:

30 0.3667 100 \u003d 1100.10 รูเบิล

การลดลงของกำไรเฉลี่ยถึง 30 นั้นเกิดจากการใช้ส่วนลดลูกค้าที่ได้รับคูปองโดยเฉลี่ยจะทำการซื้อในราคา 380 รูเบิล

ดังนั้นข้อสรุปสุดท้ายจึงพูดถึงความไม่มีประสิทธิผลของการใช้คูปองดังกล่าวในสถานการณ์เฉพาะนี้

แสดงความคิดเห็น. งานนี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการทำเช่นนี้ก็เพียงพอที่จะลดปัญหานี้ให้เป็นปัญหาในการประมาณความแตกต่างของสองวิธีโดยวิธีการแล้วนำไปใช้ StatPro / การอนุมานทางสถิติ / การวิเคราะห์สองตัวอย่าง เพื่อสร้างช่วงความเชื่อมั่นของความแตกต่างระหว่างค่าเฉลี่ยสองค่า

การควบคุมความยาวช่วงความมั่นใจ

ความยาวของช่วงความเชื่อมั่นขึ้นอยู่กับ เงื่อนไขต่อไปนี้:

ข้อมูลโดยตรง (ส่วนเบี่ยงเบนมาตรฐาน);

ระดับนัยสำคัญ

ขนาดตัวอย่าง.

ขนาดตัวอย่างในการประมาณค่าเฉลี่ย

ขั้นแรกให้พิจารณาปัญหาในกรณีทั่วไป ให้เรากำหนดค่าของครึ่งหนึ่งของความยาวของช่วงความเชื่อมั่นที่ให้กับเราเป็น B (รูปที่ 104
). เรารู้ว่าช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของตัวแปรสุ่ม X บางตัวแสดงเป็น ที่ไหน ... สมมติว่า:

และแสดง n เราได้

น่าเสียดายที่เราไม่ทราบค่าที่แน่นอนของความแปรปรวนของตัวแปรสุ่ม X นอกจากนี้เราไม่ทราบค่าของ t cr เนื่องจากมันขึ้นอยู่กับ n ผ่านจำนวนองศาอิสระ ในสถานการณ์เช่นนี้เราสามารถดำเนินการได้ดังนี้ แทนที่จะใช้ความแปรปรวนเราใช้การประมาณค่าความแปรปรวนตามการรับรู้ที่มีอยู่ของตัวแปรสุ่มที่อยู่ระหว่างการศึกษา แทนที่จะใช้ค่า t cr เราใช้ค่า z cr สำหรับการแจกแจงปกติ สิ่งนี้เป็นที่ยอมรับได้เนื่องจากฟังก์ชันความหนาแน่นของการกระจายสำหรับการแจกแจงแบบปกติและการแจกแจง t อยู่ใกล้กันมาก (ยกเว้นกรณีของ n ขนาดเล็ก) ดังนั้นสูตรที่ต้องการจึงอยู่ในรูปแบบ:

เนื่องจากสูตรให้ผลลัพธ์ที่พูดโดยทั่วไปไม่ใช่จำนวนเต็มขนาดตัวอย่างที่ต้องการจึงถูกนำมาใช้เพื่อปัดเศษส่วนเกินของผลลัพธ์

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดกำลังวางแผนที่จะขยายการจัดประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการผู้จัดการวางแผนที่จะสุ่มเลือกผู้เยี่ยมชมจำนวนหนึ่งจากผู้ที่ได้ทดลองใช้แล้วและเชิญให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่เป็นคะแนนตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณจำนวนคะแนนที่คาดว่าจะได้รับใหม่ ผลิตภัณฑ์และสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณนี้ ในขณะเดียวกันเขาต้องการให้ความกว้างครึ่งหนึ่งของช่วงความมั่นใจไม่เกิน 0.3 เขาควรสัมภาษณ์ผู้เยี่ยมชมกี่คน?

ดังต่อไปนี้:

ที่นี่ r ots คือค่าประมาณของเศษส่วน p และ B คือครึ่งหนึ่งของความยาวช่วงความเชื่อมั่น การประเมินค่าสูงเกินไปสำหรับ n สามารถหาได้โดยใช้ค่า r ots \u003d 0.5 ในกรณีนี้ความยาวของช่วงความเชื่อมั่นจะไม่เกินค่า B ที่กำหนดสำหรับค่าที่แท้จริงของ p

ตัวอย่าง

ให้ผู้จัดการจากตัวอย่างก่อนหน้านี้วางแผนประมาณสัดส่วนของลูกค้าที่ชอบผลิตภัณฑ์ประเภทใหม่ เขาต้องการสร้างช่วงความมั่นใจ 90% โดยครึ่งหนึ่งของความยาวจะต้องไม่เกิน 0.05 ตัวอย่างสุ่มควรมีลูกค้ากี่ราย

การตัดสินใจ

ในกรณีของเราค่า z cr \u003d 1.645 ดังนั้นจำนวนเงินที่ต้องการคำนวณเป็น .

หากผู้จัดการมีเหตุผลที่จะเชื่อว่าค่า p ที่ต้องการเช่นประมาณ 0.3 จากนั้นแทนที่ค่านี้ในสูตรข้างต้นเราจะได้ค่าที่น้อยกว่าของตัวอย่างสุ่มคือ 228

สูตรสำหรับการพิจารณา ขนาดตัวอย่างสุ่มในกรณีที่มีความแตกต่างระหว่างสองวิธี เขียนเป็น:

ตัวอย่าง

บริษัท คอมพิวเตอร์บางแห่งมีศูนย์บริการลูกค้า เมื่อเร็ว ๆ นี้จำนวนข้อร้องเรียนของลูกค้าเกี่ยวกับคุณภาพการบริการที่ไม่ดีได้เพิ่มขึ้น ศูนย์บริการส่วนใหญ่จ้างพนักงานสองประเภทคือผู้ที่ไม่มีประสบการณ์มากนัก แต่จบหลักสูตรเตรียมความพร้อมพิเศษและมีประสบการณ์ในทางปฏิบัติมากมาย แต่ยังไม่สำเร็จหลักสูตรพิเศษ บริษัท ต้องการวิเคราะห์ข้อร้องเรียนของลูกค้าในช่วงหกเดือนที่ผ่านมาและเปรียบเทียบตัวเลขเฉลี่ยของพนักงานแต่ละกลุ่มจากทั้งสองกลุ่ม สันนิษฐานว่าปริมาณในตัวอย่างของทั้งสองกลุ่มจะเท่ากัน ตัวอย่างควรรวมพนักงานกี่คนเพื่อให้ได้ช่วงเวลา 95% โดยมีความยาวครึ่งหนึ่งไม่เกิน 2

การตัดสินใจ

ในที่นี้цоцคือค่าประมาณของค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มทั้งสองภายใต้สมมติฐานว่าใกล้เคียงกัน ดังนั้นในงานของเราเราต้องได้ค่าประมาณนี้ ซึ่งสามารถทำได้เช่นดังต่อไปนี้ เมื่อดูข้อมูลเกี่ยวกับการร้องเรียนของลูกค้าในช่วงหกเดือนที่ผ่านมาผู้จัดการอาจสังเกตเห็นว่าสำหรับพนักงานแต่ละคนมีข้อร้องเรียน 6 ถึง 36 เรื่องเป็นหลัก เมื่อรู้ว่าสำหรับการแจกแจงแบบปกติค่าเกือบทั้งหมดจะถูกลบออกจากค่าเฉลี่ยโดยไม่เกินสามส่วนเบี่ยงเบนมาตรฐานเขาสามารถเชื่อได้อย่างสมเหตุสมผลว่า:

เพราะอะไรσоц \u003d 5.

เราจะได้ค่านี้แทนค่านี้ .

สูตรสำหรับการพิจารณา ขนาดของตัวอย่างสุ่มในกรณีของการประมาณความแตกต่างระหว่างหุ้น ดูเหมือน:

ตัวอย่าง

บริษัท บางแห่งมีโรงงานสองแห่งที่ผลิตผลิตภัณฑ์ที่คล้ายคลึงกัน ผู้จัดการ บริษัท ต้องการเปรียบเทียบสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องในโรงงานทั้งสองแห่ง จากข้อมูลที่มีอยู่อัตราเศษเหล็กของทั้งสองโรงงานอยู่ระหว่าง 3 ถึง 5% ควรสร้างช่วงความเชื่อมั่น 99% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.005 (หรือ 0.5%) ควรนำสินค้าจากโรงงานละกี่ชิ้น?

การตัดสินใจ

ในที่นี้ p 1ots และ p 2ots เป็นค่าประมาณของอัตราเศษเหล็กที่ไม่รู้จักสองแห่งในโรงงานที่ 1 และ 2 ถ้าเราใส่ p 1ots \u003d p 2ots \u003d 0.5 เราจะได้ค่าที่สูงเกินไปสำหรับ n แต่เนื่องจากในกรณีของเราเรามีข้อมูลเบื้องต้นเกี่ยวกับหุ้นเหล่านี้เราจึงใช้ค่าประมาณส่วนบนสำหรับหุ้นเหล่านี้คือ 0.05 เราได้รับ

เมื่อพารามิเตอร์บางตัวของประชากรถูกประมาณจากข้อมูลตัวอย่างไม่เพียง แต่จะมีประโยชน์ในการให้ค่าประมาณแบบจุดของพารามิเตอร์เท่านั้น แต่ยังระบุช่วงความเชื่อมั่นซึ่งจะแสดงตำแหน่งที่แน่นอนของค่าพารามิเตอร์โดยประมาณ

ในบทนี้เราได้ทำความคุ้นเคยกับความสัมพันธ์เชิงปริมาณที่ช่วยให้เราสร้างช่วงเวลาดังกล่าวสำหรับพารามิเตอร์ต่างๆ เรียนรู้วิธีควบคุมความยาวของช่วงความเชื่อมั่น

โปรดทราบว่าปัญหาในการประมาณขนาดตัวอย่าง (ปัญหาในการวางแผนการทดลอง) สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐานคือ StatPro / การอนุมานทางสถิติ / การเลือกขนาดตัวอย่าง.

ตัวอย่างใด ๆ ให้เพียงแนวคิดโดยประมาณของประชากรทั่วไปและคุณลักษณะทางสถิติของตัวอย่างทั้งหมด (ค่าเฉลี่ยโหมดความแปรปรวน ... ) เป็นการประมาณหรือกล่าวว่าเป็นค่าประมาณของพารามิเตอร์ทั่วไปซึ่งในกรณีส่วนใหญ่ไม่สามารถคำนวณได้เนื่องจากประชากรทั่วไปไม่พร้อมใช้งาน (รูปที่ 20) ...

รูปที่ 20. ข้อผิดพลาดในการสุ่มตัวอย่าง

แต่คุณสามารถระบุช่วงเวลาที่ค่าจริง (ทั่วไป) ของลักษณะทางสถิติอยู่ในระดับหนึ่งของความน่าจะเป็น ช่วงเวลานี้เรียกว่า ง ช่วงความเชื่อมั่น (CI)

ดังนั้นค่าเฉลี่ยทั่วไปที่มีความน่าจะเป็น 95% อยู่ภายใน

จากถึง, (20)

ที่ไหน t - ค่าตารางของเกณฑ์นักเรียนสำหรับ α \u003d 0.05 และ ฉ= n-1

สามารถพบ CI ได้ 99% ในกรณีนี้ t เลือกสำหรับ α =0,01.

ความสำคัญในทางปฏิบัติของช่วงความเชื่อมั่นคืออะไร?

ช่วงความเชื่อมั่นที่กว้างบ่งชี้ว่าค่าเฉลี่ยตัวอย่างไม่ได้สะท้อนถึงค่าเฉลี่ยทั่วไปอย่างถูกต้อง ซึ่งมักเกิดจากขนาดตัวอย่างไม่เพียงพอหรือความแตกต่างกันเช่น ความแปรปรวนสูง ทั้งสองให้ค่าเฉลี่ยผิดพลาดมากและดังนั้น CI ที่กว้างขึ้น และนี่คือพื้นฐานสำหรับการกลับไปสู่ขั้นตอนการวางแผนของการศึกษา

ขีด จำกัด บนและล่างของ CI ประเมินว่าผลลัพธ์จะมีนัยสำคัญทางคลินิกหรือไม่

ให้เราพิจารณารายละเอียดเพิ่มเติมเกี่ยวกับคำถามเกี่ยวกับความสำคัญทางสถิติและทางคลินิกของผลการศึกษาคุณสมบัติของกลุ่ม จำไว้ว่างานของสถิติคือการตรวจจับความแตกต่างของประชากรอย่างน้อยที่สุดโดยพิจารณาจากข้อมูลตัวอย่าง เป็นหน้าที่ของแพทย์ในการระบุความแตกต่าง (แต่ไม่ใช่ทั้งหมด) ที่จะช่วยในการวินิจฉัยหรือการรักษา และไม่ใช่ว่าการค้นพบทางสถิติจะเป็นพื้นฐานสำหรับข้อสรุปทางคลินิกเสมอไป ดังนั้นการลดลงอย่างมีนัยสำคัญทางสถิติของฮีโมโกลบิน 3 กรัม / ลิตรจึงไม่เป็นสาเหตุให้กังวล และในทางกลับกันหากปัญหาบางอย่างในร่างกายมนุษย์ไม่มีลักษณะที่ใหญ่โตในระดับของประชากรทั้งหมดนี่ไม่ใช่เหตุผลที่จะไม่จัดการกับปัญหานี้

เราจะพิจารณาบทบัญญัตินี้ที่ ตัวอย่าง.

นักวิจัยสงสัยว่าเด็กผู้ชายที่เป็นโรคติดเชื้อนั้นล้าหลังกว่าเพื่อนหรือไม่ เพื่อจุดประสงค์นี้จึงได้ทำการศึกษาตัวอย่างโดยมีเด็กชาย 10 คนที่เป็นโรคนี้เข้าร่วม ผลลัพธ์แสดงไว้ในตารางที่ 23

ตารางที่ 23. ผลการประมวลผลทางสถิติ

ขีด จำกัด ล่าง	ขีด จำกัด บน	มาตรฐาน (ซม.)
			กลาง

จากการคำนวณเหล่านี้พบว่าความสูงโดยเฉลี่ยที่คัดเลือกได้ของเด็กชายอายุ 10 ปีที่เป็นโรคติดเชื้อบางอย่างใกล้เคียงกับปกติ (132.5 ซม.) อย่างไรก็ตามขีด จำกัด ล่างของช่วงความเชื่อมั่น (126.6 ซม.) บ่งชี้ว่ามีความเป็นไปได้ 95% ที่ความสูงเฉลี่ยที่แท้จริงของเด็กเหล่านี้สอดคล้องกับแนวคิดของ "ความสูงสั้น" นั่นคือ เด็กเหล่านี้แคระแกรน

ในตัวอย่างนี้ผลการคำนวณ CI มีความสำคัญทางคลินิก

สมมติว่าเรามีสินค้าจำนวนมากที่มีการแจกแจงลักษณะบางอย่างตามปกติ (ตัวอย่างเช่นผักชนิดเดียวกันเต็มโกดังขนาดและน้ำหนักแตกต่างกันไป) คุณต้องการทราบลักษณะโดยเฉลี่ยของสินค้าทั้งชุด แต่คุณไม่มีเวลาหรือความปรารถนาที่จะวัดและชั่งน้ำหนักผักแต่ละชนิด คุณเข้าใจว่าสิ่งนี้ไม่จำเป็น แต่จะต้องสุ่มตัวอย่างมากแค่ไหน? ก่อนที่จะให้สูตรที่มีประโยชน์สำหรับสถานการณ์นี้เราจะนึกถึงสัญกรณ์บางอย่าง อันดับแรกหากเรายังคงวัดปริมาณผักทั้งหมด (ชุดขององค์ประกอบนี้เรียกว่าประชากรทั่วไป) เราก็จะรู้ว่าน้ำหนักเฉลี่ยของทั้งชุดมีความแม่นยำทั้งหมด ขอเรียกค่าเฉลี่ยนี้ ยีนเฉลี่ย X... - ค่าเฉลี่ยทั่วไป เรารู้แล้วว่าอะไรถูกกำหนดอย่างสมบูรณ์หากทราบค่าเฉลี่ยและค่าเบี่ยงเบน s จริงอยู่จนถึงตอนนี้เราไม่ทราบทั้ง X เฉลี่ย gen หรือ s ของประชากรทั่วไป เราสามารถใช้ตัวอย่างบางตัวอย่างวัดค่าที่เราต้องการและคำนวณสำหรับตัวอย่างนี้ทั้งค่าเฉลี่ย X เฉลี่ยและค่าเบี่ยงเบนมาตรฐาน S เลือก เป็นที่ทราบกันดีว่าหากการตรวจสอบตัวอย่างของเรามีองค์ประกอบจำนวนมาก (โดยปกติ n จะมากกว่า 30) และพวกมันถูกสุ่มตัวอย่างจริงๆดังนั้น s ของประชากรทั่วไปแทบจะไม่แตกต่างจาก S select นอกจากนี้สำหรับกรณีของการแจกแจงแบบปกติเราสามารถใช้สูตรต่อไปนี้

มีความน่าจะเป็น 95%

มีความน่าจะเป็น 99%

ในรูปแบบทั่วไปด้วยความน่าจะเป็นР (t)

ความสัมพันธ์ระหว่างค่า t และค่าของความน่าจะเป็น P (t) ซึ่งเราต้องการทราบช่วงความเชื่อมั่นสามารถนำมาจากตารางต่อไปนี้:

P (เสื้อ)	0,683	0,950	0,954	0,990	0,997
t	1,00	1,96	2,00	2,58	3,00

ดังนั้นเราจึงพิจารณาได้ว่าค่าเฉลี่ยสำหรับประชากรทั่วไป (ด้วยความน่าจะเป็นที่กำหนด) อยู่ในช่วงใด

หากเราไม่มีกลุ่มตัวอย่างมากพอเราไม่สามารถโต้แย้งได้ว่าประชากรทั่วไปมีทางเลือก s \u003d S นอกจากนี้ในกรณีนี้ความใกล้ชิดของตัวอย่างกับการแจกแจงปกติเป็นปัญหา ในกรณีนี้จะใช้ S select แทน s ในสูตรด้วย:

แต่ค่า t สำหรับความน่าจะเป็นคงที่ Р (t) จะขึ้นอยู่กับจำนวนองค์ประกอบในตัวอย่าง n ยิ่ง n มีขนาดใหญ่เท่าใดช่วงความเชื่อมั่นที่ได้รับจะเข้าใกล้ค่าที่กำหนดโดยสูตร (1) มากขึ้นเท่านั้น ค่าของ t ในกรณีนี้นำมาจากตารางอื่น (t-test ของนักเรียน) ซึ่งเราให้ไว้ด้านล่าง:

ค่า t-test ของนักเรียนสำหรับความน่าจะเป็น 0.95 และ 0.99& nbsp

n	ป		n	ป
n	0.95	0.99	n	0.95	0.99
2	12.71	63.66	18	2.11	2.90
3	4.30	9.93	19	2.10	2.88
4	3.18	5.84	20	2.093	2.861
5	2.78	4.60	25	2.064	2.797
6	2.57	4.03	30	2.045	2.756
7	2.45	3.71	35	2.032	2.720
8	2.37	3.50	40	2.022	2.708
9	2.31	3.36	45	2.016	2.692
10	2.26	3.25	50	2.009	2.679
11	2.23	3.17	60	2.001	2.662
12	2.20	3.11	70	1.996	2.649
13	2.18	3.06	80	1.991	2.640
14	2.16	3.01	90	1.987	2.633
15	2.15	2.98	100	1.984	2.627
16	2.13	2.95	120	1.980	2.617
17	2.12	2.92	>120	1.960	2.576

ตัวอย่างที่ 3. 30 คนถูกสุ่มเลือกจากพนักงานของ บริษัท สำหรับตัวอย่างปรากฎว่าเงินเดือนเฉลี่ย (ต่อเดือน) คือ 10,000 รูเบิลโดยมีค่าเบี่ยงเบนกำลังสองเฉลี่ย 3 พันรูเบิล ด้วยความน่าจะเป็นที่ 0.99 กำหนดเงินเดือนเฉลี่ยใน บริษัท การตัดสินใจ:ตามสมมติฐานเรามี n \u003d 30, X cf \u003d 10000, S \u003d 3000, P \u003d 0.99 ในการหาช่วงความเชื่อมั่นเราจะใช้สูตรที่สอดคล้องกับเกณฑ์ของนักเรียน ตามตารางสำหรับ n \u003d 30 และ P \u003d 0.99 เราพบ t \u003d 2.756 ดังนั้น

เหล่านั้น ช่วงความเชื่อมั่นที่ต้องการคือ 27484< Х ср.ген < 32516.

ดังนั้นด้วยความน่าจะเป็น 0.99 จึงสามารถเป็นที่ถกเถียงกันอยู่ว่าช่วงเวลา (27484; 32516) มีเงินเดือนเฉลี่ยใน บริษัท
เราหวังว่าคุณจะใช้วิธีนี้ แต่คุณไม่จำเป็นต้องมีโต๊ะกับคุณทุกครั้ง การคำนวณสามารถทำได้ใน Excel โดยอัตโนมัติ ขณะอยู่ในไฟล์ Excel ให้คลิกปุ่ม fx ที่เมนูด้านบน จากนั้นเลือกระหว่างฟังก์ชันประเภท "สถิติ" และจากรายการที่เสนอในหน้าต่าง - STYUDRESIST จากนั้นตามคำแนะนำโดยวางเคอร์เซอร์ในช่อง "ความน่าจะเป็น" ให้พิมพ์ค่าของความน่าจะเป็นผกผัน (เช่นในกรณีของเราแทนที่จะเป็นความน่าจะเป็น 0.95 คุณต้องพิมพ์ความน่าจะเป็น 0.05) เห็นได้ชัดว่าสเปรดชีตได้รับการออกแบบมาเพื่อให้ผลลัพธ์ตอบคำถามว่าเรามีโอกาสผิดพลาดได้อย่างไร ในช่อง "ระดับอิสระ" ให้ป้อนค่า (n-1) สำหรับการเลือกของคุณ