Mnk สำหรับฟังก์ชันเชิงเส้น ตัวอย่างวิธีการแก้ปัญหากำลังสองน้อยที่สุด การประมาณโดยใช้ฟังก์ชันอื่น ๆ
วิธีการหนึ่งในการศึกษาความเชื่อมโยงระหว่างคุณลักษณะสุ่มคือการวิเคราะห์การถดถอย
การวิเคราะห์การถดถอยเป็นที่มาของสมการการถดถอยด้วยความช่วยเหลือซึ่งจะพบค่าเฉลี่ยของตัวแปรสุ่ม (คุณลักษณะ - ผลลัพธ์) หากทราบค่าของตัวแปรอื่น (หรืออื่น ๆ ) (คุณลักษณะ - ปัจจัย) รวมถึงขั้นตอนต่อไปนี้:
- การเลือกรูปแบบการสื่อสาร (ประเภทของสมการถดถอยเชิงวิเคราะห์);
- การประมาณค่าพารามิเตอร์ของสมการ
- การประเมินคุณภาพของสมการถดถอยเชิงวิเคราะห์
ในกรณีของความสัมพันธ์เชิงเส้นคู่สมการถดถอยจะอยู่ในรูป: y i \u003d a + b x i + u i พารามิเตอร์ของสมการนี้ a และ b ประมาณจากข้อมูลของการสังเกตทางสถิติ x และ y ผลลัพธ์ของการประเมินดังกล่าวคือสมการโดยที่ค่าประมาณของพารามิเตอร์ a และ b คือค่าของแอตทริบิวต์ที่มีประสิทธิผล (ตัวแปร) ที่ได้จากสมการการถดถอย (ค่าที่คำนวณได้)
ส่วนใหญ่มักใช้ในการประมาณค่าพารามิเตอร์ วิธีกำลังสองน้อยที่สุด (OLS)
วิธีกำลังสองน้อยที่สุดให้ค่าประมาณที่ดีที่สุด (สม่ำเสมอมีประสิทธิภาพและเป็นกลาง) ของพารามิเตอร์ของสมการการถดถอย แต่ถ้าตรงตามข้อกำหนดเบื้องต้นบางประการสำหรับคำที่สุ่ม (u) และตัวแปรอิสระ (x) (ดูข้อกำหนดเบื้องต้นของ OLS)
ปัญหาในการประมาณค่าพารามิเตอร์ของสมการคู่เชิงเส้นโดยวิธีกำลังสองน้อยที่สุด ประกอบด้วยสิ่งต่อไปนี้: เพื่อให้ได้ค่าประมาณพารามิเตอร์ดังกล่าวซึ่งผลรวมของกำลังสองของการเบี่ยงเบนของค่าจริงของตัวบ่งชี้ที่มีประสิทธิภาพ - y i จากค่าที่คำนวณได้ - มีค่าน้อยที่สุด
อย่างเป็นทางการ เกณฑ์ OLS สามารถเขียนได้ดังนี้: .
การจำแนกวิธีกำลังสองน้อยที่สุด
- วิธีกำลังสองน้อยที่สุด
- วิธีความเป็นไปได้สูงสุด (สำหรับแบบจำลองการถดถอยเชิงเส้นแบบคลาสสิกปกติความเป็นปกติของการถดถอยที่เหลือจะถูกตั้งสมมติฐาน)
- วิธี OLS กำลังสองน้อยที่สุดโดยทั่วไปใช้ในกรณีของความสัมพันธ์อัตโนมัติของข้อผิดพลาดและในกรณีของ heteroscedasticity
- วิธีการถ่วงน้ำหนักกำลังสองน้อยที่สุด (กรณีพิเศษของ OLS ที่มีสารตกค้างที่แตกต่างกัน)
ขอแสดงสาระสำคัญ วิธีการกำลังสองแบบคลาสสิกแบบกราฟิก... ในการทำเช่นนี้เราจะสร้างพล็อตจุดตามข้อมูลการสังเกต (x i, y i, i \u003d 1; n) ในระบบพิกัดสี่เหลี่ยม (พล็อตจุดดังกล่าวเรียกว่าฟิลด์สหสัมพันธ์) ลองหาเส้นตรงที่ใกล้กับจุดของสนามสหสัมพันธ์มากที่สุด ตามวิธีกำลังสองน้อยที่สุดเส้นจะถูกเลือกเพื่อให้ผลรวมของกำลังสองของระยะทางแนวตั้งระหว่างจุดของฟิลด์สหสัมพันธ์กับเส้นนี้จะน้อยที่สุด
บันทึกทางคณิตศาสตร์ของปัญหานี้: .
เรารู้ค่า y i และ x i \u003d 1 ... n ซึ่งเป็นข้อมูลเชิงสังเกต ในฟังก์ชัน S พวกมันคือค่าคงที่ ตัวแปรในฟังก์ชันนี้เป็นค่าประมาณพารามิเตอร์ที่จำเป็น -,. ในการหาค่าต่ำสุดของฟังก์ชัน 2 ตัวแปรจำเป็นต้องคำนวณอนุพันธ์ย่อยของฟังก์ชันนี้สำหรับแต่ละพารามิเตอร์และนำค่าดังกล่าวมาเทียบเคียงเป็นศูนย์นั่นคือ .
เป็นผลให้เราได้ระบบสมการเชิงเส้นปกติ 2 สมการ:
การแก้ระบบนี้เราพบค่าประมาณพารามิเตอร์ที่ต้องการ:
ความถูกต้องของการคำนวณพารามิเตอร์ของสมการการถดถอยสามารถตรวจสอบได้โดยการเปรียบเทียบผลรวม (อาจมีความคลาดเคลื่อนเนื่องจากการคำนวณปัดเศษ)
ในการคำนวณค่าประมาณพารามิเตอร์คุณสามารถสร้างตารางที่ 1
สัญลักษณ์ของค่าสัมประสิทธิ์การถดถอย b บ่งบอกทิศทางของความสัมพันธ์ (ถ้า b\u003e 0 ความสัมพันธ์จะตรงถ้า b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
ตามปกติค่าของพารามิเตอร์ a คือค่าเฉลี่ยของ y ที่ x เท่ากับศูนย์ หากแอตทริบิวต์แฟกเตอร์ไม่มีและไม่สามารถมีค่าเป็นศูนย์ได้แสดงว่าการตีความพารามิเตอร์ a ข้างต้นไม่สมเหตุสมผล
การประเมินความหนาแน่นของความสัมพันธ์ระหว่างสัญญาณ
ดำเนินการโดยใช้ค่าสัมประสิทธิ์ของสหสัมพันธ์คู่เชิงเส้น - r x, y สามารถคำนวณได้โดยใช้สูตร: ... นอกจากนี้ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่สามารถกำหนดได้จากค่าสัมประสิทธิ์การถดถอย b: .
ช่วงของค่าที่ยอมรับได้ของสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้นคือตั้งแต่ –1 ถึง +1 สัญลักษณ์ของค่าสัมประสิทธิ์สหสัมพันธ์บ่งบอกทิศทางของลิงค์ ถ้า r x, y\u003e 0 แสดงว่าการเชื่อมต่อโดยตรง ถ้า r x, y<0, то связь обратная.
หากค่าสัมประสิทธิ์นี้ใกล้เคียงกับค่าสัมบูรณ์ความสัมพันธ์ระหว่างคุณลักษณะสามารถตีความได้ว่าเป็นค่าเชิงเส้นที่ค่อนข้างใกล้เคียง ถ้าโมดูลัสของมันมีค่าเท่ากับหนึ่งê r x, y ê \u003d 1 การเชื่อมต่อระหว่างคุณสมบัติจะเป็นเชิงเส้น หากคุณสมบัติ x และ y เป็นอิสระเชิงเส้นดังนั้น r x, y จะใกล้เคียงกับ 0
ในการคำนวณ r x, y คุณยังสามารถใช้ตารางที่ 1
ในการประเมินคุณภาพของสมการการถดถอยที่ได้รับค่าสัมประสิทธิ์การกำหนดทางทฤษฎีจะถูกคำนวณ - R 2 yx:
,
โดยที่ d 2 คือความแปรปรวน y อธิบายโดยสมการถดถอย
e 2 - ส่วนที่เหลือ (ไม่ได้อธิบายโดยสมการถดถอย) ความแปรปรวน y;
s 2 y คือผลต่างทั้งหมด (ทั้งหมด) ของ y
ค่าสัมประสิทธิ์ของการกำหนดเป็นลักษณะของสัดส่วนของความแปรปรวน (ความแปรปรวน) ของลักษณะที่มีประสิทธิผล y อธิบายโดยการถดถอย (และด้วยเหตุนี้ปัจจัย x) ในความแปรปรวนทั้งหมด (ความแปรปรวน) y ค่าสัมประสิทธิ์ของการกำหนด R 2 yx รับค่าตั้งแต่ 0 ถึง 1 ดังนั้นค่า 1-R 2 yx จะแสดงลักษณะของสัดส่วนของความแปรปรวน y ที่เกิดจากอิทธิพลของปัจจัยอื่น ๆ ที่ไม่ได้นำมาพิจารณาในข้อผิดพลาดของแบบจำลองและข้อกำหนด
ด้วยการถดถอยเชิงเส้นคู่ R 2 yx \u003d r 2 yx
งานหลักสูตร
การประมาณฟังก์ชันกำลังสองน้อยที่สุด
บทนำ
การประมาณคณิตศาสตร์เชิงประจักษ์
จุดมุ่งหมายของหลักสูตรนี้คือการเพิ่มพูนความรู้ด้านวิทยาการคอมพิวเตอร์พัฒนาและรวบรวมทักษะในการทำงานกับโปรแกรมประมวลผลสเปรดชีต Microsoft Excel และ MathCAD การประยุกต์ใช้ในการแก้ปัญหาโดยใช้คอมพิวเตอร์จากสาขาวิชาที่เกี่ยวข้องกับการวิจัย
ในแต่ละงานจะมีการกำหนดเงื่อนไขของปัญหาข้อมูลเริ่มต้นรูปแบบการออกผลลัพธ์การอ้างอิงทางคณิตศาสตร์หลักในการแก้ปัญหาจะถูกระบุการคำนวณการควบคุมช่วยให้คุณมั่นใจได้ว่าโปรแกรมทำงานอย่างถูกต้อง
แนวคิดของการประมาณคือการแสดงออกโดยประมาณของวัตถุทางคณิตศาสตร์ใด ๆ (เช่นตัวเลขหรือฟังก์ชัน) ผ่านทางอื่น ๆ ที่ง่ายกว่าใช้สะดวกกว่าหรือรู้จักกันดี ในการวิจัยทางวิทยาศาสตร์การประมาณใช้เพื่ออธิบายวิเคราะห์สรุปและใช้ผลเชิงประจักษ์เพิ่มเติม
ดังที่คุณทราบอาจมีความสัมพันธ์ (เชิงฟังก์ชัน) ที่แน่นอนระหว่างปริมาณเมื่อค่าหนึ่งของอาร์กิวเมนต์สอดคล้องกับค่าที่แน่นอนหนึ่งค่าและความสัมพันธ์ (สหสัมพันธ์) ที่มีความแม่นยำน้อยกว่าเมื่อค่าเฉพาะหนึ่งของอาร์กิวเมนต์สอดคล้องกับค่าโดยประมาณหรือชุดค่าของฟังก์ชันที่ใกล้เคียงกันมากหรือน้อย ซึ่งกันและกัน. เมื่อทำการวิจัยทางวิทยาศาสตร์การประมวลผลผลการสังเกตหรือการทดลองมักจะต้องจัดการกับตัวเลือกที่สอง เมื่อศึกษาการพึ่งพาเชิงปริมาณของตัวบ่งชี้ต่างๆค่าที่กำหนดโดยเชิงประจักษ์ตามกฎแล้วมีความแปรปรวนบางอย่าง ส่วนหนึ่งถูกกำหนดโดยความแตกต่างของวัตถุที่ศึกษาของไม่มีชีวิตและโดยเฉพาะอย่างยิ่งธรรมชาติของสิ่งมีชีวิตส่วนหนึ่งมาจากข้อผิดพลาดในการสังเกตและการประมวลผลเชิงปริมาณของวัสดุ องค์ประกอบสุดท้ายไม่สามารถแยกออกได้ทั้งหมดเสมอไปสามารถลดขนาดได้โดยการเลือกวิธีการวิจัยที่เหมาะสมและความถูกต้องของงานอย่างรอบคอบ
ผู้เชี่ยวชาญในสาขาระบบอัตโนมัติของกระบวนการทางเทคโนโลยีและอุตสาหกรรมจัดการกับข้อมูลการทดลองจำนวนมากซึ่งใช้คอมพิวเตอร์ในการประมวลผล ข้อมูลเริ่มต้นและผลการคำนวณที่ได้รับสามารถนำเสนอในรูปแบบตารางโดยใช้ตัวประมวลผลสเปรดชีต (สเปรดชีต) และโดยเฉพาะอย่างยิ่ง Excel การเรียนการสอนในวิชาวิทยาการคอมพิวเตอร์ช่วยให้นักเรียนสามารถรวบรวมและพัฒนาทักษะการทำงานโดยใช้เทคโนโลยีคอมพิวเตอร์ขั้นพื้นฐานในการแก้ปัญหาในสาขากิจกรรมระดับมืออาชีพ - ระบบพีชคณิตของคอมพิวเตอร์จากชั้นเรียนของระบบคอมพิวเตอร์ช่วยออกแบบที่เน้นการจัดทำเอกสารโต้ตอบด้วยการคำนวณและการสนับสนุนด้วยภาพมีความโดดเด่นด้วยความสะดวกในการใช้งานและการประยุกต์ใช้ สำหรับการทำงานเป็นทีม
1. ข้อมูลทั่วไป
บ่อยครั้งมากโดยเฉพาะอย่างยิ่งเมื่อวิเคราะห์ข้อมูลเชิงประจักษ์จำเป็นต้องหาความสัมพันธ์เชิงฟังก์ชันระหว่างค่าในรูปแบบที่ชัดเจน x และ ที่ซึ่งได้มาจากการวัด
ในการศึกษาวิเคราะห์ความสัมพันธ์ระหว่างสองปริมาณ x และ y มีการสังเกตจำนวนหนึ่งและผลลัพธ์คือตารางค่า:
xx1 x1 xผมXnปป1 ย1 ยผมยn
ตารางนี้มักได้มาจากการทดลองบางอย่างซึ่ง x, (ค่าอิสระ) กำหนดโดยผู้ทดลองและ y, ได้รับจากประสบการณ์ ดังนั้นค่าเหล่านี้ y,จะเรียกว่าค่าเชิงประจักษ์หรือเชิงทดลอง
มีความสัมพันธ์เชิงฟังก์ชันระหว่างค่า x และ y แต่รูปแบบการวิเคราะห์มักไม่เป็นที่รู้จักดังนั้นงานที่สำคัญในทางปฏิบัติจึงเกิดขึ้น - เพื่อหาสูตรเชิงประจักษ์
y \u003dฉ (x; ก 1, ก 2, …, อม ), (1)
(ที่ไหน ก1 , ก2 , …, กม - พารามิเตอร์) ซึ่งเป็นค่าที่ x \u003d x, อาจแตกต่างจากค่าการทดลองเล็กน้อย y, (ผม \u003d 1,2,…, p).
โดยปกติจะระบุคลาสของฟังก์ชัน (เช่นชุดของลิเนียร์เอกซ์โพเนนเชียลเอ็กซ์โพเนนเชียล ฯลฯ ) ซึ่งฟังก์ชันถูกเลือก f (x)จากนั้นจึงกำหนดค่าที่ดีที่สุดของพารามิเตอร์
ถ้าเป็นสูตรเชิงประจักษ์ (1) เราจะแทนที่ค่าเริ่มต้น x, จากนั้นเราจะได้ค่าทางทฤษฎี
ยทีผม \u003d ฉ (xผม; ก 1, ก 2……กม) ที่ไหน ผม \u003d 1,2,…, n.
ความแตกต่าง ยผมที - ที่ผม, เรียกว่าการเบี่ยงเบนและแสดงถึงระยะทางแนวตั้งจากจุด มผม ไปยังกราฟฟังก์ชันเชิงประจักษ์
ตามวิธีการกำลังสองน้อยค่าสัมประสิทธิ์ที่ดีที่สุด ก1 , ก2 , …, กม คือค่าที่ผลรวมของกำลังสองของส่วนเบี่ยงเบนของฟังก์ชันเชิงประจักษ์ที่พบจากค่าที่กำหนดของฟังก์ชัน
จะน้อยที่สุด
ให้เราอธิบายความหมายทางเรขาคณิตของวิธีกำลังสองน้อยที่สุด
ตัวเลขแต่ละคู่ ( xผม, ยผม) จากตารางต้นทางกำหนดจุด มผม บนพื้นผิว XOY ใช้สูตร (1) สำหรับค่าสัมประสิทธิ์ที่แตกต่างกัน ก1 , ก2 , …, กม สามารถพล็อตชุดของเส้นโค้งซึ่งเป็นกราฟของฟังก์ชัน (1) งานคือการกำหนดค่าสัมประสิทธิ์ ก1 , ก2 , …, กมเพื่อให้ผลรวมของกำลังสองของระยะทางแนวตั้งห่างจากจุด มผม (xผม, ยผม) ก่อนกราฟของฟังก์ชัน (1) มีค่าน้อยที่สุด (รูปที่ 1)
การสร้างสูตรเชิงประจักษ์ประกอบด้วยสองขั้นตอน: ค้นหารูปแบบทั่วไปของสูตรนี้และกำหนดพารามิเตอร์ที่ดีที่สุด
ถ้าลักษณะของความสัมพันธ์ระหว่างค่าที่กำหนดของ x และ ยจากนั้นประเภทของการพึ่งพาเชิงประจักษ์นั้นเป็นไปตามอำเภอใจ การตั้งค่าให้กับสูตรง่ายๆที่มีความแม่นยำดี การเลือกสูตรเชิงประจักษ์ที่ประสบความสำเร็จส่วนใหญ่ขึ้นอยู่กับความรู้ของผู้วิจัยในสาขาวิชาโดยใช้ซึ่งเขาสามารถระบุระดับของฟังก์ชันจากการพิจารณาทางทฤษฎี สิ่งที่สำคัญอย่างยิ่งคือภาพของข้อมูลที่ได้รับในคาร์ทีเซียนหรือในระบบพิกัดพิเศษ (กึ่งลอการิทึมลอการิทึม ฯลฯ ) ตามตำแหน่งของจุดเราสามารถคาดเดารูปแบบทั่วไปของการพึ่งพาได้โดยการสร้างความคล้ายคลึงกันระหว่างกราฟที่ลงจุดและตัวอย่างของเส้นโค้งที่รู้จัก
การกำหนดอัตราต่อรองที่ดีที่สุด ก1 , ก2,…, กม รวมอยู่ในสูตรเชิงประจักษ์ผลิตโดยวิธีการวิเคราะห์ที่รู้จักกันดี
ในการหาชุดของสัมประสิทธิ์ก ก1 , ก2 … .. กม, ซึ่งให้ค่าต่ำสุดของฟังก์ชัน S ที่กำหนดโดยสูตร (2) เราใช้เงื่อนไขที่จำเป็นสำหรับส่วนปลายสุดของฟังก์ชันของตัวแปรหลายตัว - ความเท่าเทียมกันเป็นศูนย์ของอนุพันธ์ย่อย
เป็นผลให้เราได้รับระบบปกติสำหรับกำหนดค่าสัมประสิทธิ์ กผม (ผม \u003d 1,2,…, ม.):
ดังนั้นการหาค่าสัมประสิทธิ์ กผม ลดการแก้ระบบ (3) ระบบนี้จะทำให้ง่ายขึ้นถ้าสูตรเชิงประจักษ์ (1) เป็นเส้นตรงเทียบกับพารามิเตอร์ กผมจากนั้นระบบ (3) จะเป็นแบบเส้นตรง
1.1 การพึ่งพาเชิงเส้น
รูปแบบเฉพาะของระบบ (3) ขึ้นอยู่กับคลาสของสูตรเชิงประจักษ์ที่เรากำลังมองหาการพึ่งพา (1) ในกรณีของการพึ่งพาเชิงเส้น y \u003d a1 + ก2 x ระบบ (3) จะอยู่ในรูปแบบ:
ระบบเชิงเส้นนี้สามารถแก้ไขได้ด้วยวิธีการใด ๆ ที่รู้จัก (วิธีเกาส์การทำซ้ำอย่างง่ายสูตรของ Cramer)
1.2 การพึ่งพากำลังสอง
ในกรณีของการพึ่งพากำลังสอง y \u003d a1 + ก2 x + ก3x 2 ระบบ (3) จะอยู่ในรูปแบบ:
1.3 การพึ่งพาเอกซ์โปเนนเชียล
ในบางกรณีเป็นสูตรเชิงประจักษ์ฟังก์ชันจะถูกนำมาซึ่งค่าสัมประสิทธิ์ที่ไม่ได้กำหนดจะป้อนแบบไม่เชิงเส้น ยิ่งไปกว่านั้นบางครั้งปัญหาอาจเป็นเชิงเส้นได้เช่น ลดเป็นเชิงเส้น การพึ่งพาดังกล่าวรวมถึงการพึ่งพาแบบเอ็กซ์โปเนนเชียล
y \u003d a1 * จa2x (6)
ที่ไหน 1 และ ก 2อัตราส่วนที่ไม่ได้กำหนด
การทำให้เป็นเส้นตรงทำได้โดยการหาลอการิทึมของความเท่าเทียมกัน (6) หลังจากนั้นเราจะได้ความสัมพันธ์
ln y \u003d ln ก 1 + ก 2x (7)
เราหมายถึง ln ที่ และ ln กx ตามลำดับถึง t และ คจากนั้นการพึ่งพา (6) สามารถเขียนเป็น t \u003d a1 + ก2 xซึ่งช่วยให้เราสามารถใช้สูตร (4) กับการแทนที่ได้ ก1 บน ค และ ที่ผม บน tผม
1.4 องค์ประกอบของทฤษฎีสหสัมพันธ์
กู้คืนกราฟการพึ่งพาการทำงาน y (x) ตามผลการวัด (x ผม, ที่ผม), ผม \u003d 1,2, K, n เรียกว่าเส้นโค้งการถดถอย ในการตรวจสอบข้อตกลงของเส้นโค้งการถดถอยที่สร้างขึ้นกับผลการทดลองมักจะนำลักษณะเชิงตัวเลขดังต่อไปนี้: ค่าสัมประสิทธิ์สหสัมพันธ์ (การพึ่งพาเชิงเส้น) อัตราส่วนสหสัมพันธ์และค่าสัมประสิทธิ์ของการกำหนด ในกรณีนี้ผลลัพธ์มักจะถูกจัดกลุ่มและนำเสนอในรูปแบบของตารางสหสัมพันธ์ แต่ละเซลล์ของตารางนี้ประกอบด้วยตัวเลข niJ - คู่เหล่านั้น (x, y)ซึ่งส่วนประกอบอยู่ในช่วงการจัดกลุ่มที่เหมาะสมสำหรับแต่ละตัวแปร สมมติว่าความยาวของช่วงการจัดกลุ่ม (สำหรับแต่ละตัวแปร) เท่ากับศูนย์ x ผม (ตามลำดับ ที่ผม) ของช่วงเวลาเหล่านี้และจำนวน niJ- เป็นพื้นฐานสำหรับการคำนวณ
ค่าสัมประสิทธิ์สหสัมพันธ์เป็นการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่มตาม: โดยเฉลี่ยแล้วตัวแปรตัวใดตัวหนึ่งสามารถแสดงเป็นฟังก์ชันเชิงเส้นของอีกตัวแปรหนึ่งได้ดีเพียงใด
ค่าสัมประสิทธิ์สหสัมพันธ์คำนวณโดยใช้สูตร:
ที่ไหนและคือค่าเฉลี่ยเลขคณิตตามลำดับ x และ ที่.
ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่มในค่าสัมบูรณ์ไม่เกิน 1 ยิ่งใกล้ | p | ถึง 1 ยิ่งความสัมพันธ์เชิงเส้นระหว่าง x และ ที่.
ในกรณีของความสัมพันธ์แบบไม่เชิงเส้นค่าเฉลี่ยตามเงื่อนไขจะอยู่ใกล้เส้นโค้ง ในกรณีนี้ขอแนะนำให้ใช้อัตราส่วนสหสัมพันธ์เป็นลักษณะของความแข็งแรงของพันธะซึ่งการตีความไม่ได้ขึ้นอยู่กับประเภทของการพึ่งพาที่ศึกษา
อัตราส่วนสหสัมพันธ์คำนวณโดยสูตร:
ที่ไหน nผม = , nฉ \u003d และตัวเศษแสดงลักษณะการกระจายตัวของวิธีการตามเงื่อนไข y, ใกล้ค่าเฉลี่ยที่ไม่มีเงื่อนไข ย.
เสมอ. ความเท่าเทียมกัน = 0 สอดคล้องกับค่าสุ่มที่ไม่สัมพันธ์กัน = 1 ในกรณีที่มีการเชื่อมต่อการทำงานที่แน่นอนระหว่าง ย และ x ในกรณีของการพึ่งพาเชิงเส้น ย ของ x อัตราส่วนสหสัมพันธ์เกิดขึ้นพร้อมกับกำลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ ปริมาณ - ? 2 ใช้เป็นตัวบ่งชี้ความเบี่ยงเบนจากการถดถอยเชิงเส้น
อัตราส่วนสหสัมพันธ์เป็นตัวชี้วัดความสัมพันธ์ ย จาก x ในรูปแบบใด ๆ แต่ไม่สามารถให้ความคิดเกี่ยวกับระดับความใกล้ชิดของข้อมูลเชิงประจักษ์กับรูปแบบพิเศษได้ เพื่อค้นหาว่าเส้นโค้งที่พล็อตสะท้อนข้อมูลเชิงประจักษ์ได้แม่นยำเพียงใดจึงมีการนำเสนอลักษณะอื่น - สัมประสิทธิ์ของดีเทอร์มินิซึม
เพื่ออธิบายให้พิจารณาปริมาณต่อไปนี้ คือผลรวมของกำลังสองซึ่งค่าเฉลี่ยอยู่ที่ไหน
หนึ่งสามารถพิสูจน์ความเท่าเทียมกันดังต่อไปนี้
เทอมแรกเท่ากับ Sres \u003d และเรียกว่าผลรวมที่เหลือของกำลังสอง เป็นการระบุลักษณะของการเบี่ยงเบนของการทดลองจากทางทฤษฎี
คำที่สองมีค่าเท่ากับ Sregr \u003d 2 และเรียกว่าผลรวมการถดถอยของกำลังสองและกำหนดลักษณะการแพร่กระจายของข้อมูล
เห็นได้ชัดว่าความเท่าเทียมกันดังต่อไปนี้ S เต็ม \u003d ส ost + ส regr.
ค่าสัมประสิทธิ์ของดีเทอร์มินิซึมถูกกำหนดโดยสูตร:
ผลรวมของกำลังสองที่เหลือน้อยกว่าเมื่อเทียบกับผลรวมของกำลังสองค่าของสัมประสิทธิ์ของดีเทอร์มินิซึมก็จะยิ่งมากขึ้นเท่านั้น ร2 ซึ่งแสดงให้เห็นว่าสมการถดถอยอธิบายความสัมพันธ์ระหว่างตัวแปรได้ดีเพียงใด ถ้ามันเท่ากับ 1 แสดงว่ามีความสัมพันธ์อย่างสมบูรณ์กับโมเดลนั่นคือ ไม่มีความแตกต่างระหว่างค่า y จริงและค่าโดยประมาณ มิฉะนั้นถ้าค่าสัมประสิทธิ์ของดีเทอร์มินิซึมเป็น 0 สมการถดถอยจะไม่สามารถทำนายค่าของ y ได้
ค่าสัมประสิทธิ์ของดีเทอร์มินิซึมไม่เกินอัตราส่วนสหสัมพันธ์เสมอไป ในกรณีที่เกิดความเท่าเทียมกัน ร2 \u003d จึงถือได้ว่าสูตรเชิงประจักษ์ที่สร้างขึ้นนั้นสะท้อนข้อมูลเชิงประจักษ์ได้อย่างแม่นยำที่สุด
2. คำชี้แจงของปัญหา
1. ใช้วิธีกำลังสองน้อยที่สุดฟังก์ชันที่กำหนดในตารางโดยประมาณ
ก) พหุนามของระดับแรก
b) พหุนามของระดับที่สอง
c) การพึ่งพาเลขชี้กำลัง
คำนวณค่าสัมประสิทธิ์ของปัจจัยสำหรับการพึ่งพาแต่ละครั้ง
คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ (เฉพาะในกรณีก)
วาดเส้นแนวโน้มสำหรับการพึ่งพาแต่ละครั้ง
ใช้ฟังก์ชัน LINEST คำนวณลักษณะเชิงตัวเลขของการพึ่งพา
เปรียบเทียบการคำนวณของคุณกับผลลัพธ์ที่ได้โดยใช้ LINEST
สรุปว่าสูตรใดที่ได้รับใกล้เคียงกับฟังก์ชันมากที่สุด
เขียนโปรแกรมด้วยภาษาโปรแกรมภาษาใดภาษาหนึ่งและเปรียบเทียบผลการนับกับที่ได้รับข้างต้น
3. ข้อมูลเริ่มต้น
ฟังก์ชันถูกกำหนดไว้ในรูปที่ 1
4. การคำนวณค่าประมาณใน Excel ตัวประมวลผลสเปรดชีต
สำหรับการคำนวณขอแนะนำให้ใช้สเปรดชีต Microsoft Excel และจัดเรียงข้อมูลดังรูปที่ 2.
ในการดำเนินการนี้ให้ป้อน:
· ในเซลล์ A6: A30 เราป้อนค่า xi .
· ในเซลล์ B6: B30 เราป้อนค่าของуi .
· ในเซลล์ C6 เราป้อนสูตร \u003d A6 ^ 2.
· สูตรนี้คัดลอกไปยังเซลล์ C7: C30
· ในเซลล์ D6 ป้อนสูตร \u003d A6 * B6
· สูตรนี้ถูกคัดลอกไปยังเซลล์ D7: D30
· ในเซลล์ F6 ให้ป้อนสูตร \u003d A6 ^ 4
· ในเซลล์ F7: F30 คัดลอกสูตรนี้
· ในเซลล์ G6 ให้ป้อนสูตร \u003d A6 ^ 2 * B6
· สูตรนี้จะถูกคัดลอกไปยังเซลล์ G7: G30
· ในเซลล์ H6 ให้ป้อนสูตร \u003d LN (B6)
· สูตรนี้ถูกคัดลอกไปยังเซลล์ H7: H30
· ในเซลล์ I6 ให้ป้อนสูตร \u003d A6 * LN (B6)
· ในเซลล์ I7: I30 คัดลอกสูตรนี้ ขั้นตอนต่อไปทำได้โดยใช้ autosum
· ในเซลล์ A33 ให้ป้อนสูตร \u003d SUM (A6: A30)
· ในเซลล์ B33 ให้ป้อนสูตร \u003d SUM (B6: B30)
· ในเซลล์ C33 ให้ป้อนสูตร \u003d SUM (C6: C30)
· ในเซลล์ D33 ให้ป้อนสูตร \u003d SUM (D6: D30)
· ในเซลล์ E33 ให้ป้อนสูตร \u003d SUM (E6: E30)
· ในเซลล์ F33 ให้ป้อนสูตร \u003d SUM (F6: F30)
· ในเซลล์ G33 ให้ป้อนสูตร \u003d SUM (G6: G30)
· ในเซลล์ H33 ให้ป้อนสูตร \u003d SUM (H6: H30)
· ในเซลล์ I33 ให้ป้อนสูตร \u003d SUM (I6: I30)
เราประมาณฟังก์ชั่น y \u003d ฉ (x) ฟังก์ชันเชิงเส้น y \u003d a1 + ก2x. เพื่อหาค่าสัมประสิทธิ์ก 1 และก 2 เราใช้ระบบ (4) ใช้ผลรวมทั้งหมดของตารางที่ 2 ที่อยู่ในเซลล์ A33, B33, C33 และ D33 เราเขียนระบบ (4) ในรูปแบบ
แก้ซึ่งเราได้ 1 \u003d -24.7164 และ a2 = 11,63183
ดังนั้นการประมาณเชิงเส้นจึงมีรูปแบบ y \u003d -24.7164 + 11.63183x (12)
ระบบ (11) ได้รับการแก้ไขโดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์จะแสดงในรูปที่ 3:
ตารางในเซลล์ A38: B39 มีสูตร (\u003d MOBR (A35: B36)) เซลล์ E38: E39 ประกอบด้วยสูตร (\u003d MULTIPLE (A38: B39, C35: C36))
ต่อไปเราจะประมาณฟังก์ชัน y \u003d ฉ (x) ฟังก์ชันกำลังสอง y \u003d a1 + ก2 x + ก3 x2... เพื่อกำหนดค่าสัมประสิทธิ์ก 1, ก 2 และก 3 เราใช้ระบบ (5) จากผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A33, B33, C33, D33, E33, F33 และ G33 เราเขียนระบบ (5) ดังนี้
เมื่อแก้ไขแล้วเราจะได้ไฟล์ 1 \u003d 1.580946, ก 2 \u003d -0.60819 และ a3 = 0,954171 (14)
ดังนั้นการประมาณกำลังสองคือ:
y \u003d 1.580946 -0.60819x + 0.954171 x2
ระบบ (13) ได้รับการแก้ไขโดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์จะแสดงในรูปที่ 4
ตารางในเซลล์ A46: C48 มีสูตร (\u003d MOBR (A41: C43)) เซลล์ F46: F48 มีสูตร (\u003d MULTIPLE (A41: C43, D46: D48))
ตอนนี้เราประมาณฟังก์ชัน y \u003d ฉ (x) ฟังก์ชันเอกซ์โพเนนเชียล y \u003d a1 จa2x. เพื่อกำหนดค่าสัมประสิทธิ์ ก1 และ ก2 ลอการิทึมค่า ยผม และใช้ผลรวมของตาราง 2 ที่อยู่ในเซลล์ A26, C26, H26 และ I26 เราได้รับระบบ:
ที่ไหน c \u003d ln (ก1 ).
เราพบระบบการแก้ปัญหา (10) c \u003d 0.506435, a2 = 0.409819.
หลังจากการเพิ่มพลังเราจะได้ a1 = 1,659365.
ดังนั้นการประมาณเลขชี้กำลังจึงมีรูปแบบ y \u003d 1.659365 * จ0.4098194x
ระบบ (15) ได้รับการแก้ไขโดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์จะแสดงในรูปที่ 5
ตารางในเซลล์ A55: B56 มีสูตร (\u003d MOBR (A51: B52)) เซลล์ E54: E56 ประกอบด้วยสูตร (\u003d MULTIPLE (A51: B52, C51: C52)) เซลล์ E56 มีสูตร \u003d EXP (E54)
เราคำนวณค่าเฉลี่ยเลขคณิตของ x และ y ตามสูตร:
ผลลัพธ์ของการคำนวณ x และ ย เครื่องมือ Microsoft Excel แสดงในรูปที่ 6
เซลล์ B58 มีสูตร \u003d A33 / 25 เซลล์ B59 มีสูตร \u003d B33 / 25
ตารางที่ 2
ให้เราอธิบายว่าตารางในรูปที่ 7 ถูกรวบรวมอย่างไร
เซลล์ A6: A33 และ B6: B33 ถูกกรอกข้อมูลแล้ว (ดูรูปที่ 2)
· ในเซลล์ J6 ให้ป้อนสูตร \u003d (A6- $ B $ 58) * (B6- $ B $ 59)
· สูตรนี้คัดลอกไปยังเซลล์ J7: J30
· ในเซลล์ K6 เราป้อนสูตร \u003d (A6- $ B $ 58) ^ 2.
· ในเซลล์ K7: K30 คัดลอกสูตรนี้
· ในเซลล์ L6 ให้ป้อนสูตร \u003d (B1- $ B $ 59) ^ 2
· สูตรนี้จะคัดลอกไปยังเซลล์ L7: L30
· ในเซลล์ M6 ให้ป้อนสูตร \u003d ($ E $ 38 + $ E $ 39 * A6-B6) ^ 2
· สูตรนี้จะถูกคัดลอกไปยังเซลล์ M7: M30
· ในเซลล์ N6 ให้ป้อนสูตร \u003d ($ F $ 46 + $ F $ 47 * A6 + $ F $ 48 * A6 A6-B6) ^ 2
· ในเซลล์ N7: N30 คัดลอกสูตรนี้
· ในเซลล์ O6 ให้ป้อนสูตร \u003d ($ E $ 56 * EXP ($ E $ 55 * A6) - B6) ^ 2
· ในเซลล์ O7: O30 คัดลอกสูตรนี้
ขั้นตอนต่อไปทำได้โดยใช้การสรุปอัตโนมัติ
· ในเซลล์ J33 ให้ป้อนสูตร \u003d CYMM (J6: J30)
· ในเซลล์ K33 ให้ป้อนสูตร \u003d SUM (K6: K30)
· ในเซลล์ L33 ให้ป้อนสูตร \u003d CYMM (L6: L30)
· ในเซลล์ M33 ป้อนสูตร \u003d SUM (M6: M30)
· ในเซลล์ N33 ให้ป้อนสูตร \u003d SUM (N6: N30)
· ในเซลล์ O33 ให้ป้อนสูตร \u003d SUM (06: 030)
ตอนนี้ให้เราคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (8) (สำหรับการประมาณเชิงเส้นเท่านั้น) และค่าสัมประสิทธิ์ของดีเทอร์มินิซึมโดยใช้สูตร (10) ผลลัพธ์ของการคำนวณโดยใช้เครื่องมือ Microsoft Excel แสดงในรูปที่ 7
ในตารางที่ 8 เซลล์ B61 มีสูตร \u003d J33 / (K33 * L33 ^ (1/2) เซลล์ B62 มีสูตร \u003d 1 - M33 / L33 เซลล์ B63 มีสูตร \u003d 1 - N33 / L33 เซลล์ B64 ประกอบด้วย สูตร \u003d 1 - O33 / L33
การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณกำลังสองอธิบายข้อมูลการทดลองได้ดีที่สุด
4.1 การพล็อตกราฟใน Excel
เลือกเซลล์ A1: A25 จากนั้นหันไปหาตัวช่วยสร้างแผนภูมิ มาเลือกพล็อตกระจาย หลังจากสร้างแผนภาพแล้วให้คลิกขวาที่เส้นกราฟและเลือกเพื่อเพิ่มเส้นแนวโน้ม (เชิงเส้นเอกซ์โพเนนเชียลเลขชี้กำลังและพหุนามของระดับที่สองตามลำดับ)
พล็อต Linear Fit
พล็อตกำลังสองพอดี
พล็อตแบบเอกซ์โปเนนเชียล
5. การประมาณฟังก์ชันโดยใช้ MathCAD
การประมาณข้อมูลโดยคำนึงถึงพารามิเตอร์ทางสถิติหมายถึงปัญหาการถดถอย โดยปกติจะเกิดขึ้นในการประมวลผลข้อมูลการทดลองที่ได้จากการวัดกระบวนการหรือปรากฏการณ์ทางกายภาพที่มีลักษณะทางสถิติ (เช่นการวัดในรูปรังสีและธรณีฟิสิกส์นิวเคลียร์) หรือที่สัญญาณรบกวน (สัญญาณรบกวน) ในระดับสูง งานของการวิเคราะห์การถดถอยคือการเลือกสูตรทางคณิตศาสตร์ที่อธิบายข้อมูลการทดลองได้ดีที่สุด
.1 การถดถอยเชิงเส้น
การถดถอยเชิงเส้นในระบบ Mathcad ดำเนินการกับเวกเตอร์ของอาร์กิวเมนต์ X และนับ ย ฟังก์ชั่น:
สกัดกั้น (x, y) - คำนวณพารามิเตอร์ และ1 , การกระจัดในแนวตั้งของเส้นถดถอย (ดูรูปที่)
ความชัน (x, y) - คำนวณพารามิเตอร์ ก2 , ความชันของเส้นถดถอย (ดูรูปที่)
y (x) \u003d a1 + a2 * x
ฟังก์ชัน คอร์ (y, y (x)) คำนวณ ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน ยิ่งอยู่ใกล้ 1, ข้อมูลที่ประมวลผลแล้วจะยิ่งตรงกับความสัมพันธ์เชิงเส้นมากขึ้นเท่านั้น (ดูภาพประกอบ)
.2 การถดถอยพหุนาม
การถดถอยพหุนามมิติเดียวที่มีระดับ n ของพหุนามโดยพลการและด้วยพิกัดโดยพลการของตัวอย่างใน Mathcad จะดำเนินการโดยฟังก์ชัน:
ถอยหลัง (x, y, n) - คำนวณเวกเตอร์ S, ซึ่งรวมถึงค่าสัมประสิทธิ์ AIพหุนาม n- ปริญญา;
ค่าสัมประสิทธิ์ AI สามารถดึงออกมาจากเวกเตอร์ ส ฟังก์ชัน subatrix (S, 3, ความยาว (S) - 1, 0, 0)
เราใช้ค่าที่ได้รับของสัมประสิทธิ์ในสมการถดถอย
y (x) \u003d a1 + a2 * x + a3 * x2 (ดูภาพ)
.3 การถดถอยแบบไม่เป็นเชิงเส้น
สำหรับสูตรการประมาณมาตรฐานอย่างง่ายจะมีฟังก์ชันการถดถอยแบบไม่เชิงเส้นจำนวนหนึ่งซึ่งโปรแกรม Mathcad จะเลือกพารามิเตอร์ของฟังก์ชัน
ซึ่งรวมถึงฟังก์ชัน expfit (x, y, s), ซึ่งจะส่งคืนเวกเตอร์ที่มีค่าสัมประสิทธิ์ a1, a2และ a3 ฟังก์ชันเลขชี้กำลัง
y (x) \u003d a1 ^ exp (a2x) + a3 เป็นเวกเตอร์ ส มีการนำค่าเริ่มต้นของสัมประสิทธิ์มาใช้ a1, a2และ a3 การประมาณครั้งแรก
สรุป
การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณเชิงเส้นอธิบายข้อมูลการทดลองได้ดีที่สุด
ผลลัพธ์ที่ได้จากโปรแกรม MathCAD ตรงกับค่าที่ได้จาก Excel อย่างสมบูรณ์ สิ่งนี้บ่งชี้ความถูกต้องของการคำนวณ
บรรณานุกรม
- สารสนเทศศาสตร์: ตำรา / เอ็ด. ศ. N.V. Makarova มอสโก: การเงินและสถิติ 2007
- สารสนเทศศาสตร์: อบรมเชิงปฏิบัติการเรื่องเทคโนโลยีการทำงานบนคอมพิวเตอร์ / Under. เอ็ด. ศ. N.V. Makarova เอ็มการเงินและสถิติ, 2554
- เอ็น. Piskunov แคลคูลัสเชิงอนุพันธ์และปริพันธ์ 2553
- สารสนเทศศาสตร์การประมาณโดยวิธีกำลังสองน้อยแนวทางเซนต์ปีเตอร์สเบิร์ก 2552
กวดวิชา
ต้องการความช่วยเหลือในการสำรวจหัวข้อหรือไม่?
ผู้เชี่ยวชาญของเราจะให้คำแนะนำหรือให้บริการสอนพิเศษในหัวข้อที่คุณสนใจ
ส่งคำขอ พร้อมระบุหัวข้อในขณะนี้เพื่อค้นหาความเป็นไปได้ในการขอรับคำปรึกษา
วิธีกำลังสองน้อยที่สุด
ในบทเรียนสุดท้ายของหัวข้อเราจะทำความคุ้นเคยกับแอปพลิเคชันที่มีชื่อเสียงที่สุด FNPซึ่งเป็นแอปพลิเคชั่นที่กว้างที่สุดในสาขาวิทยาศาสตร์และการปฏิบัติต่างๆ อาจเป็นฟิสิกส์เคมีชีววิทยาเศรษฐศาสตร์สังคมวิทยาจิตวิทยาและอื่น ๆ และอื่น ๆ ตามความตั้งใจของโชคชะตาฉันมักจะต้องรับมือกับเศรษฐกิจดังนั้นวันนี้ฉันจะออกตั๋วให้คุณไปยังประเทศที่น่าตื่นตาตื่นใจที่เรียกว่า เศรษฐมิติ \u003d) ... ไม่อยากได้ไง! มันดีมากที่นั่น - คุณต้องตัดสินใจ! ... แต่สิ่งที่คุณต้องการแน่นอนคือเรียนรู้วิธีแก้ปัญหา กำลังสองน้อยที่สุด... และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันขันแข็งจะได้เรียนรู้วิธีการแก้ปัญหาไม่เพียง แต่ถูกต้อง แต่ยังรวดเร็วมาก ;-) แต่ก่อนอื่น คำชี้แจงปัญหาทั่วไป + ตัวอย่างที่เกี่ยวข้อง:
ปล่อยให้ในบางสาขาวิชามีการตรวจสอบตัวบ่งชี้ที่มีการแสดงออกเชิงปริมาณ ในเวลาเดียวกันมีเหตุผลทุกประการที่จะเชื่อว่าตัวบ่งชี้ขึ้นอยู่กับตัวบ่งชี้ สมมติฐานนี้อาจเป็นได้ทั้งสมมติฐานทางวิทยาศาสตร์และตามสามัญสำนึกเบื้องต้น อย่างไรก็ตามทิ้งวิทยาศาสตร์ไว้และสำรวจพื้นที่ที่น่ารับประทานมากขึ้นนั่นคือร้านขายของชำ ให้เราแสดงโดย:
- พื้นที่ร้านค้าปลีก, ตร.ม. ,
- มูลค่าการซื้อขายประจำปีของร้านขายของชำล้านรูเบิล
ค่อนข้างชัดเจนว่ายิ่งพื้นที่ของร้านมีขนาดใหญ่เท่าไหร่การหมุนเวียนของร้านก็จะมากขึ้นเท่านั้น
สมมติว่าหลังจากทำการสังเกต / ทดลอง / คำนวณ / เต้นรำด้วยรำมะนาแล้วเรามีข้อมูลตัวเลขที่เราจำหน่าย:
สำหรับร้านขายของชำฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านที่ 1 - ผลประกอบการประจำปี - พื้นที่ของร้านที่ 2 - การหมุนเวียนประจำปี ฯลฯ อย่างไรก็ตามไม่จำเป็นเลยที่จะต้องเข้าถึงวัสดุที่จัดประเภท - สามารถหาค่าประมาณมูลค่าการซื้อขายได้อย่างแม่นยำโดยใช้วิธีการ สถิติทางคณิตศาสตร์... อย่างไรก็ตามอย่าเพิ่งเสียสมาธิหลักสูตรการจารกรรมเชิงพาณิชย์ได้รับการชำระแล้ว \u003d)
ข้อมูลแบบตารางยังสามารถเขียนในรูปแบบของจุดและแสดงให้เราเห็นได้ตามปกติ ระบบคาร์ทีเซียน .
มาตอบคำถามสำคัญ: จำเป็นต้องใช้กี่คะแนนสำหรับการศึกษาเชิงคุณภาพ?
ใหญ่กว่าดีกว่า. ชุดขั้นต่ำที่อนุญาตประกอบด้วย 5-6 คะแนน นอกจากนี้ด้วยข้อมูลจำนวนเล็กน้อยตัวอย่างจึงไม่สามารถรวมผลลัพธ์ที่ "ผิดปกติ" ได้ ตัวอย่างเช่นร้านค้าชั้นนำขนาดเล็กสามารถช่วยได้ตามคำสั่งของ "เพื่อนร่วมงาน" ที่มีขนาดใหญ่กว่าจึงบิดเบือนรูปแบบทั่วไปที่ต้องหา
ค่อนข้างง่ายเราต้องเลือกฟังก์ชัน กำหนดการ ซึ่งผ่านเข้าใกล้จุดมากที่สุด ... ฟังก์ชันนี้เรียกว่า ประมาณ (การประมาณ - การประมาณ) หรือ ฟังก์ชันทางทฤษฎี ... โดยทั่วไปแล้ว "ผู้สมัคร" ที่ชัดเจนจะปรากฏขึ้นที่นี่ทันที - พหุนามระดับสูงซึ่งกราฟผ่านจุดทั้งหมด แต่ตัวเลือกนี้ทำได้ยากและมักจะไม่ถูกต้อง (เนื่องจากแผนภูมิมักจะ "บิด" และสะท้อนแนวโน้มหลักได้ไม่ดี).
ดังนั้นฟังก์ชันที่ต้องการควรเรียบง่ายเพียงพอและในขณะเดียวกันก็สะท้อนถึงการพึ่งพาอย่างเพียงพอ อย่างที่คุณอาจเดาได้ว่าหนึ่งในวิธีการค้นหาฟังก์ชันดังกล่าวเรียกว่า กำลังสองน้อยที่สุด... ก่อนอื่นมาดูสาระสำคัญในแง่ทั่วไป ให้บางฟังก์ชันประมาณข้อมูลการทดลอง:
วิธีการประเมินความถูกต้องของการประมาณนี้? ให้เราคำนวณความแตกต่าง (ค่าเบี่ยงเบน) ระหว่างค่าทดลองและค่าฟังก์ชัน (ศึกษาการวาดภาพ)... ความคิดแรกที่อยู่ในใจคือการประมาณว่าผลรวมมีขนาดใหญ่เพียงใด แต่ปัญหาคือความแตกต่างอาจเป็นลบได้ (เช่น, )
และการเบี่ยงเบนอันเป็นผลมาจากการรวมดังกล่าวจะยกเลิกซึ่งกันและกัน ดังนั้นเพื่อเป็นการประมาณความแม่นยำของการประมาณจึงขอให้ยอมรับผลรวม โมดูล การเบี่ยงเบน:
หรือยุบ: (ทันใดนั้นใครก็ไม่รู้: คือไอคอนผลรวมและ - ตัวแปรเสริม - "ตัวนับ" ซึ่งรับค่าตั้งแต่ 1 ถึง ) .
เมื่อเข้าใกล้จุดทดลองด้วยฟังก์ชันที่แตกต่างกันเราจะได้ค่าที่แตกต่างกันและเห็นได้ชัดว่าเมื่อใดที่ผลรวมน้อยกว่า - ฟังก์ชันนั้นมีความแม่นยำมากกว่า
วิธีการดังกล่าวมีอยู่และเรียกว่า วิธีโมดูลัสน้อยที่สุด... อย่างไรก็ตามในทางปฏิบัติได้แพร่หลายมากขึ้น วิธีกำลังสองน้อยที่สุดซึ่งค่าลบที่เป็นไปได้จะไม่ถูกกำจัดโดยโมดูลัส แต่โดยการยกกำลังสองส่วนเบี่ยงเบน:
หลังจากนั้นความพยายามจะถูกนำไปที่การเลือกฟังก์ชันดังกล่าวเพื่อให้ผลรวมของกำลังสองของการเบี่ยงเบน มีขนาดเล็กที่สุด จริงๆแล้วจึงเป็นชื่อของวิธีการ
และตอนนี้เรากลับไปยังจุดสำคัญอีกประการหนึ่งดังที่ระบุไว้ข้างต้นฟังก์ชันที่เลือกควรจะค่อนข้างเรียบง่าย - แต่ก็มีฟังก์ชั่นดังกล่าวมากมาย: เชิงเส้น , ไฮเพอร์โบลิก , เลขชี้กำลัง , ลอการิทึม , กำลังสอง เป็นต้น และแน่นอนที่นี่ฉันต้องการ "ลดกิจกรรม" ทันที เลือกฟังก์ชั่นคลาสใดสำหรับการวิจัย เคล็ดลับดั้งเดิม แต่มีประสิทธิภาพ:
- วิธีที่ง่ายที่สุดในการดึงคะแนน บนภาพวาดและวิเคราะห์ตำแหน่งของพวกเขา หากพวกเขามักจะเป็นเส้นตรงคุณควรมองหา สมการเส้นตรง ด้วยค่าที่เหมาะสมที่สุดและ. กล่าวอีกนัยหนึ่งภารกิจคือการหาสัมประสิทธิ์ของ SUCH - เพื่อให้ผลรวมของกำลังสองของการเบี่ยงเบนน้อยที่สุด
หากจุดตั้งอยู่เช่นพร้อม อติพจน์เห็นได้ชัดว่าฟังก์ชันเชิงเส้นจะให้ค่าประมาณที่ไม่ดี ในกรณีนี้เรากำลังมองหาค่าสัมประสิทธิ์ที่ "ดี" ที่สุดสำหรับสมการไฮเพอร์โบลา - สิ่งที่ให้ผลรวมขั้นต่ำของกำลังสอง .
ตอนนี้โปรดทราบว่าในทั้งสองกรณีเรากำลังพูดถึง ฟังก์ชันของสองตัวแปรซึ่งมีข้อโต้แย้ง พารามิเตอร์ของการอ้างอิงที่ต้องการ:
และในสาระสำคัญเราต้องแก้ปัญหามาตรฐาน - เพื่อค้นหา ฟังก์ชันขั้นต่ำของสองตัวแปร.
ลองจำตัวอย่างของเราสมมติว่าจุด "ร้านค้า" มักจะอยู่ในแนวเส้นตรงและมีเหตุผลทุกประการที่จะเชื่อว่า ความสัมพันธ์เชิงเส้น การหมุนเวียนจากพื้นที่ค้าปลีก ลองหาสัมประสิทธิ์ของ SUCH "a" และ "bs" เพื่อให้ผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุด ทุกอย่างเป็นไปตามปกติ - อันดับแรก อนุพันธ์ย่อยลำดับที่ 1... ตาม กฎเชิงเส้น คุณสามารถแยกความแตกต่างได้โดยตรงภายใต้ไอคอนจำนวนเงิน:
หากคุณต้องการใช้ข้อมูลนี้สำหรับเรียงความหรือหนังสือเรียนฉันจะขอบคุณมากสำหรับลิงก์ในรายการแหล่งข้อมูลคุณจะพบการคำนวณโดยละเอียดดังกล่าวในไม่กี่แห่ง:
มาสร้างระบบมาตรฐาน:
เราลดแต่ละสมการด้วย "สอง" และนอกจากนี้ "แยก" ผลรวม:
บันทึก : วิเคราะห์ด้วยตัวคุณเองว่าเหตุใดจึงสามารถนำ "a" และ "bh" ออกมาเป็นไอคอนผลรวมได้ โดยวิธีการนี้สามารถทำได้อย่างเป็นทางการด้วยผลรวม
มาเขียนระบบใหม่ในรูปแบบ "ใช้":
หลังจากนั้นอัลกอริทึมสำหรับการแก้ปัญหาของเราจะเริ่มขึ้น:
เรารู้พิกัดของจุดหรือไม่? พวกเรารู้. จำนวน เราสามารถหา? ได้อย่างง่ายดาย การแต่งที่ง่ายที่สุด ระบบสมการเชิงเส้นสองตัวแปรที่ไม่รู้จัก("A" และ "bh") เราแก้ระบบเช่น วิธีการของ Cramerซึ่งเป็นผลมาจากการที่เราได้รับจุดหยุดนิ่ง กำลังตรวจสอบ สภาพที่เพียงพอสำหรับแขนขาเราสามารถตรวจสอบได้ว่า ณ จุดนี้เป็นฟังก์ชัน บรรลุอย่างแน่นอน ขั้นต่ำ... การยืนยันเกี่ยวข้องกับการคำนวณเพิ่มเติมดังนั้นเราจะทิ้งไว้เบื้องหลัง (หากจำเป็นสามารถดูเฟรมที่ขาดหายไปได้ที่นี่ ) ... เราได้ข้อสรุปสุดท้าย:
ฟังก์ชัน วิธีที่ดีที่สุด (อย่างน้อยเมื่อเทียบกับฟังก์ชันเชิงเส้นอื่น ๆ ) นำประเด็นการทดลองเข้ามาใกล้ ... กล่าวโดยคร่าวๆกราฟของมันจะเข้าใกล้จุดเหล่านี้มากที่สุด ตามประเพณี เศรษฐมิติฟังก์ชันการประมาณที่เป็นผลลัพธ์เรียกอีกอย่างว่า สมการถดถอยเชิงเส้นคู่ .
ปัญหาที่กำลังพิจารณามีความสำคัญในทางปฏิบัติอย่างยิ่ง ในสถานการณ์ด้วยตัวอย่างของเราสมการ ช่วยให้คุณสามารถคาดเดาได้ว่ามีการหมุนเวียนเท่าใด ("เกม") จะอยู่ที่ร้านค้าโดยมีมูลค่าหนึ่งหรือค่าอื่นของพื้นที่ค้าปลีก (นี่หรือค่านั้น "x")... ใช่การคาดการณ์ที่ได้รับจะเป็นเพียงการคาดการณ์ แต่ในหลาย ๆ กรณีการคาดการณ์จะค่อนข้างแม่นยำ
ฉันจะวิเคราะห์ปัญหาเดียวด้วยตัวเลข "จริง" เนื่องจากไม่มีปัญหาใด ๆ - การคำนวณทั้งหมดอยู่ในระดับของหลักสูตรโรงเรียนประถมศึกษาปีที่ 7-8 ใน 95 เปอร์เซ็นต์ของกรณีคุณจะถูกขอให้ค้นหาเพียงฟังก์ชันเชิงเส้น แต่ในตอนท้ายของบทความฉันจะแสดงให้เห็นว่าการหาสมการของไฮเพอร์โบลาเลขชี้กำลังและฟังก์ชันอื่น ๆ ที่เหมาะสมนั้นไม่ยากเลย
ในความเป็นจริงมันยังคงแจกขนมปังที่สัญญาไว้ - เพื่อที่คุณจะได้เรียนรู้วิธีแก้ตัวอย่างดังกล่าวไม่เพียง แต่ถูกต้อง แต่ยังรวดเร็ว เราศึกษามาตรฐานอย่างรอบคอบ:
งาน
จากการศึกษาความสัมพันธ์ระหว่างตัวบ่งชี้ทั้งสองจึงได้คู่ของตัวเลขต่อไปนี้:
ใช้วิธีกำลังสองน้อยที่สุดค้นหาฟังก์ชันเชิงเส้นที่ใกล้เคียงกับเชิงประจักษ์ได้ดีที่สุด (มีประสบการณ์) ข้อมูล. วาดภาพซึ่งในระบบพิกัดสี่เหลี่ยมคาร์ทีเซียนพล็อตจุดทดลองและกราฟของฟังก์ชันการประมาณ ... ค้นหาผลรวมของความเบี่ยงเบนกำลังสองระหว่างค่าเชิงประจักษ์และเชิงทฤษฎี ดูว่าฟังก์ชันจะดีขึ้นหรือไม่ (จากมุมมองของวิธีกำลังสองน้อยที่สุด) นำประเด็นการทดลองเข้ามาใกล้
โปรดทราบว่าค่า "x" นั้นเป็นไปตามธรรมชาติและมีความหมายที่มีลักษณะเฉพาะซึ่งฉันจะพูดถึงในภายหลัง แต่แน่นอนว่าอาจเป็นเศษส่วนได้ นอกจากนี้ค่า "x" และ "เกม" อาจเป็นลบทั้งหมดหรือบางส่วนทั้งนี้ขึ้นอยู่กับเนื้อหาของปัญหานั้น ๆ เรามีงานที่ "ไร้หน้า" และเราก็เริ่มต้นมัน การตัดสินใจ:
เราพบค่าสัมประสิทธิ์ของฟังก์ชันที่เหมาะสมเป็นวิธีแก้ปัญหาของระบบ:
เพื่อประโยชน์ของสัญกรณ์ที่กะทัดรัดยิ่งขึ้นตัวแปร "ตัวนับ" สามารถละเว้นได้เนื่องจากเป็นที่ชัดเจนแล้วว่าการสรุปจะดำเนินการตั้งแต่ 1 ถึง
สะดวกกว่าในการคำนวณจำนวนเงินที่ต้องการในรูปแบบตาราง:
การคำนวณสามารถทำได้บนเครื่องคำนวณขนาดเล็ก แต่จะดีกว่ามากหากใช้ Excel ทั้งเร็วกว่าและไม่มีข้อผิดพลาด ชมวิดีโอสั้น ๆ :
ดังนั้นเราจึงได้รับสิ่งต่อไปนี้ ระบบ:
ที่นี่คุณสามารถคูณสมการที่สองด้วย 3 และ ลบที่ 2 ออกจากสมการที่ 1 ด้วยเทอม... แต่นี่เป็นความโชคดี - ในทางปฏิบัติระบบมักไม่ใช่ของขวัญและในกรณีเช่นนี้ระบบจะช่วยประหยัดได้ วิธีการของ Cramer:
ซึ่งหมายความว่าระบบมีโซลูชันเฉพาะ
มาตรวจสอบกัน ฉันเข้าใจว่าไม่ต้องการ แต่ทำไมจึงข้ามข้อผิดพลาดที่สามารถหลีกเลี่ยงได้ทั้งหมด เราแทนที่คำตอบที่พบทางด้านซ้ายของแต่ละสมการของระบบ:
ได้รับด้านขวามือของสมการที่เกี่ยวข้องซึ่งหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง
ดังนั้นฟังก์ชันที่ต้องการสำหรับการประมาณ: - จาก ของฟังก์ชันเชิงเส้นทั้งหมด เธอเป็นผู้ประมาณข้อมูลการทดลองด้วยวิธีที่ดีที่สุด
ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าในพื้นที่การพึ่งพาที่พบคือ ย้อนกลับ (หลักการ "ยิ่งมาก - น้อย")และความจริงนี้ถูกเปิดเผยทันทีโดยลบ ความลาดชัน... ฟังก์ชัน บอกเราว่าด้วยการเพิ่มขึ้นของตัวบ่งชี้ที่แน่นอน 1 หน่วยค่าของตัวบ่งชี้ที่พึ่งพาจะลดลง เฉลี่ยโดย 0.65 หน่วย ตามที่กล่าวไปยิ่งราคาของบัควีทสูงเท่าไหร่ก็ยิ่งขายได้น้อยลงเท่านั้น
ในการพล็อตกราฟของฟังก์ชันการประมาณเราจะพบค่าสองค่า:
และดำเนินการวาดภาพ:
เส้นที่สร้างขึ้นเรียกว่า เส้นแนวโน้ม
(กล่าวคือเส้นแนวโน้มเชิงเส้นกล่าวคือในกรณีทั่วไปแนวโน้มไม่จำเป็นต้องเป็นเส้นตรง)... ทุกคนคุ้นเคยกับคำว่า“ be in trend” และฉันคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม
ลองคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบน ระหว่างค่านิยมเชิงประจักษ์และเชิงทฤษฎี ในทางเรขาคณิตมันคือผลรวมของกำลังสองของความยาวของส่วน "สีแดงเข้ม" (สองอันเล็กมากจนมองไม่เห็น).
สรุปการคำนวณในตาราง:
สามารถทำได้ด้วยตนเองอีกครั้งในกรณีที่ฉันจะยกตัวอย่างสำหรับจุดที่ 1:
แต่จะมีประสิทธิภาพมากกว่าในการดำเนินการในลักษณะที่เป็นที่รู้จัก:
ขอย้ำ: ความหมายของผลลัพธ์ที่ได้คืออะไร? ของ ของฟังก์ชันเชิงเส้นทั้งหมด ฟังก์ชัน ตัวบ่งชี้มีขนาดเล็กที่สุดนั่นคือในตระกูลมันเป็นการประมาณที่ดีที่สุด และที่นี่คำถามสุดท้ายของปัญหาไม่ได้เกิดขึ้นโดยบังเอิญ: จะเกิดอะไรขึ้นถ้าฟังก์ชันเลขชี้กำลังที่เสนอ การประมาณคะแนนทดลองจะดีกว่าไหม
ลองหาผลรวมของการเบี่ยงเบนกำลังสองที่สอดคล้องกัน - เพื่อแยกความแตกต่างฉันจะกำหนดด้วยตัวอักษร "epsilon" เทคนิคเหมือนกันทุกประการ:
และอีกครั้งสำหรับนักผจญเพลิงทุกคนการคำนวณสำหรับจุดที่ 1:
ใน Excel เราใช้ฟังก์ชันมาตรฐาน EXP (ไวยากรณ์สามารถพบได้ในวิธีใช้ของ Excel).
สรุป: ซึ่งหมายความว่าฟังก์ชันเอกซ์โพเนนเชียลใกล้เคียงกับจุดทดลองที่แย่กว่าเส้นตรง .
แต่ที่นี่ควรสังเกตว่า "แย่กว่า" คือ ยังไม่ได้หมายความว่า, เกิดอะไรขึ้น. ตอนนี้ฉันพล็อตฟังก์ชันเอกซ์โพเนนเชียลนี้ - และมันก็เข้าใกล้จุดด้วย - มากจนหากไม่มีการวิจัยเชิงวิเคราะห์เป็นการยากที่จะบอกว่าฟังก์ชันใดแม่นยำกว่ากัน
นี่เป็นการแก้ปัญหาให้เสร็จสมบูรณ์และฉันกลับไปที่คำถามเกี่ยวกับค่าธรรมชาติของอาร์กิวเมนต์ ในการศึกษาต่างๆตามกฎทางเศรษฐกิจหรือสังคมวิทยาจำนวน "xes" ตามธรรมชาติเดือนปีหรือช่วงเวลาอื่น ๆ ที่เท่ากัน ตัวอย่างเช่นพิจารณาปัญหาเช่นนี้:
เรามีข้อมูลการหมุนเวียนของร้านค้าปลีกในช่วงครึ่งปีแรกดังต่อไปนี้:
ใช้การจัดแนวเส้นตรงเชิงวิเคราะห์กำหนดมูลค่าการซื้อขายสำหรับเดือนกรกฎาคม.
ใช่ไม่มีปัญหา: เรานับเดือนที่ 1, 2, 3, 4, 5, 6 และใช้อัลกอริทึมตามปกติซึ่งเป็นผลมาจากการที่เราได้สมการ - สิ่งเดียวที่เมื่อถึงเวลามักจะใช้ตัวอักษร "te" (แม้ว่าจะไม่สำคัญก็ตาม)... สมการที่ได้แสดงให้เห็นว่าในช่วงครึ่งปีแรกมูลค่าการซื้อขายเพิ่มขึ้นเฉลี่ย 27.74 หน่วย ต่อเดือน. รับการพยากรณ์สำหรับเดือนกรกฎาคม (เดือนที่ 7): d.e.
และงานดังกล่าว - ความมืดก็มืด ผู้ที่สนใจสามารถใช้บริการเพิ่มเติมคือ my เครื่องคิดเลข Excel (เวอร์ชันสาธิต)ซึ่งไฟล์ แก้ปัญหาการวิเคราะห์เกือบจะทันที! มีเวอร์ชันที่ใช้งานได้ของโปรแกรม ในการแลกเปลี่ยน หรือสำหรับ โทเค็น.
ในตอนท้ายของบทเรียนข้อมูลสั้น ๆ เกี่ยวกับการค้นหาการอ้างอิงของประเภทอื่น ๆ ที่จริงแล้วไม่มีอะไรพิเศษที่จะบอกได้เนื่องจากแนวทางที่มีหลักการและอัลกอริทึมการแก้ปัญหายังคงเหมือนเดิม
สมมติว่าการจัดเรียงของจุดทดลองคล้ายกับไฮเพอร์โบลา จากนั้นเพื่อหาค่าสัมประสิทธิ์ของไฮเพอร์โบลาที่ดีที่สุดคุณต้องหาฟังก์ชันขั้นต่ำ - ผู้ที่ต้องการคำนวณโดยละเอียดและเข้าสู่ระบบที่คล้ายกัน:
จากมุมมองที่เป็นทางการและทางเทคนิคได้มาจากระบบ "เชิงเส้น" (มาทำเครื่องหมายด้วย "ดอกจัน") แทนที่ "x" ด้วย และจำนวนเงินคือ คำนวณแล้วหาค่าสัมประสิทธิ์ที่เหมาะสม "a" และ "be" ที่มือ.
หากมีเหตุให้เชื่อได้ทุกข้อ ตั้งอยู่ตามเส้นโค้งลอการิทึมจากนั้นค้นหาค่าที่เหมาะสมที่สุดและค้นหาค่าต่ำสุดของฟังก์ชัน ... ตามปกติในระบบ (*) จะต้องถูกแทนที่ด้วย:
เมื่อทำการคำนวณใน Excel ให้ใช้ฟังก์ชัน LN... ฉันยอมรับว่าการสร้างเครื่องคำนวณสำหรับแต่ละกรณีที่อยู่ระหว่างการพิจารณาไม่ใช่เรื่องยาก แต่จะดีกว่าถ้าคุณ "ตั้งโปรแกรม" การคำนวณด้วยตัวเอง วิดีโอบทเรียนเพื่อช่วย
ด้วยการพึ่งพาแบบเอกซ์โพเนนเชียลสถานการณ์จึงซับซ้อนขึ้นเล็กน้อย ในการลดสสารให้เป็นกรณีเชิงเส้นให้เราลอการิทึมของฟังก์ชันและใช้ คุณสมบัติของลอการิทึม:
ตอนนี้การเปรียบเทียบฟังก์ชันผลลัพธ์กับฟังก์ชันเชิงเส้นเราได้ข้อสรุปว่าในระบบ (*) ต้องถูกแทนที่ด้วยและ - โดย เพื่อความสะดวกเราแสดงว่า:
โปรดทราบว่าระบบได้รับการแก้ไขเมื่อเทียบกับและดังนั้นหลังจากค้นหารากแล้วคุณต้องอย่าลืมหาค่าสัมประสิทธิ์นั้นเอง
เพื่อนำประเด็นการทดลองเข้ามาใกล้ พาราโบลาที่เหมาะสมที่สุด ควรจะพบ ฟังก์ชันขั้นต่ำของสามตัวแปร ... หลังจากดำเนินการตามมาตรฐานแล้วเราจะได้รับสิ่งต่อไปนี้ "ใช้งานได้" ระบบ:
ใช่แน่นอนว่ามีจำนวนมากกว่าที่นี่ แต่เมื่อใช้แอปพลิเคชันโปรดของคุณจะไม่มีปัญหาใด ๆ เลย และในที่สุดฉันจะบอกวิธีตรวจสอบและสร้างเส้นแนวโน้มที่ต้องการโดยใช้ Excel อย่างรวดเร็ว: สร้างแผนภูมิกระจายเลือกจุดใดก็ได้ด้วยเมาส์ และคลิกขวาเลือกตัวเลือก "เพิ่มเส้นแนวโน้ม"... จากนั้นเลือกประเภทของแผนภูมิและบนแท็บ "ตัวเลือก"เปิดใช้งานตัวเลือก แสดงสมการในแผนภูมิ... ตกลง
เช่นเคยฉันต้องการจบบทความด้วยวลีที่สวยงามและฉันเกือบจะพิมพ์ว่า "เป็นเทรนด์!" แต่เขาเปลี่ยนใจทันเวลา และไม่ใช่เพราะมันตายตัว ฉันไม่รู้ว่าใครเป็นยังไง แต่ฉันไม่อยากทำตามคนอเมริกันที่ได้รับการส่งเสริมและโดยเฉพาะอย่างยิ่งเทรนด์ยุโรป \u003d) ดังนั้นฉันขอให้พวกคุณแต่ละคนยึดมั่นในแนวของตัวเอง
http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html
วิธีกำลังสองน้อยที่สุดเป็นวิธีหนึ่งที่แพร่หลายและพัฒนามากที่สุดเนื่องจาก ความเรียบง่ายและประสิทธิภาพของวิธีการประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติเชิงเส้น... ในขณะเดียวกันควรใช้ความระมัดระวังในการใช้งานเนื่องจากแบบจำลองที่สร้างขึ้นโดยใช้งานอาจไม่ตรงตามข้อกำหนดหลายประการสำหรับคุณภาพของพารามิเตอร์และด้วยเหตุนี้จึงไม่ "ดีพอ" ที่จะแสดงรูปแบบของการพัฒนากระบวนการ
ให้เราพิจารณาขั้นตอนในการประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติเชิงเส้นโดยใช้วิธีกำลังสองน้อยที่สุดในรายละเอียดเพิ่มเติม แบบจำลองดังกล่าวในรูปแบบทั่วไปสามารถแสดงได้ด้วยสมการ (1.2):
y t \u003d a 0 + a 1 х 1t + ... + a n х nt + ε t
ข้อมูลเริ่มต้นเมื่อประมาณค่าพารามิเตอร์ a 0, a 1, ... , n คือเวกเตอร์ของค่าของตัวแปรตาม ย \u003d (y 1, y 2, ... , y T) "และเมทริกซ์ของค่าของตัวแปรอิสระ
ซึ่งคอลัมน์แรกของคอลัมน์นั้นสอดคล้องกับค่าสัมประสิทธิ์ของแบบจำลอง
วิธีการของกำลังสองน้อยที่สุดมีชื่อตามหลักการพื้นฐานที่ค่าประมาณพารามิเตอร์ที่ได้รับบนพื้นฐานต้องเป็นไปตาม: ผลรวมของกำลังสองของข้อผิดพลาดแบบจำลองควรน้อยที่สุด
ตัวอย่างการแก้ปัญหาโดยใช้วิธีกำลังสองน้อยที่สุด
ตัวอย่างที่ 2.1.องค์กรการค้ามีเครือข่ายร้านค้า 12 แห่งข้อมูลเกี่ยวกับกิจกรรมที่นำเสนอในตาราง 2.1.
ผู้บริหารของ บริษัท ต้องการทราบว่าขนาดของมูลค่าการซื้อขายต่อปีขึ้นอยู่กับพื้นที่ค้าปลีกของร้านค้าอย่างไร
ตารางที่ 2.1
หมายเลขร้านค้า | ผลประกอบการประจำปี RUB mln | ย่านการค้าพันม. 2 |
19,76 | 0,24 | |
38,09 | 0,31 | |
40,95 | 0,55 | |
41,08 | 0,48 | |
56,29 | 0,78 | |
68,51 | 0,98 | |
75,01 | 0,94 | |
89,05 | 1,21 | |
91,13 | 1,29 | |
91,26 | 1,12 | |
99,84 | 1,29 | |
108,55 | 1,49 |
สารละลายกำลังสองน้อยที่สุดมากำหนด - มูลค่าการซื้อขายประจำปีของร้านค้า th, ล้านรูเบิล; - แหล่งค้าขายหน้าร้านพันม. 2
รูปที่ 2.1. แผนภาพกระจายตัวอย่าง 2.1
เพื่อกำหนดรูปแบบของความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรและสร้างแผนภาพกระจาย (รูปที่ 2.1)
จากแผนภาพการกระจายสรุปได้ว่าผลประกอบการรายปีขึ้นอยู่กับพื้นที่ค้าปลีกในเชิงบวก (กล่าวคือ y จะเติบโตตามการเติบโต) รูปแบบการสื่อสารที่เหมาะสมที่สุดคือ เชิงเส้น.
ข้อมูลสำหรับการคำนวณเพิ่มเติมแสดงอยู่ในตาราง 2.2. โดยใช้วิธีกำลังสองน้อยที่สุดเราประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติปัจจัยเดียวเชิงเส้น
ตาราง 2.2
t | y t | x 1t | y เสื้อ 2 | x 1t 2 | x 1t y t |
19,76 | 0,24 | 390,4576 | 0,0576 | 4,7424 | |
38,09 | 0,31 | 1450,8481 | 0,0961 | 11,8079 | |
40,95 | 0,55 | 1676,9025 | 0,3025 | 22,5225 | |
41,08 | 0,48 | 1687,5664 | 0,2304 | 19,7184 | |
56,29 | 0,78 | 3168,5641 | 0,6084 | 43,9062 | |
68,51 | 0,98 | 4693,6201 | 0,9604 | 67,1398 | |
75,01 | 0,94 | 5626,5001 | 0,8836 | 70,5094 | |
89,05 | 1,21 | 7929,9025 | 1,4641 | 107,7505 | |
91,13 | 1,29 | 8304,6769 | 1,6641 | 117,5577 | |
91,26 | 1,12 | 8328,3876 | 1,2544 | 102,2112 | |
99,84 | 1,29 | 9968,0256 | 1,6641 | 128,7936 | |
108,55 | 1,49 | 11783,1025 | 2,2201 | 161,7395 | |
ส | 819,52 | 10,68 | 65008,554 | 11,4058 | 858,3991 |
เฉลี่ย | 68,29 | 0,89 |
ทางนี้,
ดังนั้นด้วยการเพิ่มพื้นที่การขาย 1 พัน m 2 สิ่งอื่น ๆ ทั้งหมดเท่ากันมูลค่าการซื้อขายเฉลี่ยต่อปีเพิ่มขึ้น 67.8871 ล้านรูเบิล
ตัวอย่าง 2.2.ผู้บริหารของ บริษัท สังเกตเห็นว่าการหมุนเวียนรายปีไม่เพียงขึ้นอยู่กับพื้นที่ค้าปลีกของร้านค้า (ดูตัวอย่างที่ 2.1) แต่ยังรวมถึงจำนวนผู้เยี่ยมชมโดยเฉลี่ยด้วย ข้อมูลที่เกี่ยวข้องแสดงในตาราง 2.3.
ตารางที่ 2.3
การตัดสินใจ.ลองกำหนด - จำนวนผู้เยี่ยมชมร้านค้าโดยเฉลี่ยต่อวันพันคน
เพื่อกำหนดรูปแบบของความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรและสร้างแผนภาพกระจาย (รูปที่ 2.2)
จาก scatterplot สรุปได้ว่าผลประกอบการรายปีขึ้นอยู่กับจำนวนผู้เยี่ยมชมโดยเฉลี่ยต่อวัน (กล่าวคือ y จะเพิ่มขึ้นตามการเติบโต) รูปแบบของการพึ่งพาการทำงานเป็นเชิงเส้น
รูป: 2.2. Scatter plot ตัวอย่าง 2.2
ตารางที่ 2.4
t | x 2t | x 2 ครั้ง 2 | y t x 2t | x 1t x 2t |
8,25 | 68,0625 | 163,02 | 1,98 | |
10,24 | 104,8575 | 390,0416 | 3,1744 | |
9,31 | 86,6761 | 381,2445 | 5,1205 | |
11,01 | 121,2201 | 452,2908 | 5,2848 | |
8,54 | 72,9316 | 480,7166 | 6,6612 | |
7,51 | 56,4001 | 514,5101 | 7,3598 | |
12,36 | 152,7696 | 927,1236 | 11,6184 | |
10,81 | 116,8561 | 962,6305 | 13,0801 | |
9,89 | 97,8121 | 901,2757 | 12,7581 | |
13,72 | 188,2384 | 1252,0872 | 15,3664 | |
12,27 | 150,5529 | 1225,0368 | 15,8283 | |
13,92 | 193,7664 | 1511,016 | 20,7408 | |
ส | 127,83 | 1410,44 | 9160,9934 | 118,9728 |
เฉลี่ย | 10,65 |
โดยทั่วไปจำเป็นต้องกำหนดพารามิเตอร์ของแบบจำลองเศรษฐมิติสองปัจจัย
คุณ t \u003d a 0 + a 1 х 1t + a 2 х 2t + ε t
ข้อมูลที่จำเป็นสำหรับการคำนวณเพิ่มเติมแสดงอยู่ในตาราง 2.4.
ให้เราประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติเชิงเส้นสองปัจจัยโดยใช้วิธีกำลังสองน้อยที่สุด
ทางนี้,
ค่าประมาณของค่าสัมประสิทธิ์ \u003d 61.6583 แสดงให้เห็นว่าสิ่งอื่น ๆ ทั้งหมดเท่ากันเมื่อเพิ่มพื้นที่ขาย 1 พัน m 2 มูลค่าการซื้อขายต่อปีจะเพิ่มขึ้นโดยเฉลี่ย 61.6583 ล้านรูเบิล
ค่าสัมประสิทธิ์โดยประมาณ \u003d 2.2748 แสดงให้เห็นว่าสิ่งอื่น ๆ เท่ากันโดยมีจำนวนผู้เข้าชมเฉลี่ยเพิ่มขึ้นต่อ 1,000 คน ต่อวันมูลค่าการซื้อขายประจำปีจะเพิ่มขึ้นโดยเฉลี่ย 2.2748 ล้านรูเบิล
ตัวอย่างที่ 2.3ใช้ข้อมูลที่แสดงในตาราง 2.2 และ 2.4 ประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติปัจจัยเดียว
มูลค่าศูนย์กลางของการหมุนเวียนประจำปีของร้านค้าอยู่ที่ไหนล้านรูเบิล - ค่ากลางของจำนวนผู้เยี่ยมชมร้านค้า t-th เฉลี่ยต่อวันนับพันคน (ดูตัวอย่าง 2.1-2.2)
การตัดสินใจ. ข้อมูลเพิ่มเติมที่จำเป็นสำหรับการคำนวณแสดงอยู่ในตาราง 2.5.
ตารางที่ 2.5
-48,53 | -2,40 | 5,7720 | 116,6013 | |
-30,20 | -0,41 | 0,1702 | 12,4589 | |
-27,34 | -1,34 | 1,8023 | 36,7084 | |
-27,21 | 0,36 | 0,1278 | -9,7288 | |
-12,00 | -2,11 | 4,4627 | 25,3570 | |
0,22 | -3,14 | 9,8753 | -0,6809 | |
6,72 | 1,71 | 2,9156 | 11,4687 | |
20,76 | 0,16 | 0,0348 | 3,2992 | |
22,84 | -0,76 | 0,5814 | -17,413 | |
22,97 | 3,07 | 9,4096 | 70,4503 | |
31,55 | 1,62 | 2,6163 | 51,0267 | |
40,26 | 3,27 | 10,6766 | 131,5387 | |
จำนวน | 48,4344 | 431,0566 |
ใช้สูตร (2.35) เราได้รับ
ทางนี้,
http://www.cleverstudents.ru/articles/mnk.html
ตัวอย่าง.
ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร xและ ที่จะได้รับในตาราง
อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน
การใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลนี้ด้วยการพึ่งพาเชิงเส้น y \u003d ขวาน + b (ค้นหาพารามิเตอร์ และ และ ข). ค้นหาว่าเส้นสองเส้นใดดีกว่ากัน (ในแง่ของวิธีกำลังสองน้อยที่สุด) จะจัดแนวข้อมูลการทดลอง วาดรูป.
การตัดสินใจ.
ในตัวอย่างของเรา n \u003d 5... เรากรอกข้อมูลในตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ
ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ผม.
ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ผม.
ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าตามแถว
เราใช้สูตรกำลังสองน้อยที่สุดในการหาค่าสัมประสิทธิ์ และ และ ข... เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตาราง:
ดังนั้น y \u003d 0.165x + 2.184 - จำเป็นต้องประมาณเส้นตรง
มันยังคงอยู่เพื่อค้นหาว่าบรรทัดใด y \u003d 0.165x + 2.184 หรือ ประมาณข้อมูลเดิมได้ดีกว่านั่นคือทำการประมาณโดยใช้วิธีกำลังสองน้อยที่สุด
หลักฐาน.
ดังนั้นเมื่อพบว่า และ และ ข ฟังก์ชันรับค่าที่น้อยที่สุดมีความจำเป็นที่จุดนี้เมทริกซ์ของรูปแบบกำลังสองของส่วนต่างลำดับที่สองสำหรับฟังก์ชัน แน่นอนในเชิงบวก มาแสดงให้ดู
ส่วนต่างลำดับที่สองมีรูปแบบ:
นั่นคือ
ดังนั้นเมทริกซ์ของรูปกำลังสองจึงมีรูปแบบ
และค่าขององค์ประกอบไม่ขึ้นอยู่กับ และและ ข.
ให้เราแสดงว่าเมทริกซ์เป็นบวกแน่นอน สิ่งนี้ต้องการให้ผู้เยาว์มุมเป็นบวก
มุมลำดับรองลงมา ... ความไม่เท่าเทียมกันนั้นเข้มงวดตั้งแต่จุด
ตัวอย่าง.
ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร x และ ที่ จะได้รับในตาราง
อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน
การใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลนี้ด้วยการพึ่งพาเชิงเส้น y \u003d ขวาน + b (ค้นหาพารามิเตอร์ และ และ ข). ค้นหาว่าเส้นสองเส้นใดดีกว่ากัน (ในแง่ของวิธีกำลังสองน้อยที่สุด) จะจัดแนวข้อมูลการทดลอง วาดรูป.
สาระสำคัญของวิธีกำลังสองน้อยที่สุด (OLS)
ภารกิจคือการหาค่าสัมประสิทธิ์ของการพึ่งพาเชิงเส้นซึ่งฟังก์ชันของสองตัวแปร และ และ ข ใช้ค่าที่น้อยที่สุด นั่นคือได้รับ และ และ ข ผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด
ดังนั้นการแก้ปัญหาของตัวอย่างจึงลดลงเป็นการค้นหาสุดขั้วของฟังก์ชันของสองตัวแปร
การหาสูตรเพื่อหาค่าสัมประสิทธิ์
ระบบของสมการสองสมการที่มีสองสิ่งที่ไม่รู้จักถูกประกอบและแก้ไข ค้นหาอนุพันธ์ย่อยของฟังก์ชันที่เกี่ยวข้องกับตัวแปร และ และ ขเราถือว่าอนุพันธ์เหล่านี้เป็นศูนย์
เราแก้ระบบสมการผลลัพธ์ด้วยวิธีใดก็ได้ (ตัวอย่างเช่น วิธีการทดแทน หรือ) และเราได้รับสูตรสำหรับการหาค่าสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (OLS)
ด้วยข้อมูล และ และ ข ฟังก์ชัน ใช้ค่าที่น้อยที่สุด ได้รับการพิสูจน์ข้อเท็จจริงนี้
นั่นเป็นวิธีกำลังสองน้อยที่สุด สูตรสำหรับค้นหาพารามิเตอร์ ก มีผลรวม ,,, และพารามิเตอร์ n - จำนวนข้อมูลการทดลอง เราขอแนะนำให้คำนวณมูลค่าของจำนวนเหล่านี้แยกกัน ค่าสัมประสิทธิ์ ข อยู่หลังการคำนวณ ก.
ถึงเวลาจำตัวอย่างเดิม
การตัดสินใจ.
ในตัวอย่างของเรา n \u003d 5... เรากรอกข้อมูลในตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ
ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ผม.
ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ผม.
ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าตามแถว
เราใช้สูตรกำลังสองน้อยที่สุดในการหาค่าสัมประสิทธิ์ และ และ ข... เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตาราง:
ดังนั้น y \u003d 0.165x + 2.184 - จำเป็นต้องประมาณเส้นตรง
มันยังคงอยู่เพื่อค้นหาว่าบรรทัดใด y \u003d 0.165x + 2.184 หรือ ประมาณข้อมูลเดิมได้ดีกว่านั่นคือทำการประมาณโดยใช้วิธีกำลังสองน้อยที่สุด
การประมาณข้อผิดพลาดของวิธีกำลังสองน้อยที่สุด
ในการทำเช่นนี้คุณต้องคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลเริ่มต้นจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ใกล้เคียงกับข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด
ตั้งแต่นั้นเป็นต้นมา y \u003d 0.165x + 2.184 ประมาณข้อมูลต้นฉบับได้ดีกว่า
ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (mns)
ทุกอย่างสามารถมองเห็นได้อย่างสมบูรณ์บนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y \u003d 0.165x + 2.184เส้นสีน้ำเงินคือ จุดสีชมพูเป็นข้อมูลดิบ
มีไว้เพื่ออะไรการประมาณทั้งหมดนี้มีไว้เพื่ออะไร?
โดยส่วนตัวแล้วฉันใช้เพื่อแก้ปัญหาการปรับให้เรียบของข้อมูลการแก้ไขและการประมาณค่า (ในตัวอย่างเดิมคุณอาจขอให้หาค่าของค่าที่สังเกตได้ ย ที่ x \u003d 3 หรือที่ x \u003d 6 โดยวิธี OLS) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของไซต์ในภายหลัง
หลักฐาน.
ดังนั้นเมื่อพบว่า และ และ ข ฟังก์ชันรับค่าที่น้อยที่สุดมีความจำเป็นที่จุดนี้เมทริกซ์ของรูปแบบกำลังสองของส่วนต่างลำดับที่สองสำหรับฟังก์ชัน แน่นอนในเชิงบวก มาแสดงให้ดู
ให้เราประมาณฟังก์ชันด้วยพหุนามดีกรี 2 สำหรับสิ่งนี้เราคำนวณค่าสัมประสิทธิ์ของระบบสมการปกติ:
, ,
มาสร้างระบบปกติของกำลังสองน้อยที่สุดซึ่งมีรูปแบบ:
โซลูชันระบบหาง่าย: ,,.
ดังนั้นจึงพบพหุนามของระดับที่ 2:.
พื้นหลังทางทฤษฎี
กลับไปที่หน้า<Введение в вычислительную математику. Примеры>
ตัวอย่าง 2... การหาระดับที่เหมาะสมที่สุดของพหุนาม
กลับไปที่หน้า<Введение в вычислительную математику. Примеры>
ตัวอย่างที่ 3... ที่มาของระบบสมการปกติสำหรับการค้นหาพารามิเตอร์ของการพึ่งพาเชิงประจักษ์
ให้เราได้ระบบสมการเพื่อหาค่าสัมประสิทธิ์และฟังก์ชัน ซึ่งทำการประมาณค่าราก - ค่าเฉลี่ยกำลังสองของฟังก์ชันที่กำหนดโดยจุด มาเขียนฟังก์ชันกัน และเขียนเงื่อนไขที่จำเป็นสำหรับมัน:
จากนั้นระบบปกติจะอยู่ในรูปแบบ:
ได้รับระบบสมการเชิงเส้นสำหรับพารามิเตอร์ที่ไม่รู้จักและแก้ไขได้ง่าย
พื้นหลังทางทฤษฎี
กลับไปที่หน้า<Введение в вычислительную математику. Примеры>
ตัวอย่าง.
ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร x และ ที่ จะได้รับในตาราง
อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน
การใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลนี้ด้วยการพึ่งพาเชิงเส้น y \u003d ขวาน + b (ค้นหาพารามิเตอร์ และ และ ข). ค้นหาว่าเส้นสองเส้นใดดีกว่ากัน (ในแง่ของวิธีกำลังสองน้อยที่สุด) จะจัดแนวข้อมูลการทดลอง วาดรูป.
สาระสำคัญของวิธีกำลังสองน้อยที่สุด (OLS)
ภารกิจคือการหาค่าสัมประสิทธิ์ของการพึ่งพาเชิงเส้นซึ่งฟังก์ชันของสองตัวแปร และ และ ข ใช้ค่าที่น้อยที่สุด นั่นคือได้รับ และ และ ข ผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด
ดังนั้นการแก้ปัญหาของตัวอย่างจึงลดลงเป็นการค้นหาสุดขั้วของฟังก์ชันของสองตัวแปร
การหาสูตรเพื่อหาค่าสัมประสิทธิ์
ระบบของสมการสองสมการที่มีสองสิ่งที่ไม่รู้จักถูกประกอบและแก้ไข ค้นหาอนุพันธ์ย่อยของฟังก์ชัน ตามตัวแปร และ และ ขเราถือว่าอนุพันธ์เหล่านี้เป็นศูนย์
เราแก้ระบบสมการผลลัพธ์ด้วยวิธีใดก็ได้ (ตัวอย่างเช่น วิธีการทดแทน หรือวิธีการของ Cramer) และเราได้รับสูตรสำหรับการหาค่าสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (OLS)
ด้วยข้อมูล และ และ ข ฟังก์ชัน ใช้ค่าที่น้อยที่สุด การพิสูจน์ข้อเท็จจริงนี้ระบุไว้ด้านล่างในข้อความท้ายหน้า
นั่นเป็นวิธีกำลังสองน้อยที่สุด สูตรสำหรับค้นหาพารามิเตอร์ ก มีผลรวม ,,, และพารามิเตอร์ n - จำนวนข้อมูลทดลอง เราขอแนะนำให้คำนวณมูลค่าของจำนวนเหล่านี้แยกกัน
ค่าสัมประสิทธิ์ ข อยู่หลังการคำนวณ ก.
ถึงเวลาจำตัวอย่างเดิม
การตัดสินใจ.
ในตัวอย่างของเรา n \u003d 5... เรากรอกข้อมูลในตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ
ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ผม.
ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ผม.
ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าตามแถว
เราใช้สูตรกำลังสองน้อยที่สุดในการหาค่าสัมประสิทธิ์ และ และ ข... เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตาราง:
ดังนั้น y \u003d 0.165x + 2.184 - จำเป็นต้องประมาณเส้นตรง
มันยังคงอยู่เพื่อค้นหาว่าบรรทัดใด y \u003d 0.165x + 2.184 หรือ ประมาณข้อมูลเดิมได้ดีกว่านั่นคือทำการประมาณโดยใช้วิธีกำลังสองน้อยที่สุด
การประมาณข้อผิดพลาดของวิธีกำลังสองน้อยที่สุด
ในการทำเช่นนี้คุณต้องคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลเริ่มต้นจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ใกล้เคียงกับข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด
ตั้งแต่นั้นเป็นต้นมา y \u003d 0.165x + 2.184 ประมาณข้อมูลต้นฉบับได้ดีกว่า
ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (mns)
ทุกอย่างสามารถมองเห็นได้อย่างสมบูรณ์บนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y \u003d 0.165x + 2.184เส้นสีน้ำเงินคือ จุดสีชมพูเป็นข้อมูลดิบ
มีไว้เพื่ออะไรการประมาณทั้งหมดนี้มีไว้เพื่ออะไร?
โดยส่วนตัวแล้วฉันใช้เพื่อแก้ปัญหาการปรับให้เรียบของข้อมูลการแก้ไขและการประมาณค่า (ในตัวอย่างเดิมคุณอาจขอให้หาค่าของค่าที่สังเกตได้ ย ที่ x \u003d 3 หรือที่ x \u003d 6 โดยวิธี OLS) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของไซต์ในภายหลัง
กลับไปที่ด้านบนของหน้า
หลักฐาน.
ดังนั้นเมื่อพบว่า และ และ ข ฟังก์ชันรับค่าที่น้อยที่สุดมีความจำเป็นที่จุดนี้เมทริกซ์ของรูปแบบกำลังสองของส่วนต่างลำดับที่สองสำหรับฟังก์ชัน แน่นอนในเชิงบวก มาแสดงให้ดู
ส่วนต่างลำดับที่สองมีรูปแบบ:
นั่นคือ
ดังนั้นเมทริกซ์ของรูปกำลังสองจึงมีรูปแบบ
และค่าขององค์ประกอบไม่ขึ้นอยู่กับ และ และ ข.
ให้เราแสดงว่าเมทริกซ์เป็นบวกแน่นอน สิ่งนี้ต้องการให้ผู้เยาว์มุมเป็นบวก
มุมลำดับรองลงมา ... ความไม่เท่าเทียมกันนั้นเข้มงวดเนื่องจากประเด็นต่างๆไม่ใช่เรื่องบังเอิญ ในสิ่งต่อไปนี้เราจะหมายถึงมัน
มุมรองลำดับที่สอง
ให้เราพิสูจน์ว่า โดยวิธีการอุปนัยทางคณิตศาสตร์
สรุป: พบค่า และ และ ข สอดคล้องกับค่าฟังก์ชันที่น้อยที่สุด ดังนั้นจึงเป็นพารามิเตอร์ที่จำเป็นสำหรับวิธีกำลังสองน้อยที่สุด
ไม่มีเวลาคิดออก?
สั่งซื้อโซลูชัน
กลับไปที่ด้านบนของหน้า
การพัฒนาการคาดการณ์โดยใช้วิธีกำลังสองน้อยที่สุด ตัวอย่างการแก้ปัญหา
Extrapolation เป็นวิธีการวิจัยทางวิทยาศาสตร์ซึ่งอาศัยการเผยแพร่แนวโน้มรูปแบบการเชื่อมโยงในอดีตและปัจจุบันสำหรับการพัฒนาในอนาคตของวัตถุพยากรณ์ วิธีการคาดการณ์ ได้แก่ วิธีค่าเฉลี่ยเคลื่อนที่วิธีการเรียบเลขชี้กำลังวิธีกำลังสองน้อยที่สุด
สาระการเรียนรู้แกนกลาง วิธีกำลังสองน้อยที่สุด ประกอบด้วยการลดผลรวมของส่วนเบี่ยงเบนกำลังสองระหว่างค่าที่สังเกตและคำนวณ พบค่าที่คำนวณได้ตามสมการที่พอดี - สมการถดถอย ยิ่งระยะห่างระหว่างค่าจริงและค่าที่คำนวณได้น้อยลงการคาดการณ์ตามสมการการถดถอยก็จะยิ่งแม่นยำมากขึ้น
การวิเคราะห์เชิงทฤษฎีเกี่ยวกับสาระสำคัญของปรากฏการณ์ที่อยู่ระหว่างการศึกษาการเปลี่ยนแปลงที่แสดงโดยอนุกรมเวลาทำหน้าที่เป็นพื้นฐานในการเลือกเส้นโค้ง บางครั้งการพิจารณาเกี่ยวกับลักษณะของการเติบโตของระดับของซีรีส์จะถูกนำมาพิจารณาด้วย ดังนั้นหากคาดว่าการเติบโตของผลผลิตในความก้าวหน้าทางคณิตศาสตร์การปรับให้เรียบจะดำเนินการตามเส้นตรง หากปรากฎว่าการเติบโตเป็นเลขชี้กำลังควรทำการปรับให้เรียบตามฟังก์ชันเลขชี้กำลัง
สูตรการทำงานของกำลังสองน้อยที่สุด : Y เสื้อ + 1 \u003d a * X + bโดยที่ t + 1 คือช่วงเวลาคาดการณ์ Уt + 1 - ตัวบ่งชี้ที่คาดการณ์; a และ b คือสัมประสิทธิ์ X เป็นสัญลักษณ์ของเวลา
การคำนวณค่าสัมประสิทธิ์ a และ b ดำเนินการตามสูตรต่อไปนี้:
ที่ไหน Uf - ค่าจริงของพลวัตจำนวนหนึ่ง n คือจำนวนระดับในอนุกรมเวลา
การปรับอนุกรมเวลาให้เรียบโดยวิธีกำลังสองน้อยที่สุดช่วยสะท้อนรูปแบบของพัฒนาการของปรากฏการณ์ที่กำลังศึกษาอยู่ ในนิพจน์เชิงวิเคราะห์ของแนวโน้มเวลาถือเป็นตัวแปรอิสระและระดับของอนุกรมทำหน้าที่เป็นตัวแปรอิสระนี้
การพัฒนาของปรากฏการณ์ไม่ได้ขึ้นอยู่กับระยะเวลาที่ผ่านไปนับตั้งแต่ช่วงเวลาเริ่มต้น แต่ปัจจัยที่มีอิทธิพลต่อการพัฒนาในทิศทางใดและรุนแรงเพียงใด ดังนั้นจึงเป็นที่ชัดเจนว่าการพัฒนาของปรากฏการณ์ในเวลาปรากฏเป็นผลมาจากการกระทำของปัจจัยเหล่านี้
การกำหนดประเภทของเส้นโค้งอย่างถูกต้องประเภทของการพึ่งพาการวิเคราะห์กับเวลาเป็นหนึ่งในงานที่ยากที่สุดในการวิเคราะห์ล่วงหน้า .
การเลือกประเภทของฟังก์ชันที่อธิบายถึงแนวโน้มพารามิเตอร์ที่กำหนดโดยวิธีกำลังสองน้อยที่สุดจะดำเนินการในกรณีส่วนใหญ่โดยการสร้างฟังก์ชันจำนวนมากและเปรียบเทียบซึ่งกันและกันโดยค่าของค่าความคลาดเคลื่อนกำลังสองของค่าเฉลี่ยรากที่คำนวณโดยสูตร:
โดยที่ Uf - ค่าจริงของพลวัตจำนวนหนึ่ง Ur - คำนวณ (ปรับให้เรียบ) ค่าของพลวัตจำนวนหนึ่ง n คือจำนวนระดับในอนุกรมเวลา p - จำนวนพารามิเตอร์ที่กำหนดในสูตรที่อธิบายถึงแนวโน้ม (แนวโน้มการพัฒนา)
ข้อเสียของวิธีกำลังสองน้อยที่สุด :
- เมื่อพยายามอธิบายปรากฏการณ์ทางเศรษฐกิจภายใต้การศึกษาโดยใช้สมการทางคณิตศาสตร์การคาดการณ์จะแม่นยำในช่วงเวลาสั้น ๆ และควรคำนวณสมการถดถอยใหม่เมื่อมีข้อมูลใหม่
- ความซับซ้อนของการเลือกสมการถดถอยซึ่งแก้ไขได้เมื่อใช้โปรแกรมคอมพิวเตอร์ทั่วไป
ตัวอย่างการใช้วิธีกำลังสองน้อยที่สุดในการพัฒนาการคาดการณ์
งาน ... มีข้อมูลที่แสดงลักษณะของอัตราการว่างงานในภูมิภาค%
- สร้างการคาดการณ์อัตราการว่างงานในภูมิภาคสำหรับเดือนพฤศจิกายนธันวาคมเดือนมกราคมโดยใช้วิธีการดังต่อไปนี้ค่าเฉลี่ยเคลื่อนที่การปรับให้เรียบเลขชี้กำลังกำลังสองน้อยที่สุด
- คำนวณข้อผิดพลาดของการคาดการณ์ที่ได้รับโดยใช้แต่ละวิธี
- เปรียบเทียบผลลัพธ์สรุปผล
สารละลายกำลังสองน้อยที่สุด
ในการแก้ปัญหาเราจะจัดทำตารางซึ่งเราจะทำการคำนวณที่จำเป็น:
ε \u003d 28.63 / 10 \u003d 2.86% ความแม่นยำในการพยากรณ์ สูง.
สรุป : เปรียบเทียบผลลัพธ์ที่ได้ในการคำนวณ วิธีค่าเฉลี่ยเคลื่อนที่ , การปรับให้เรียบเลขชี้กำลัง และวิธีกำลังสองน้อยที่สุดเราสามารถพูดได้ว่าข้อผิดพลาดสัมพัทธ์เฉลี่ยเมื่อคำนวณโดยวิธีการปรับให้เรียบเลขชี้กำลังอยู่ในช่วง 20-50% ซึ่งหมายความว่าความแม่นยำในการคาดการณ์ในกรณีนี้เป็นที่น่าพอใจเท่านั้น
ในกรณีที่หนึ่งและสามความแม่นยำในการคาดการณ์จะสูงเนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยน้อยกว่า 10% แต่วิธีการย้ายค่าเฉลี่ยทำให้ได้ผลลัพธ์ที่น่าเชื่อถือมากขึ้น (คาดการณ์เดือนพฤศจิกายน - 1.52% คาดการณ์เดือนธันวาคม - 1.53% คาดการณ์มกราคม - 1.49%) เนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยเมื่อใช้วิธีนี้น้อยที่สุด - 1 , 13%.
วิธีกำลังสองน้อยที่สุด
บทความอื่น ๆ ในหัวข้อนี้:
รายชื่อแหล่งที่มาที่ใช้
- คำแนะนำทางวิทยาศาสตร์และระเบียบวิธีเกี่ยวกับการวินิจฉัยความเสี่ยงทางสังคมและการคาดการณ์ความท้าทายภัยคุกคามและผลกระทบทางสังคม มหาวิทยาลัยสังคมแห่งรัฐรัสเซีย มอสโก. พ.ศ. 2553;
- วลาดิมิโรวา L.P. การพยากรณ์และการวางแผนในสภาวะตลาด: ตำรา. เบี้ยเลี้ยง. M .: สำนักพิมพ์ "Dashkov and Co", 2544;
- Novikova N.V. , Pozdeeva O.G. พยากรณ์เศรษฐกิจแห่งชาติ: คู่มือการสอน. เยคาเตรินเบิร์ก: สำนักพิมพ์อูราล. สถานะ เศรษฐศาสตร์. มหาวิทยาลัย, 2550;
- Slutskin L.N. หลักสูตร MBA เกี่ยวกับการพยากรณ์ในธุรกิจ M .: Alpina Business Books, 2549
โปรแกรม OLS
ป้อนข้อมูล
ข้อมูลและการประมาณ y \u003d a + b x
ผม - หมายเลขจุดทดลอง
x ผม - ค่าของพารามิเตอร์คงที่ที่จุด ผม;
ฉัน - ค่าของพารามิเตอร์ที่วัดได้ที่จุด ผม;
ω i - น้ำหนักของการวัดที่จุด ผม;
ครับผมแคลเซียม - ความแตกต่างระหว่างวัดและคำนวณโดยค่าการถดถอย ย ตรงจุด ผม;
S x i (x i) - การประมาณค่าผิดพลาด x ผม เมื่อทำการวัด ย ตรงจุด ผม.
ข้อมูลและการประมาณ y \u003d k x
ผม | x ผม | ฉัน | ω i | ครับผมแคลเซียม | ฉันฉัน | S x i (x i) |
---|
คลิกที่กราฟ
คำแนะนำสำหรับผู้ใช้โปรแกรมออนไลน์ MNC
ในช่องข้อมูลให้ป้อนค่า "x" และ "y" ที่จุดทดสอบเดียวกันในแต่ละบรรทัดแยกกัน ต้องคั่นค่าด้วยอักขระเว้นวรรค (ช่องว่างหรือแท็บ)
ค่าที่สามอาจเป็นน้ำหนักของจุด "w" หากไม่ได้ระบุน้ำหนักจุดก็จะเท่ากับหนึ่ง ในกรณีส่วนใหญ่ที่ท่วมท้นไม่ทราบน้ำหนักของคะแนนทดลองหรือไม่ได้คำนวณกล่าวคือ ข้อมูลการทดลองทั้งหมดถือว่าเทียบเท่ากัน บางครั้งน้ำหนักในช่วงของค่าที่ศึกษาจะไม่เทียบเท่ากันอย่างแน่นอนและสามารถคำนวณได้ในทางทฤษฎี ตัวอย่างเช่นในสเปกโตรโฟโตเมตรีน้ำหนักสามารถคำนวณได้โดยใช้สูตรง่ายๆแม้ว่าโดยพื้นฐานแล้วทุกคนจะละเลยสิ่งนี้เพื่อลดต้นทุนแรงงาน
สามารถวางข้อมูลผ่านคลิปบอร์ดจากสเปรดชีตชุดโปรแกรมสำนักงานเช่น Excel จาก Microsoft Office หรือ Calc จาก Open Office ในการดำเนินการนี้ในสเปรดชีตให้เลือกช่วงของข้อมูลที่จะคัดลอกคัดลอกไปยังคลิปบอร์ดแล้ววางข้อมูลลงในช่องข้อมูลในหน้านี้
สำหรับการคำนวณโดยวิธีกำลังสองน้อยที่สุดจำเป็นต้องมีจุดอย่างน้อยสองจุดเพื่อกำหนดค่าสัมประสิทธิ์สองค่า "b" - แทนเจนต์ของความชันของเส้นตรงและ "a" - ค่าที่ตัดด้วยเส้นตรงบนแกน "y"
ในการประมาณข้อผิดพลาดของค่าสัมประสิทธิ์การถดถอยที่คำนวณได้คุณต้องกำหนดจำนวนจุดทดลองมากกว่าสองจุด
วิธีกำลังสองน้อยที่สุด (OLS)
จำนวนจุดทดลองที่มากขึ้นการประมาณค่าสัมประสิทธิ์ทางสถิติจะแม่นยำมากขึ้น (เนื่องจากค่าสัมประสิทธิ์ของนักเรียนลดลง) และค่าประมาณใกล้เคียงกับค่าประมาณของตัวอย่างทั่วไป
การได้รับค่าในแต่ละจุดการทดลองมักใช้แรงงานมากดังนั้นจึงมักมีการลดจำนวนการทดลองที่ให้ค่าประมาณย่อยได้และไม่นำไปสู่ต้นทุนแรงงานที่มากเกินไป ตามกฎแล้วจำนวนจุดทดลองสำหรับการพึ่งพากำลังสองเชิงเส้นน้อยที่สุดที่มีค่าสัมประสิทธิ์สองตัวจะถูกเลือกในพื้นที่ 5-7 จุด
ทฤษฎีโดยย่อเกี่ยวกับวิธีกำลังสองน้อยที่สุดสำหรับการพึ่งพาเชิงเส้น
สมมติว่าเรามีชุดข้อมูลการทดลองในรูปแบบของคู่ค่า [`y_i`," x_i`] โดยที่ "i" คือตัวเลขของการวัดการทดลองหนึ่งรายการจาก 1 ถึง "n`; `y_i` - ค่าของค่าที่วัดได้ที่จุด` i`; "x_i` - ค่าของพารามิเตอร์ที่เราตั้งไว้ที่จุด" i "
ตัวอย่างเช่นพิจารณาการทำงานของกฎของโอห์ม โดยการเปลี่ยนแรงดันไฟฟ้า (ความต่างศักย์) ระหว่างส่วนของวงจรไฟฟ้าเราจะวัดปริมาณกระแสที่ไหลผ่านส่วนนี้ ฟิสิกส์ทำให้เรามีการพึ่งพาที่พบในการทดลอง:
`ฉัน \u003d U / R`,
โดยที่ "ฉัน" - ความแรงในปัจจุบัน `R` - ความต้านทาน; `U` - แรงดันไฟฟ้า
ในกรณีนี้ "y_i" คือค่ากระแสไฟฟ้าที่วัดได้และ "x_i" คือค่าแรงดันไฟฟ้า
อีกตัวอย่างหนึ่งให้พิจารณาการดูดกลืนแสงโดยสารละลายของสารในสารละลาย เคมีให้สูตรแก่เรา:
`A \u003d εล C`,
โดยที่ "A" คือความหนาแน่นของแสงของสารละลาย `ε` - การส่งผ่านของตัวถูกละลาย "l` - ความยาวของเส้นทางเมื่อแสงผ่าน cuvette ด้วยสารละลาย `C` - ความเข้มข้นของตัวถูกละลาย
ในกรณีนี้ "y_i" เรามีค่าที่วัดได้ของความหนาแน่นของแสง "A" และ "x_i" คือค่าของความเข้มข้นของสารที่เราตั้งไว้
เราจะพิจารณากรณีที่ข้อผิดพลาดสัมพัทธ์ในการตั้งค่า "x_i" น้อยกว่าข้อผิดพลาดการวัดสัมพัทธ์ "y_i" มาก นอกจากนี้เราจะถือว่าค่าที่วัดได้ทั้งหมด "y_i" เป็นแบบสุ่มและกระจายตามปกติกล่าวคือ ปฏิบัติตามกฎหมายการกระจายปกติ
ในกรณีของการพึ่งพาเชิงเส้นของ "y" กับ "x" เราสามารถเขียนการพึ่งพาทางทฤษฎีได้:
`y \u003d a + b x`
จากมุมมองทางเรขาคณิตสัมประสิทธิ์ "b" แสดงถึงแทนเจนต์ของมุมเอียงของเส้นกับแกน "x" และค่าสัมประสิทธิ์ "a" - ค่าของ "y" ที่จุดตัดของเส้นกับแกน "y" (ที่ "x \u003d 0")
การค้นหาพารามิเตอร์ของเส้นการถดถอย
ในการทดลองค่าที่วัดได้ของ "y_i" ไม่สามารถอยู่บนเส้นตรงตามทฤษฎีได้อย่างแน่นอนเนื่องจากข้อผิดพลาดในการวัดที่มีอยู่เสมอในชีวิตจริง ดังนั้นสมการเชิงเส้นจะต้องแสดงด้วยระบบสมการ:
`y_i \u003d a + b x_i + ε_i` (1),
โดยที่ "ε_i" คือข้อผิดพลาดในการวัดที่ไม่ทราบสาเหตุของ "y" ในการทดสอบ "i`-th
เรียกอีกอย่างว่าการพึ่งพา (1) การถดถอยเช่น การพึ่งพาสองค่าจากกันอย่างมีนัยสำคัญทางสถิติ
ภารกิจในการฟื้นฟูการพึ่งพาคือการหาค่าสัมประสิทธิ์ "a" และ "b" จากจุดทดลอง [`y_i`," x_i`]
ในการหาค่าสัมประสิทธิ์ "a" และ "b" โดยปกติจะใช้ วิธีกำลังสองน้อยที่สุด (OLS). เป็นกรณีพิเศษของหลักการความเป็นไปได้สูงสุด
ให้เราเขียน (1) ใหม่เป็น "ε_i \u003d y_i - a - b x_i`
จากนั้นผลรวมของกำลังสองของข้อผิดพลาดจะเป็น
`Φ \u003d sum_ (i \u003d 1) ^ (n) ε_i ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2` (2)
หลักการของ OLS (วิธีกำลังสองน้อยที่สุด) คือการลดผลรวม (2) ตามพารามิเตอร์ "a` และ" b ".
ถึงค่าต่ำสุดเมื่ออนุพันธ์บางส่วนของผลรวม (2) เทียบกับสัมประสิทธิ์ "a" และ "b" เท่ากับศูนย์:
`frac (บางส่วนΦ) (บางส่วน a) \u003d frac (ผลรวมบางส่วน (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (บางส่วน a) \u003d 0`
`frac (บางส่วนΦ) (b บางส่วน) \u003d frac (บางส่วน sum_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (b บางส่วน) \u003d 0`
การขยายอนุพันธ์เราได้ระบบของสองสมการโดยมีสองสมการที่ไม่รู้จัก:
`sum_ (i \u003d 1) ^ (n) (2a + 2bx_i - 2y_i) \u003d sum_ (i \u003d 1) ^ (n) (a + bx_i - y_i) \u003d 0`
`sum_ (i \u003d 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) \u003d sum_ (i \u003d 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) \u003d 0`
เราเปิดวงเล็บและโอนผลรวมโดยไม่ขึ้นกับค่าสัมประสิทธิ์ที่ต้องการไปยังอีกครึ่งหนึ่งเราได้ระบบสมการเชิงเส้น:
`sum_ (i \u003d 1) ^ (n) y_i \u003d a n + b sum_ (i \u003d 1) ^ (n) bx_i`
`sum_ (i \u003d 1) ^ (n) x_iy_i \u003d a sum_ (i \u003d 1) ^ (n) x_i + b sum_ (i \u003d 1) ^ (n) x_i ^ 2`
ในการแก้ระบบผลลัพธ์เราพบสูตรสำหรับสัมประสิทธิ์ "a` และ" b`:
`a \u003d frac (sum_ (i \u003d 1) ^ (n) y_i sum_ (i \u003d 1) ^ (n) x_i ^ 2 - sum_ (i \u003d 1) ^ (n) x_i sum_ (i \u003d 1) ^ (n ) x_iy_i) (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.1)
`b \u003d frac (n sum_ (i \u003d 1) ^ (n) x_iy_i - sum_ (i \u003d 1) ^ (n) x_i sum_ (i \u003d 1) ^ (n) y_i) (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.2)
สูตรเหล่านี้มีคำตอบเมื่อ "n\u003e 1` (เส้นสามารถลากได้จากจุดอย่างน้อย 2 จุด) และเมื่อดีเทอร์มิแนนต์` D \u003d n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2! \u003d 0` เช่น เมื่อจุด "x_i" ในการทดสอบต่างกัน (เช่นเมื่อเส้นไม่ใช่แนวตั้ง)
การประมาณข้อผิดพลาดของค่าสัมประสิทธิ์ของเส้นถดถอย
สำหรับค่าประมาณที่แม่นยำยิ่งขึ้นของข้อผิดพลาดในการคำนวณค่าสัมประสิทธิ์ "a" และ "b" จึงเป็นที่ต้องการของจุดทดลองจำนวนมาก เมื่อ "n \u003d 2" จะไม่สามารถประมาณค่าสัมประสิทธิ์ข้อผิดพลาดได้เนื่องจาก เส้นประมาณจะผ่านจุดสองจุด
ข้อผิดพลาดของตัวแปรสุ่ม "V" ถูกกำหนด กฎแห่งการสะสมของข้อผิดพลาด
`S_V ^ 2 \u003d sum_ (i \u003d 1) ^ p (frac (บางส่วน f) (z_i บางส่วน)) ^ 2 S_ (z_i) ^ 2`,
โดยที่ "p" คือจำนวนพารามิเตอร์ "z_i" ที่มีข้อผิดพลาด "S_ (z_i)" ที่ส่งผลต่อข้อผิดพลาด "S_V";
"f` - ฟังก์ชันการพึ่งพาของ" V "บน" z_i "
ให้เราเขียนกฎการสะสมข้อผิดพลาดสำหรับข้อผิดพลาดของสัมประสิทธิ์ "a" และ "b"
`S_a ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (frac (บางส่วน a) (y_i บางส่วน)) ^ 2 S_ (y_i) ^ 2 + sum_ (i \u003d 1) ^ (n) (frac (บางส่วน a ) (บางส่วน x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (บางส่วน a) (y_i บางส่วน)) ^ 2 `,
`S_b ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (frac (บางส่วน b) (y_i บางส่วน)) ^ 2 S_ (y_i) ^ 2 + sum_ (i \u003d 1) ^ (n) (frac (บางส่วน b ) (บางส่วน x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (บางส่วน b) (y_i บางส่วน)) ^ 2 `,
ตั้งแต่ `S_ (x_i) ^ 2 \u003d 0` (เราได้ทำการจองก่อนหน้านี้ว่าข้อผิดพลาด" x "เล็กน้อย)
`S_y ^ 2 \u003d S_ (y_i) ^ 2` - ข้อผิดพลาด (ความแปรปรวนกำลังสองของส่วนเบี่ยงเบนมาตรฐาน) ในการวัด" y "โดยสมมติว่าข้อผิดพลาดนั้นเหมือนกันสำหรับค่าทั้งหมดของ" y "
เราได้รับการแทนที่สูตรสำหรับการคำนวณ "a" และ "b" ในนิพจน์ที่ได้รับ
`S_a ^ 2 \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) (sum_ (i \u003d 1) ^ (n) x_i ^ 2 - x_i sum_ (i \u003d 1) ^ (n) x_i) ^ 2 ) (D ^ 2) \u003d S_y ^ 2 frac ((n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) sum_ (i \u003d 1) ^ (n) x_i ^ 2) (D ^ 2) \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) x_i ^ 2) (D) `(4.1)
`S_b ^ 2 \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) (n x_i - sum_ (i \u003d 1) ^ (n) x_i) ^ 2) (D ^ 2) \u003d S_y ^ 2 frac ( n (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2)) (D ^ 2) \u003d S_y ^ 2 frac (n) (D) `(4.2)
ในการทดลองในชีวิตจริงส่วนใหญ่จะไม่มีการวัดค่า "Sy" ในการทำเช่นนี้คุณต้องทำการวัดแบบขนานหลาย ๆ จุด (การทดลอง) ที่จุดใดจุดหนึ่งของแผนซึ่งจะเพิ่มเวลา (และอาจมีค่าใช้จ่าย) ของการทดสอบ ดังนั้นโดยปกติจะถือว่าค่าเบี่ยงเบนของ "y" จากเส้นการถดถอยถือได้ว่าเป็นการสุ่ม ค่าประมาณของความแปรปรวน "y" ในกรณีนี้คำนวณโดยสูตร
`S_y ^ 2 \u003d S_ (y, ส่วนที่เหลือ) ^ 2 \u003d frac (sum_ (i \u003d 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)".
ตัวหาร "n-2" ปรากฏขึ้นเนื่องจากเราได้ลดจำนวนองศาอิสระลงเนื่องจากการคำนวณค่าสัมประสิทธิ์สองตัวสำหรับข้อมูลทดลองตัวอย่างเดียวกัน
การประมาณนี้เรียกอีกอย่างว่าค่าความแปรปรวนที่เหลือที่สัมพันธ์กับเส้นการถดถอย "S_ (y, ส่วนที่เหลือ) ^ 2"
ความสำคัญของค่าสัมประสิทธิ์ได้รับการประเมินตามแบบทดสอบของนักเรียน
`t_a \u003d frac (| a |) (S_a)`, `t_b \u003d frac (| b |) (S_b)`
หากเกณฑ์ที่คำนวณได้ "t_a", "t_b" น้อยกว่าเกณฑ์ตาราง "t (P, n-2)" จะถือว่าค่าสัมประสิทธิ์ที่สอดคล้องกันไม่แตกต่างอย่างมีนัยสำคัญจากศูนย์โดยมีความน่าจะเป็นที่กำหนด "P"
ในการประเมินคุณภาพของคำอธิบายของความสัมพันธ์เชิงเส้นคุณสามารถเปรียบเทียบ "S_ (y, rest) ^ 2` และ" S_ (bar y) "เทียบกับค่าเฉลี่ยโดยใช้การทดสอบของฟิชเชอร์
`S_ (บาร์ y) \u003d frac (sum_ (i \u003d 1) ^ n (y_i - บาร์ y) ^ 2) (n-1) \u003d frac (sum_ (i \u003d 1) ^ n (y_i - (sum_ (i \u003d 1) ^ n y_i) / n) ^ 2) (n-1) `- ค่าประมาณตัวอย่างของความแปรปรวน` y` เทียบกับค่าเฉลี่ย
ในการประเมินประสิทธิภาพของสมการการถดถอยเพื่ออธิบายความสัมพันธ์ค่าสัมประสิทธิ์ฟิชเชอร์จะถูกคำนวณ
`F \u003d S_ (บาร์ y) / S_ (y, ส่วนที่เหลือ) ^ 2`,
ซึ่งเปรียบเทียบกับตารางสัมประสิทธิ์ฟิชเชอร์ `F (p, n-1, n-2)"
ถ้า "F\u003e F (P, n-1, n-2)" ความแตกต่างระหว่างคำอธิบายของการพึ่งพา "y \u003d f (x)" โดยใช้สมการถดถอยและคำอธิบายโดยใช้ค่าเฉลี่ยจะถือว่ามีนัยสำคัญทางสถิติโดยมีความน่าจะเป็น "P" เหล่านั้น. การถดถอยอธิบายความสัมพันธ์ได้ดีกว่าการแพร่กระจายของ "y" ที่สัมพันธ์กับค่าเฉลี่ย
คลิกที่กราฟ
เพื่อเพิ่มค่าลงในตาราง
วิธีกำลังสองน้อยที่สุด วิธีกำลังสองน้อยที่สุดถูกเข้าใจว่าเป็นการกำหนดพารามิเตอร์ที่ไม่รู้จัก a, b, c, การพึ่งพาฟังก์ชันที่นำมาใช้
วิธีกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก ก, ข, ค, ... การพึ่งพาการทำงานที่ยอมรับ
y \u003d f (x, a, b, c, ... ),
ซึ่งจะให้ข้อผิดพลาดกำลังสองค่าเฉลี่ยขั้นต่ำ (ความแปรปรวน)
, (24)
โดยที่ x i, y i คือชุดของจำนวนคู่ที่ได้จากการทดลอง
เนื่องจากเงื่อนไขสำหรับสุดขั้วของฟังก์ชันของตัวแปรหลายตัวจึงเป็นเงื่อนไขของความเท่าเทียมกันเป็นศูนย์ของอนุพันธ์ย่อยพารามิเตอร์ ก, ข, ค, ...ถูกกำหนดจากระบบสมการ:
; ; ; … (25)
ควรจำไว้ว่าวิธีการกำลังสองน้อยที่สุดถูกใช้เพื่อเลือกพารามิเตอร์หลังฟังก์ชัน y \u003d f (x) กำหนด
หากจากการพิจารณาทางทฤษฎีเป็นไปไม่ได้ที่จะสรุปข้อสรุปใด ๆ เกี่ยวกับสิ่งที่สูตรเชิงประจักษ์ควรจะต้องมีการนำเสนอโดยการแสดงภาพโดยส่วนใหญ่เป็นการแสดงข้อมูลที่สังเกตได้ในเชิงกราฟิก
ในทางปฏิบัติส่วนใหญ่มัก จำกัด เฉพาะฟังก์ชันประเภทต่อไปนี้:
1) เชิงเส้น ;
2) กำลังสองก.