Mnk สำหรับฟังก์ชันเชิงเส้น ตัวอย่างวิธีการแก้ปัญหากำลังสองน้อยที่สุด การประมาณโดยใช้ฟังก์ชันอื่น ๆ

วิธีกำลังสองน้อยที่สุด ใช้ในการประมาณค่าพารามิเตอร์ของสมการการถดถอย

วิธีการหนึ่งในการศึกษาความเชื่อมโยงระหว่างคุณลักษณะสุ่มคือการวิเคราะห์การถดถอย
การวิเคราะห์การถดถอยเป็นที่มาของสมการการถดถอยด้วยความช่วยเหลือซึ่งจะพบค่าเฉลี่ยของตัวแปรสุ่ม (คุณลักษณะ - ผลลัพธ์) หากทราบค่าของตัวแปรอื่น (หรืออื่น ๆ ) (คุณลักษณะ - ปัจจัย) รวมถึงขั้นตอนต่อไปนี้:

  1. การเลือกรูปแบบการสื่อสาร (ประเภทของสมการถดถอยเชิงวิเคราะห์);
  2. การประมาณค่าพารามิเตอร์ของสมการ
  3. การประเมินคุณภาพของสมการถดถอยเชิงวิเคราะห์
ส่วนใหญ่รูปแบบเชิงเส้นจะใช้เพื่ออธิบายความสัมพันธ์ทางสถิติของคุณลักษณะ ความสนใจต่อความสัมพันธ์เชิงเส้นอธิบายได้จากการตีความทางเศรษฐศาสตร์ที่ชัดเจนของพารามิเตอร์การเปลี่ยนแปลงที่ จำกัด ของตัวแปรและความจริงที่ว่าในกรณีส่วนใหญ่รูปแบบการสื่อสารที่ไม่ใช่เชิงเส้นจะถูกแปลง (โดยลอการิทึมหรือการเปลี่ยนแปลงของตัวแปร) เป็นรูปแบบเชิงเส้นเพื่อทำการคำนวณ
ในกรณีของความสัมพันธ์เชิงเส้นคู่สมการถดถอยจะอยู่ในรูป: y i \u003d a + b x i + u i พารามิเตอร์ของสมการนี้ a และ b ประมาณจากข้อมูลของการสังเกตทางสถิติ x และ y ผลลัพธ์ของการประเมินดังกล่าวคือสมการโดยที่ค่าประมาณของพารามิเตอร์ a และ b คือค่าของแอตทริบิวต์ที่มีประสิทธิผล (ตัวแปร) ที่ได้จากสมการการถดถอย (ค่าที่คำนวณได้)

ส่วนใหญ่มักใช้ในการประมาณค่าพารามิเตอร์ วิธีกำลังสองน้อยที่สุด (OLS)
วิธีกำลังสองน้อยที่สุดให้ค่าประมาณที่ดีที่สุด (สม่ำเสมอมีประสิทธิภาพและเป็นกลาง) ของพารามิเตอร์ของสมการการถดถอย แต่ถ้าตรงตามข้อกำหนดเบื้องต้นบางประการสำหรับคำที่สุ่ม (u) และตัวแปรอิสระ (x) (ดูข้อกำหนดเบื้องต้นของ OLS)

ปัญหาในการประมาณค่าพารามิเตอร์ของสมการคู่เชิงเส้นโดยวิธีกำลังสองน้อยที่สุด ประกอบด้วยสิ่งต่อไปนี้: เพื่อให้ได้ค่าประมาณพารามิเตอร์ดังกล่าวซึ่งผลรวมของกำลังสองของการเบี่ยงเบนของค่าจริงของตัวบ่งชี้ที่มีประสิทธิภาพ - y i จากค่าที่คำนวณได้ - มีค่าน้อยที่สุด
อย่างเป็นทางการ เกณฑ์ OLS สามารถเขียนได้ดังนี้: .

การจำแนกวิธีกำลังสองน้อยที่สุด

  1. วิธีกำลังสองน้อยที่สุด
  2. วิธีความเป็นไปได้สูงสุด (สำหรับแบบจำลองการถดถอยเชิงเส้นแบบคลาสสิกปกติความเป็นปกติของการถดถอยที่เหลือจะถูกตั้งสมมติฐาน)
  3. วิธี OLS กำลังสองน้อยที่สุดโดยทั่วไปใช้ในกรณีของความสัมพันธ์อัตโนมัติของข้อผิดพลาดและในกรณีของ heteroscedasticity
  4. วิธีการถ่วงน้ำหนักกำลังสองน้อยที่สุด (กรณีพิเศษของ OLS ที่มีสารตกค้างที่แตกต่างกัน)

ขอแสดงสาระสำคัญ วิธีการกำลังสองแบบคลาสสิกแบบกราฟิก... ในการทำเช่นนี้เราจะสร้างพล็อตจุดตามข้อมูลการสังเกต (x i, y i, i \u003d 1; n) ในระบบพิกัดสี่เหลี่ยม (พล็อตจุดดังกล่าวเรียกว่าฟิลด์สหสัมพันธ์) ลองหาเส้นตรงที่ใกล้กับจุดของสนามสหสัมพันธ์มากที่สุด ตามวิธีกำลังสองน้อยที่สุดเส้นจะถูกเลือกเพื่อให้ผลรวมของกำลังสองของระยะทางแนวตั้งระหว่างจุดของฟิลด์สหสัมพันธ์กับเส้นนี้จะน้อยที่สุด

บันทึกทางคณิตศาสตร์ของปัญหานี้: .
เรารู้ค่า y i และ x i \u003d 1 ... n ซึ่งเป็นข้อมูลเชิงสังเกต ในฟังก์ชัน S พวกมันคือค่าคงที่ ตัวแปรในฟังก์ชันนี้เป็นค่าประมาณพารามิเตอร์ที่จำเป็น -,. ในการหาค่าต่ำสุดของฟังก์ชัน 2 ตัวแปรจำเป็นต้องคำนวณอนุพันธ์ย่อยของฟังก์ชันนี้สำหรับแต่ละพารามิเตอร์และนำค่าดังกล่าวมาเทียบเคียงเป็นศูนย์นั่นคือ .
เป็นผลให้เราได้ระบบสมการเชิงเส้นปกติ 2 สมการ:
การแก้ระบบนี้เราพบค่าประมาณพารามิเตอร์ที่ต้องการ:

ความถูกต้องของการคำนวณพารามิเตอร์ของสมการการถดถอยสามารถตรวจสอบได้โดยการเปรียบเทียบผลรวม (อาจมีความคลาดเคลื่อนเนื่องจากการคำนวณปัดเศษ)
ในการคำนวณค่าประมาณพารามิเตอร์คุณสามารถสร้างตารางที่ 1
สัญลักษณ์ของค่าสัมประสิทธิ์การถดถอย b บ่งบอกทิศทางของความสัมพันธ์ (ถ้า b\u003e 0 ความสัมพันธ์จะตรงถ้า b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
ตามปกติค่าของพารามิเตอร์ a คือค่าเฉลี่ยของ y ที่ x เท่ากับศูนย์ หากแอตทริบิวต์แฟกเตอร์ไม่มีและไม่สามารถมีค่าเป็นศูนย์ได้แสดงว่าการตีความพารามิเตอร์ a ข้างต้นไม่สมเหตุสมผล

การประเมินความหนาแน่นของความสัมพันธ์ระหว่างสัญญาณ ดำเนินการโดยใช้ค่าสัมประสิทธิ์ของสหสัมพันธ์คู่เชิงเส้น - r x, y สามารถคำนวณได้โดยใช้สูตร: ... นอกจากนี้ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่สามารถกำหนดได้จากค่าสัมประสิทธิ์การถดถอย b: .
ช่วงของค่าที่ยอมรับได้ของสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้นคือตั้งแต่ –1 ถึง +1 สัญลักษณ์ของค่าสัมประสิทธิ์สหสัมพันธ์บ่งบอกทิศทางของลิงค์ ถ้า r x, y\u003e 0 แสดงว่าการเชื่อมต่อโดยตรง ถ้า r x, y<0, то связь обратная.
หากค่าสัมประสิทธิ์นี้ใกล้เคียงกับค่าสัมบูรณ์ความสัมพันธ์ระหว่างคุณลักษณะสามารถตีความได้ว่าเป็นค่าเชิงเส้นที่ค่อนข้างใกล้เคียง ถ้าโมดูลัสของมันมีค่าเท่ากับหนึ่งê r x, y ê \u003d 1 การเชื่อมต่อระหว่างคุณสมบัติจะเป็นเชิงเส้น หากคุณสมบัติ x และ y เป็นอิสระเชิงเส้นดังนั้น r x, y จะใกล้เคียงกับ 0
ในการคำนวณ r x, y คุณยังสามารถใช้ตารางที่ 1

ในการประเมินคุณภาพของสมการการถดถอยที่ได้รับค่าสัมประสิทธิ์การกำหนดทางทฤษฎีจะถูกคำนวณ - R 2 yx:

,
โดยที่ d 2 คือความแปรปรวน y อธิบายโดยสมการถดถอย
e 2 - ส่วนที่เหลือ (ไม่ได้อธิบายโดยสมการถดถอย) ความแปรปรวน y;
s 2 y คือผลต่างทั้งหมด (ทั้งหมด) ของ y
ค่าสัมประสิทธิ์ของการกำหนดเป็นลักษณะของสัดส่วนของความแปรปรวน (ความแปรปรวน) ของลักษณะที่มีประสิทธิผล y อธิบายโดยการถดถอย (และด้วยเหตุนี้ปัจจัย x) ในความแปรปรวนทั้งหมด (ความแปรปรวน) y ค่าสัมประสิทธิ์ของการกำหนด R 2 yx รับค่าตั้งแต่ 0 ถึง 1 ดังนั้นค่า 1-R 2 yx จะแสดงลักษณะของสัดส่วนของความแปรปรวน y ที่เกิดจากอิทธิพลของปัจจัยอื่น ๆ ที่ไม่ได้นำมาพิจารณาในข้อผิดพลาดของแบบจำลองและข้อกำหนด
ด้วยการถดถอยเชิงเส้นคู่ R 2 yx \u003d r 2 yx

งานหลักสูตร

การประมาณฟังก์ชันกำลังสองน้อยที่สุด


บทนำ

การประมาณคณิตศาสตร์เชิงประจักษ์

จุดมุ่งหมายของหลักสูตรนี้คือการเพิ่มพูนความรู้ด้านวิทยาการคอมพิวเตอร์พัฒนาและรวบรวมทักษะในการทำงานกับโปรแกรมประมวลผลสเปรดชีต Microsoft Excel และ MathCAD การประยุกต์ใช้ในการแก้ปัญหาโดยใช้คอมพิวเตอร์จากสาขาวิชาที่เกี่ยวข้องกับการวิจัย

ในแต่ละงานจะมีการกำหนดเงื่อนไขของปัญหาข้อมูลเริ่มต้นรูปแบบการออกผลลัพธ์การอ้างอิงทางคณิตศาสตร์หลักในการแก้ปัญหาจะถูกระบุการคำนวณการควบคุมช่วยให้คุณมั่นใจได้ว่าโปรแกรมทำงานอย่างถูกต้อง

แนวคิดของการประมาณคือการแสดงออกโดยประมาณของวัตถุทางคณิตศาสตร์ใด ๆ (เช่นตัวเลขหรือฟังก์ชัน) ผ่านทางอื่น ๆ ที่ง่ายกว่าใช้สะดวกกว่าหรือรู้จักกันดี ในการวิจัยทางวิทยาศาสตร์การประมาณใช้เพื่ออธิบายวิเคราะห์สรุปและใช้ผลเชิงประจักษ์เพิ่มเติม

ดังที่คุณทราบอาจมีความสัมพันธ์ (เชิงฟังก์ชัน) ที่แน่นอนระหว่างปริมาณเมื่อค่าหนึ่งของอาร์กิวเมนต์สอดคล้องกับค่าที่แน่นอนหนึ่งค่าและความสัมพันธ์ (สหสัมพันธ์) ที่มีความแม่นยำน้อยกว่าเมื่อค่าเฉพาะหนึ่งของอาร์กิวเมนต์สอดคล้องกับค่าโดยประมาณหรือชุดค่าของฟังก์ชันที่ใกล้เคียงกันมากหรือน้อย ซึ่งกันและกัน. เมื่อทำการวิจัยทางวิทยาศาสตร์การประมวลผลผลการสังเกตหรือการทดลองมักจะต้องจัดการกับตัวเลือกที่สอง เมื่อศึกษาการพึ่งพาเชิงปริมาณของตัวบ่งชี้ต่างๆค่าที่กำหนดโดยเชิงประจักษ์ตามกฎแล้วมีความแปรปรวนบางอย่าง ส่วนหนึ่งถูกกำหนดโดยความแตกต่างของวัตถุที่ศึกษาของไม่มีชีวิตและโดยเฉพาะอย่างยิ่งธรรมชาติของสิ่งมีชีวิตส่วนหนึ่งมาจากข้อผิดพลาดในการสังเกตและการประมวลผลเชิงปริมาณของวัสดุ องค์ประกอบสุดท้ายไม่สามารถแยกออกได้ทั้งหมดเสมอไปสามารถลดขนาดได้โดยการเลือกวิธีการวิจัยที่เหมาะสมและความถูกต้องของงานอย่างรอบคอบ

ผู้เชี่ยวชาญในสาขาระบบอัตโนมัติของกระบวนการทางเทคโนโลยีและอุตสาหกรรมจัดการกับข้อมูลการทดลองจำนวนมากซึ่งใช้คอมพิวเตอร์ในการประมวลผล ข้อมูลเริ่มต้นและผลการคำนวณที่ได้รับสามารถนำเสนอในรูปแบบตารางโดยใช้ตัวประมวลผลสเปรดชีต (สเปรดชีต) และโดยเฉพาะอย่างยิ่ง Excel การเรียนการสอนในวิชาวิทยาการคอมพิวเตอร์ช่วยให้นักเรียนสามารถรวบรวมและพัฒนาทักษะการทำงานโดยใช้เทคโนโลยีคอมพิวเตอร์ขั้นพื้นฐานในการแก้ปัญหาในสาขากิจกรรมระดับมืออาชีพ - ระบบพีชคณิตของคอมพิวเตอร์จากชั้นเรียนของระบบคอมพิวเตอร์ช่วยออกแบบที่เน้นการจัดทำเอกสารโต้ตอบด้วยการคำนวณและการสนับสนุนด้วยภาพมีความโดดเด่นด้วยความสะดวกในการใช้งานและการประยุกต์ใช้ สำหรับการทำงานเป็นทีม


1. ข้อมูลทั่วไป


บ่อยครั้งมากโดยเฉพาะอย่างยิ่งเมื่อวิเคราะห์ข้อมูลเชิงประจักษ์จำเป็นต้องหาความสัมพันธ์เชิงฟังก์ชันระหว่างค่าในรูปแบบที่ชัดเจน x และ ที่ซึ่งได้มาจากการวัด

ในการศึกษาวิเคราะห์ความสัมพันธ์ระหว่างสองปริมาณ x และ y มีการสังเกตจำนวนหนึ่งและผลลัพธ์คือตารางค่า:


xx1 x1 xผมXnปป1 1 ผมn

ตารางนี้มักได้มาจากการทดลองบางอย่างซึ่ง x, (ค่าอิสระ) กำหนดโดยผู้ทดลองและ y, ได้รับจากประสบการณ์ ดังนั้นค่าเหล่านี้ y,จะเรียกว่าค่าเชิงประจักษ์หรือเชิงทดลอง

มีความสัมพันธ์เชิงฟังก์ชันระหว่างค่า x และ y แต่รูปแบบการวิเคราะห์มักไม่เป็นที่รู้จักดังนั้นงานที่สำคัญในทางปฏิบัติจึงเกิดขึ้น - เพื่อหาสูตรเชิงประจักษ์


y \u003d(x; ก 1, ก 2, …, อม ), (1)


(ที่ไหน 1 , ก2 , …, ก - พารามิเตอร์) ซึ่งเป็นค่าที่ x \u003d x, อาจแตกต่างจากค่าการทดลองเล็กน้อย y, (ผม \u003d 1,2,…, p).

โดยปกติจะระบุคลาสของฟังก์ชัน (เช่นชุดของลิเนียร์เอกซ์โพเนนเชียลเอ็กซ์โพเนนเชียล ฯลฯ ) ซึ่งฟังก์ชันถูกเลือก f (x)จากนั้นจึงกำหนดค่าที่ดีที่สุดของพารามิเตอร์

ถ้าเป็นสูตรเชิงประจักษ์ (1) เราจะแทนที่ค่าเริ่มต้น x, จากนั้นเราจะได้ค่าทางทฤษฎี

ทีผม \u003d ฉ (xผม; ก 1, ก 2……) ที่ไหน ผม \u003d 1,2,…, n.


ความแตกต่าง ผมที - ที่ผม, เรียกว่าการเบี่ยงเบนและแสดงถึงระยะทางแนวตั้งจากจุด ผม ไปยังกราฟฟังก์ชันเชิงประจักษ์

ตามวิธีการกำลังสองน้อยค่าสัมประสิทธิ์ที่ดีที่สุด 1 , ก2 , …, ก คือค่าที่ผลรวมของกำลังสองของส่วนเบี่ยงเบนของฟังก์ชันเชิงประจักษ์ที่พบจากค่าที่กำหนดของฟังก์ชัน



จะน้อยที่สุด

ให้เราอธิบายความหมายทางเรขาคณิตของวิธีกำลังสองน้อยที่สุด

ตัวเลขแต่ละคู่ ( xผม, ผม) จากตารางต้นทางกำหนดจุด ผม บนพื้นผิว XOY ใช้สูตร (1) สำหรับค่าสัมประสิทธิ์ที่แตกต่างกัน 1 , ก2 , …, ก สามารถพล็อตชุดของเส้นโค้งซึ่งเป็นกราฟของฟังก์ชัน (1) งานคือการกำหนดค่าสัมประสิทธิ์ 1 , ก2 , …, กเพื่อให้ผลรวมของกำลังสองของระยะทางแนวตั้งห่างจากจุด ผม (xผม, ผม) ก่อนกราฟของฟังก์ชัน (1) มีค่าน้อยที่สุด (รูปที่ 1)



การสร้างสูตรเชิงประจักษ์ประกอบด้วยสองขั้นตอน: ค้นหารูปแบบทั่วไปของสูตรนี้และกำหนดพารามิเตอร์ที่ดีที่สุด

ถ้าลักษณะของความสัมพันธ์ระหว่างค่าที่กำหนดของ x และ จากนั้นประเภทของการพึ่งพาเชิงประจักษ์นั้นเป็นไปตามอำเภอใจ การตั้งค่าให้กับสูตรง่ายๆที่มีความแม่นยำดี การเลือกสูตรเชิงประจักษ์ที่ประสบความสำเร็จส่วนใหญ่ขึ้นอยู่กับความรู้ของผู้วิจัยในสาขาวิชาโดยใช้ซึ่งเขาสามารถระบุระดับของฟังก์ชันจากการพิจารณาทางทฤษฎี สิ่งที่สำคัญอย่างยิ่งคือภาพของข้อมูลที่ได้รับในคาร์ทีเซียนหรือในระบบพิกัดพิเศษ (กึ่งลอการิทึมลอการิทึม ฯลฯ ) ตามตำแหน่งของจุดเราสามารถคาดเดารูปแบบทั่วไปของการพึ่งพาได้โดยการสร้างความคล้ายคลึงกันระหว่างกราฟที่ลงจุดและตัวอย่างของเส้นโค้งที่รู้จัก

การกำหนดอัตราต่อรองที่ดีที่สุด 1 , ก2,…, รวมอยู่ในสูตรเชิงประจักษ์ผลิตโดยวิธีการวิเคราะห์ที่รู้จักกันดี

ในการหาชุดของสัมประสิทธิ์ก 1 , ก2 … .. ก, ซึ่งให้ค่าต่ำสุดของฟังก์ชัน S ที่กำหนดโดยสูตร (2) เราใช้เงื่อนไขที่จำเป็นสำหรับส่วนปลายสุดของฟังก์ชันของตัวแปรหลายตัว - ความเท่าเทียมกันเป็นศูนย์ของอนุพันธ์ย่อย

เป็นผลให้เราได้รับระบบปกติสำหรับกำหนดค่าสัมประสิทธิ์ ผม (ผม \u003d 1,2,…, ม.):



ดังนั้นการหาค่าสัมประสิทธิ์ ผม ลดการแก้ระบบ (3) ระบบนี้จะทำให้ง่ายขึ้นถ้าสูตรเชิงประจักษ์ (1) เป็นเส้นตรงเทียบกับพารามิเตอร์ ผมจากนั้นระบบ (3) จะเป็นแบบเส้นตรง


1.1 การพึ่งพาเชิงเส้น


รูปแบบเฉพาะของระบบ (3) ขึ้นอยู่กับคลาสของสูตรเชิงประจักษ์ที่เรากำลังมองหาการพึ่งพา (1) ในกรณีของการพึ่งพาเชิงเส้น y \u003d a1 + ก2 x ระบบ (3) จะอยู่ในรูปแบบ:


ระบบเชิงเส้นนี้สามารถแก้ไขได้ด้วยวิธีการใด ๆ ที่รู้จัก (วิธีเกาส์การทำซ้ำอย่างง่ายสูตรของ Cramer)


1.2 การพึ่งพากำลังสอง


ในกรณีของการพึ่งพากำลังสอง y \u003d a1 + ก2 x + ก3x 2 ระบบ (3) จะอยู่ในรูปแบบ:



1.3 การพึ่งพาเอกซ์โปเนนเชียล


ในบางกรณีเป็นสูตรเชิงประจักษ์ฟังก์ชันจะถูกนำมาซึ่งค่าสัมประสิทธิ์ที่ไม่ได้กำหนดจะป้อนแบบไม่เชิงเส้น ยิ่งไปกว่านั้นบางครั้งปัญหาอาจเป็นเชิงเส้นได้เช่น ลดเป็นเชิงเส้น การพึ่งพาดังกล่าวรวมถึงการพึ่งพาแบบเอ็กซ์โปเนนเชียล


y \u003d a1 * จa2x (6)


ที่ไหน 1 และ 2อัตราส่วนที่ไม่ได้กำหนด

การทำให้เป็นเส้นตรงทำได้โดยการหาลอการิทึมของความเท่าเทียมกัน (6) หลังจากนั้นเราจะได้ความสัมพันธ์

ln y \u003d ln ก 1 + ก 2x (7)


เราหมายถึง ln ที่ และ ln x ตามลำดับถึง t และ จากนั้นการพึ่งพา (6) สามารถเขียนเป็น t \u003d a1 + ก2 xซึ่งช่วยให้เราสามารถใช้สูตร (4) กับการแทนที่ได้ 1 บน และ ที่ผม บน tผม


1.4 องค์ประกอบของทฤษฎีสหสัมพันธ์


กู้คืนกราฟการพึ่งพาการทำงาน y (x) ตามผลการวัด (x ผม, ที่ผม), ผม \u003d 1,2, K, n เรียกว่าเส้นโค้งการถดถอย ในการตรวจสอบข้อตกลงของเส้นโค้งการถดถอยที่สร้างขึ้นกับผลการทดลองมักจะนำลักษณะเชิงตัวเลขดังต่อไปนี้: ค่าสัมประสิทธิ์สหสัมพันธ์ (การพึ่งพาเชิงเส้น) อัตราส่วนสหสัมพันธ์และค่าสัมประสิทธิ์ของการกำหนด ในกรณีนี้ผลลัพธ์มักจะถูกจัดกลุ่มและนำเสนอในรูปแบบของตารางสหสัมพันธ์ แต่ละเซลล์ของตารางนี้ประกอบด้วยตัวเลข niJ - คู่เหล่านั้น (x, y)ซึ่งส่วนประกอบอยู่ในช่วงการจัดกลุ่มที่เหมาะสมสำหรับแต่ละตัวแปร สมมติว่าความยาวของช่วงการจัดกลุ่ม (สำหรับแต่ละตัวแปร) เท่ากับศูนย์ x ผม (ตามลำดับ ที่ผม) ของช่วงเวลาเหล่านี้และจำนวน niJ- เป็นพื้นฐานสำหรับการคำนวณ

ค่าสัมประสิทธิ์สหสัมพันธ์เป็นการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่มตาม: โดยเฉลี่ยแล้วตัวแปรตัวใดตัวหนึ่งสามารถแสดงเป็นฟังก์ชันเชิงเส้นของอีกตัวแปรหนึ่งได้ดีเพียงใด

ค่าสัมประสิทธิ์สหสัมพันธ์คำนวณโดยใช้สูตร:


ที่ไหนและคือค่าเฉลี่ยเลขคณิตตามลำดับ x และ ที่.

ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่มในค่าสัมบูรณ์ไม่เกิน 1 ยิ่งใกล้ | p | ถึง 1 ยิ่งความสัมพันธ์เชิงเส้นระหว่าง x และ ที่.

ในกรณีของความสัมพันธ์แบบไม่เชิงเส้นค่าเฉลี่ยตามเงื่อนไขจะอยู่ใกล้เส้นโค้ง ในกรณีนี้ขอแนะนำให้ใช้อัตราส่วนสหสัมพันธ์เป็นลักษณะของความแข็งแรงของพันธะซึ่งการตีความไม่ได้ขึ้นอยู่กับประเภทของการพึ่งพาที่ศึกษา

อัตราส่วนสหสัมพันธ์คำนวณโดยสูตร:



ที่ไหน nผม = , n \u003d และตัวเศษแสดงลักษณะการกระจายตัวของวิธีการตามเงื่อนไข y, ใกล้ค่าเฉลี่ยที่ไม่มีเงื่อนไข .

เสมอ. ความเท่าเทียมกัน = 0 สอดคล้องกับค่าสุ่มที่ไม่สัมพันธ์กัน = 1 ในกรณีที่มีการเชื่อมต่อการทำงานที่แน่นอนระหว่าง และ x ในกรณีของการพึ่งพาเชิงเส้น ของ x อัตราส่วนสหสัมพันธ์เกิดขึ้นพร้อมกับกำลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ ปริมาณ - ? 2 ใช้เป็นตัวบ่งชี้ความเบี่ยงเบนจากการถดถอยเชิงเส้น

อัตราส่วนสหสัมพันธ์เป็นตัวชี้วัดความสัมพันธ์ จาก x ในรูปแบบใด ๆ แต่ไม่สามารถให้ความคิดเกี่ยวกับระดับความใกล้ชิดของข้อมูลเชิงประจักษ์กับรูปแบบพิเศษได้ เพื่อค้นหาว่าเส้นโค้งที่พล็อตสะท้อนข้อมูลเชิงประจักษ์ได้แม่นยำเพียงใดจึงมีการนำเสนอลักษณะอื่น - สัมประสิทธิ์ของดีเทอร์มินิซึม

เพื่ออธิบายให้พิจารณาปริมาณต่อไปนี้ คือผลรวมของกำลังสองซึ่งค่าเฉลี่ยอยู่ที่ไหน

หนึ่งสามารถพิสูจน์ความเท่าเทียมกันดังต่อไปนี้

เทอมแรกเท่ากับ Sres \u003d และเรียกว่าผลรวมที่เหลือของกำลังสอง เป็นการระบุลักษณะของการเบี่ยงเบนของการทดลองจากทางทฤษฎี

คำที่สองมีค่าเท่ากับ Sregr \u003d 2 และเรียกว่าผลรวมการถดถอยของกำลังสองและกำหนดลักษณะการแพร่กระจายของข้อมูล

เห็นได้ชัดว่าความเท่าเทียมกันดังต่อไปนี้ S เต็ม \u003d ost + ส regr.

ค่าสัมประสิทธิ์ของดีเทอร์มินิซึมถูกกำหนดโดยสูตร:



ผลรวมของกำลังสองที่เหลือน้อยกว่าเมื่อเทียบกับผลรวมของกำลังสองค่าของสัมประสิทธิ์ของดีเทอร์มินิซึมก็จะยิ่งมากขึ้นเท่านั้น 2 ซึ่งแสดงให้เห็นว่าสมการถดถอยอธิบายความสัมพันธ์ระหว่างตัวแปรได้ดีเพียงใด ถ้ามันเท่ากับ 1 แสดงว่ามีความสัมพันธ์อย่างสมบูรณ์กับโมเดลนั่นคือ ไม่มีความแตกต่างระหว่างค่า y จริงและค่าโดยประมาณ มิฉะนั้นถ้าค่าสัมประสิทธิ์ของดีเทอร์มินิซึมเป็น 0 สมการถดถอยจะไม่สามารถทำนายค่าของ y ได้

ค่าสัมประสิทธิ์ของดีเทอร์มินิซึมไม่เกินอัตราส่วนสหสัมพันธ์เสมอไป ในกรณีที่เกิดความเท่าเทียมกัน 2 \u003d จึงถือได้ว่าสูตรเชิงประจักษ์ที่สร้างขึ้นนั้นสะท้อนข้อมูลเชิงประจักษ์ได้อย่างแม่นยำที่สุด


2. คำชี้แจงของปัญหา


1. ใช้วิธีกำลังสองน้อยที่สุดฟังก์ชันที่กำหนดในตารางโดยประมาณ

ก) พหุนามของระดับแรก

b) พหุนามของระดับที่สอง

c) การพึ่งพาเลขชี้กำลัง

คำนวณค่าสัมประสิทธิ์ของปัจจัยสำหรับการพึ่งพาแต่ละครั้ง

คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ (เฉพาะในกรณีก)

วาดเส้นแนวโน้มสำหรับการพึ่งพาแต่ละครั้ง

ใช้ฟังก์ชัน LINEST คำนวณลักษณะเชิงตัวเลขของการพึ่งพา

เปรียบเทียบการคำนวณของคุณกับผลลัพธ์ที่ได้โดยใช้ LINEST

สรุปว่าสูตรใดที่ได้รับใกล้เคียงกับฟังก์ชันมากที่สุด

เขียนโปรแกรมด้วยภาษาโปรแกรมภาษาใดภาษาหนึ่งและเปรียบเทียบผลการนับกับที่ได้รับข้างต้น


3. ข้อมูลเริ่มต้น


ฟังก์ชันถูกกำหนดไว้ในรูปที่ 1



4. การคำนวณค่าประมาณใน Excel ตัวประมวลผลสเปรดชีต


สำหรับการคำนวณขอแนะนำให้ใช้สเปรดชีต Microsoft Excel และจัดเรียงข้อมูลดังรูปที่ 2.



ในการดำเนินการนี้ให้ป้อน:

· ในเซลล์ A6: A30 เราป้อนค่า xi .

· ในเซลล์ B6: B30 เราป้อนค่าของуi .

· ในเซลล์ C6 เราป้อนสูตร \u003d A6 ^ 2.

· สูตรนี้คัดลอกไปยังเซลล์ C7: C30

· ในเซลล์ D6 ป้อนสูตร \u003d A6 * B6

· สูตรนี้ถูกคัดลอกไปยังเซลล์ D7: D30

· ในเซลล์ F6 ให้ป้อนสูตร \u003d A6 ^ 4

· ในเซลล์ F7: F30 คัดลอกสูตรนี้

· ในเซลล์ G6 ให้ป้อนสูตร \u003d A6 ^ 2 * B6

· สูตรนี้จะถูกคัดลอกไปยังเซลล์ G7: G30

· ในเซลล์ H6 ให้ป้อนสูตร \u003d LN (B6)

· สูตรนี้ถูกคัดลอกไปยังเซลล์ H7: H30

· ในเซลล์ I6 ให้ป้อนสูตร \u003d A6 * LN (B6)

· ในเซลล์ I7: I30 คัดลอกสูตรนี้ ขั้นตอนต่อไปทำได้โดยใช้ autosum

· ในเซลล์ A33 ให้ป้อนสูตร \u003d SUM (A6: A30)

· ในเซลล์ B33 ให้ป้อนสูตร \u003d SUM (B6: B30)

· ในเซลล์ C33 ให้ป้อนสูตร \u003d SUM (C6: C30)

· ในเซลล์ D33 ให้ป้อนสูตร \u003d SUM (D6: D30)

· ในเซลล์ E33 ให้ป้อนสูตร \u003d SUM (E6: E30)

· ในเซลล์ F33 ให้ป้อนสูตร \u003d SUM (F6: F30)

· ในเซลล์ G33 ให้ป้อนสูตร \u003d SUM (G6: G30)

· ในเซลล์ H33 ให้ป้อนสูตร \u003d SUM (H6: H30)

· ในเซลล์ I33 ให้ป้อนสูตร \u003d SUM (I6: I30)

เราประมาณฟังก์ชั่น y \u003d ฉ (x) ฟังก์ชันเชิงเส้น y \u003d a1 + ก2x. เพื่อหาค่าสัมประสิทธิ์ก 1 และก 2 เราใช้ระบบ (4) ใช้ผลรวมทั้งหมดของตารางที่ 2 ที่อยู่ในเซลล์ A33, B33, C33 และ D33 เราเขียนระบบ (4) ในรูปแบบ



แก้ซึ่งเราได้ 1 \u003d -24.7164 และ a2 = 11,63183

ดังนั้นการประมาณเชิงเส้นจึงมีรูปแบบ y \u003d -24.7164 + 11.63183x (12)

ระบบ (11) ได้รับการแก้ไขโดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์จะแสดงในรูปที่ 3:



ตารางในเซลล์ A38: B39 มีสูตร (\u003d MOBR (A35: B36)) เซลล์ E38: E39 ประกอบด้วยสูตร (\u003d MULTIPLE (A38: B39, C35: C36))


ต่อไปเราจะประมาณฟังก์ชัน y \u003d ฉ (x) ฟังก์ชันกำลังสอง y \u003d a1 + ก2 x + ก3 x2... เพื่อกำหนดค่าสัมประสิทธิ์ก 1, ก 2 และก 3 เราใช้ระบบ (5) จากผลรวมของตารางที่ 2 ซึ่งอยู่ในเซลล์ A33, B33, C33, D33, E33, F33 และ G33 เราเขียนระบบ (5) ดังนี้



เมื่อแก้ไขแล้วเราจะได้ไฟล์ 1 \u003d 1.580946, ก 2 \u003d -0.60819 และ a3 = 0,954171 (14)

ดังนั้นการประมาณกำลังสองคือ:

y \u003d 1.580946 -0.60819x + 0.954171 x2

ระบบ (13) ได้รับการแก้ไขโดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์จะแสดงในรูปที่ 4



ตารางในเซลล์ A46: C48 มีสูตร (\u003d MOBR (A41: C43)) เซลล์ F46: F48 มีสูตร (\u003d MULTIPLE (A41: C43, D46: D48))

ตอนนี้เราประมาณฟังก์ชัน y \u003d ฉ (x) ฟังก์ชันเอกซ์โพเนนเชียล y \u003d a1 a2x. เพื่อกำหนดค่าสัมประสิทธิ์ 1 และ 2 ลอการิทึมค่า ผม และใช้ผลรวมของตาราง 2 ที่อยู่ในเซลล์ A26, C26, H26 และ I26 เราได้รับระบบ:



ที่ไหน c \u003d ln (ก1 ).

เราพบระบบการแก้ปัญหา (10) c \u003d 0.506435, a2 = 0.409819.

หลังจากการเพิ่มพลังเราจะได้ a1 = 1,659365.

ดังนั้นการประมาณเลขชี้กำลังจึงมีรูปแบบ y \u003d 1.659365 * จ0.4098194x

ระบบ (15) ได้รับการแก้ไขโดยใช้เครื่องมือ Microsoft Excel ผลลัพธ์จะแสดงในรูปที่ 5


ตารางในเซลล์ A55: B56 มีสูตร (\u003d MOBR (A51: B52)) เซลล์ E54: E56 ประกอบด้วยสูตร (\u003d MULTIPLE (A51: B52, C51: C52)) เซลล์ E56 มีสูตร \u003d EXP (E54)

เราคำนวณค่าเฉลี่ยเลขคณิตของ x และ y ตามสูตร:



ผลลัพธ์ของการคำนวณ x และ เครื่องมือ Microsoft Excel แสดงในรูปที่ 6



เซลล์ B58 มีสูตร \u003d A33 / 25 เซลล์ B59 มีสูตร \u003d B33 / 25

ตารางที่ 2


ให้เราอธิบายว่าตารางในรูปที่ 7 ถูกรวบรวมอย่างไร

เซลล์ A6: A33 และ B6: B33 ถูกกรอกข้อมูลแล้ว (ดูรูปที่ 2)

· ในเซลล์ J6 ให้ป้อนสูตร \u003d (A6- $ B $ 58) * (B6- $ B $ 59)

· สูตรนี้คัดลอกไปยังเซลล์ J7: J30

· ในเซลล์ K6 เราป้อนสูตร \u003d (A6- $ B $ 58) ^ 2.

· ในเซลล์ K7: K30 คัดลอกสูตรนี้

· ในเซลล์ L6 ให้ป้อนสูตร \u003d (B1- $ B $ 59) ^ 2

· สูตรนี้จะคัดลอกไปยังเซลล์ L7: L30

· ในเซลล์ M6 ให้ป้อนสูตร \u003d ($ E $ 38 + $ E $ 39 * A6-B6) ^ 2

· สูตรนี้จะถูกคัดลอกไปยังเซลล์ M7: M30

· ในเซลล์ N6 ให้ป้อนสูตร \u003d ($ F $ 46 + $ F $ 47 * A6 + $ F $ 48 * A6 A6-B6) ^ 2

· ในเซลล์ N7: N30 คัดลอกสูตรนี้

· ในเซลล์ O6 ให้ป้อนสูตร \u003d ($ E $ 56 * EXP ($ E $ 55 * A6) - B6) ^ 2

· ในเซลล์ O7: O30 คัดลอกสูตรนี้

ขั้นตอนต่อไปทำได้โดยใช้การสรุปอัตโนมัติ

· ในเซลล์ J33 ให้ป้อนสูตร \u003d CYMM (J6: J30)

· ในเซลล์ K33 ให้ป้อนสูตร \u003d SUM (K6: K30)

· ในเซลล์ L33 ให้ป้อนสูตร \u003d CYMM (L6: L30)

· ในเซลล์ M33 ป้อนสูตร \u003d SUM (M6: M30)

· ในเซลล์ N33 ให้ป้อนสูตร \u003d SUM (N6: N30)

· ในเซลล์ O33 ให้ป้อนสูตร \u003d SUM (06: 030)

ตอนนี้ให้เราคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (8) (สำหรับการประมาณเชิงเส้นเท่านั้น) และค่าสัมประสิทธิ์ของดีเทอร์มินิซึมโดยใช้สูตร (10) ผลลัพธ์ของการคำนวณโดยใช้เครื่องมือ Microsoft Excel แสดงในรูปที่ 7



ในตารางที่ 8 เซลล์ B61 มีสูตร \u003d J33 / (K33 * L33 ^ (1/2) เซลล์ B62 มีสูตร \u003d 1 - M33 / L33 เซลล์ B63 มีสูตร \u003d 1 - N33 / L33 เซลล์ B64 ประกอบด้วย สูตร \u003d 1 - O33 / L33

การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณกำลังสองอธิบายข้อมูลการทดลองได้ดีที่สุด


4.1 การพล็อตกราฟใน Excel


เลือกเซลล์ A1: A25 จากนั้นหันไปหาตัวช่วยสร้างแผนภูมิ มาเลือกพล็อตกระจาย หลังจากสร้างแผนภาพแล้วให้คลิกขวาที่เส้นกราฟและเลือกเพื่อเพิ่มเส้นแนวโน้ม (เชิงเส้นเอกซ์โพเนนเชียลเลขชี้กำลังและพหุนามของระดับที่สองตามลำดับ)

พล็อต Linear Fit


พล็อตกำลังสองพอดี


พล็อตแบบเอกซ์โปเนนเชียล


5. การประมาณฟังก์ชันโดยใช้ MathCAD


การประมาณข้อมูลโดยคำนึงถึงพารามิเตอร์ทางสถิติหมายถึงปัญหาการถดถอย โดยปกติจะเกิดขึ้นในการประมวลผลข้อมูลการทดลองที่ได้จากการวัดกระบวนการหรือปรากฏการณ์ทางกายภาพที่มีลักษณะทางสถิติ (เช่นการวัดในรูปรังสีและธรณีฟิสิกส์นิวเคลียร์) หรือที่สัญญาณรบกวน (สัญญาณรบกวน) ในระดับสูง งานของการวิเคราะห์การถดถอยคือการเลือกสูตรทางคณิตศาสตร์ที่อธิบายข้อมูลการทดลองได้ดีที่สุด


.1 การถดถอยเชิงเส้น


การถดถอยเชิงเส้นในระบบ Mathcad ดำเนินการกับเวกเตอร์ของอาร์กิวเมนต์ X และนับ ฟังก์ชั่น:

สกัดกั้น (x, y) - คำนวณพารามิเตอร์ และ1 , การกระจัดในแนวตั้งของเส้นถดถอย (ดูรูปที่)

ความชัน (x, y) - คำนวณพารามิเตอร์ 2 , ความชันของเส้นถดถอย (ดูรูปที่)

y (x) \u003d a1 + a2 * x


ฟังก์ชัน คอร์ (y, y (x)) คำนวณ ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน ยิ่งอยู่ใกล้ 1, ข้อมูลที่ประมวลผลแล้วจะยิ่งตรงกับความสัมพันธ์เชิงเส้นมากขึ้นเท่านั้น (ดูภาพประกอบ)

.2 การถดถอยพหุนาม


การถดถอยพหุนามมิติเดียวที่มีระดับ n ของพหุนามโดยพลการและด้วยพิกัดโดยพลการของตัวอย่างใน Mathcad จะดำเนินการโดยฟังก์ชัน:

ถอยหลัง (x, y, n) - คำนวณเวกเตอร์ S, ซึ่งรวมถึงค่าสัมประสิทธิ์ AIพหุนาม n- ปริญญา;

ค่าสัมประสิทธิ์ AI สามารถดึงออกมาจากเวกเตอร์ ฟังก์ชัน subatrix (S, 3, ความยาว (S) - 1, 0, 0)

เราใช้ค่าที่ได้รับของสัมประสิทธิ์ในสมการถดถอย


y (x) \u003d a1 + a2 * x + a3 * x2 (ดูภาพ)

.3 การถดถอยแบบไม่เป็นเชิงเส้น


สำหรับสูตรการประมาณมาตรฐานอย่างง่ายจะมีฟังก์ชันการถดถอยแบบไม่เชิงเส้นจำนวนหนึ่งซึ่งโปรแกรม Mathcad จะเลือกพารามิเตอร์ของฟังก์ชัน

ซึ่งรวมถึงฟังก์ชัน expfit (x, y, s), ซึ่งจะส่งคืนเวกเตอร์ที่มีค่าสัมประสิทธิ์ a1, a2และ a3 ฟังก์ชันเลขชี้กำลัง

y (x) \u003d a1 ^ exp (a2x) + a3 เป็นเวกเตอร์ มีการนำค่าเริ่มต้นของสัมประสิทธิ์มาใช้ a1, a2และ a3 การประมาณครั้งแรก


สรุป


การวิเคราะห์ผลการคำนวณแสดงให้เห็นว่าการประมาณเชิงเส้นอธิบายข้อมูลการทดลองได้ดีที่สุด

ผลลัพธ์ที่ได้จากโปรแกรม MathCAD ตรงกับค่าที่ได้จาก Excel อย่างสมบูรณ์ สิ่งนี้บ่งชี้ความถูกต้องของการคำนวณ


บรรณานุกรม

  1. สารสนเทศศาสตร์: ตำรา / เอ็ด. ศ. N.V. Makarova มอสโก: การเงินและสถิติ 2007
  2. สารสนเทศศาสตร์: อบรมเชิงปฏิบัติการเรื่องเทคโนโลยีการทำงานบนคอมพิวเตอร์ / Under. เอ็ด. ศ. N.V. Makarova เอ็มการเงินและสถิติ, 2554
  3. เอ็น. Piskunov แคลคูลัสเชิงอนุพันธ์และปริพันธ์ 2553
  4. สารสนเทศศาสตร์การประมาณโดยวิธีกำลังสองน้อยแนวทางเซนต์ปีเตอร์สเบิร์ก 2552
กวดวิชา

ต้องการความช่วยเหลือในการสำรวจหัวข้อหรือไม่?

ผู้เชี่ยวชาญของเราจะให้คำแนะนำหรือให้บริการสอนพิเศษในหัวข้อที่คุณสนใจ
ส่งคำขอ พร้อมระบุหัวข้อในขณะนี้เพื่อค้นหาความเป็นไปได้ในการขอรับคำปรึกษา

วิธีกำลังสองน้อยที่สุด

ในบทเรียนสุดท้ายของหัวข้อเราจะทำความคุ้นเคยกับแอปพลิเคชันที่มีชื่อเสียงที่สุด FNPซึ่งเป็นแอปพลิเคชั่นที่กว้างที่สุดในสาขาวิทยาศาสตร์และการปฏิบัติต่างๆ อาจเป็นฟิสิกส์เคมีชีววิทยาเศรษฐศาสตร์สังคมวิทยาจิตวิทยาและอื่น ๆ และอื่น ๆ ตามความตั้งใจของโชคชะตาฉันมักจะต้องรับมือกับเศรษฐกิจดังนั้นวันนี้ฉันจะออกตั๋วให้คุณไปยังประเทศที่น่าตื่นตาตื่นใจที่เรียกว่า เศรษฐมิติ \u003d) ... ไม่อยากได้ไง! มันดีมากที่นั่น - คุณต้องตัดสินใจ! ... แต่สิ่งที่คุณต้องการแน่นอนคือเรียนรู้วิธีแก้ปัญหา กำลังสองน้อยที่สุด... และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันขันแข็งจะได้เรียนรู้วิธีการแก้ปัญหาไม่เพียง แต่ถูกต้อง แต่ยังรวดเร็วมาก ;-) แต่ก่อนอื่น คำชี้แจงปัญหาทั่วไป + ตัวอย่างที่เกี่ยวข้อง:

ปล่อยให้ในบางสาขาวิชามีการตรวจสอบตัวบ่งชี้ที่มีการแสดงออกเชิงปริมาณ ในเวลาเดียวกันมีเหตุผลทุกประการที่จะเชื่อว่าตัวบ่งชี้ขึ้นอยู่กับตัวบ่งชี้ สมมติฐานนี้อาจเป็นได้ทั้งสมมติฐานทางวิทยาศาสตร์และตามสามัญสำนึกเบื้องต้น อย่างไรก็ตามทิ้งวิทยาศาสตร์ไว้และสำรวจพื้นที่ที่น่ารับประทานมากขึ้นนั่นคือร้านขายของชำ ให้เราแสดงโดย:

- พื้นที่ร้านค้าปลีก, ตร.ม. ,
- มูลค่าการซื้อขายประจำปีของร้านขายของชำล้านรูเบิล

ค่อนข้างชัดเจนว่ายิ่งพื้นที่ของร้านมีขนาดใหญ่เท่าไหร่การหมุนเวียนของร้านก็จะมากขึ้นเท่านั้น

สมมติว่าหลังจากทำการสังเกต / ทดลอง / คำนวณ / เต้นรำด้วยรำมะนาแล้วเรามีข้อมูลตัวเลขที่เราจำหน่าย:

สำหรับร้านขายของชำฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านที่ 1 - ผลประกอบการประจำปี - พื้นที่ของร้านที่ 2 - การหมุนเวียนประจำปี ฯลฯ อย่างไรก็ตามไม่จำเป็นเลยที่จะต้องเข้าถึงวัสดุที่จัดประเภท - สามารถหาค่าประมาณมูลค่าการซื้อขายได้อย่างแม่นยำโดยใช้วิธีการ สถิติทางคณิตศาสตร์... อย่างไรก็ตามอย่าเพิ่งเสียสมาธิหลักสูตรการจารกรรมเชิงพาณิชย์ได้รับการชำระแล้ว \u003d)

ข้อมูลแบบตารางยังสามารถเขียนในรูปแบบของจุดและแสดงให้เราเห็นได้ตามปกติ ระบบคาร์ทีเซียน .

มาตอบคำถามสำคัญ: จำเป็นต้องใช้กี่คะแนนสำหรับการศึกษาเชิงคุณภาพ?

ใหญ่กว่าดีกว่า. ชุดขั้นต่ำที่อนุญาตประกอบด้วย 5-6 คะแนน นอกจากนี้ด้วยข้อมูลจำนวนเล็กน้อยตัวอย่างจึงไม่สามารถรวมผลลัพธ์ที่ "ผิดปกติ" ได้ ตัวอย่างเช่นร้านค้าชั้นนำขนาดเล็กสามารถช่วยได้ตามคำสั่งของ "เพื่อนร่วมงาน" ที่มีขนาดใหญ่กว่าจึงบิดเบือนรูปแบบทั่วไปที่ต้องหา



ค่อนข้างง่ายเราต้องเลือกฟังก์ชัน กำหนดการ ซึ่งผ่านเข้าใกล้จุดมากที่สุด ... ฟังก์ชันนี้เรียกว่า ประมาณ (การประมาณ - การประมาณ) หรือ ฟังก์ชันทางทฤษฎี ... โดยทั่วไปแล้ว "ผู้สมัคร" ที่ชัดเจนจะปรากฏขึ้นที่นี่ทันที - พหุนามระดับสูงซึ่งกราฟผ่านจุดทั้งหมด แต่ตัวเลือกนี้ทำได้ยากและมักจะไม่ถูกต้อง (เนื่องจากแผนภูมิมักจะ "บิด" และสะท้อนแนวโน้มหลักได้ไม่ดี).

ดังนั้นฟังก์ชันที่ต้องการควรเรียบง่ายเพียงพอและในขณะเดียวกันก็สะท้อนถึงการพึ่งพาอย่างเพียงพอ อย่างที่คุณอาจเดาได้ว่าหนึ่งในวิธีการค้นหาฟังก์ชันดังกล่าวเรียกว่า กำลังสองน้อยที่สุด... ก่อนอื่นมาดูสาระสำคัญในแง่ทั่วไป ให้บางฟังก์ชันประมาณข้อมูลการทดลอง:


วิธีการประเมินความถูกต้องของการประมาณนี้? ให้เราคำนวณความแตกต่าง (ค่าเบี่ยงเบน) ระหว่างค่าทดลองและค่าฟังก์ชัน (ศึกษาการวาดภาพ)... ความคิดแรกที่อยู่ในใจคือการประมาณว่าผลรวมมีขนาดใหญ่เพียงใด แต่ปัญหาคือความแตกต่างอาจเป็นลบได้ (เช่น, ) และการเบี่ยงเบนอันเป็นผลมาจากการรวมดังกล่าวจะยกเลิกซึ่งกันและกัน ดังนั้นเพื่อเป็นการประมาณความแม่นยำของการประมาณจึงขอให้ยอมรับผลรวม โมดูล การเบี่ยงเบน:

หรือยุบ: (ทันใดนั้นใครก็ไม่รู้: คือไอคอนผลรวมและ - ตัวแปรเสริม - "ตัวนับ" ซึ่งรับค่าตั้งแต่ 1 ถึง ) .

เมื่อเข้าใกล้จุดทดลองด้วยฟังก์ชันที่แตกต่างกันเราจะได้ค่าที่แตกต่างกันและเห็นได้ชัดว่าเมื่อใดที่ผลรวมน้อยกว่า - ฟังก์ชันนั้นมีความแม่นยำมากกว่า

วิธีการดังกล่าวมีอยู่และเรียกว่า วิธีโมดูลัสน้อยที่สุด... อย่างไรก็ตามในทางปฏิบัติได้แพร่หลายมากขึ้น วิธีกำลังสองน้อยที่สุดซึ่งค่าลบที่เป็นไปได้จะไม่ถูกกำจัดโดยโมดูลัส แต่โดยการยกกำลังสองส่วนเบี่ยงเบน:



หลังจากนั้นความพยายามจะถูกนำไปที่การเลือกฟังก์ชันดังกล่าวเพื่อให้ผลรวมของกำลังสองของการเบี่ยงเบน มีขนาดเล็กที่สุด จริงๆแล้วจึงเป็นชื่อของวิธีการ

และตอนนี้เรากลับไปยังจุดสำคัญอีกประการหนึ่งดังที่ระบุไว้ข้างต้นฟังก์ชันที่เลือกควรจะค่อนข้างเรียบง่าย - แต่ก็มีฟังก์ชั่นดังกล่าวมากมาย: เชิงเส้น , ไฮเพอร์โบลิก , เลขชี้กำลัง , ลอการิทึม , กำลังสอง เป็นต้น และแน่นอนที่นี่ฉันต้องการ "ลดกิจกรรม" ทันที เลือกฟังก์ชั่นคลาสใดสำหรับการวิจัย เคล็ดลับดั้งเดิม แต่มีประสิทธิภาพ:

- วิธีที่ง่ายที่สุดในการดึงคะแนน บนภาพวาดและวิเคราะห์ตำแหน่งของพวกเขา หากพวกเขามักจะเป็นเส้นตรงคุณควรมองหา สมการเส้นตรง ด้วยค่าที่เหมาะสมที่สุดและ. กล่าวอีกนัยหนึ่งภารกิจคือการหาสัมประสิทธิ์ของ SUCH - เพื่อให้ผลรวมของกำลังสองของการเบี่ยงเบนน้อยที่สุด

หากจุดตั้งอยู่เช่นพร้อม อติพจน์เห็นได้ชัดว่าฟังก์ชันเชิงเส้นจะให้ค่าประมาณที่ไม่ดี ในกรณีนี้เรากำลังมองหาค่าสัมประสิทธิ์ที่ "ดี" ที่สุดสำหรับสมการไฮเพอร์โบลา - สิ่งที่ให้ผลรวมขั้นต่ำของกำลังสอง .

ตอนนี้โปรดทราบว่าในทั้งสองกรณีเรากำลังพูดถึง ฟังก์ชันของสองตัวแปรซึ่งมีข้อโต้แย้ง พารามิเตอร์ของการอ้างอิงที่ต้องการ:

และในสาระสำคัญเราต้องแก้ปัญหามาตรฐาน - เพื่อค้นหา ฟังก์ชันขั้นต่ำของสองตัวแปร.

ลองจำตัวอย่างของเราสมมติว่าจุด "ร้านค้า" มักจะอยู่ในแนวเส้นตรงและมีเหตุผลทุกประการที่จะเชื่อว่า ความสัมพันธ์เชิงเส้น การหมุนเวียนจากพื้นที่ค้าปลีก ลองหาสัมประสิทธิ์ของ SUCH "a" และ "bs" เพื่อให้ผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุด ทุกอย่างเป็นไปตามปกติ - อันดับแรก อนุพันธ์ย่อยลำดับที่ 1... ตาม กฎเชิงเส้น คุณสามารถแยกความแตกต่างได้โดยตรงภายใต้ไอคอนจำนวนเงิน:

หากคุณต้องการใช้ข้อมูลนี้สำหรับเรียงความหรือหนังสือเรียนฉันจะขอบคุณมากสำหรับลิงก์ในรายการแหล่งข้อมูลคุณจะพบการคำนวณโดยละเอียดดังกล่าวในไม่กี่แห่ง:

มาสร้างระบบมาตรฐาน:

เราลดแต่ละสมการด้วย "สอง" และนอกจากนี้ "แยก" ผลรวม:

บันทึก : วิเคราะห์ด้วยตัวคุณเองว่าเหตุใดจึงสามารถนำ "a" และ "bh" ออกมาเป็นไอคอนผลรวมได้ โดยวิธีการนี้สามารถทำได้อย่างเป็นทางการด้วยผลรวม

มาเขียนระบบใหม่ในรูปแบบ "ใช้":

หลังจากนั้นอัลกอริทึมสำหรับการแก้ปัญหาของเราจะเริ่มขึ้น:

เรารู้พิกัดของจุดหรือไม่? พวกเรารู้. จำนวน เราสามารถหา? ได้อย่างง่ายดาย การแต่งที่ง่ายที่สุด ระบบสมการเชิงเส้นสองตัวแปรที่ไม่รู้จัก("A" และ "bh") เราแก้ระบบเช่น วิธีการของ Cramerซึ่งเป็นผลมาจากการที่เราได้รับจุดหยุดนิ่ง กำลังตรวจสอบ สภาพที่เพียงพอสำหรับแขนขาเราสามารถตรวจสอบได้ว่า ณ จุดนี้เป็นฟังก์ชัน บรรลุอย่างแน่นอน ขั้นต่ำ... การยืนยันเกี่ยวข้องกับการคำนวณเพิ่มเติมดังนั้นเราจะทิ้งไว้เบื้องหลัง (หากจำเป็นสามารถดูเฟรมที่ขาดหายไปได้ที่นี่ ) ... เราได้ข้อสรุปสุดท้าย:

ฟังก์ชัน วิธีที่ดีที่สุด (อย่างน้อยเมื่อเทียบกับฟังก์ชันเชิงเส้นอื่น ๆ ) นำประเด็นการทดลองเข้ามาใกล้ ... กล่าวโดยคร่าวๆกราฟของมันจะเข้าใกล้จุดเหล่านี้มากที่สุด ตามประเพณี เศรษฐมิติฟังก์ชันการประมาณที่เป็นผลลัพธ์เรียกอีกอย่างว่า สมการถดถอยเชิงเส้นคู่ .

ปัญหาที่กำลังพิจารณามีความสำคัญในทางปฏิบัติอย่างยิ่ง ในสถานการณ์ด้วยตัวอย่างของเราสมการ ช่วยให้คุณสามารถคาดเดาได้ว่ามีการหมุนเวียนเท่าใด ("เกม") จะอยู่ที่ร้านค้าโดยมีมูลค่าหนึ่งหรือค่าอื่นของพื้นที่ค้าปลีก (นี่หรือค่านั้น "x")... ใช่การคาดการณ์ที่ได้รับจะเป็นเพียงการคาดการณ์ แต่ในหลาย ๆ กรณีการคาดการณ์จะค่อนข้างแม่นยำ

ฉันจะวิเคราะห์ปัญหาเดียวด้วยตัวเลข "จริง" เนื่องจากไม่มีปัญหาใด ๆ - การคำนวณทั้งหมดอยู่ในระดับของหลักสูตรโรงเรียนประถมศึกษาปีที่ 7-8 ใน 95 เปอร์เซ็นต์ของกรณีคุณจะถูกขอให้ค้นหาเพียงฟังก์ชันเชิงเส้น แต่ในตอนท้ายของบทความฉันจะแสดงให้เห็นว่าการหาสมการของไฮเพอร์โบลาเลขชี้กำลังและฟังก์ชันอื่น ๆ ที่เหมาะสมนั้นไม่ยากเลย

ในความเป็นจริงมันยังคงแจกขนมปังที่สัญญาไว้ - เพื่อที่คุณจะได้เรียนรู้วิธีแก้ตัวอย่างดังกล่าวไม่เพียง แต่ถูกต้อง แต่ยังรวดเร็ว เราศึกษามาตรฐานอย่างรอบคอบ:

งาน

จากการศึกษาความสัมพันธ์ระหว่างตัวบ่งชี้ทั้งสองจึงได้คู่ของตัวเลขต่อไปนี้:

ใช้วิธีกำลังสองน้อยที่สุดค้นหาฟังก์ชันเชิงเส้นที่ใกล้เคียงกับเชิงประจักษ์ได้ดีที่สุด (มีประสบการณ์) ข้อมูล. วาดภาพซึ่งในระบบพิกัดสี่เหลี่ยมคาร์ทีเซียนพล็อตจุดทดลองและกราฟของฟังก์ชันการประมาณ ... ค้นหาผลรวมของความเบี่ยงเบนกำลังสองระหว่างค่าเชิงประจักษ์และเชิงทฤษฎี ดูว่าฟังก์ชันจะดีขึ้นหรือไม่ (จากมุมมองของวิธีกำลังสองน้อยที่สุด) นำประเด็นการทดลองเข้ามาใกล้

โปรดทราบว่าค่า "x" นั้นเป็นไปตามธรรมชาติและมีความหมายที่มีลักษณะเฉพาะซึ่งฉันจะพูดถึงในภายหลัง แต่แน่นอนว่าอาจเป็นเศษส่วนได้ นอกจากนี้ค่า "x" และ "เกม" อาจเป็นลบทั้งหมดหรือบางส่วนทั้งนี้ขึ้นอยู่กับเนื้อหาของปัญหานั้น ๆ เรามีงานที่ "ไร้หน้า" และเราก็เริ่มต้นมัน การตัดสินใจ:

เราพบค่าสัมประสิทธิ์ของฟังก์ชันที่เหมาะสมเป็นวิธีแก้ปัญหาของระบบ:

เพื่อประโยชน์ของสัญกรณ์ที่กะทัดรัดยิ่งขึ้นตัวแปร "ตัวนับ" สามารถละเว้นได้เนื่องจากเป็นที่ชัดเจนแล้วว่าการสรุปจะดำเนินการตั้งแต่ 1 ถึง

สะดวกกว่าในการคำนวณจำนวนเงินที่ต้องการในรูปแบบตาราง:


การคำนวณสามารถทำได้บนเครื่องคำนวณขนาดเล็ก แต่จะดีกว่ามากหากใช้ Excel ทั้งเร็วกว่าและไม่มีข้อผิดพลาด ชมวิดีโอสั้น ๆ :

ดังนั้นเราจึงได้รับสิ่งต่อไปนี้ ระบบ:

ที่นี่คุณสามารถคูณสมการที่สองด้วย 3 และ ลบที่ 2 ออกจากสมการที่ 1 ด้วยเทอม... แต่นี่เป็นความโชคดี - ในทางปฏิบัติระบบมักไม่ใช่ของขวัญและในกรณีเช่นนี้ระบบจะช่วยประหยัดได้ วิธีการของ Cramer:
ซึ่งหมายความว่าระบบมีโซลูชันเฉพาะ

มาตรวจสอบกัน ฉันเข้าใจว่าไม่ต้องการ แต่ทำไมจึงข้ามข้อผิดพลาดที่สามารถหลีกเลี่ยงได้ทั้งหมด เราแทนที่คำตอบที่พบทางด้านซ้ายของแต่ละสมการของระบบ:

ได้รับด้านขวามือของสมการที่เกี่ยวข้องซึ่งหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง

ดังนั้นฟังก์ชันที่ต้องการสำหรับการประมาณ: - จาก ของฟังก์ชันเชิงเส้นทั้งหมด เธอเป็นผู้ประมาณข้อมูลการทดลองด้วยวิธีที่ดีที่สุด

ไม่เหมือน ตรง การพึ่งพาการหมุนเวียนของร้านค้าในพื้นที่การพึ่งพาที่พบคือ ย้อนกลับ (หลักการ "ยิ่งมาก - น้อย")และความจริงนี้ถูกเปิดเผยทันทีโดยลบ ความลาดชัน... ฟังก์ชัน บอกเราว่าด้วยการเพิ่มขึ้นของตัวบ่งชี้ที่แน่นอน 1 หน่วยค่าของตัวบ่งชี้ที่พึ่งพาจะลดลง เฉลี่ยโดย 0.65 หน่วย ตามที่กล่าวไปยิ่งราคาของบัควีทสูงเท่าไหร่ก็ยิ่งขายได้น้อยลงเท่านั้น

ในการพล็อตกราฟของฟังก์ชันการประมาณเราจะพบค่าสองค่า:

และดำเนินการวาดภาพ:

เส้นที่สร้างขึ้นเรียกว่า เส้นแนวโน้ม (กล่าวคือเส้นแนวโน้มเชิงเส้นกล่าวคือในกรณีทั่วไปแนวโน้มไม่จำเป็นต้องเป็นเส้นตรง)... ทุกคนคุ้นเคยกับคำว่า“ be in trend” และฉันคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม

ลองคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบน ระหว่างค่านิยมเชิงประจักษ์และเชิงทฤษฎี ในทางเรขาคณิตมันคือผลรวมของกำลังสองของความยาวของส่วน "สีแดงเข้ม" (สองอันเล็กมากจนมองไม่เห็น).

สรุปการคำนวณในตาราง:


สามารถทำได้ด้วยตนเองอีกครั้งในกรณีที่ฉันจะยกตัวอย่างสำหรับจุดที่ 1:

แต่จะมีประสิทธิภาพมากกว่าในการดำเนินการในลักษณะที่เป็นที่รู้จัก:

ขอย้ำ: ความหมายของผลลัพธ์ที่ได้คืออะไร? ของ ของฟังก์ชันเชิงเส้นทั้งหมด ฟังก์ชัน ตัวบ่งชี้มีขนาดเล็กที่สุดนั่นคือในตระกูลมันเป็นการประมาณที่ดีที่สุด และที่นี่คำถามสุดท้ายของปัญหาไม่ได้เกิดขึ้นโดยบังเอิญ: จะเกิดอะไรขึ้นถ้าฟังก์ชันเลขชี้กำลังที่เสนอ การประมาณคะแนนทดลองจะดีกว่าไหม

ลองหาผลรวมของการเบี่ยงเบนกำลังสองที่สอดคล้องกัน - เพื่อแยกความแตกต่างฉันจะกำหนดด้วยตัวอักษร "epsilon" เทคนิคเหมือนกันทุกประการ:


และอีกครั้งสำหรับนักผจญเพลิงทุกคนการคำนวณสำหรับจุดที่ 1:

ใน Excel เราใช้ฟังก์ชันมาตรฐาน EXP (ไวยากรณ์สามารถพบได้ในวิธีใช้ของ Excel).

สรุป: ซึ่งหมายความว่าฟังก์ชันเอกซ์โพเนนเชียลใกล้เคียงกับจุดทดลองที่แย่กว่าเส้นตรง .

แต่ที่นี่ควรสังเกตว่า "แย่กว่า" คือ ยังไม่ได้หมายความว่า, เกิดอะไรขึ้น. ตอนนี้ฉันพล็อตฟังก์ชันเอกซ์โพเนนเชียลนี้ - และมันก็เข้าใกล้จุดด้วย - มากจนหากไม่มีการวิจัยเชิงวิเคราะห์เป็นการยากที่จะบอกว่าฟังก์ชันใดแม่นยำกว่ากัน

นี่เป็นการแก้ปัญหาให้เสร็จสมบูรณ์และฉันกลับไปที่คำถามเกี่ยวกับค่าธรรมชาติของอาร์กิวเมนต์ ในการศึกษาต่างๆตามกฎทางเศรษฐกิจหรือสังคมวิทยาจำนวน "xes" ตามธรรมชาติเดือนปีหรือช่วงเวลาอื่น ๆ ที่เท่ากัน ตัวอย่างเช่นพิจารณาปัญหาเช่นนี้:

เรามีข้อมูลการหมุนเวียนของร้านค้าปลีกในช่วงครึ่งปีแรกดังต่อไปนี้:

ใช้การจัดแนวเส้นตรงเชิงวิเคราะห์กำหนดมูลค่าการซื้อขายสำหรับเดือนกรกฎาคม.

ใช่ไม่มีปัญหา: เรานับเดือนที่ 1, 2, 3, 4, 5, 6 และใช้อัลกอริทึมตามปกติซึ่งเป็นผลมาจากการที่เราได้สมการ - สิ่งเดียวที่เมื่อถึงเวลามักจะใช้ตัวอักษร "te" (แม้ว่าจะไม่สำคัญก็ตาม)... สมการที่ได้แสดงให้เห็นว่าในช่วงครึ่งปีแรกมูลค่าการซื้อขายเพิ่มขึ้นเฉลี่ย 27.74 หน่วย ต่อเดือน. รับการพยากรณ์สำหรับเดือนกรกฎาคม (เดือนที่ 7): d.e.

และงานดังกล่าว - ความมืดก็มืด ผู้ที่สนใจสามารถใช้บริการเพิ่มเติมคือ my เครื่องคิดเลข Excel (เวอร์ชันสาธิต)ซึ่งไฟล์ แก้ปัญหาการวิเคราะห์เกือบจะทันที! มีเวอร์ชันที่ใช้งานได้ของโปรแกรม ในการแลกเปลี่ยน หรือสำหรับ โทเค็น.

ในตอนท้ายของบทเรียนข้อมูลสั้น ๆ เกี่ยวกับการค้นหาการอ้างอิงของประเภทอื่น ๆ ที่จริงแล้วไม่มีอะไรพิเศษที่จะบอกได้เนื่องจากแนวทางที่มีหลักการและอัลกอริทึมการแก้ปัญหายังคงเหมือนเดิม

สมมติว่าการจัดเรียงของจุดทดลองคล้ายกับไฮเพอร์โบลา จากนั้นเพื่อหาค่าสัมประสิทธิ์ของไฮเพอร์โบลาที่ดีที่สุดคุณต้องหาฟังก์ชันขั้นต่ำ - ผู้ที่ต้องการคำนวณโดยละเอียดและเข้าสู่ระบบที่คล้ายกัน:

จากมุมมองที่เป็นทางการและทางเทคนิคได้มาจากระบบ "เชิงเส้น" (มาทำเครื่องหมายด้วย "ดอกจัน") แทนที่ "x" ด้วย และจำนวนเงินคือ คำนวณแล้วหาค่าสัมประสิทธิ์ที่เหมาะสม "a" และ "be" ที่มือ.

หากมีเหตุให้เชื่อได้ทุกข้อ ตั้งอยู่ตามเส้นโค้งลอการิทึมจากนั้นค้นหาค่าที่เหมาะสมที่สุดและค้นหาค่าต่ำสุดของฟังก์ชัน ... ตามปกติในระบบ (*) จะต้องถูกแทนที่ด้วย:

เมื่อทำการคำนวณใน Excel ให้ใช้ฟังก์ชัน LN... ฉันยอมรับว่าการสร้างเครื่องคำนวณสำหรับแต่ละกรณีที่อยู่ระหว่างการพิจารณาไม่ใช่เรื่องยาก แต่จะดีกว่าถ้าคุณ "ตั้งโปรแกรม" การคำนวณด้วยตัวเอง วิดีโอบทเรียนเพื่อช่วย

ด้วยการพึ่งพาแบบเอกซ์โพเนนเชียลสถานการณ์จึงซับซ้อนขึ้นเล็กน้อย ในการลดสสารให้เป็นกรณีเชิงเส้นให้เราลอการิทึมของฟังก์ชันและใช้ คุณสมบัติของลอการิทึม:

ตอนนี้การเปรียบเทียบฟังก์ชันผลลัพธ์กับฟังก์ชันเชิงเส้นเราได้ข้อสรุปว่าในระบบ (*) ต้องถูกแทนที่ด้วยและ - โดย เพื่อความสะดวกเราแสดงว่า:

โปรดทราบว่าระบบได้รับการแก้ไขเมื่อเทียบกับและดังนั้นหลังจากค้นหารากแล้วคุณต้องอย่าลืมหาค่าสัมประสิทธิ์นั้นเอง

เพื่อนำประเด็นการทดลองเข้ามาใกล้ พาราโบลาที่เหมาะสมที่สุด ควรจะพบ ฟังก์ชันขั้นต่ำของสามตัวแปร ... หลังจากดำเนินการตามมาตรฐานแล้วเราจะได้รับสิ่งต่อไปนี้ "ใช้งานได้" ระบบ:

ใช่แน่นอนว่ามีจำนวนมากกว่าที่นี่ แต่เมื่อใช้แอปพลิเคชันโปรดของคุณจะไม่มีปัญหาใด ๆ เลย และในที่สุดฉันจะบอกวิธีตรวจสอบและสร้างเส้นแนวโน้มที่ต้องการโดยใช้ Excel อย่างรวดเร็ว: สร้างแผนภูมิกระจายเลือกจุดใดก็ได้ด้วยเมาส์ และคลิกขวาเลือกตัวเลือก "เพิ่มเส้นแนวโน้ม"... จากนั้นเลือกประเภทของแผนภูมิและบนแท็บ "ตัวเลือก"เปิดใช้งานตัวเลือก แสดงสมการในแผนภูมิ... ตกลง

เช่นเคยฉันต้องการจบบทความด้วยวลีที่สวยงามและฉันเกือบจะพิมพ์ว่า "เป็นเทรนด์!" แต่เขาเปลี่ยนใจทันเวลา และไม่ใช่เพราะมันตายตัว ฉันไม่รู้ว่าใครเป็นยังไง แต่ฉันไม่อยากทำตามคนอเมริกันที่ได้รับการส่งเสริมและโดยเฉพาะอย่างยิ่งเทรนด์ยุโรป \u003d) ดังนั้นฉันขอให้พวกคุณแต่ละคนยึดมั่นในแนวของตัวเอง

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

วิธีกำลังสองน้อยที่สุดเป็นวิธีหนึ่งที่แพร่หลายและพัฒนามากที่สุดเนื่องจาก ความเรียบง่ายและประสิทธิภาพของวิธีการประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติเชิงเส้น... ในขณะเดียวกันควรใช้ความระมัดระวังในการใช้งานเนื่องจากแบบจำลองที่สร้างขึ้นโดยใช้งานอาจไม่ตรงตามข้อกำหนดหลายประการสำหรับคุณภาพของพารามิเตอร์และด้วยเหตุนี้จึงไม่ "ดีพอ" ที่จะแสดงรูปแบบของการพัฒนากระบวนการ

ให้เราพิจารณาขั้นตอนในการประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติเชิงเส้นโดยใช้วิธีกำลังสองน้อยที่สุดในรายละเอียดเพิ่มเติม แบบจำลองดังกล่าวในรูปแบบทั่วไปสามารถแสดงได้ด้วยสมการ (1.2):

y t \u003d a 0 + a 1 х 1t + ... + a n х nt + ε t

ข้อมูลเริ่มต้นเมื่อประมาณค่าพารามิเตอร์ a 0, a 1, ... , n คือเวกเตอร์ของค่าของตัวแปรตาม \u003d (y 1, y 2, ... , y T) "และเมทริกซ์ของค่าของตัวแปรอิสระ

ซึ่งคอลัมน์แรกของคอลัมน์นั้นสอดคล้องกับค่าสัมประสิทธิ์ของแบบจำลอง

วิธีการของกำลังสองน้อยที่สุดมีชื่อตามหลักการพื้นฐานที่ค่าประมาณพารามิเตอร์ที่ได้รับบนพื้นฐานต้องเป็นไปตาม: ผลรวมของกำลังสองของข้อผิดพลาดแบบจำลองควรน้อยที่สุด

ตัวอย่างการแก้ปัญหาโดยใช้วิธีกำลังสองน้อยที่สุด

ตัวอย่างที่ 2.1.องค์กรการค้ามีเครือข่ายร้านค้า 12 แห่งข้อมูลเกี่ยวกับกิจกรรมที่นำเสนอในตาราง 2.1.

ผู้บริหารของ บริษัท ต้องการทราบว่าขนาดของมูลค่าการซื้อขายต่อปีขึ้นอยู่กับพื้นที่ค้าปลีกของร้านค้าอย่างไร

ตารางที่ 2.1

หมายเลขร้านค้า ผลประกอบการประจำปี RUB mln ย่านการค้าพันม. 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

สารละลายกำลังสองน้อยที่สุดมากำหนด - มูลค่าการซื้อขายประจำปีของร้านค้า th, ล้านรูเบิล; - แหล่งค้าขายหน้าร้านพันม. 2

รูปที่ 2.1. แผนภาพกระจายตัวอย่าง 2.1

เพื่อกำหนดรูปแบบของความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรและสร้างแผนภาพกระจาย (รูปที่ 2.1)

จากแผนภาพการกระจายสรุปได้ว่าผลประกอบการรายปีขึ้นอยู่กับพื้นที่ค้าปลีกในเชิงบวก (กล่าวคือ y จะเติบโตตามการเติบโต) รูปแบบการสื่อสารที่เหมาะสมที่สุดคือ เชิงเส้น.

ข้อมูลสำหรับการคำนวณเพิ่มเติมแสดงอยู่ในตาราง 2.2. โดยใช้วิธีกำลังสองน้อยที่สุดเราประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติปัจจัยเดียวเชิงเส้น

ตาราง 2.2

t y t x 1t y เสื้อ 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
819,52 10,68 65008,554 11,4058 858,3991
เฉลี่ย 68,29 0,89

ทางนี้,

ดังนั้นด้วยการเพิ่มพื้นที่การขาย 1 พัน m 2 สิ่งอื่น ๆ ทั้งหมดเท่ากันมูลค่าการซื้อขายเฉลี่ยต่อปีเพิ่มขึ้น 67.8871 ล้านรูเบิล

ตัวอย่าง 2.2.ผู้บริหารของ บริษัท สังเกตเห็นว่าการหมุนเวียนรายปีไม่เพียงขึ้นอยู่กับพื้นที่ค้าปลีกของร้านค้า (ดูตัวอย่างที่ 2.1) แต่ยังรวมถึงจำนวนผู้เยี่ยมชมโดยเฉลี่ยด้วย ข้อมูลที่เกี่ยวข้องแสดงในตาราง 2.3.

ตารางที่ 2.3

การตัดสินใจ.ลองกำหนด - จำนวนผู้เยี่ยมชมร้านค้าโดยเฉลี่ยต่อวันพันคน

เพื่อกำหนดรูปแบบของความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรและสร้างแผนภาพกระจาย (รูปที่ 2.2)

จาก scatterplot สรุปได้ว่าผลประกอบการรายปีขึ้นอยู่กับจำนวนผู้เยี่ยมชมโดยเฉลี่ยต่อวัน (กล่าวคือ y จะเพิ่มขึ้นตามการเติบโต) รูปแบบของการพึ่งพาการทำงานเป็นเชิงเส้น

รูป: 2.2. Scatter plot ตัวอย่าง 2.2

ตารางที่ 2.4

t x 2t x 2 ครั้ง 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
127,83 1410,44 9160,9934 118,9728
เฉลี่ย 10,65

โดยทั่วไปจำเป็นต้องกำหนดพารามิเตอร์ของแบบจำลองเศรษฐมิติสองปัจจัย

คุณ t \u003d a 0 + a 1 х 1t + a 2 х 2t + ε t

ข้อมูลที่จำเป็นสำหรับการคำนวณเพิ่มเติมแสดงอยู่ในตาราง 2.4.

ให้เราประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติเชิงเส้นสองปัจจัยโดยใช้วิธีกำลังสองน้อยที่สุด

ทางนี้,

ค่าประมาณของค่าสัมประสิทธิ์ \u003d 61.6583 แสดงให้เห็นว่าสิ่งอื่น ๆ ทั้งหมดเท่ากันเมื่อเพิ่มพื้นที่ขาย 1 พัน m 2 มูลค่าการซื้อขายต่อปีจะเพิ่มขึ้นโดยเฉลี่ย 61.6583 ล้านรูเบิล

ค่าสัมประสิทธิ์โดยประมาณ \u003d 2.2748 แสดงให้เห็นว่าสิ่งอื่น ๆ เท่ากันโดยมีจำนวนผู้เข้าชมเฉลี่ยเพิ่มขึ้นต่อ 1,000 คน ต่อวันมูลค่าการซื้อขายประจำปีจะเพิ่มขึ้นโดยเฉลี่ย 2.2748 ล้านรูเบิล

ตัวอย่างที่ 2.3ใช้ข้อมูลที่แสดงในตาราง 2.2 และ 2.4 ประมาณค่าพารามิเตอร์ของแบบจำลองเศรษฐมิติปัจจัยเดียว

มูลค่าศูนย์กลางของการหมุนเวียนประจำปีของร้านค้าอยู่ที่ไหนล้านรูเบิล - ค่ากลางของจำนวนผู้เยี่ยมชมร้านค้า t-th เฉลี่ยต่อวันนับพันคน (ดูตัวอย่าง 2.1-2.2)

การตัดสินใจ. ข้อมูลเพิ่มเติมที่จำเป็นสำหรับการคำนวณแสดงอยู่ในตาราง 2.5.

ตารางที่ 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
จำนวน 48,4344 431,0566

ใช้สูตร (2.35) เราได้รับ

ทางนี้,

http://www.cleverstudents.ru/articles/mnk.html

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร xและ ที่จะได้รับในตาราง

อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน

การใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลนี้ด้วยการพึ่งพาเชิงเส้น y \u003d ขวาน + b (ค้นหาพารามิเตอร์ และ และ ). ค้นหาว่าเส้นสองเส้นใดดีกว่ากัน (ในแง่ของวิธีกำลังสองน้อยที่สุด) จะจัดแนวข้อมูลการทดลอง วาดรูป.

การตัดสินใจ.

ในตัวอย่างของเรา n \u003d 5... เรากรอกข้อมูลในตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ

ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ผม.

ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ผม.

ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าตามแถว

เราใช้สูตรกำลังสองน้อยที่สุดในการหาค่าสัมประสิทธิ์ และ และ ... เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตาราง:

ดังนั้น y \u003d 0.165x + 2.184 - จำเป็นต้องประมาณเส้นตรง

มันยังคงอยู่เพื่อค้นหาว่าบรรทัดใด y \u003d 0.165x + 2.184 หรือ ประมาณข้อมูลเดิมได้ดีกว่านั่นคือทำการประมาณโดยใช้วิธีกำลังสองน้อยที่สุด

หลักฐาน.

ดังนั้นเมื่อพบว่า และ และ ฟังก์ชันรับค่าที่น้อยที่สุดมีความจำเป็นที่จุดนี้เมทริกซ์ของรูปแบบกำลังสองของส่วนต่างลำดับที่สองสำหรับฟังก์ชัน แน่นอนในเชิงบวก มาแสดงให้ดู

ส่วนต่างลำดับที่สองมีรูปแบบ:

นั่นคือ

ดังนั้นเมทริกซ์ของรูปกำลังสองจึงมีรูปแบบ

และค่าขององค์ประกอบไม่ขึ้นอยู่กับ และและ .

ให้เราแสดงว่าเมทริกซ์เป็นบวกแน่นอน สิ่งนี้ต้องการให้ผู้เยาว์มุมเป็นบวก

มุมลำดับรองลงมา ... ความไม่เท่าเทียมกันนั้นเข้มงวดตั้งแต่จุด

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร x และ ที่ จะได้รับในตาราง

อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน

การใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลนี้ด้วยการพึ่งพาเชิงเส้น y \u003d ขวาน + b (ค้นหาพารามิเตอร์ และ และ ). ค้นหาว่าเส้นสองเส้นใดดีกว่ากัน (ในแง่ของวิธีกำลังสองน้อยที่สุด) จะจัดแนวข้อมูลการทดลอง วาดรูป.

สาระสำคัญของวิธีกำลังสองน้อยที่สุด (OLS)

ภารกิจคือการหาค่าสัมประสิทธิ์ของการพึ่งพาเชิงเส้นซึ่งฟังก์ชันของสองตัวแปร และ และ ใช้ค่าที่น้อยที่สุด นั่นคือได้รับ และ และ ผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้นการแก้ปัญหาของตัวอย่างจึงลดลงเป็นการค้นหาสุดขั้วของฟังก์ชันของสองตัวแปร

การหาสูตรเพื่อหาค่าสัมประสิทธิ์

ระบบของสมการสองสมการที่มีสองสิ่งที่ไม่รู้จักถูกประกอบและแก้ไข ค้นหาอนุพันธ์ย่อยของฟังก์ชันที่เกี่ยวข้องกับตัวแปร และ และ เราถือว่าอนุพันธ์เหล่านี้เป็นศูนย์

เราแก้ระบบสมการผลลัพธ์ด้วยวิธีใดก็ได้ (ตัวอย่างเช่น วิธีการทดแทน หรือ) และเราได้รับสูตรสำหรับการหาค่าสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (OLS)

ด้วยข้อมูล และ และ ฟังก์ชัน ใช้ค่าที่น้อยที่สุด ได้รับการพิสูจน์ข้อเท็จจริงนี้

นั่นเป็นวิธีกำลังสองน้อยที่สุด สูตรสำหรับค้นหาพารามิเตอร์ มีผลรวม ,,, และพารามิเตอร์ n - จำนวนข้อมูลการทดลอง เราขอแนะนำให้คำนวณมูลค่าของจำนวนเหล่านี้แยกกัน ค่าสัมประสิทธิ์ อยู่หลังการคำนวณ .

ถึงเวลาจำตัวอย่างเดิม

การตัดสินใจ.

ในตัวอย่างของเรา n \u003d 5... เรากรอกข้อมูลในตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ

ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ผม.

ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ผม.

ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าตามแถว

เราใช้สูตรกำลังสองน้อยที่สุดในการหาค่าสัมประสิทธิ์ และ และ ... เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตาราง:

ดังนั้น y \u003d 0.165x + 2.184 - จำเป็นต้องประมาณเส้นตรง

มันยังคงอยู่เพื่อค้นหาว่าบรรทัดใด y \u003d 0.165x + 2.184 หรือ ประมาณข้อมูลเดิมได้ดีกว่านั่นคือทำการประมาณโดยใช้วิธีกำลังสองน้อยที่สุด

การประมาณข้อผิดพลาดของวิธีกำลังสองน้อยที่สุด

ในการทำเช่นนี้คุณต้องคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลเริ่มต้นจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ใกล้เคียงกับข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด

ตั้งแต่นั้นเป็นต้นมา y \u003d 0.165x + 2.184 ประมาณข้อมูลต้นฉบับได้ดีกว่า

ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (mns)

ทุกอย่างสามารถมองเห็นได้อย่างสมบูรณ์บนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y \u003d 0.165x + 2.184เส้นสีน้ำเงินคือ จุดสีชมพูเป็นข้อมูลดิบ

มีไว้เพื่ออะไรการประมาณทั้งหมดนี้มีไว้เพื่ออะไร?

โดยส่วนตัวแล้วฉันใช้เพื่อแก้ปัญหาการปรับให้เรียบของข้อมูลการแก้ไขและการประมาณค่า (ในตัวอย่างเดิมคุณอาจขอให้หาค่าของค่าที่สังเกตได้ ที่ x \u003d 3 หรือที่ x \u003d 6 โดยวิธี OLS) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของไซต์ในภายหลัง

หลักฐาน.

ดังนั้นเมื่อพบว่า และ และ ฟังก์ชันรับค่าที่น้อยที่สุดมีความจำเป็นที่จุดนี้เมทริกซ์ของรูปแบบกำลังสองของส่วนต่างลำดับที่สองสำหรับฟังก์ชัน แน่นอนในเชิงบวก มาแสดงให้ดู

ให้เราประมาณฟังก์ชันด้วยพหุนามดีกรี 2 สำหรับสิ่งนี้เราคำนวณค่าสัมประสิทธิ์ของระบบสมการปกติ:

, ,

มาสร้างระบบปกติของกำลังสองน้อยที่สุดซึ่งมีรูปแบบ:

โซลูชันระบบหาง่าย: ,,.

ดังนั้นจึงพบพหุนามของระดับที่ 2:.

พื้นหลังทางทฤษฎี

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่าง 2... การหาระดับที่เหมาะสมที่สุดของพหุนาม

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่างที่ 3... ที่มาของระบบสมการปกติสำหรับการค้นหาพารามิเตอร์ของการพึ่งพาเชิงประจักษ์

ให้เราได้ระบบสมการเพื่อหาค่าสัมประสิทธิ์และฟังก์ชัน ซึ่งทำการประมาณค่าราก - ค่าเฉลี่ยกำลังสองของฟังก์ชันที่กำหนดโดยจุด มาเขียนฟังก์ชันกัน และเขียนเงื่อนไขที่จำเป็นสำหรับมัน:

จากนั้นระบบปกติจะอยู่ในรูปแบบ:

ได้รับระบบสมการเชิงเส้นสำหรับพารามิเตอร์ที่ไม่รู้จักและแก้ไขได้ง่าย

พื้นหลังทางทฤษฎี

กลับไปที่หน้า<Введение в вычислительную математику. Примеры>

ตัวอย่าง.

ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร x และ ที่ จะได้รับในตาราง

อันเป็นผลมาจากการจัดตำแหน่งฟังก์ชัน

การใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลนี้ด้วยการพึ่งพาเชิงเส้น y \u003d ขวาน + b (ค้นหาพารามิเตอร์ และ และ ). ค้นหาว่าเส้นสองเส้นใดดีกว่ากัน (ในแง่ของวิธีกำลังสองน้อยที่สุด) จะจัดแนวข้อมูลการทดลอง วาดรูป.

สาระสำคัญของวิธีกำลังสองน้อยที่สุด (OLS)

ภารกิจคือการหาค่าสัมประสิทธิ์ของการพึ่งพาเชิงเส้นซึ่งฟังก์ชันของสองตัวแปร และ และ ใช้ค่าที่น้อยที่สุด นั่นคือได้รับ และ และ ผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด

ดังนั้นการแก้ปัญหาของตัวอย่างจึงลดลงเป็นการค้นหาสุดขั้วของฟังก์ชันของสองตัวแปร

การหาสูตรเพื่อหาค่าสัมประสิทธิ์

ระบบของสมการสองสมการที่มีสองสิ่งที่ไม่รู้จักถูกประกอบและแก้ไข ค้นหาอนุพันธ์ย่อยของฟังก์ชัน ตามตัวแปร และ และ เราถือว่าอนุพันธ์เหล่านี้เป็นศูนย์

เราแก้ระบบสมการผลลัพธ์ด้วยวิธีใดก็ได้ (ตัวอย่างเช่น วิธีการทดแทน หรือวิธีการของ Cramer) และเราได้รับสูตรสำหรับการหาค่าสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (OLS)

ด้วยข้อมูล และ และ ฟังก์ชัน ใช้ค่าที่น้อยที่สุด การพิสูจน์ข้อเท็จจริงนี้ระบุไว้ด้านล่างในข้อความท้ายหน้า

นั่นเป็นวิธีกำลังสองน้อยที่สุด สูตรสำหรับค้นหาพารามิเตอร์ มีผลรวม ,,, และพารามิเตอร์ n - จำนวนข้อมูลทดลอง เราขอแนะนำให้คำนวณมูลค่าของจำนวนเหล่านี้แยกกัน

ค่าสัมประสิทธิ์ อยู่หลังการคำนวณ .

ถึงเวลาจำตัวอย่างเดิม

การตัดสินใจ.

ในตัวอย่างของเรา n \u003d 5... เรากรอกข้อมูลในตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ

ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ผม.

ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าของแถวที่ 2 สำหรับแต่ละตัวเลข ผม.

ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าตามแถว

เราใช้สูตรกำลังสองน้อยที่สุดในการหาค่าสัมประสิทธิ์ และ และ ... เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตาราง:

ดังนั้น y \u003d 0.165x + 2.184 - จำเป็นต้องประมาณเส้นตรง

มันยังคงอยู่เพื่อค้นหาว่าบรรทัดใด y \u003d 0.165x + 2.184 หรือ ประมาณข้อมูลเดิมได้ดีกว่านั่นคือทำการประมาณโดยใช้วิธีกำลังสองน้อยที่สุด

การประมาณข้อผิดพลาดของวิธีกำลังสองน้อยที่สุด

ในการทำเช่นนี้คุณต้องคำนวณผลรวมของกำลังสองของส่วนเบี่ยงเบนของข้อมูลเริ่มต้นจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ใกล้เคียงกับข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด

ตั้งแต่นั้นเป็นต้นมา y \u003d 0.165x + 2.184 ประมาณข้อมูลต้นฉบับได้ดีกว่า

ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (mns)

ทุกอย่างสามารถมองเห็นได้อย่างสมบูรณ์บนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y \u003d 0.165x + 2.184เส้นสีน้ำเงินคือ จุดสีชมพูเป็นข้อมูลดิบ

มีไว้เพื่ออะไรการประมาณทั้งหมดนี้มีไว้เพื่ออะไร?

โดยส่วนตัวแล้วฉันใช้เพื่อแก้ปัญหาการปรับให้เรียบของข้อมูลการแก้ไขและการประมาณค่า (ในตัวอย่างเดิมคุณอาจขอให้หาค่าของค่าที่สังเกตได้ ที่ x \u003d 3 หรือที่ x \u003d 6 โดยวิธี OLS) แต่เราจะพูดถึงเรื่องนี้เพิ่มเติมในส่วนอื่นของไซต์ในภายหลัง

กลับไปที่ด้านบนของหน้า

หลักฐาน.

ดังนั้นเมื่อพบว่า และ และ ฟังก์ชันรับค่าที่น้อยที่สุดมีความจำเป็นที่จุดนี้เมทริกซ์ของรูปแบบกำลังสองของส่วนต่างลำดับที่สองสำหรับฟังก์ชัน แน่นอนในเชิงบวก มาแสดงให้ดู

ส่วนต่างลำดับที่สองมีรูปแบบ:

นั่นคือ

ดังนั้นเมทริกซ์ของรูปกำลังสองจึงมีรูปแบบ

และค่าขององค์ประกอบไม่ขึ้นอยู่กับ และ และ .

ให้เราแสดงว่าเมทริกซ์เป็นบวกแน่นอน สิ่งนี้ต้องการให้ผู้เยาว์มุมเป็นบวก

มุมลำดับรองลงมา ... ความไม่เท่าเทียมกันนั้นเข้มงวดเนื่องจากประเด็นต่างๆไม่ใช่เรื่องบังเอิญ ในสิ่งต่อไปนี้เราจะหมายถึงมัน

มุมรองลำดับที่สอง

ให้เราพิสูจน์ว่า โดยวิธีการอุปนัยทางคณิตศาสตร์

สรุป: พบค่า และ และ สอดคล้องกับค่าฟังก์ชันที่น้อยที่สุด ดังนั้นจึงเป็นพารามิเตอร์ที่จำเป็นสำหรับวิธีกำลังสองน้อยที่สุด

ไม่มีเวลาคิดออก?
สั่งซื้อโซลูชัน

กลับไปที่ด้านบนของหน้า

การพัฒนาการคาดการณ์โดยใช้วิธีกำลังสองน้อยที่สุด ตัวอย่างการแก้ปัญหา

Extrapolation เป็นวิธีการวิจัยทางวิทยาศาสตร์ซึ่งอาศัยการเผยแพร่แนวโน้มรูปแบบการเชื่อมโยงในอดีตและปัจจุบันสำหรับการพัฒนาในอนาคตของวัตถุพยากรณ์ วิธีการคาดการณ์ ได้แก่ วิธีค่าเฉลี่ยเคลื่อนที่วิธีการเรียบเลขชี้กำลังวิธีกำลังสองน้อยที่สุด

สาระการเรียนรู้แกนกลาง วิธีกำลังสองน้อยที่สุด ประกอบด้วยการลดผลรวมของส่วนเบี่ยงเบนกำลังสองระหว่างค่าที่สังเกตและคำนวณ พบค่าที่คำนวณได้ตามสมการที่พอดี - สมการถดถอย ยิ่งระยะห่างระหว่างค่าจริงและค่าที่คำนวณได้น้อยลงการคาดการณ์ตามสมการการถดถอยก็จะยิ่งแม่นยำมากขึ้น

การวิเคราะห์เชิงทฤษฎีเกี่ยวกับสาระสำคัญของปรากฏการณ์ที่อยู่ระหว่างการศึกษาการเปลี่ยนแปลงที่แสดงโดยอนุกรมเวลาทำหน้าที่เป็นพื้นฐานในการเลือกเส้นโค้ง บางครั้งการพิจารณาเกี่ยวกับลักษณะของการเติบโตของระดับของซีรีส์จะถูกนำมาพิจารณาด้วย ดังนั้นหากคาดว่าการเติบโตของผลผลิตในความก้าวหน้าทางคณิตศาสตร์การปรับให้เรียบจะดำเนินการตามเส้นตรง หากปรากฎว่าการเติบโตเป็นเลขชี้กำลังควรทำการปรับให้เรียบตามฟังก์ชันเลขชี้กำลัง

สูตรการทำงานของกำลังสองน้อยที่สุด : Y เสื้อ + 1 \u003d a * X + bโดยที่ t + 1 คือช่วงเวลาคาดการณ์ Уt + 1 - ตัวบ่งชี้ที่คาดการณ์; a และ b คือสัมประสิทธิ์ X เป็นสัญลักษณ์ของเวลา

การคำนวณค่าสัมประสิทธิ์ a และ b ดำเนินการตามสูตรต่อไปนี้:

ที่ไหน Uf - ค่าจริงของพลวัตจำนวนหนึ่ง n คือจำนวนระดับในอนุกรมเวลา

การปรับอนุกรมเวลาให้เรียบโดยวิธีกำลังสองน้อยที่สุดช่วยสะท้อนรูปแบบของพัฒนาการของปรากฏการณ์ที่กำลังศึกษาอยู่ ในนิพจน์เชิงวิเคราะห์ของแนวโน้มเวลาถือเป็นตัวแปรอิสระและระดับของอนุกรมทำหน้าที่เป็นตัวแปรอิสระนี้

การพัฒนาของปรากฏการณ์ไม่ได้ขึ้นอยู่กับระยะเวลาที่ผ่านไปนับตั้งแต่ช่วงเวลาเริ่มต้น แต่ปัจจัยที่มีอิทธิพลต่อการพัฒนาในทิศทางใดและรุนแรงเพียงใด ดังนั้นจึงเป็นที่ชัดเจนว่าการพัฒนาของปรากฏการณ์ในเวลาปรากฏเป็นผลมาจากการกระทำของปัจจัยเหล่านี้

การกำหนดประเภทของเส้นโค้งอย่างถูกต้องประเภทของการพึ่งพาการวิเคราะห์กับเวลาเป็นหนึ่งในงานที่ยากที่สุดในการวิเคราะห์ล่วงหน้า .

การเลือกประเภทของฟังก์ชันที่อธิบายถึงแนวโน้มพารามิเตอร์ที่กำหนดโดยวิธีกำลังสองน้อยที่สุดจะดำเนินการในกรณีส่วนใหญ่โดยการสร้างฟังก์ชันจำนวนมากและเปรียบเทียบซึ่งกันและกันโดยค่าของค่าความคลาดเคลื่อนกำลังสองของค่าเฉลี่ยรากที่คำนวณโดยสูตร:

โดยที่ Uf - ค่าจริงของพลวัตจำนวนหนึ่ง Ur - คำนวณ (ปรับให้เรียบ) ค่าของพลวัตจำนวนหนึ่ง n คือจำนวนระดับในอนุกรมเวลา p - จำนวนพารามิเตอร์ที่กำหนดในสูตรที่อธิบายถึงแนวโน้ม (แนวโน้มการพัฒนา)

ข้อเสียของวิธีกำลังสองน้อยที่สุด :

  • เมื่อพยายามอธิบายปรากฏการณ์ทางเศรษฐกิจภายใต้การศึกษาโดยใช้สมการทางคณิตศาสตร์การคาดการณ์จะแม่นยำในช่วงเวลาสั้น ๆ และควรคำนวณสมการถดถอยใหม่เมื่อมีข้อมูลใหม่
  • ความซับซ้อนของการเลือกสมการถดถอยซึ่งแก้ไขได้เมื่อใช้โปรแกรมคอมพิวเตอร์ทั่วไป

ตัวอย่างการใช้วิธีกำลังสองน้อยที่สุดในการพัฒนาการคาดการณ์

งาน ... มีข้อมูลที่แสดงลักษณะของอัตราการว่างงานในภูมิภาค%

  • สร้างการคาดการณ์อัตราการว่างงานในภูมิภาคสำหรับเดือนพฤศจิกายนธันวาคมเดือนมกราคมโดยใช้วิธีการดังต่อไปนี้ค่าเฉลี่ยเคลื่อนที่การปรับให้เรียบเลขชี้กำลังกำลังสองน้อยที่สุด
  • คำนวณข้อผิดพลาดของการคาดการณ์ที่ได้รับโดยใช้แต่ละวิธี
  • เปรียบเทียบผลลัพธ์สรุปผล

สารละลายกำลังสองน้อยที่สุด

ในการแก้ปัญหาเราจะจัดทำตารางซึ่งเราจะทำการคำนวณที่จำเป็น:

ε \u003d 28.63 / 10 \u003d 2.86% ความแม่นยำในการพยากรณ์ สูง.

สรุป : เปรียบเทียบผลลัพธ์ที่ได้ในการคำนวณ วิธีค่าเฉลี่ยเคลื่อนที่ , การปรับให้เรียบเลขชี้กำลัง และวิธีกำลังสองน้อยที่สุดเราสามารถพูดได้ว่าข้อผิดพลาดสัมพัทธ์เฉลี่ยเมื่อคำนวณโดยวิธีการปรับให้เรียบเลขชี้กำลังอยู่ในช่วง 20-50% ซึ่งหมายความว่าความแม่นยำในการคาดการณ์ในกรณีนี้เป็นที่น่าพอใจเท่านั้น

ในกรณีที่หนึ่งและสามความแม่นยำในการคาดการณ์จะสูงเนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยน้อยกว่า 10% แต่วิธีการย้ายค่าเฉลี่ยทำให้ได้ผลลัพธ์ที่น่าเชื่อถือมากขึ้น (คาดการณ์เดือนพฤศจิกายน - 1.52% คาดการณ์เดือนธันวาคม - 1.53% คาดการณ์มกราคม - 1.49%) เนื่องจากข้อผิดพลาดสัมพัทธ์เฉลี่ยเมื่อใช้วิธีนี้น้อยที่สุด - 1 , 13%.

วิธีกำลังสองน้อยที่สุด

บทความอื่น ๆ ในหัวข้อนี้:

รายชื่อแหล่งที่มาที่ใช้

  1. คำแนะนำทางวิทยาศาสตร์และระเบียบวิธีเกี่ยวกับการวินิจฉัยความเสี่ยงทางสังคมและการคาดการณ์ความท้าทายภัยคุกคามและผลกระทบทางสังคม มหาวิทยาลัยสังคมแห่งรัฐรัสเซีย มอสโก. พ.ศ. 2553;
  2. วลาดิมิโรวา L.P. การพยากรณ์และการวางแผนในสภาวะตลาด: ตำรา. เบี้ยเลี้ยง. M .: สำนักพิมพ์ "Dashkov and Co", 2544;
  3. Novikova N.V. , Pozdeeva O.G. พยากรณ์เศรษฐกิจแห่งชาติ: คู่มือการสอน. เยคาเตรินเบิร์ก: สำนักพิมพ์อูราล. สถานะ เศรษฐศาสตร์. มหาวิทยาลัย, 2550;
  4. Slutskin L.N. หลักสูตร MBA เกี่ยวกับการพยากรณ์ในธุรกิจ M .: Alpina Business Books, 2549

โปรแกรม OLS

ป้อนข้อมูล

ข้อมูลและการประมาณ y \u003d a + b x

ผม - หมายเลขจุดทดลอง
x ผม - ค่าของพารามิเตอร์คงที่ที่จุด ผม;
ฉัน - ค่าของพารามิเตอร์ที่วัดได้ที่จุด ผม;
ω i - น้ำหนักของการวัดที่จุด ผม;
ครับผมแคลเซียม - ความแตกต่างระหว่างวัดและคำนวณโดยค่าการถดถอย ตรงจุด ผม;
S x i (x i) - การประมาณค่าผิดพลาด x ผม เมื่อทำการวัด ตรงจุด ผม.

ข้อมูลและการประมาณ y \u003d k x

ผม x ผม ฉัน ω i ครับผมแคลเซียม ฉันฉัน S x i (x i)

คลิกที่กราฟ

คำแนะนำสำหรับผู้ใช้โปรแกรมออนไลน์ MNC

ในช่องข้อมูลให้ป้อนค่า "x" และ "y" ที่จุดทดสอบเดียวกันในแต่ละบรรทัดแยกกัน ต้องคั่นค่าด้วยอักขระเว้นวรรค (ช่องว่างหรือแท็บ)

ค่าที่สามอาจเป็นน้ำหนักของจุด "w" หากไม่ได้ระบุน้ำหนักจุดก็จะเท่ากับหนึ่ง ในกรณีส่วนใหญ่ที่ท่วมท้นไม่ทราบน้ำหนักของคะแนนทดลองหรือไม่ได้คำนวณกล่าวคือ ข้อมูลการทดลองทั้งหมดถือว่าเทียบเท่ากัน บางครั้งน้ำหนักในช่วงของค่าที่ศึกษาจะไม่เทียบเท่ากันอย่างแน่นอนและสามารถคำนวณได้ในทางทฤษฎี ตัวอย่างเช่นในสเปกโตรโฟโตเมตรีน้ำหนักสามารถคำนวณได้โดยใช้สูตรง่ายๆแม้ว่าโดยพื้นฐานแล้วทุกคนจะละเลยสิ่งนี้เพื่อลดต้นทุนแรงงาน

สามารถวางข้อมูลผ่านคลิปบอร์ดจากสเปรดชีตชุดโปรแกรมสำนักงานเช่น Excel จาก Microsoft Office หรือ Calc จาก Open Office ในการดำเนินการนี้ในสเปรดชีตให้เลือกช่วงของข้อมูลที่จะคัดลอกคัดลอกไปยังคลิปบอร์ดแล้ววางข้อมูลลงในช่องข้อมูลในหน้านี้

สำหรับการคำนวณโดยวิธีกำลังสองน้อยที่สุดจำเป็นต้องมีจุดอย่างน้อยสองจุดเพื่อกำหนดค่าสัมประสิทธิ์สองค่า "b" - แทนเจนต์ของความชันของเส้นตรงและ "a" - ค่าที่ตัดด้วยเส้นตรงบนแกน "y"

ในการประมาณข้อผิดพลาดของค่าสัมประสิทธิ์การถดถอยที่คำนวณได้คุณต้องกำหนดจำนวนจุดทดลองมากกว่าสองจุด

วิธีกำลังสองน้อยที่สุด (OLS)

จำนวนจุดทดลองที่มากขึ้นการประมาณค่าสัมประสิทธิ์ทางสถิติจะแม่นยำมากขึ้น (เนื่องจากค่าสัมประสิทธิ์ของนักเรียนลดลง) และค่าประมาณใกล้เคียงกับค่าประมาณของตัวอย่างทั่วไป

การได้รับค่าในแต่ละจุดการทดลองมักใช้แรงงานมากดังนั้นจึงมักมีการลดจำนวนการทดลองที่ให้ค่าประมาณย่อยได้และไม่นำไปสู่ต้นทุนแรงงานที่มากเกินไป ตามกฎแล้วจำนวนจุดทดลองสำหรับการพึ่งพากำลังสองเชิงเส้นน้อยที่สุดที่มีค่าสัมประสิทธิ์สองตัวจะถูกเลือกในพื้นที่ 5-7 จุด

ทฤษฎีโดยย่อเกี่ยวกับวิธีกำลังสองน้อยที่สุดสำหรับการพึ่งพาเชิงเส้น

สมมติว่าเรามีชุดข้อมูลการทดลองในรูปแบบของคู่ค่า [`y_i`," x_i`] โดยที่ "i" คือตัวเลขของการวัดการทดลองหนึ่งรายการจาก 1 ถึง "n`; `y_i` - ค่าของค่าที่วัดได้ที่จุด` i`; "x_i` - ค่าของพารามิเตอร์ที่เราตั้งไว้ที่จุด" i "

ตัวอย่างเช่นพิจารณาการทำงานของกฎของโอห์ม โดยการเปลี่ยนแรงดันไฟฟ้า (ความต่างศักย์) ระหว่างส่วนของวงจรไฟฟ้าเราจะวัดปริมาณกระแสที่ไหลผ่านส่วนนี้ ฟิสิกส์ทำให้เรามีการพึ่งพาที่พบในการทดลอง:

`ฉัน \u003d U / R`,
โดยที่ "ฉัน" - ความแรงในปัจจุบัน `R` - ความต้านทาน; `U` - แรงดันไฟฟ้า

ในกรณีนี้ "y_i" คือค่ากระแสไฟฟ้าที่วัดได้และ "x_i" คือค่าแรงดันไฟฟ้า

อีกตัวอย่างหนึ่งให้พิจารณาการดูดกลืนแสงโดยสารละลายของสารในสารละลาย เคมีให้สูตรแก่เรา:

`A \u003d εล C`,
โดยที่ "A" คือความหนาแน่นของแสงของสารละลาย `ε` - การส่งผ่านของตัวถูกละลาย "l` - ความยาวของเส้นทางเมื่อแสงผ่าน cuvette ด้วยสารละลาย `C` - ความเข้มข้นของตัวถูกละลาย

ในกรณีนี้ "y_i" เรามีค่าที่วัดได้ของความหนาแน่นของแสง "A" และ "x_i" คือค่าของความเข้มข้นของสารที่เราตั้งไว้

เราจะพิจารณากรณีที่ข้อผิดพลาดสัมพัทธ์ในการตั้งค่า "x_i" น้อยกว่าข้อผิดพลาดการวัดสัมพัทธ์ "y_i" มาก นอกจากนี้เราจะถือว่าค่าที่วัดได้ทั้งหมด "y_i" เป็นแบบสุ่มและกระจายตามปกติกล่าวคือ ปฏิบัติตามกฎหมายการกระจายปกติ

ในกรณีของการพึ่งพาเชิงเส้นของ "y" กับ "x" เราสามารถเขียนการพึ่งพาทางทฤษฎีได้:
`y \u003d a + b x`

จากมุมมองทางเรขาคณิตสัมประสิทธิ์ "b" แสดงถึงแทนเจนต์ของมุมเอียงของเส้นกับแกน "x" และค่าสัมประสิทธิ์ "a" - ค่าของ "y" ที่จุดตัดของเส้นกับแกน "y" (ที่ "x \u003d 0")

การค้นหาพารามิเตอร์ของเส้นการถดถอย

ในการทดลองค่าที่วัดได้ของ "y_i" ไม่สามารถอยู่บนเส้นตรงตามทฤษฎีได้อย่างแน่นอนเนื่องจากข้อผิดพลาดในการวัดที่มีอยู่เสมอในชีวิตจริง ดังนั้นสมการเชิงเส้นจะต้องแสดงด้วยระบบสมการ:
`y_i \u003d a + b x_i + ε_i` (1),
โดยที่ "ε_i" คือข้อผิดพลาดในการวัดที่ไม่ทราบสาเหตุของ "y" ในการทดสอบ "i`-th

เรียกอีกอย่างว่าการพึ่งพา (1) การถดถอยเช่น การพึ่งพาสองค่าจากกันอย่างมีนัยสำคัญทางสถิติ

ภารกิจในการฟื้นฟูการพึ่งพาคือการหาค่าสัมประสิทธิ์ "a" และ "b" จากจุดทดลอง [`y_i`," x_i`]

ในการหาค่าสัมประสิทธิ์ "a" และ "b" โดยปกติจะใช้ วิธีกำลังสองน้อยที่สุด (OLS). เป็นกรณีพิเศษของหลักการความเป็นไปได้สูงสุด

ให้เราเขียน (1) ใหม่เป็น "ε_i \u003d y_i - a - b x_i`

จากนั้นผลรวมของกำลังสองของข้อผิดพลาดจะเป็น
`Φ \u003d sum_ (i \u003d 1) ^ (n) ε_i ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2` (2)

หลักการของ OLS (วิธีกำลังสองน้อยที่สุด) คือการลดผลรวม (2) ตามพารามิเตอร์ "a` และ" b ".

ถึงค่าต่ำสุดเมื่ออนุพันธ์บางส่วนของผลรวม (2) เทียบกับสัมประสิทธิ์ "a" และ "b" เท่ากับศูนย์:
`frac (บางส่วนΦ) (บางส่วน a) \u003d frac (ผลรวมบางส่วน (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (บางส่วน a) \u003d 0`
`frac (บางส่วนΦ) (b บางส่วน) \u003d frac (บางส่วน sum_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (b บางส่วน) \u003d 0`

การขยายอนุพันธ์เราได้ระบบของสองสมการโดยมีสองสมการที่ไม่รู้จัก:
`sum_ (i \u003d 1) ^ (n) (2a + 2bx_i - 2y_i) \u003d sum_ (i \u003d 1) ^ (n) (a + bx_i - y_i) \u003d 0`
`sum_ (i \u003d 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) \u003d sum_ (i \u003d 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) \u003d 0`

เราเปิดวงเล็บและโอนผลรวมโดยไม่ขึ้นกับค่าสัมประสิทธิ์ที่ต้องการไปยังอีกครึ่งหนึ่งเราได้ระบบสมการเชิงเส้น:
`sum_ (i \u003d 1) ^ (n) y_i \u003d a n + b sum_ (i \u003d 1) ^ (n) bx_i`
`sum_ (i \u003d 1) ^ (n) x_iy_i \u003d a sum_ (i \u003d 1) ^ (n) x_i + b sum_ (i \u003d 1) ^ (n) x_i ^ 2`

ในการแก้ระบบผลลัพธ์เราพบสูตรสำหรับสัมประสิทธิ์ "a` และ" b`:

`a \u003d frac (sum_ (i \u003d 1) ^ (n) y_i sum_ (i \u003d 1) ^ (n) x_i ^ 2 - sum_ (i \u003d 1) ^ (n) x_i sum_ (i \u003d 1) ^ (n ) x_iy_i) (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.1)

`b \u003d frac (n sum_ (i \u003d 1) ^ (n) x_iy_i - sum_ (i \u003d 1) ^ (n) x_i sum_ (i \u003d 1) ^ (n) y_i) (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.2)

สูตรเหล่านี้มีคำตอบเมื่อ "n\u003e 1` (เส้นสามารถลากได้จากจุดอย่างน้อย 2 จุด) และเมื่อดีเทอร์มิแนนต์` D \u003d n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2! \u003d 0` เช่น เมื่อจุด "x_i" ในการทดสอบต่างกัน (เช่นเมื่อเส้นไม่ใช่แนวตั้ง)

การประมาณข้อผิดพลาดของค่าสัมประสิทธิ์ของเส้นถดถอย

สำหรับค่าประมาณที่แม่นยำยิ่งขึ้นของข้อผิดพลาดในการคำนวณค่าสัมประสิทธิ์ "a" และ "b" จึงเป็นที่ต้องการของจุดทดลองจำนวนมาก เมื่อ "n \u003d 2" จะไม่สามารถประมาณค่าสัมประสิทธิ์ข้อผิดพลาดได้เนื่องจาก เส้นประมาณจะผ่านจุดสองจุด

ข้อผิดพลาดของตัวแปรสุ่ม "V" ถูกกำหนด กฎแห่งการสะสมของข้อผิดพลาด
`S_V ^ 2 \u003d sum_ (i \u003d 1) ^ p (frac (บางส่วน f) (z_i บางส่วน)) ^ 2 S_ (z_i) ^ 2`,
โดยที่ "p" คือจำนวนพารามิเตอร์ "z_i" ที่มีข้อผิดพลาด "S_ (z_i)" ที่ส่งผลต่อข้อผิดพลาด "S_V";
"f` - ฟังก์ชันการพึ่งพาของ" V "บน" z_i "

ให้เราเขียนกฎการสะสมข้อผิดพลาดสำหรับข้อผิดพลาดของสัมประสิทธิ์ "a" และ "b"
`S_a ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (frac (บางส่วน a) (y_i บางส่วน)) ^ 2 S_ (y_i) ^ 2 + sum_ (i \u003d 1) ^ (n) (frac (บางส่วน a ) (บางส่วน x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (บางส่วน a) (y_i บางส่วน)) ^ 2 `,
`S_b ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (frac (บางส่วน b) (y_i บางส่วน)) ^ 2 S_ (y_i) ^ 2 + sum_ (i \u003d 1) ^ (n) (frac (บางส่วน b ) (บางส่วน x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (บางส่วน b) (y_i บางส่วน)) ^ 2 `,
ตั้งแต่ `S_ (x_i) ^ 2 \u003d 0` (เราได้ทำการจองก่อนหน้านี้ว่าข้อผิดพลาด" x "เล็กน้อย)

`S_y ^ 2 \u003d S_ (y_i) ^ 2` - ข้อผิดพลาด (ความแปรปรวนกำลังสองของส่วนเบี่ยงเบนมาตรฐาน) ในการวัด" y "โดยสมมติว่าข้อผิดพลาดนั้นเหมือนกันสำหรับค่าทั้งหมดของ" y "

เราได้รับการแทนที่สูตรสำหรับการคำนวณ "a" และ "b" ในนิพจน์ที่ได้รับ

`S_a ^ 2 \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) (sum_ (i \u003d 1) ^ (n) x_i ^ 2 - x_i sum_ (i \u003d 1) ^ (n) x_i) ^ 2 ) (D ^ 2) \u003d S_y ^ 2 frac ((n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) sum_ (i \u003d 1) ^ (n) x_i ^ 2) (D ^ 2) \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) x_i ^ 2) (D) `(4.1)

`S_b ^ 2 \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) (n x_i - sum_ (i \u003d 1) ^ (n) x_i) ^ 2) (D ^ 2) \u003d S_y ^ 2 frac ( n (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2)) (D ^ 2) \u003d S_y ^ 2 frac (n) (D) `(4.2)

ในการทดลองในชีวิตจริงส่วนใหญ่จะไม่มีการวัดค่า "Sy" ในการทำเช่นนี้คุณต้องทำการวัดแบบขนานหลาย ๆ จุด (การทดลอง) ที่จุดใดจุดหนึ่งของแผนซึ่งจะเพิ่มเวลา (และอาจมีค่าใช้จ่าย) ของการทดสอบ ดังนั้นโดยปกติจะถือว่าค่าเบี่ยงเบนของ "y" จากเส้นการถดถอยถือได้ว่าเป็นการสุ่ม ค่าประมาณของความแปรปรวน "y" ในกรณีนี้คำนวณโดยสูตร

`S_y ^ 2 \u003d S_ (y, ส่วนที่เหลือ) ^ 2 \u003d frac (sum_ (i \u003d 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)".

ตัวหาร "n-2" ปรากฏขึ้นเนื่องจากเราได้ลดจำนวนองศาอิสระลงเนื่องจากการคำนวณค่าสัมประสิทธิ์สองตัวสำหรับข้อมูลทดลองตัวอย่างเดียวกัน

การประมาณนี้เรียกอีกอย่างว่าค่าความแปรปรวนที่เหลือที่สัมพันธ์กับเส้นการถดถอย "S_ (y, ส่วนที่เหลือ) ^ 2"

ความสำคัญของค่าสัมประสิทธิ์ได้รับการประเมินตามแบบทดสอบของนักเรียน

`t_a \u003d frac (| a |) (S_a)`, `t_b \u003d frac (| b |) (S_b)`

หากเกณฑ์ที่คำนวณได้ "t_a", "t_b" น้อยกว่าเกณฑ์ตาราง "t (P, n-2)" จะถือว่าค่าสัมประสิทธิ์ที่สอดคล้องกันไม่แตกต่างอย่างมีนัยสำคัญจากศูนย์โดยมีความน่าจะเป็นที่กำหนด "P"

ในการประเมินคุณภาพของคำอธิบายของความสัมพันธ์เชิงเส้นคุณสามารถเปรียบเทียบ "S_ (y, rest) ^ 2` และ" S_ (bar y) "เทียบกับค่าเฉลี่ยโดยใช้การทดสอบของฟิชเชอร์

`S_ (บาร์ y) \u003d frac (sum_ (i \u003d 1) ^ n (y_i - บาร์ y) ^ 2) (n-1) \u003d frac (sum_ (i \u003d 1) ^ n (y_i - (sum_ (i \u003d 1) ^ n y_i) / n) ^ 2) (n-1) `- ค่าประมาณตัวอย่างของความแปรปรวน` y` เทียบกับค่าเฉลี่ย

ในการประเมินประสิทธิภาพของสมการการถดถอยเพื่ออธิบายความสัมพันธ์ค่าสัมประสิทธิ์ฟิชเชอร์จะถูกคำนวณ
`F \u003d S_ (บาร์ y) / S_ (y, ส่วนที่เหลือ) ^ 2`,
ซึ่งเปรียบเทียบกับตารางสัมประสิทธิ์ฟิชเชอร์ `F (p, n-1, n-2)"

ถ้า "F\u003e F (P, n-1, n-2)" ความแตกต่างระหว่างคำอธิบายของการพึ่งพา "y \u003d f (x)" โดยใช้สมการถดถอยและคำอธิบายโดยใช้ค่าเฉลี่ยจะถือว่ามีนัยสำคัญทางสถิติโดยมีความน่าจะเป็น "P" เหล่านั้น. การถดถอยอธิบายความสัมพันธ์ได้ดีกว่าการแพร่กระจายของ "y" ที่สัมพันธ์กับค่าเฉลี่ย

คลิกที่กราฟ
เพื่อเพิ่มค่าลงในตาราง

วิธีกำลังสองน้อยที่สุด วิธีกำลังสองน้อยที่สุดถูกเข้าใจว่าเป็นการกำหนดพารามิเตอร์ที่ไม่รู้จัก a, b, c, การพึ่งพาฟังก์ชันที่นำมาใช้

วิธีกำลังสองน้อยที่สุดหมายถึงการกำหนดพารามิเตอร์ที่ไม่รู้จัก ก, ข, ค, ... การพึ่งพาการทำงานที่ยอมรับ

y \u003d f (x, a, b, c, ... ),

ซึ่งจะให้ข้อผิดพลาดกำลังสองค่าเฉลี่ยขั้นต่ำ (ความแปรปรวน)

, (24)

โดยที่ x i, y i คือชุดของจำนวนคู่ที่ได้จากการทดลอง

เนื่องจากเงื่อนไขสำหรับสุดขั้วของฟังก์ชันของตัวแปรหลายตัวจึงเป็นเงื่อนไขของความเท่าเทียมกันเป็นศูนย์ของอนุพันธ์ย่อยพารามิเตอร์ ก, ข, ค, ...ถูกกำหนดจากระบบสมการ:

; ; ; … (25)

ควรจำไว้ว่าวิธีการกำลังสองน้อยที่สุดถูกใช้เพื่อเลือกพารามิเตอร์หลังฟังก์ชัน y \u003d f (x) กำหนด

หากจากการพิจารณาทางทฤษฎีเป็นไปไม่ได้ที่จะสรุปข้อสรุปใด ๆ เกี่ยวกับสิ่งที่สูตรเชิงประจักษ์ควรจะต้องมีการนำเสนอโดยการแสดงภาพโดยส่วนใหญ่เป็นการแสดงข้อมูลที่สังเกตได้ในเชิงกราฟิก

ในทางปฏิบัติส่วนใหญ่มัก จำกัด เฉพาะฟังก์ชันประเภทต่อไปนี้:

1) เชิงเส้น ;

2) กำลังสองก.

{!LANG-a130d04c2f2b505c7f4d12e589b89d38!}{!LANG-eececfefcade4194353233c1afc164b5!}