ฟังก์ชันกำลังสองกำลังสองน้อยที่สุด excel การประยุกต์ใช้วิธีการกำลังสองน้อยที่สุดใน Excel การใช้วิธีการใน Excel
วิธีหนึ่งในการศึกษาความสัมพันธ์สุ่มระหว่างคุณลักษณะคือการวิเคราะห์การถดถอย
การวิเคราะห์การถดถอยเป็นที่มาของสมการการถดถอยโดยใช้ค่าเฉลี่ยของตัวแปรสุ่ม (คุณสมบัติ-ผลลัพธ์) หากทราบค่าของตัวแปรอื่น (หรืออื่น ๆ ) (ปัจจัยคุณสมบัติ) ประกอบด้วยขั้นตอนต่อไปนี้:
- ทางเลือกของรูปแบบการสื่อสาร (ประเภทของสมการถดถอยเชิงวิเคราะห์);
- การประมาณค่าพารามิเตอร์ของสมการ
- การประเมินคุณภาพของสมการถดถอยเชิงวิเคราะห์
ในกรณีของความสัมพันธ์แบบคู่เชิงเส้น สมการถดถอยจะอยู่ในรูปแบบ: y i = a + b x i + u i พารามิเตอร์ของสมการ a และ b นี้ประมาณการจากข้อมูลของการสังเกตทางสถิติ x และ y ผลลัพธ์ของการประเมินดังกล่าวคือสมการ โดยที่ ค่าประมาณของพารามิเตอร์ a และ b คือค่าของแอตทริบิวต์ที่มีประสิทธิผล (ตัวแปร) ที่ได้จากสมการถดถอย (ค่าที่คำนวณ)
ค่าพารามิเตอร์ที่ใช้บ่อยที่สุด วิธีกำลังสองน้อยที่สุด (OLS)
วิธีกำลังสองน้อยที่สุดให้การประมาณค่าพารามิเตอร์ของสมการถดถอยที่ดีที่สุด (สม่ำเสมอ มีประสิทธิภาพ และเป็นกลาง) ที่ดีที่สุด แต่ถ้าเป็นไปตามข้อกำหนดเบื้องต้นบางประการเกี่ยวกับคำสุ่ม (u) และตัวแปรอิสระ (x) (ดูข้อกำหนดเบื้องต้นของ OLS)
ปัญหาการประมาณค่าพารามิเตอร์ของสมการคู่เชิงเส้นโดยวิธีกำลังสองน้อยที่สุดประกอบด้วยสิ่งต่อไปนี้: เพื่อให้ได้ค่าประมาณพารามิเตอร์ดังกล่าวซึ่งผลรวมของกำลังสองของการเบี่ยงเบนของค่าจริงของตัวบ่งชี้ที่มีประสิทธิภาพ - y i จากค่าที่คำนวณได้ - น้อยที่สุด
อย่างเป็นทางการ เกณฑ์ OLSสามารถเขียนได้ดังนี้ .
การจำแนกสี่เหลี่ยมน้อยที่สุด
- วิธีกำลังสองน้อยที่สุด
- วิธีความน่าจะเป็นสูงสุด (สำหรับแบบจำลองการถดถอยเชิงเส้นแบบคลาสสิกปกติ ค่าปกติของเศษเหลือจากการถดถอยจะถูกตั้งสมมติฐานไว้)
- วิธี OLS กำลังสองน้อยที่สุดโดยทั่วไปจะใช้ในกรณีของความสัมพันธ์อัตโนมัติของข้อผิดพลาดและในกรณีของ heteroscedasticity
- วิธีถ่วงน้ำหนักกำลังสองน้อยที่สุด (กรณีพิเศษของ OLS ที่มีเศษเหลือไม่เท่ากัน)
มาอธิบายสาระสำคัญกันเถอะ วิธีแบบกราฟิกกำลังสองน้อยที่สุดแบบคลาสสิก... ในการทำเช่นนี้ เราจะสร้างจุดพล็อตตามข้อมูลการสังเกต (x i, y i, i = 1; n) ในระบบพิกัดสี่เหลี่ยม (พล็อตจุดดังกล่าวเรียกว่าสนามสหสัมพันธ์) ลองหาเส้นตรงที่ใกล้กับจุดสนามสหสัมพันธ์มากที่สุดกัน ตามวิธีการของกำลังสองน้อยที่สุด เส้นจะถูกเลือกเพื่อให้ผลรวมของกำลังสองของระยะห่างแนวตั้งระหว่างจุดของสนามสหสัมพันธ์กับเส้นนี้มีค่าน้อยที่สุด
บันทึกทางคณิตศาสตร์ของปัญหานี้: .
เราทราบค่าของ y i และ x i = 1 ... n ซึ่งเป็นข้อมูลเชิงสังเกต ในฟังก์ชัน S พวกมันคือค่าคงที่ ตัวแปรในฟังก์ชันนี้เป็นค่าประมาณพารามิเตอร์ที่จำเป็น -, ในการหาค่าต่ำสุดของฟังก์ชัน 2 ตัวแปร จำเป็นต้องคำนวณอนุพันธ์ย่อยของฟังก์ชันนี้โดยเทียบกับพารามิเตอร์แต่ละตัวและนำมารวมกันเป็นศูนย์ กล่าวคือ .
เป็นผลให้เราได้ระบบสมการเชิงเส้นปกติ 2 สมการ:
ในการแก้ระบบนี้ เราพบการประมาณค่าพารามิเตอร์ที่จำเป็น:
ความถูกต้องของการคำนวณพารามิเตอร์ของสมการถดถอยสามารถตรวจสอบได้โดยการเปรียบเทียบผลรวม (อาจมีความคลาดเคลื่อนบ้างเนื่องจากการปัดเศษของการคำนวณ)
ในการคำนวณค่าประมาณพารามิเตอร์ คุณสามารถสร้างตารางที่ 1
เครื่องหมายของสัมประสิทธิ์การถดถอย b ระบุทิศทางของความสัมพันธ์ (ถ้า b> 0 ความสัมพันธ์เป็นแบบตรง ถ้า b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
อย่างเป็นทางการ ค่าของพารามิเตอร์ a คือค่าเฉลี่ยของ y ที่ x เท่ากับศูนย์ หากปัจจัยแอตทริบิวต์ไม่มีและไม่สามารถมีค่าเป็นศูนย์ได้ การตีความพารามิเตอร์ a ข้างต้นไม่สมเหตุสมผล
การประเมินความรัดกุมของความสัมพันธ์ระหว่างสัญญาณ
ดำเนินการโดยใช้สัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้น - r x, y สามารถคำนวณได้โดยใช้สูตร: ... นอกจากนี้ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่สามารถกำหนดได้โดยใช้ค่าสัมประสิทธิ์การถดถอย b: .
ช่วงของค่าที่ยอมรับได้ของสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้นคือตั้งแต่ –1 ถึง +1 เครื่องหมายของสัมประสิทธิ์สหสัมพันธ์ระบุทิศทางของการเชื่อมโยง ถ้า r x, y> 0 แสดงว่ามีการเชื่อมต่อโดยตรง ถ้า r x, y<0, то связь обратная.
หากสัมประสิทธิ์นี้ใกล้เคียงกับค่าสัมบูรณ์หนึ่งค่า ความสัมพันธ์ระหว่างคุณลักษณะสามารถตีความได้ว่าเป็นค่าเชิงเส้นที่ค่อนข้างใกล้เคียง หากโมดูลัสของมันเท่ากับหนึ่ง ê r x, y ê = 1 แสดงว่าการเชื่อมต่อระหว่างคุณลักษณะจะเป็นเชิงเส้นเชิงฟังก์ชัน หากจุดสนใจ x และ y มีความเป็นอิสระเชิงเส้น ดังนั้น r x, y จะเข้าใกล้ 0
ในการคำนวณ r x, y คุณสามารถใช้ตารางที่ 1 ได้เช่นกัน
ในการประเมินคุณภาพของสมการถดถอยที่ได้รับจะคำนวณค่าสัมประสิทธิ์ทางทฤษฎีของการกำหนด - R 2 yx:
,
โดยที่ d 2 คือความแปรปรวน y ที่อธิบายโดยสมการถดถอย
e 2 - เศษเหลือ (ไม่ได้อธิบายโดยสมการถดถอย) ความแปรปรวน y;
s 2 y คือความแปรปรวนรวม (ทั้งหมด) ของ y
สัมประสิทธิ์การกำหนดลักษณะสัดส่วนของการแปรผัน (ความแปรปรวน) ของลักษณะที่มีประสิทธิผล y อธิบายโดยการถดถอย (และด้วยเหตุนี้ ปัจจัย x) ในการแปรผันทั้งหมด (ความแปรปรวน) y สัมประสิทธิ์การกำหนด R 2 yx ใช้ค่าตั้งแต่ 0 ถึง 1 ดังนั้น ค่า 1-R 2 yx จะแสดงลักษณะสัดส่วนของความแปรปรวน y ที่เกิดจากอิทธิพลของปัจจัยอื่นๆ ที่ไม่ได้นำมาพิจารณาในข้อผิดพลาดของแบบจำลองและข้อมูลจำเพาะ
ด้วยการถดถอยเชิงเส้นคู่ R 2 yx = r 2 yx
กำลังสองน้อยที่สุดคือขั้นตอนทางคณิตศาสตร์สำหรับการสร้างสมการเชิงเส้นที่ตรงกับชุดของตัวเลขสองชุดมากที่สุด จุดประสงค์ของวิธีนี้คือเพื่อลดความคลาดเคลื่อนกำลังสองทั้งหมดให้เหลือน้อยที่สุด Excel มีเครื่องมือที่คุณสามารถใช้วิธีนี้ในการคำนวณได้ เรามาดูกันว่ามันทำอย่างไร
วิธีการของช่องสี่เหลี่ยมน้อยที่สุด (OLS) เป็นคำอธิบายทางคณิตศาสตร์ของการพึ่งพาตัวแปรตัวหนึ่งกับอีกตัวแปรหนึ่ง สามารถใช้ในการพยากรณ์ได้
การเปิดใช้งาน Solver add-in
ในการใช้ OLS ใน Excel คุณต้องเปิดใช้งาน add-in "ค้นหาวิธีแก้ปัญหา"ซึ่งถูกปิดใช้งานโดยค่าเริ่มต้น
ตอนนี้ฟังก์ชั่น หาทางออกใน Excel ถูกเปิดใช้งานและมีเครื่องมือปรากฏบนริบบอน
เงื่อนไขของปัญหา
ให้เราอธิบายการใช้งานของ OLS ด้วยตัวอย่างเฉพาะ เรามีตัวเลขสองแถว NS และ y ตามลำดับที่แสดงในภาพด้านล่าง
ฟังก์ชันนี้สามารถอธิบายการพึ่งพาอาศัยกันนี้ได้อย่างแม่นยำที่สุด:
นอกจากนี้ เป็นที่ทราบกันดีว่าสำหรับ x = 0 yก็เท่าเทียมกัน 0 ... ดังนั้นสมการนี้สามารถอธิบายได้โดยการพึ่งพา y = นx .
เราต้องหาผลรวมขั้นต่ำของกำลังสองของส่วนต่าง
สารละลาย
มาดูการอธิบายการใช้วิธีการโดยตรงกัน
อย่างที่คุณเห็น การประยุกต์ใช้วิธีกำลังสองน้อยที่สุดเป็นขั้นตอนทางคณิตศาสตร์ที่ค่อนข้างซับซ้อน เราได้แสดงให้เห็นในการดำเนินการโดยใช้ตัวอย่างที่ง่ายที่สุด แต่มีกรณีที่ซับซ้อนมากขึ้น อย่างไรก็ตาม ชุดเครื่องมือ Microsoft Excel ได้รับการออกแบบมาเพื่อลดความซับซ้อนในการคำนวณให้มากที่สุด
วิธีกำลังสองน้อยที่สุด (OLS)
ระบบสมการเชิงเส้น m ที่มีค่าไม่ทราบค่า n มีรูปแบบดังนี้
เป็นไปได้สามกรณี: m ถ้า m> n และระบบสอดคล้องกัน เมทริกซ์ A จะมีแถวที่ขึ้นกับเชิงเส้นอย่างน้อย m - n ที่นี่สามารถหาวิธีแก้ปัญหาได้โดยเลือกสมการอิสระเชิงเส้น n สมการ (ถ้ามี) และใช้สูตร X = A -1 CHV นั่นคือโดยการลดปัญหาลงเป็นสมการที่แก้ไขก่อนหน้านี้ ในกรณีนี้ คำตอบที่ได้จะเป็นไปตามสมการ m - n ที่เหลือเสมอ อย่างไรก็ตามเมื่อใช้คอมพิวเตอร์จะสะดวกกว่าถ้าใช้วิธีทั่วไปมากขึ้น - วิธีกำลังสองน้อยที่สุด วิธีพีชคณิตกำลังสองน้อยที่สุดเป็นที่เข้าใจกันว่าเป็นวิธีการแก้ระบบสมการเชิงเส้น โดยการลดบรรทัดฐานแบบยุคลิดให้น้อยที่สุด ขวาน? NS? > อินฟ. (1.2) พิจารณาการทดลองบางอย่าง ในช่วงเวลานั้น วัดอุณหภูมิ Q (t) เช่น ให้ผลการวัดถูกกำหนดโดยอาร์เรย์ ให้เราสมมติว่าเงื่อนไขของการทดลองนั้นทำให้การวัดมีข้อผิดพลาดโดยเจตนา ในกรณีเหล่านี้ ให้ใช้กฎความแปรผันของอุณหภูมิ Q (t) โดยใช้พหุนาม P (t) = + + + ... +, การหาค่าสัมประสิทธิ์ไม่ทราบค่า ... จากการพิจารณาว่าค่า E (, ...,) กำหนดโดยความเท่าเทียมกัน เกาส์พีชคณิต exel ประมาณ เอาค่าต่ำสุด. เนื่องจากผลรวมของกำลังสองถูกย่อให้เล็กสุด วิธีนี้จึงเรียกว่าข้อมูลกำลังสองน้อยที่สุดพอดี หากเราแทนที่ P (t) ด้วยนิพจน์ เราจะได้ ให้เราสร้างปัญหาในการกำหนดอาร์เรย์เพื่อให้ค่าน้อยที่สุด กล่าวคือ มากำหนดอาร์เรย์โดยใช้วิธีกำลังสองน้อยที่สุด ในการทำเช่นนี้ เราให้อนุพันธ์ย่อยบางส่วนเท่ากับศูนย์: หากคุณป้อน m × n เมทริกซ์ A = (), i = 1, 2 ..., m; j = 1, 2, ..., n โดยที่ ผม = 1, 2 ..., ม.; เจ = 1, 2, ..., น, แล้วความเท่าเทียมที่เป็นลายลักษณ์อักษรก็จะอยู่ในรูป ให้เราเขียนความเท่าเทียมกันเป็นลายลักษณ์อักษรใหม่ในแง่ของการดำเนินการกับเมทริกซ์ เรามีตามนิยามของการคูณเมทริกซ์คอลัมน์ สำหรับเมทริกซ์ทรานสโพส ความสัมพันธ์ที่คล้ายคลึงกันจะเป็นดังนี้ ให้เราแนะนำสัญกรณ์: องค์ประกอบที่ i ของเวกเตอร์ขวานจะแสดงแทน ตามความเท่าเทียมกันของเมทริกซ์ที่เขียนไว้ เราจะมี ในรูปแบบเมทริกซ์ ความเท่าเทียมกันนี้สามารถเขียนใหม่เป็น เอ ที x = เอ ที บี (1.3) โดยที่ A คือเมทริกซ์สี่เหลี่ยม m × n นอกจากนี้ ในปัญหาของการประมาณข้อมูล ตามกฎ m> n สมการ (1.3) เรียกว่าสมการปกติ เป็นไปได้ตั้งแต่ต้นโดยใช้บรรทัดฐานของเวกเตอร์แบบยุคลิดเพื่อเขียนปัญหาในรูปแบบเมทริกซ์ที่เทียบเท่ากัน: เป้าหมายของเราคือลดฟังก์ชันนี้ให้เหลือน้อยที่สุดเมื่อเทียบกับ x ในการที่จะไปถึงค่าต่ำสุดที่จุดสารละลาย อนุพันธ์อันดับ 1 เทียบกับ x ณ จุดนี้จะต้องเท่ากับศูนย์ อนุพันธ์ของฟังก์ชันนี้คือ 2A T B + 2A T ขวาน ดังนั้นคำตอบจึงต้องเป็นไปตามระบบสมการเชิงเส้น (A T A) x = (A T B) สมการเหล่านี้เรียกว่าสมการปกติ ถ้า A เป็นเมทริกซ์ขนาด m × n แล้ว A> A - n × n เป็นเมทริกซ์ กล่าวคือ เมทริกซ์ของสมการปกติจะเป็นเมทริกซ์สมมาตรกำลังสองเสมอ ยิ่งไปกว่านั้น มันมีคุณสมบัติของการกำหนดเชิงบวกในแง่ที่ว่า (A> ขวาน, x) = (ขวาน, ขวาน)? 0. ความคิดเห็น บางครั้งการแก้สมการของรูปแบบ (1.3) เรียกว่าคำตอบของระบบ Axe = B โดยที่ A คือเมทริกซ์สี่เหลี่ยมจัตุรัส m × n (m> n) โดยวิธีกำลังสองน้อยที่สุด ปัญหากำลังสองน้อยที่สุดสามารถตีความแบบกราฟิกได้ว่าเป็นการลดระยะทางแนวตั้งจากจุดข้อมูลไปยังเส้นโค้งแบบจำลอง (ดูรูปที่ 1.1) แนวคิดนี้ตั้งอยู่บนสมมติฐานที่ว่าข้อผิดพลาดทั้งหมดในการประมาณนั้นสอดคล้องกับข้อผิดพลาดในการสังเกต หากมีข้อผิดพลาดในตัวแปรอธิบายด้วย ก็อาจจะเหมาะสมกว่าที่จะลดระยะห่างแบบยุคลิดจากข้อมูลไปยังแบบจำลอง อัลกอริทึมสำหรับการนำ OLS ไปใช้ใน Excel ด้านล่างถือว่าข้อมูลเริ่มต้นทั้งหมดเป็นที่รู้จักแล้ว สมการเมทริกซ์ทั้งสองด้าน AЧX = B ของระบบคูณทางซ้ายด้วยเมทริกซ์ทรานสโพสของระบบ AT: AT AX = AT B จากนั้นเราคูณทั้งสองข้างของสมการทางด้านซ้ายด้วยเมทริกซ์ (AT A) -1 ถ้าเมทริกซ์นี้มีอยู่ ระบบก็จะถูกกำหนด พิจารณาว่า (AT A) -1 * (AT A) = E เราได้ X = (AT A) -1 AT B. สมการเมทริกซ์ที่เป็นผลลัพธ์คือคำตอบของระบบสมการเชิงเส้น m ที่มีค่าไม่ทราบค่า n ค่าสำหรับ m> n ลองพิจารณาการประยุกต์ใช้อัลกอริธึมข้างต้นสำหรับตัวอย่างเฉพาะ ตัวอย่าง. ให้จำเป็นต้องแก้ระบบ ใน Excel รายการที่มีโซลูชันในโหมดแสดงสูตรสำหรับงานนี้มีลักษณะดังนี้: ผลการคำนวณ: เวกเตอร์ X ที่ต้องการจะอยู่ในช่วง E11: E12 เมื่อแก้ระบบสมการเชิงเส้นที่กำหนด จะใช้ฟังก์ชันต่อไปนี้: 1. MOBRE - ส่งกลับค่าผกผันของเมทริกซ์ที่เก็บไว้ในอาร์เรย์ ไวยากรณ์: MOBR (อาร์เรย์) Array - อาร์เรย์ตัวเลขที่มีจำนวนแถวและคอลัมน์เท่ากัน 2. MULTIPLE - ส่งคืนผลิตภัณฑ์ของเมทริกซ์ (เมทริกซ์ถูกเก็บไว้ในอาร์เรย์) ผลลัพธ์คืออาร์เรย์ที่มีจำนวนแถวเท่ากับ array1 และจำนวนคอลัมน์เท่ากับ array2 ไวยากรณ์: MULTIPLE (array1, array2) Array1, array2 - อาร์เรย์คูณ หลังจากป้อนฟังก์ชันในเซลล์ด้านซ้ายบนของช่วงอาร์เรย์แล้ว ให้เลือกอาร์เรย์ที่ขึ้นต้นด้วยเซลล์ที่มีสูตร จากนั้นกด F2 จากนั้นกด CTRL + SHIFT + ENTER 3. TRANSPOSE - แปลงชุดเซลล์แนวตั้งเป็นแนวนอนหรือกลับกัน ผลลัพธ์ของการใช้ฟังก์ชันนี้คืออาร์เรย์ที่มีจำนวนแถวเท่ากับจำนวนคอลัมน์ในอาร์เรย์ดั้งเดิม และจำนวนคอลัมน์เท่ากับจำนวนแถวในอาร์เรย์เริ่มต้น มีแอปพลิเคชันมากมาย เนื่องจากช่วยให้สามารถแสดงฟังก์ชันที่กำหนดโดยฟังก์ชันอื่นที่ง่ายกว่าได้โดยประมาณ OLS มีประโยชน์อย่างยิ่งในการประมวลผลการสังเกต และมีการใช้อย่างแข็งขันเพื่อประเมินปริมาณบางส่วนจากผลการวัดอื่นๆ ที่มีข้อผิดพลาดแบบสุ่ม บทความนี้จะแสดงวิธีการใช้การคำนวณกำลังสองน้อยที่สุดใน Excel สมมติว่ามีตัวบ่งชี้ X และ Y สองตัว และ Y ขึ้นอยู่กับ X เนื่องจาก OLS เป็นที่สนใจของเราจากมุมมองของการวิเคราะห์การถดถอย (ใน Excel วิธีการของมันถูกใช้งานโดยใช้ฟังก์ชันในตัว) คุณควรไปทันที เพื่อพิจารณาปัญหาเฉพาะ ดังนั้น ให้ X เป็นพื้นที่ค้าปลีกของร้านขายของชำ โดยวัดเป็นตารางเมตร และ Y คือมูลค่าการซื้อขายประจำปีที่วัดเป็นล้านรูเบิล จำเป็นต้องคาดการณ์มูลค่าการซื้อขาย (Y) ที่ร้านค้าจะมีหากมีพื้นที่ค้าปลีกเฉพาะ เห็นได้ชัดว่าฟังก์ชัน Y = f (X) กำลังเพิ่มขึ้น เนื่องจากไฮเปอร์มาร์เก็ตขายสินค้ามากกว่าแผงลอย สมมติว่าเรามีตารางที่สร้างจากข้อมูลสำหรับร้านค้า n ตามสถิติทางคณิตศาสตร์ ผลลัพธ์จะถูกต้องไม่มากก็น้อยหากตรวจสอบข้อมูลเกี่ยวกับวัตถุอย่างน้อย 5-6 ชิ้น นอกจากนี้ คุณไม่สามารถใช้ผลลัพธ์ "ผิดปกติ" ได้ โดยเฉพาะอย่างยิ่ง บูติกขนาดเล็กชั้นยอดสามารถมียอดขายมากกว่าการหมุนเวียนของร้านค้าปลีกขนาดใหญ่ในระดับ "masmarket" หลายเท่า ข้อมูลตารางสามารถแสดงบนระนาบคาร์ทีเซียนเป็นจุด M 1 (x 1, y 1),… M n (x n, y n) ตอนนี้การแก้ปัญหาจะลดลงเหลือการเลือกฟังก์ชันการประมาณ y = f (x) ซึ่งมีกราฟผ่านใกล้จุด M 1, M 2, .. M n. แน่นอน คุณสามารถใช้พหุนามระดับสูงได้ แต่ตัวเลือกดังกล่าวไม่เพียงแต่นำไปใช้ได้ยาก แต่ยังไม่ถูกต้องอีกด้วย เนื่องจากจะไม่สะท้อนถึงแนวโน้มหลักที่ต้องตรวจพบ วิธีแก้ปัญหาที่สมเหตุสมผลที่สุดคือการหาเส้นตรง y = ax + b ซึ่งใกล้เคียงกับข้อมูลการทดลองมากที่สุด หรือมากกว่าคือค่าสัมประสิทธิ์ - a และ b สำหรับการประมาณใด ๆ การประเมินความถูกต้องมีความสำคัญเป็นพิเศษ ให้เราแสดงด้วย e i ความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าการทำงานและค่าทดลองสำหรับจุด x i นั่นคือ e i = y i - f (x i) เห็นได้ชัดว่า ในการประมาณความแม่นยำของการประมาณ สามารถใช้ผลรวมของค่าเบี่ยงเบนได้ เช่น เมื่อเลือกเส้นตรงสำหรับการแทนค่าโดยประมาณของการพึ่งพา X บน Y ควรกำหนดการตั้งค่าให้กับค่าที่มีค่าน้อยที่สุดของ sum ei ทุกจุดที่อยู่ในการพิจารณา อย่างไรก็ตามไม่ใช่ทุกอย่างจะง่ายนักเนื่องจากจะมีการเบี่ยงเบนเชิงลบพร้อมกับการเบี่ยงเบนเชิงบวก ปัญหาสามารถแก้ไขได้โดยใช้โมดูลของการเบี่ยงเบนหรือกำลังสอง วิธีสุดท้ายเป็นวิธีที่ใช้กันอย่างแพร่หลาย มีการใช้ในหลายพื้นที่ รวมถึงการวิเคราะห์การถดถอย (Excel ใช้ฟังก์ชันในตัวสองตัว) และได้รับการพิสูจน์แล้วว่าคุ้มค่ามาช้านาน ดังที่คุณทราบใน Excel มีฟังก์ชัน autosum ในตัวที่ให้คุณคำนวณค่าของค่าทั้งหมดที่อยู่ในขอบเขตที่เลือก ดังนั้น ไม่มีอะไรขัดขวางเราจากการคำนวณค่าของนิพจน์ (e 1 2 + e 2 2 + e 3 2 + ... e n 2) ในสัญกรณ์คณิตศาสตร์ดูเหมือนว่า: ตั้งแต่แรกเริ่มตัดสินใจประมาณโดยใช้เส้นตรง เรามี: ดังนั้น ปัญหาในการค้นหาเส้นตรงที่อธิบายการพึ่งพาเฉพาะของปริมาณ X และ Y ได้ดีที่สุดจึงลดลงเหลือเพียงการคำนวณฟังก์ชันขั้นต่ำของตัวแปรสองตัว: สิ่งนี้ต้องเท่ากับศูนย์อนุพันธ์ย่อยบางส่วนเมื่อเทียบกับตัวแปรใหม่ a และ b และการแก้ระบบพื้นฐานที่ประกอบด้วยสมการสองสมการที่มี 2 รูปแบบที่ไม่ทราบรูปแบบ: หลังจากการแปลงอย่างง่าย รวมถึงการหารด้วย 2 และจัดการผลรวม เราจะได้: การแก้ปัญหา ตัวอย่างเช่น โดยวิธีของ Cramer เราจะได้จุดคงที่ที่มีค่าสัมประสิทธิ์ a * และ b * นี่คือค่าขั้นต่ำ กล่าวคือ เพื่อคาดการณ์ว่ามูลค่าการซื้อขายของร้านค้าจะมีเท่าไรสำหรับพื้นที่หนึ่ง เส้นตรง y = a * x + b * ซึ่งเป็นแบบจำลองการถดถอยสำหรับตัวอย่างที่เป็นปัญหานั้นเหมาะสม แน่นอนว่าจะไม่อนุญาตให้คุณค้นหาผลลัพธ์ที่แน่นอน แต่จะช่วยให้คุณทราบว่าการซื้อด้วยเครดิตสำหรับร้านค้าในพื้นที่เฉพาะจะได้ผลหรือไม่ Excel มีฟังก์ชันสำหรับคำนวณค่า OLS มีรูปแบบดังนี้: "TREND" (ค่า Y ที่รู้จัก ค่า X ที่รู้จัก ค่า X ใหม่ const.) ลองใช้สูตรการคำนวณ OLS ใน Excel กับตารางของเรา ในการดำเนินการนี้ ในเซลล์ที่ควรแสดงผลการคำนวณด้วยวิธีกำลังสองน้อยที่สุดใน Excel ให้ป้อนเครื่องหมาย "=" และเลือกฟังก์ชัน "TREND" ในหน้าต่างที่เปิดขึ้น ให้กรอกข้อมูลในฟิลด์ที่เหมาะสม โดยเน้น: นอกจากนี้ สูตรยังมีตัวแปรบูลีน "Const" หากคุณป้อน 1 ในฟิลด์ที่เกี่ยวข้อง นี่จะหมายความว่าควรทำการคำนวณ โดยสมมติว่า b = 0 หากคุณต้องการทราบการคาดการณ์สำหรับค่า x มากกว่าหนึ่งค่าจากนั้นหลังจากป้อนสูตรแล้ว คุณไม่ควรกด "Enter" แต่คุณต้องพิมพ์ชุดค่าผสม "Shift" + "Control" + "Enter" บนแป้นพิมพ์ ("เข้า"). การวิเคราะห์การถดถอยอาจมีให้สำหรับหุ่นจำลอง สูตร Excel สำหรับการทำนายค่าของอาร์เรย์ของตัวแปรที่ไม่รู้จัก - "TREND" - สามารถใช้ได้กับผู้ที่ไม่เคยได้ยินวิธีกำลังสองน้อยที่สุด แค่รู้คุณสมบัติบางอย่างของงานของเธอก็เพียงพอแล้ว โดยเฉพาะอย่างยิ่ง: มันถูกนำไปใช้กับหลายฟังก์ชั่น หนึ่งในนั้นเรียกว่า "พยากรณ์" คล้ายกับ "TREND" นั่นคือให้ผลลัพธ์ของการคำนวณโดยใช้วิธีกำลังสองน้อยที่สุด อย่างไรก็ตาม สำหรับ X หนึ่งรายการเท่านั้น ซึ่งไม่ทราบค่า Y ตอนนี้คุณรู้สูตรใน Excel สำหรับหุ่นที่ช่วยให้คุณทำนายมูลค่าในอนาคตของตัวบ่งชี้ที่กำหนดตามแนวโน้มเชิงเส้น ในที่ทำงานพวกเขารายงานไปยังการตรวจสอบบทความถูกเขียนขึ้นที่บ้านสำหรับการประชุม - ตอนนี้คุณสามารถเขียนถึงบล็อก ในขณะที่ฉันกำลังประมวลผลข้อมูล ฉันรู้ว่าฉันไม่สามารถช่วย แต่เขียนเกี่ยวกับ add-in ที่ยอดเยี่ยมและจำเป็นใน Excel ซึ่งเรียกว่า ดังนั้นบทความนี้จะทุ่มเทให้กับ Add-in นี้โดยเฉพาะและฉันจะบอกคุณเกี่ยวกับเรื่องนี้โดยใช้ตัวอย่างการใช้งาน วิธีกำลังสองน้อยที่สุด(OLS) เพื่อค้นหาสัมประสิทธิ์สมการที่ไม่รู้จักเมื่ออธิบายข้อมูลการทดลอง วิธีเปิดใช้งาน Find Solution add-in ก่อนอื่น มาดูวิธีเปิดใช้งาน Add-in นี้กันก่อน 1. ไปที่เมนู "ไฟล์" และเลือก "ตัวเลือก Excel" 2. ในหน้าต่างที่ปรากฏขึ้น เลือก "ค้นหาวิธีแก้ปัญหา" และคลิก "ไป" 3. ในหน้าต่างถัดไป ให้ทำเครื่องหมายที่หน้ารายการ "ค้นหาวิธีแก้ปัญหา" แล้วคลิก "ตกลง" 4. เปิดใช้งานส่วนเสริม - ตอนนี้สามารถพบได้ในรายการเมนู "ข้อมูล" ตอนนี้สั้น ๆ เกี่ยวกับ วิธีกำลังสองน้อยที่สุด (OLS)
และสามารถนำไปใช้ได้ที่ไหน สมมติว่าเรามีชุดข้อมูลหลังจากที่เราทำการทดลอง ซึ่งเราศึกษาผลกระทบของค่า X ต่อค่า Y เราต้องการอธิบายอิทธิพลนี้ทางคณิตศาสตร์ เพื่อที่เราจะได้ใช้สูตรนี้ในภายหลังและรู้ว่าถ้าเราเปลี่ยนค่าของ X ไปมาก เราก็จะได้ค่าของ Y ดังนั้น ... ฉันจะยกตัวอย่างง่ายๆ (ดูรูป) เป็นที่ชัดเจนว่าจุดต่างๆ เรียงต่อกันราวกับเป็นเส้นตรง ดังนั้นเราจึงถือว่าการพึ่งพาอาศัยกันของเราอธิบายโดยฟังก์ชันเชิงเส้น y = kx + b ในขณะเดียวกัน เราแน่ใจอย่างแน่นอนว่าเมื่อ X เท่ากับศูนย์ ค่าของ Y ก็จะเท่ากับศูนย์ด้วย ซึ่งหมายความว่าฟังก์ชันที่อธิบายการพึ่งพาอาศัยกันจะง่ายยิ่งขึ้น: y = kx (จำหลักสูตรของโรงเรียน) โดยทั่วไป เราต้องหาสัมประสิทธิ์ k นี่คือสิ่งที่เราจะทำกับ OLS
โดยใช้ส่วนเสริม "ค้นหาวิธีแก้ปัญหา" วิธีการประกอบด้วยความจริงที่ว่า (ที่นี่ - ความสนใจ: คุณต้องคิดเกี่ยวกับมัน) ผลรวมของกำลังสองของความแตกต่างระหว่างค่าที่ได้จากการทดลองกับค่าที่คำนวณได้นั้นน้อยที่สุด นั่นคือเมื่อ X1 = 1 ค่าที่วัดได้จริง Y1 = 4.6 และค่าที่คำนวณได้ y1 = f (x1) คือ 4 ค่ากำลังสองของผลต่างจะเป็น (y1-Y1) ^ 2 = (4-4.6) ^ 2 = 0.36 ... เช่นเดียวกัน: เมื่อ X2 = 2 ค่าที่วัดได้จริง Y2 = 8.1 และ y2 ที่คำนวณได้คือ 8 ค่ากำลังสองของผลต่างจะเป็น (y2-Y2) ^ 2 = (8-8.1) ^ 2 = 0.01 . และผลรวมของกำลังสองเหล่านี้ควรมีค่าน้อยที่สุด เรามาเริ่มฝึกการใช้ OLS และ ค้นหาโซลูชัน Add-in ของ Excel
. 1. หากคุณไม่ได้เปิดส่วนเสริม "ค้นหาวิธีแก้ปัญหา" ให้กลับไปที่ point วิธีเปิดใช้งานการค้นหาโซลูชัน add-in และ enable 🙂 2. ในเซลล์ A1 ให้ป้อนค่า "1" หน่วยนี้จะเป็นค่าประมาณแรกของค่าจริงของสัมประสิทธิ์ (k) ของการพึ่งพาฟังก์ชัน y = kx 3. ในคอลัมน์ B เรามีค่าของพารามิเตอร์ X ในคอลัมน์ C - ค่าของพารามิเตอร์ Y ในเซลล์ของคอลัมน์ D เราป้อนสูตร: "สัมประสิทธิ์ k คูณด้วยค่าของ X ” ตัวอย่างเช่น ในเซลล์ D1 เราป้อน "= A1 * B1" ในเซลล์ D2 เราป้อน "= A1 * B2" เป็นต้น 4. เราเชื่อว่าสัมประสิทธิ์ k เท่ากับหนึ่ง และฟังก์ชัน f (x) = y = 1 * x เป็นการประมาณค่าแรกสำหรับโซลูชันของเรา เราสามารถคำนวณผลรวมของกำลังสองของส่วนต่างระหว่างค่าที่วัดได้ของ Y และค่าที่คำนวณโดยสูตร y = 1 * x เราสามารถทำสิ่งนี้ได้ด้วยตนเองโดยใส่การอ้างอิงเซลล์ที่เหมาะสมลงในสูตร: "= (D2-C2) ^ 2 + (D3-C3) ^ 2 + (D4-C4) ^ 2 ... เป็นต้น ในที่สุดเราก็เป็น เข้าใจผิดและเข้าใจว่าเราเสียเวลาไปมากแล้ว ใน Excel สำหรับการคำนวณผลรวมกำลังสองของส่วนต่างมีสูตรพิเศษ "SUMKVRAZN" ซึ่งจะทำทุกอย่างให้เรา ป้อนในเซลล์ A2 และตั้งค่าเริ่มต้น ข้อมูล: ช่วงของค่าที่วัดได้ Y (คอลัมน์ C) และช่วงของค่า Y ที่คำนวณได้ (คอลัมน์ D) 4. คำนวณผลรวมของความแตกต่างของช่องสี่เหลี่ยมแล้ว - ตอนนี้เราไปที่แท็บ "ข้อมูล" และเลือก "ค้นหาวิธีแก้ปัญหา" 5. ในเมนูที่ปรากฏขึ้น ให้เลือกเซลล์ A1 (เซลล์ที่มีค่าสัมประสิทธิ์ k) เป็นเซลล์ที่จะเปลี่ยนแปลง 6. เลือกเซลล์ A2 เป็นเป้าหมายและตั้งค่าเงื่อนไข "ตั้งค่าให้เท่ากับค่าต่ำสุด" จำไว้ว่านี่คือเซลล์ที่เราคำนวณผลรวมของกำลังสองของส่วนต่างระหว่างค่าที่คำนวณและค่าที่วัดได้ และผลรวมนี้ควรมีค่าน้อยที่สุด คลิก "ดำเนินการ" 7. เลือกค่าสัมประสิทธิ์ k ตอนนี้คุณสามารถตรวจสอบได้ว่าค่าที่คำนวณได้นั้นใกล้เคียงกับค่าที่วัดได้มาก โดยทั่วไปแล้ว ในการประมาณข้อมูลทดลองใน Excel มีเครื่องมือพิเศษที่ช่วยให้คุณสามารถอธิบายข้อมูลโดยใช้ฟังก์ชันเชิงเส้น เลขชี้กำลัง ยกกำลัง และพหุนาม คุณจึงมักจะทำได้โดยไม่ต้องใช้ n โปรแกรมเสริมการค้นหาโซลูชัน... ฉันพูดถึงวิธีการประมาณเหล่านี้ในเหมืองของฉันแล้ว ดังนั้นหากคุณสนใจ ลองดูสิ แต่เมื่อพูดถึงฟังก์ชั่นที่แปลกใหม่ ด้วยค่าสัมประสิทธิ์ไม่ทราบค่าหนึ่งค่าหรือปัญหาการเพิ่มประสิทธิภาพ ที่นี่ โครงสร้างส่วนบนมีโอกาสมาก ค้นหาโซลูชัน add-inสามารถใช้สำหรับงานอื่น ๆ สิ่งสำคัญคือการทำความเข้าใจสาระสำคัญ: มีเซลล์ที่เราเลือกค่าและมีเซลล์เป้าหมายที่มีการตั้งค่าเงื่อนไขสำหรับการเลือกพารามิเตอร์ที่ไม่รู้จัก พีชคณิตกำลังสองน้อยที่สุด
การวิเคราะห์ข้อมูลการทดลอง
OLS เป็น Excel
คำชี้แจงปัญหาโดยใช้ตัวอย่างเฉพาะ
คำสองสามคำเกี่ยวกับความถูกต้องของข้อมูลเบื้องต้นที่ใช้สำหรับการทำนาย
สาระสำคัญของวิธีการ
การประเมินความแม่นยำ
วิธีกำลังสองน้อยที่สุด
วิธีการใช้วิธีกำลังสองน้อยที่สุดใน Excel
คุณสมบัติบางอย่าง
ฟังก์ชันพยากรณ์
วิธีกำลังสองน้อยที่สุด
การใช้ add-in การค้นหาโซลูชัน
ป.ล.
นั่นคือทั้งหมด! ในบทความถัดไปฉันจะเล่านิทานเกี่ยวกับวันหยุดให้คุณฟัง เพื่อไม่ให้พลาดบทความ