วิธีการกำลังสองน้อยที่สุดและหาคำตอบใน Excel วิธีการกำลังสองน้อยที่สุดใน Excel การวิเคราะห์การถดถอย กำลังสองน้อยที่สุดในตัวอย่าง excel

4.1. การใช้ฟังก์ชันในตัว

การคำนวณ สัมประสิทธิ์การถดถอยดำเนินการโดยใช้ฟังก์ชัน

LINEST(Values_y; ค่า_x; Konst; สถิติ),

Values_y- อาร์เรย์ของค่า y

ค่า_x- อาร์เรย์ของค่าทางเลือก xถ้าอาร์เรย์ Xละเว้น ถือว่านี่คืออาร์เรย์ (1;2;3;...) ที่มีขนาดเท่ากับ Values_y,

Konst- ค่าบูลีนที่ระบุว่าต้องการค่าคงที่หรือไม่ เท่ากับ 0 ถ้า Konstมีความหมาย จริงหรือละเว้นแล้ว คำนวณด้วยวิธีปกติ ถ้าข้อโต้แย้ง Konstเป็นเท็จ ดังนั้น จะถือว่าเป็น 0 และค่า เอถูกเลือกเพื่อให้ความสัมพันธ์ y=ขวาน

สถิติ- ค่าบูลีนที่ระบุว่าต้องส่งคืนสถิติการถดถอยเพิ่มเติมหรือไม่ ถ้าข้อโต้แย้ง สถิติมีความหมาย จริงจากนั้นฟังก์ชัน LINESTส่งกลับสถิติการถดถอยเพิ่มเติม ถ้าข้อโต้แย้ง สถิติมีความหมาย โกหกหรือละเว้นแล้วฟังก์ชัน LINESTส่งกลับเฉพาะค่าสัมประสิทธิ์ เอและถาวร .

ต้องจำไว้ว่าผลของการทำงาน LINEST()เป็นชุดของค่า - อาร์เรย์

สำหรับการคำนวณ ค่าสัมประสิทธิ์สหสัมพันธ์ใช้ฟังก์ชัน

CORREL(Array1;Array2),

ส่งคืนค่าสัมประสิทธิ์สหสัมพันธ์โดยที่ Array1- อาร์เรย์ของค่า y, Array2- อาร์เรย์ของค่า x. Array1และ Array2จะต้องมีขนาดเท่ากัน

ตัวอย่าง 1. ติดยาเสพติด y(x) ถูกนำเสนอในตาราง สร้าง เส้นถดถอยและคำนวณ ค่าสัมประสิทธิ์สหสัมพันธ์.

y 0.5 1.5 2.5 3.5
x 2.39 2.81 3.25 3.75 4.11 4.45 4.85 5.25

ป้อนตารางค่าลงในแผ่นงาน MS Excel และสร้างพล็อตแบบกระจาย แผ่นงานจะอยู่ในรูปแบบที่แสดงในรูปที่ 2.

เพื่อคำนวณค่าสัมประสิทธิ์การถดถอย เอและ เลือกเซลล์ A7:B7,ไปที่ตัวช่วยสร้างฟังก์ชันและในหมวดหมู่ สถิติเลือกฟังก์ชั่น LINEST. กรอกข้อมูลในไดอะล็อกบ็อกซ์ที่แสดงตามรูปที่ 3 แล้วกด ตกลง.


เป็นผลให้ค่าที่คำนวณจะปรากฏเฉพาะในเซลล์ A6(รูปที่ 4). สำหรับค่าที่จะปรากฏในเซลล์ B6คุณต้องเข้าสู่โหมดแก้ไข (key F2)แล้วกดคีย์ผสม CTRL+SHIFT+ENTER.

เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ต่อเซลล์ C6มีการแนะนำสูตรต่อไปนี้:

C7=CORREL(B3:J3;B2:J2).

รู้ค่าสัมประสิทธิ์การถดถอย เอและ คำนวณค่าของฟังก์ชัน y=ขวาน+สำหรับให้ x. ในการทำเช่นนี้เราขอแนะนำสูตร

B5=$A$7*B2+$B$7

และคัดลอกไปยังช่วง С5:J5(รูปที่ 5).

ลองพลอตเส้นการถดถอยบนไดอะแกรม เลือกจุดทดสอบบนแผนภูมิ คลิกขวาและเลือกคำสั่ง ข้อมูลเบื้องต้น. ในกล่องโต้ตอบที่ปรากฏขึ้น (รูปที่ 5) ให้เลือกแท็บ แถวและคลิกที่ปุ่ม เพิ่ม. กรอกข้อมูลลงในช่องป้อนข้อมูล ดังแสดงในรูปที่ 6 แล้วกดปุ่ม ตกลง. เส้นการถดถอยจะถูกเพิ่มลงในแผนภาพข้อมูลทดลอง โดยค่าเริ่มต้น กราฟจะแสดงเป็นจุดที่ไม่ได้เชื่อมต่อกันด้วยเส้นที่ปรับให้เรียบ



ในการเปลี่ยนลักษณะที่ปรากฏของเส้นการถดถอย ให้ทำตามขั้นตอนต่อไปนี้ คลิกขวาที่จุดที่แสดงกราฟเส้น เลือกคำสั่ง ประเภทแผนภูมิและกำหนดประเภทของแผนภาพกระจาย ดังแสดงในรูปที่ 7.

สามารถเปลี่ยนชนิดเส้น สี และความหนาได้ดังนี้ เลือกเส้นบนไดอะแกรม กดปุ่มเมาส์ขวาและเลือกคำสั่งในเมนูบริบท รูปแบบชุดข้อมูล…ถัดไป ทำการตั้งค่า เช่น ดังแสดงในรูปที่ แปด.

จากการแปลงทั้งหมด เราได้กราฟของข้อมูลทดลองและเส้นการถดถอยในพื้นที่กราฟิกเดียว (รูปที่ 9)

4.2. การใช้เส้นแนวโน้ม

การสร้างการขึ้นต่อกันโดยประมาณต่างๆ ใน ​​MS Excel ถูกนำไปใช้เป็นคุณสมบัติแผนภูมิ - เส้นแนวโน้ม.

ตัวอย่าง 2. จากผลการทดลอง ได้มีการพิจารณาการพึ่งพาแบบตารางบางส่วน

0.15 0.16 0.17 0.18 0.19 0.20
4.4817 4.4930 5.4739 6.0496 6.6859 7.3891

เลือกและสร้างการพึ่งพาอาศัยกันโดยประมาณ สร้างกราฟของการพึ่งพาการวิเคราะห์แบบตารางและแบบติดตั้ง

การแก้ปัญหาสามารถแบ่งออกเป็นขั้นตอนต่อไปนี้: การป้อนข้อมูลเริ่มต้น การสร้างพล็อตกระจาย และการเพิ่มเส้นแนวโน้มลงในพล็อตนี้

ลองพิจารณากระบวนการนี้โดยละเอียด ป้อนข้อมูลเริ่มต้นลงในแผ่นงานและลงจุดข้อมูลการทดลอง จากนั้นเลือกจุดทดสอบบนแผนภูมิ คลิกขวาและใช้คำสั่ง เพิ่ม l เส้นแนวโน้ม(รูปที่ 10).

กล่องโต้ตอบที่ปรากฏขึ้นช่วยให้คุณสร้างการพึ่งพาอาศัยกันโดยประมาณ

แท็บแรก (รูปที่ 11) ของหน้าต่างนี้ระบุประเภทของการพึ่งพาอาศัยกันโดยประมาณ

อันที่สอง (รูปที่ 12) กำหนดพารามิเตอร์การก่อสร้าง:

ชื่อของการพึ่งพาอาศัยกันโดยประมาณ

พยากรณ์ไปข้างหน้า (ย้อนกลับ) บน หน่วย (พารามิเตอร์นี้กำหนดจำนวนหน่วยไปข้างหน้า (ย้อนกลับ) จำเป็นต้องขยายเส้นแนวโน้ม);

ว่าจะแสดงจุดตัดของเส้นโค้งกับเส้นหรือไม่ y=const;

จะแสดงฟังก์ชันการประมาณบนไดอะแกรมหรือไม่ (แสดงสมการบนพารามิเตอร์ไดอะแกรม);

จะวางค่าของค่าเบี่ยงเบนมาตรฐานบนไดอะแกรมหรือไม่ (พารามิเตอร์สำหรับวางค่าความน่าเชื่อถือโดยประมาณบนไดอะแกรม)

ให้เราเลือกพหุนามของดีกรีที่สองเป็นการพึ่งพาอาศัยกันโดยประมาณ (รูปที่ 11) และรับสมการที่อธิบายพหุนามนี้บนกราฟ (รูปที่ 12) ไดอะแกรมผลลัพธ์จะแสดงในรูปที่ สิบสาม

ในทำนองเดียวกันกับ เส้นแนวโน้มคุณสามารถเลือกพารามิเตอร์ของการพึ่งพาเช่น

เชิงเส้น y=เป็∙x+,

ลอการิทึม y=ln(x)+,

เลขชี้กำลัง y=a∙eb,

พลัง y=ก x ข,

พหุนาม y=เป็∙x 2 +ข∙x+, y=เป็∙x 3 +ข∙x 2 +c∙x+dและอื่นๆ จนถึงและรวมถึงพหุนามดีกรีที่ 6

การกรองเชิงเส้น

4.3. การใช้เครื่องมือวิเคราะห์ตัวเลือก: ค้นหาวิธีแก้ปัญหา

สิ่งที่น่าสนใจมากคือการนำไปใช้ใน MS Excel ของการเลือกพารามิเตอร์ของการพึ่งพาฟังก์ชันโดยวิธีกำลังสองน้อยที่สุดโดยใช้เครื่องมือวิเคราะห์ตัวเลือก: ค้นหาวิธีแก้ปัญหา เทคนิคนี้ช่วยให้คุณเลือกพารามิเตอร์ของฟังก์ชันประเภทใดก็ได้ ลองพิจารณาความเป็นไปได้นี้กับตัวอย่างของปัญหาต่อไปนี้

ตัวอย่าง 3. จากการทดลองพบว่าการพึ่งพา z(t) แสดงในตาราง

0,66 0,9 1,17 1,47 1,7 1,74 2,08 2,63 3,12
38,9 68,8 64,4 66,5 64,95 59,36 82,6 90,63 113,5

เลือกค่าสัมประสิทธิ์การพึ่งพา Z(t)=ที่ 4 +Bt 3 +Ct 2 +Dt+Kโดยวิธีกำลังสองน้อยที่สุด

ปัญหานี้เทียบเท่ากับปัญหาการหาค่าฟังก์ชันขั้นต่ำของตัวแปร 5 ตัว

พิจารณาขั้นตอนการแก้ปัญหาการปรับให้เหมาะสม (รูปที่ 14)

ให้ค่า อา, วี, กับ, ดีและ ถึงเก็บไว้ในเซลล์ A7:E7. คำนวณค่าทางทฤษฎีของฟังก์ชัน Z(t)=At4+Bt3+Ct2+Dt+Kสำหรับให้ t(B2:J2). การทำเช่นนี้ในเซลล์ B4ป้อนค่าของฟังก์ชันที่จุดแรก (cell B2):

B4=$A$7*B2^4+$B$7*B2^3+$C$7*B2^2+$D$7*B2+$E$7.

คัดลอกสูตรนี้ลงในช่วง С4:J4และรับค่าที่คาดหวังของฟังก์ชัน ณ จุด ซึ่ง abscissas จะถูกเก็บไว้ในเซลล์ B2:J2.

สู่เซลล์ B5เราแนะนำสูตรที่คำนวณกำลังสองของความแตกต่างระหว่างจุดทดลองและจุดที่คำนวณได้:

B5=(B4-B3)^2,

และคัดลอกไปยังช่วง С5:J5. ในเซลล์ F7เราจะเก็บค่าคลาดเคลื่อนกำลังสองทั้งหมด (10) ในการทำเช่นนี้ เราขอแนะนำสูตร:

F7 = SUM(B5:J5).

มาใช้คำสั่ง บริการ®ค้นหาวิธีแก้ปัญหาและแก้ปัญหาการเพิ่มประสิทธิภาพโดยไม่มีข้อจำกัด กรอกข้อมูลลงในช่องป้อนข้อมูลที่เหมาะสมในกล่องโต้ตอบที่แสดงในรูปที่ 14 แล้วกดปุ่ม วิ่ง. หากพบวิธีแก้ปัญหา หน้าต่างที่แสดงในรูปที่ 15.

ผลลัพธ์ของบล็อกการตัดสินใจจะเป็นผลลัพธ์ไปยังเซลล์ A7:E7ค่าพารามิเตอร์ฟังก์ชั่น Z(t)=At4+Bt3+Ct2+Dt+K. ในเซลล์ B4:J4เราได้รับ ค่าฟังก์ชันที่คาดไว้ที่จุดเริ่มต้น ในเซลล์ F7จะเก็บไว้ ข้อผิดพลาดกำลังสองทั้งหมด.

คุณสามารถแสดงจุดทดลองและเส้นที่พอดีในพื้นที่กราฟิกเดียวกันได้หากคุณเลือกช่วง B2:J4, เรียก ตัวช่วยสร้างแผนภูมิแล้วจัดรูปแบบลักษณะที่ปรากฏของกราฟผลลัพธ์

ข้าว. 17 แสดงเวิร์กชีต MS Excel หลังจากทำการคำนวณแล้ว

มีแอปพลิเคชันมากมาย เนื่องจากช่วยให้สามารถแสดงฟังก์ชันที่กำหนดโดยฟังก์ชันอื่นที่ง่ายกว่าได้โดยประมาณ LSM สามารถเป็นประโยชน์อย่างยิ่งในการประมวลผลการสังเกต และมีการใช้อย่างแข็งขันเพื่อประเมินปริมาณบางส่วนจากผลการวัดอื่นๆ ที่มีข้อผิดพลาดแบบสุ่ม ในบทความนี้ คุณจะได้เรียนรู้วิธีใช้การคำนวณกำลังสองน้อยที่สุดใน Excel

คำชี้แจงปัญหาในตัวอย่างเฉพาะ

สมมติว่ามีตัวบ่งชี้ X และ Y สองตัว นอกจากนี้ Y ขึ้นอยู่กับ X เนื่องจาก OLS เป็นที่สนใจของเราจากมุมมองของการวิเคราะห์การถดถอย (ใน Excel วิธีการของมันถูกใช้งานโดยใช้ฟังก์ชันในตัว) เราจึงควรดำเนินการทันที เพื่อพิจารณาปัญหาเฉพาะ

ดังนั้น ให้ X เป็นพื้นที่ขายของร้านขายของชำ โดยวัดเป็นตารางเมตร และ Y คือมูลค่าการซื้อขายประจำปี ซึ่งกำหนดไว้เป็นล้านรูเบิล

จำเป็นต้องคาดการณ์มูลค่าการซื้อขาย (Y) ที่ร้านค้าจะมีหากมีพื้นที่ค้าปลีกหนึ่งแห่งหรืออื่น เห็นได้ชัดว่าฟังก์ชัน Y = f (X) กำลังเพิ่มขึ้น เนื่องจากไฮเปอร์มาร์เก็ตขายสินค้ามากกว่าแผงลอย

คำสองสามคำเกี่ยวกับความถูกต้องของข้อมูลเบื้องต้นที่ใช้สำหรับการทำนาย

สมมติว่าเรามีตารางที่สร้างด้วยข้อมูลสำหรับร้านค้า n

ตามสถิติทางคณิตศาสตร์ ผลลัพธ์จะถูกต้องไม่มากก็น้อยหากตรวจสอบข้อมูลอย่างน้อย 5-6 วัตถุ นอกจากนี้ยังไม่สามารถใช้ผลลัพธ์ "ผิดปกติ" ได้ โดยเฉพาะอย่างยิ่ง บูติกขนาดเล็กชั้นยอดสามารถมียอดขายมากกว่าการหมุนเวียนของร้านค้าขนาดใหญ่ของคลาส "มาสมาร์เก็ต" หลายเท่า

สาระสำคัญของวิธีการ

ข้อมูลตารางสามารถแสดงบนระนาบคาร์ทีเซียนเป็นจุด M 1 (x 1, y 1), ... M n (x n, y n) ตอนนี้การแก้ปัญหาจะลดลงเหลือเพียงการเลือกฟังก์ชันการประมาณ y = f (x) ซึ่งมีกราฟผ่านเข้าใกล้จุด M 1, M 2, .. M n มากที่สุด

แน่นอน คุณสามารถใช้พหุนามระดับสูงได้ แต่ตัวเลือกนี้ไม่เพียงแต่ใช้งานยาก แต่ยังไม่ถูกต้อง เนื่องจากจะไม่สะท้อนถึงแนวโน้มหลักที่ต้องตรวจพบ วิธีแก้ปัญหาที่สมเหตุสมผลที่สุดคือการค้นหาเส้นตรง y = ax + b ซึ่งจะประมาณข้อมูลการทดลองได้ดีที่สุด และให้แม่นยำกว่านั้นคือ ค่าสัมประสิทธิ์ - a และ b

คะแนนความแม่นยำ

การประเมินความถูกต้องมีความสำคัญเป็นพิเศษสำหรับการประมาณค่าใดๆ ระบุโดย e i ความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าการทำงานและค่าทดลองสำหรับจุด x ผม , i.e. e i = y i - f (x i).

เห็นได้ชัดว่า ในการประเมินความถูกต้องของการประมาณ คุณสามารถใช้ผลรวมของการเบี่ยงเบน กล่าวคือ เมื่อเลือกเส้นตรงสำหรับการแสดงค่าประมาณของการพึ่งพา X บน Y ควรกำหนดการตั้งค่าให้กับเส้นที่มีค่าน้อยที่สุดของ รวมทุกจุดที่อยู่ในการพิจารณา อย่างไรก็ตามไม่ใช่ทุกอย่างจะง่ายนักเนื่องจากจะมีการเบี่ยงเบนในทางบวกพร้อมกับค่าเบี่ยงเบนเชิงลบ

คุณสามารถแก้ปัญหาได้โดยใช้โมดูลส่วนเบี่ยงเบนหรือกำลังสอง วิธีหลังเป็นวิธีที่ใช้กันอย่างแพร่หลาย มีการใช้ในหลายพื้นที่ รวมถึงการวิเคราะห์การถดถอย (ใน Excel การใช้งานจะดำเนินการโดยใช้ฟังก์ชันในตัว 2 ฟังก์ชัน) และได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพมานานแล้ว

วิธีกำลังสองน้อยที่สุด

ดังที่คุณทราบใน Excel มีฟังก์ชัน autosum ในตัวที่ให้คุณคำนวณค่าของค่าทั้งหมดที่อยู่ในขอบเขตที่เลือก ดังนั้น ไม่มีอะไรจะป้องกันเราจากการคำนวณค่าของนิพจน์ (e 1 2 + e 2 2 + e 3 2 + ... e n 2)

ในสัญกรณ์คณิตศาสตร์ดูเหมือนว่า:

ตั้งแต่แรกเริ่มตัดสินใจประมาณโดยใช้เส้นตรง เรามี:

ดังนั้น งานในการหาเส้นตรงที่อธิบายความสัมพันธ์เฉพาะระหว่าง X และ Y ได้ดีที่สุด เท่ากับการคำนวณหาค่าฟังก์ชันขั้นต่ำของตัวแปรสองตัว:

สิ่งนี้ต้องการการเท่ากับศูนย์อนุพันธ์ย่อยบางส่วนเมื่อเทียบกับตัวแปรใหม่ a และ b และการแก้ระบบพื้นฐานที่ประกอบด้วยสมการสองสมการที่มี 2 รูปแบบที่ไม่ทราบรูปแบบ:

หลังจากการแปลงอย่างง่าย รวมถึงการหารด้วย 2 และจัดการผลรวม เราได้รับ:

การแก้ปัญหา ตัวอย่างเช่น โดยวิธีของ Cramer เราจะได้จุดคงที่ที่มีค่าสัมประสิทธิ์ a * และ b * นี่คือค่าต่ำสุด กล่าวคือ เพื่อคาดการณ์ว่ามูลค่าการซื้อขายของร้านค้าจะมีเท่าไรสำหรับพื้นที่หนึ่ง เส้นตรง y = a * x + b * เหมาะสม ซึ่งเป็นแบบจำลองการถดถอยสำหรับตัวอย่างที่เป็นปัญหา แน่นอนว่าจะไม่อนุญาตให้คุณค้นหาผลลัพธ์ที่แน่นอน แต่จะช่วยให้คุณเข้าใจว่าการซื้อร้านค้าด้วยเครดิตในพื้นที่ใดพื้นที่หนึ่งจะได้ผลหรือไม่

วิธีการใช้วิธีการกำลังสองน้อยที่สุดใน Excel

Excel มีฟังก์ชันสำหรับคำนวณค่าของกำลังสองน้อยที่สุด มีรูปแบบดังต่อไปนี้: TREND (ค่า Y ที่รู้จัก ค่า X ที่รู้จัก ค่า X ใหม่ ค่าคงที่) ลองใช้สูตรการคำนวณ OLS ใน Excel กับตารางของเรา

ในการดำเนินการนี้ ในเซลล์ที่ควรแสดงผลการคำนวณด้วยวิธีกำลังสองน้อยที่สุดใน Excel ให้ป้อนเครื่องหมาย "=" และเลือกฟังก์ชัน "TREND" ในหน้าต่างที่เปิดขึ้น ให้กรอกข้อมูลในฟิลด์ที่เหมาะสม โดยเน้น:

  • ช่วงของค่าที่ทราบสำหรับ Y (ในกรณีนี้คือข้อมูลสำหรับการหมุนเวียน)
  • ช่วง x 1 , …x n เช่น ขนาดของพื้นที่ค้าปลีก
  • และค่าที่รู้จักและไม่รู้จักของ x ซึ่งคุณต้องหาขนาดของการหมุนเวียน (สำหรับข้อมูลเกี่ยวกับตำแหน่งของพวกเขาในแผ่นงาน ดูด้านล่าง)

นอกจากนี้ยังมีตัวแปรตรรกะ "Const" ในสูตรอีกด้วย หากคุณป้อน 1 ในฟิลด์ที่ตรงกัน นี่หมายความว่าควรทำการคำนวณ โดยสมมติว่า b \u003d 0

หากคุณต้องการทราบการคาดการณ์สำหรับค่า x มากกว่าหนึ่งค่า จากนั้นหลังจากป้อนสูตรแล้ว คุณไม่ควรกด "Enter" แต่คุณต้องพิมพ์ชุดค่าผสม "Shift" + "Control" + "Enter" ("Enter" ) บนแป้นพิมพ์

คุณสมบัติบางอย่าง

การวิเคราะห์การถดถอยสามารถเข้าถึงได้แม้กระทั่งกับหุ่นจำลอง สูตร Excel สำหรับการทำนายค่าของอาร์เรย์ของตัวแปรที่ไม่รู้จัก - "TREND" - สามารถใช้ได้กับผู้ที่ไม่เคยได้ยินวิธีกำลังสองน้อยที่สุด แค่รู้คุณสมบัติบางอย่างของงานก็เพียงพอแล้ว โดยเฉพาะอย่างยิ่ง:

  • หากคุณจัดเรียงช่วงของค่าที่ทราบของตัวแปร y ในหนึ่งแถวหรือหนึ่งคอลัมน์ โปรแกรมจะรับรู้แต่ละแถว (คอลัมน์) ที่มีค่า x ที่ทราบเป็นตัวแปรแยกต่างหาก
  • หากไม่มีการระบุช่วงที่มีค่า x ในหน้าต่าง TREND ในกรณีของการใช้ฟังก์ชันใน Excel โปรแกรมจะพิจารณาว่าเป็นอาร์เรย์ที่ประกอบด้วยจำนวนเต็ม ซึ่งเป็นจำนวนที่สอดคล้องกับช่วงที่มีค่าที่กำหนด ​ของตัวแปร y
  • หากต้องการส่งออกอาร์เรย์ของค่า "ที่คาดการณ์" จะต้องป้อนนิพจน์แนวโน้มเป็นสูตรอาร์เรย์
  • หากไม่มีการระบุค่า x ใหม่ ฟังก์ชัน TREND จะถือว่าค่าเหล่านั้นเท่ากับค่าที่รู้จัก หากไม่ได้ระบุไว้ อาร์เรย์ 1 จะถูกนำมาเป็นอาร์กิวเมนต์ 2; 3; 4;… ซึ่งเทียบเท่ากับช่วงที่มีพารามิเตอร์ y ที่ให้ไว้แล้ว
  • ช่วงที่มีค่า x ใหม่ต้องมีแถวหรือคอลัมน์ที่เหมือนกันหรือมากกว่าเป็นช่วงที่มีค่า y ที่กำหนด กล่าวคือต้องได้สัดส่วนกับตัวแปรอิสระ
  • อาร์เรย์ที่มีค่า x ที่รู้จักสามารถมีได้หลายตัวแปร อย่างไรก็ตามหากเรากำลังพูดถึงเพียงช่วงเดียวก็จำเป็นต้องมีช่วงที่มีค่า x และ y ที่กำหนด ในกรณีของตัวแปรหลายตัว จำเป็นต้องให้ช่วงที่มีค่า y กำหนดอยู่ในคอลัมน์เดียวหรือหนึ่งแถว

ฟังก์ชันพยากรณ์

มันถูกใช้งานโดยใช้ฟังก์ชั่นหลายอย่าง หนึ่งในนั้นเรียกว่า "PREDICTION" คล้ายกับ TREND กล่าวคือ ให้ผลลัพธ์ของการคำนวณโดยใช้วิธีกำลังสองน้อยที่สุด อย่างไรก็ตาม สำหรับ X ตัวเดียวเท่านั้น ซึ่งไม่ทราบค่าของ Y

ตอนนี้คุณรู้สูตร Excel สำหรับหุ่นที่ให้คุณทำนายมูลค่าของมูลค่าในอนาคตของตัวบ่งชี้ตามแนวโน้มเชิงเส้นแล้ว

วิธีกำลังสองน้อยที่สุดคือขั้นตอนทางคณิตศาสตร์สำหรับการสร้างสมการเชิงเส้นที่ตรงกับชุดของตัวเลขสองชุดมากที่สุด จุดประสงค์ของวิธีนี้คือเพื่อลดความคลาดเคลื่อนกำลังสองทั้งหมดให้เหลือน้อยที่สุด Excel มีเครื่องมือที่สามารถใช้วิธีนี้ในการคำนวณได้ เรามาดูกันว่ามันทำอย่างไร

วิธีการของช่องสี่เหลี่ยมน้อยที่สุด (LSM) เป็นคำอธิบายทางคณิตศาสตร์ของการพึ่งพาตัวแปรตัวหนึ่งกับตัวแปรอื่น สามารถใช้พยากรณ์ได้

เปิดใช้งาน Solver add-in

ในการใช้ OLS ใน Excel คุณต้องเปิดใช้งาน add-in "ค้นหาวิธีแก้ปัญหา"ซึ่งถูกปิดใช้งานโดยค่าเริ่มต้น


ตอนนี้ฟังก์ชั่น หาทางออกใน Excel ถูกเปิดใช้งาน และเครื่องมือจะปรากฏบน Ribbon

เงื่อนไขของปัญหา

ให้เราอธิบายการใช้ LSM ในตัวอย่างที่เฉพาะเจาะจง เรามีตัวเลขสองแถว x และ y ตามลำดับที่แสดงในภาพด้านล่าง

การพึ่งพาอาศัยกันนี้สามารถอธิบายได้อย่างแม่นยำที่สุดโดยฟังก์ชัน:

ขณะเดียวกันก็ทราบดีว่า x=0 yเท่ากัน 0 . ดังนั้นสมการนี้สามารถอธิบายได้โดยการพึ่งพา y=nx .

เราต้องหาผลรวมกำลังสองขั้นต่ำของผลต่าง

สารละลาย

ให้เราดำเนินการตามคำอธิบายของการใช้วิธีการโดยตรง


อย่างที่คุณเห็น การประยุกต์ใช้วิธีกำลังสองน้อยที่สุดเป็นขั้นตอนทางคณิตศาสตร์ที่ค่อนข้างซับซ้อน เราได้แสดงให้เห็นในการดำเนินการด้วยตัวอย่างที่ง่ายที่สุด แต่มีกรณีที่ซับซ้อนกว่านั้นมาก อย่างไรก็ตาม ชุดเครื่องมือ Microsoft Excel ได้รับการออกแบบมาเพื่อลดความซับซ้อนในการคำนวณให้มากที่สุด

วิธีการของกำลังสองน้อยที่สุด (LSM) อยู่ในสาขาการวิเคราะห์การถดถอย มีแอปพลิเคชันมากมาย เนื่องจากช่วยให้สามารถแสดงฟังก์ชันที่กำหนดโดยฟังก์ชันอื่นที่ง่ายกว่าได้โดยประมาณ LSM สามารถเป็นประโยชน์อย่างยิ่งในการประมวลผลการสังเกต และมีการใช้อย่างแข็งขันเพื่อประเมินปริมาณบางส่วนจากผลการวัดอื่นๆ ที่มีข้อผิดพลาดแบบสุ่ม ในบทความนี้ คุณจะได้เรียนรู้วิธีใช้การคำนวณกำลังสองน้อยที่สุดใน Excel

คำชี้แจงปัญหาในตัวอย่างเฉพาะ

สมมติว่ามีตัวบ่งชี้ X และ Y สองตัว นอกจากนี้ Y ขึ้นอยู่กับ X เนื่องจาก OLS เป็นที่สนใจของเราจากมุมมองของการวิเคราะห์การถดถอย (ใน Excel วิธีการของมันถูกใช้งานโดยใช้ฟังก์ชันในตัว) เราจึงควรดำเนินการทันที เพื่อพิจารณาปัญหาเฉพาะ

ดังนั้น ให้ X เป็นพื้นที่ขายของร้านขายของชำ โดยวัดเป็นตารางเมตร และ Y คือมูลค่าการซื้อขายประจำปี ซึ่งกำหนดไว้เป็นล้านรูเบิล

จำเป็นต้องคาดการณ์มูลค่าการซื้อขาย (Y) ที่ร้านค้าจะมีหากมีพื้นที่ค้าปลีกหนึ่งแห่งหรืออื่น เห็นได้ชัดว่าฟังก์ชัน Y = f (X) กำลังเพิ่มขึ้น เนื่องจากไฮเปอร์มาร์เก็ตขายสินค้ามากกว่าแผงลอย

คำสองสามคำเกี่ยวกับความถูกต้องของข้อมูลเบื้องต้นที่ใช้สำหรับการทำนาย

สมมติว่าเรามีตารางที่สร้างด้วยข้อมูลสำหรับร้านค้า n

ตามสถิติทางคณิตศาสตร์ ผลลัพธ์จะถูกต้องไม่มากก็น้อยหากตรวจสอบข้อมูลอย่างน้อย 5-6 วัตถุ นอกจากนี้ยังไม่สามารถใช้ผลลัพธ์ "ผิดปกติ" ได้ โดยเฉพาะอย่างยิ่ง บูติกขนาดเล็กชั้นยอดสามารถมียอดขายมากกว่าการหมุนเวียนของร้านค้าขนาดใหญ่ของคลาส "มาสมาร์เก็ต" หลายเท่า

สาระสำคัญของวิธีการ

ข้อมูลตารางสามารถแสดงบนระนาบคาร์ทีเซียนเป็นจุด M 1 (x 1, y 1), ... M n (x n, y n) ตอนนี้การแก้ปัญหาจะลดลงเหลือเพียงการเลือกฟังก์ชันการประมาณ y = f (x) ซึ่งมีกราฟผ่านเข้าใกล้จุด M 1, M 2, .. M n มากที่สุด

แน่นอน คุณสามารถใช้พหุนามระดับสูงได้ แต่ตัวเลือกนี้ไม่เพียงแต่ใช้งานยาก แต่ยังไม่ถูกต้อง เนื่องจากจะไม่สะท้อนถึงแนวโน้มหลักที่ต้องตรวจพบ วิธีแก้ปัญหาที่สมเหตุสมผลที่สุดคือการค้นหาเส้นตรง y = ax + b ซึ่งจะประมาณข้อมูลการทดลองได้ดีที่สุด และให้แม่นยำกว่านั้นคือ ค่าสัมประสิทธิ์ - a และ b

คะแนนความแม่นยำ

การประเมินความถูกต้องมีความสำคัญเป็นพิเศษสำหรับการประมาณค่าใดๆ ระบุโดย e i ความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าการทำงานและค่าทดลองสำหรับจุด x ผม , i.e. e i = y i - f (x i).

เห็นได้ชัดว่า ในการประเมินความถูกต้องของการประมาณ คุณสามารถใช้ผลรวมของการเบี่ยงเบน กล่าวคือ เมื่อเลือกเส้นตรงสำหรับการแสดงค่าประมาณของการพึ่งพา X บน Y ควรกำหนดการตั้งค่าให้กับเส้นที่มีค่าน้อยที่สุดของ รวมทุกจุดที่อยู่ในการพิจารณา อย่างไรก็ตามไม่ใช่ทุกอย่างจะง่ายนักเนื่องจากจะมีการเบี่ยงเบนในทางบวกพร้อมกับค่าเบี่ยงเบนเชิงลบ

คุณสามารถแก้ปัญหาได้โดยใช้โมดูลส่วนเบี่ยงเบนหรือกำลังสอง วิธีหลังเป็นวิธีที่ใช้กันอย่างแพร่หลาย มีการใช้ในหลายพื้นที่ รวมถึงการวิเคราะห์การถดถอย (ใน Excel การใช้งานจะดำเนินการโดยใช้ฟังก์ชันในตัว 2 ฟังก์ชัน) และได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพมานานแล้ว

วิธีกำลังสองน้อยที่สุด

ดังที่คุณทราบใน Excel มีฟังก์ชัน autosum ในตัวที่ให้คุณคำนวณค่าของค่าทั้งหมดที่อยู่ในขอบเขตที่เลือก ดังนั้น ไม่มีอะไรจะป้องกันเราจากการคำนวณค่าของนิพจน์ (e 1 2 + e 2 2 + e 3 2 + ... e n 2)

ในสัญกรณ์คณิตศาสตร์ดูเหมือนว่า:

ตั้งแต่แรกเริ่มตัดสินใจประมาณโดยใช้เส้นตรง เรามี:

ดังนั้น งานในการหาเส้นตรงที่อธิบายความสัมพันธ์เฉพาะระหว่าง X และ Y ได้ดีที่สุด เท่ากับการคำนวณหาค่าฟังก์ชันขั้นต่ำของตัวแปรสองตัว:

สิ่งนี้ต้องการการเท่ากับศูนย์อนุพันธ์ย่อยบางส่วนเมื่อเทียบกับตัวแปรใหม่ a และ b และการแก้ระบบพื้นฐานที่ประกอบด้วยสมการสองสมการที่มี 2 รูปแบบที่ไม่ทราบรูปแบบ:

หลังจากการแปลงอย่างง่าย รวมถึงการหารด้วย 2 และจัดการผลรวม เราได้รับ:

การแก้ปัญหา ตัวอย่างเช่น โดยวิธีของ Cramer เราจะได้จุดคงที่ที่มีค่าสัมประสิทธิ์ a * และ b * นี่คือค่าต่ำสุด กล่าวคือ เพื่อคาดการณ์ว่ามูลค่าการซื้อขายของร้านค้าจะมีเท่าไรสำหรับพื้นที่หนึ่ง เส้นตรง y = a * x + b * เหมาะสม ซึ่งเป็นแบบจำลองการถดถอยสำหรับตัวอย่างที่เป็นปัญหา แน่นอนว่าจะไม่อนุญาตให้คุณค้นหาผลลัพธ์ที่แน่นอน แต่จะช่วยให้คุณเข้าใจว่าการซื้อร้านค้าด้วยเครดิตในพื้นที่ใดพื้นที่หนึ่งจะได้ผลหรือไม่

วิธีการใช้วิธีการกำลังสองน้อยที่สุดใน Excel

Excel มีฟังก์ชันสำหรับคำนวณค่าของกำลังสองน้อยที่สุด มีรูปแบบดังต่อไปนี้: TREND (ค่า Y ที่รู้จัก ค่า X ที่รู้จัก ค่า X ใหม่ ค่าคงที่) ลองใช้สูตรการคำนวณ OLS ใน Excel กับตารางของเรา

ในการดำเนินการนี้ ในเซลล์ที่ควรแสดงผลการคำนวณด้วยวิธีกำลังสองน้อยที่สุดใน Excel ให้ป้อนเครื่องหมาย "=" และเลือกฟังก์ชัน "TREND" ในหน้าต่างที่เปิดขึ้น ให้กรอกข้อมูลในฟิลด์ที่เหมาะสม โดยเน้น:

  • ช่วงของค่าที่ทราบสำหรับ Y (ในกรณีนี้คือข้อมูลสำหรับการหมุนเวียน)
  • ช่วง x 1 , …x n เช่น ขนาดของพื้นที่ค้าปลีก
  • และค่าที่รู้จักและไม่รู้จักของ x ซึ่งคุณต้องหาขนาดของการหมุนเวียน (สำหรับข้อมูลเกี่ยวกับตำแหน่งของพวกเขาในแผ่นงาน ดูด้านล่าง)

นอกจากนี้ยังมีตัวแปรตรรกะ "Const" ในสูตรอีกด้วย หากคุณป้อน 1 ในฟิลด์ที่ตรงกัน นี่หมายความว่าควรทำการคำนวณ โดยสมมติว่า b \u003d 0

หากคุณต้องการทราบการคาดการณ์สำหรับค่า x มากกว่าหนึ่งค่า จากนั้นหลังจากป้อนสูตรแล้ว คุณไม่ควรกด "Enter" แต่คุณต้องพิมพ์ชุดค่าผสม "Shift" + "Control" + "Enter" ("Enter" ) บนแป้นพิมพ์

คุณสมบัติบางอย่าง

การวิเคราะห์การถดถอยสามารถเข้าถึงได้แม้กระทั่งกับหุ่นจำลอง สูตร Excel สำหรับการทำนายค่าของอาร์เรย์ของตัวแปรที่ไม่รู้จัก - "TREND" - สามารถใช้ได้กับผู้ที่ไม่เคยได้ยินวิธีกำลังสองน้อยที่สุด แค่รู้คุณสมบัติบางอย่างของงานก็เพียงพอแล้ว โดยเฉพาะอย่างยิ่ง:

  • หากคุณจัดเรียงช่วงของค่าที่ทราบของตัวแปร y ในหนึ่งแถวหรือหนึ่งคอลัมน์ โปรแกรมจะรับรู้แต่ละแถว (คอลัมน์) ที่มีค่า x ที่ทราบเป็นตัวแปรแยกต่างหาก
  • หากไม่มีการระบุช่วงที่มีค่า x ในหน้าต่าง TREND ในกรณีของการใช้ฟังก์ชันใน Excel โปรแกรมจะพิจารณาว่าเป็นอาร์เรย์ที่ประกอบด้วยจำนวนเต็ม ซึ่งเป็นจำนวนที่สอดคล้องกับช่วงที่มีค่าที่กำหนด ​ของตัวแปร y
  • หากต้องการส่งออกอาร์เรย์ของค่า "ที่คาดการณ์" จะต้องป้อนนิพจน์แนวโน้มเป็นสูตรอาร์เรย์
  • หากไม่มีการระบุค่า x ใหม่ ฟังก์ชัน TREND จะถือว่าค่าเหล่านั้นเท่ากับค่าที่รู้จัก หากไม่ได้ระบุไว้ อาร์เรย์ 1 จะถูกนำมาเป็นอาร์กิวเมนต์ 2; 3; 4;… ซึ่งเทียบเท่ากับช่วงที่มีพารามิเตอร์ y ที่ให้ไว้แล้ว
  • ช่วงที่มีค่า x ใหม่ต้องมีแถวหรือคอลัมน์ที่เหมือนกันหรือมากกว่าเป็นช่วงที่มีค่า y ที่กำหนด กล่าวคือต้องได้สัดส่วนกับตัวแปรอิสระ
  • อาร์เรย์ที่มีค่า x ที่รู้จักสามารถมีได้หลายตัวแปร อย่างไรก็ตามหากเรากำลังพูดถึงเพียงช่วงเดียวก็จำเป็นต้องมีช่วงที่มีค่า x และ y ที่กำหนด ในกรณีของตัวแปรหลายตัว จำเป็นต้องให้ช่วงที่มีค่า y กำหนดอยู่ในคอลัมน์เดียวหรือหนึ่งแถว

ฟังก์ชันพยากรณ์

การวิเคราะห์การถดถอยใน Excel ดำเนินการโดยใช้หลายฟังก์ชัน หนึ่งในนั้นเรียกว่า "PREDICTION" คล้ายกับ TREND กล่าวคือ ให้ผลลัพธ์ของการคำนวณโดยใช้วิธีกำลังสองน้อยที่สุด อย่างไรก็ตาม สำหรับ X ตัวเดียวเท่านั้น ซึ่งไม่ทราบค่าของ Y

ตอนนี้คุณรู้สูตร Excel สำหรับหุ่นที่ให้คุณทำนายมูลค่าของมูลค่าในอนาคตของตัวบ่งชี้ตามแนวโน้มเชิงเส้นแล้ว

ข้อผิดพลาด:เนื้อหาได้รับการคุ้มครอง!!