Doğrusal bir fonksiyon için Mnk. Problem çözmenin en küçük kareler yöntemi örnekleri. Diğer işlevleri kullanarak tahmin

En küçük kareler yöntemi regresyon denkleminin parametrelerini tahmin etmek için kullanılır.

Özellikler arasındaki stokastik bağlantıları incelemenin yöntemlerinden biri regresyon analizidir.
Regresyon analizi, başka (veya diğer) değişkenlerin (özellik faktörlerinin) değeri biliniyorsa, rastgele bir değişkenin (özellik-sonuç) ortalama değerinin bulunduğu regresyon denkleminin türetilmesidir. Aşağıdaki adımları içerir:

  1. iletişim biçiminin seçimi (analitik regresyon denklemi türü);
  2. denklem parametrelerinin tahmini;
  3. analitik regresyon denkleminin kalitesinin değerlendirilmesi.
Çoğu zaman, özelliklerin istatistiksel ilişkisini tanımlamak için doğrusal bir biçim kullanılır. Doğrusal ilişkiye dikkat, parametrelerinin net bir ekonomik yorumu, değişkenlerin sınırlı varyasyonu ve çoğu durumda hesaplamaları gerçekleştirmek için doğrusal olmayan iletişim biçimlerinin (logaritma veya değişken değişkenleri değiştirerek) doğrusal bir biçime dönüştürülmesiyle açıklanır.
Doğrusal bir ikili ilişki durumunda, regresyon denklemi şu biçimi alacaktır: y i \u003d a + b x i + u i. Bu denklemin a ve b parametreleri, istatistiksel gözlem x ve y verilerinden tahmin edilir. Böyle bir değerlendirmenin sonucu aşağıdaki denklemdir: burada, a ve b parametrelerinin tahminleri, regresyon denklemi (hesaplanan değer) ile elde edilen etkin özniteliğin (değişken) değeridir.

Parametreleri tahmin etmek için en sık kullanılan en küçük kareler yöntemi (OLS).
En küçük kareler yöntemi, regresyon denkleminin parametrelerinin en iyi (tutarlı, verimli ve tarafsız) tahminlerini verir. Ancak yalnızca rastgele terim (u) ve bağımsız değişken (x) ile ilgili belirli ön koşullar karşılanırsa (bkz. OLS önkoşulları).

Doğrusal çiftli denklemin parametrelerini en küçük kareler yöntemi ile tahmin etme problemi aşağıdakilerden oluşur: etkin göstergenin gerçek değerlerinin sapmalarının karelerinin toplamının - hesaplanan değerlerden y i - minimum olduğu bu tür parametre tahminlerini elde etmek.
Resmen oLS kriteri şu şekilde yazılabilir: .

En küçük kareler yöntemlerinin sınıflandırılması

  1. En küçük kareler yöntemi.
  2. Maksimum olabilirlik yöntemi (normal klasik doğrusal regresyon modeli için, regresyon artıklarının normalliği varsayılır).
  3. Genelleştirilmiş en küçük kareler OLS yöntemi, hataların otokorelasyonu durumunda ve değişken varyans durumunda kullanılır.
  4. Ağırlıklı en küçük kareler yöntemi (heteroskedastik artıklara sahip özel bir OLS durumu).

Özü gösterelim grafiksel olarak en küçük karelerin klasik yöntemi... Bunu yapmak için, dikdörtgen bir koordinat sisteminde (böyle bir nokta grafiğine korelasyon alanı denir) gözlem verilerine (x i, y i, i \u003d 1; n) göre bir nokta grafiği oluşturacağız. Korelasyon alanının noktalarına en yakın düz bir çizgi bulmaya çalışalım. En küçük kareler yöntemine göre, çizgi, korelasyon alanı noktaları ile bu doğru arasındaki dikey uzaklıkların karelerinin toplamı minimum olacak şekilde seçilir.

Bu problemin matematiksel kaydı: .
Y i ve x i \u003d 1 ... n değerlerini biliyoruz, bunlar gözlemsel verilerdir. S fonksiyonunda bunlar sabittir. Bu işlevdeki değişkenler gerekli parametre tahminleridir - ,. 2 değişkenli bir fonksiyonun minimumunu bulmak için, bu fonksiyonun kısmi türevlerini her bir parametre için hesaplamak ve bunları sıfıra eşitlemek gerekir, yani. .
Sonuç olarak, 2 normal doğrusal denklem sistemi elde ederiz:
Bu sistemi çözerek gerekli parametre tahminlerini buluruz:

Regresyon denkleminin parametrelerinin hesaplanmasının doğruluğu, toplamlar karşılaştırılarak kontrol edilebilir (hesaplamaların yuvarlanmasından dolayı bazı tutarsızlıklar olabilir).
Parametre tahminlerini hesaplamak için tablo 1'i oluşturabilirsiniz.
Regresyon katsayısı b'nin işareti, ilişkinin yönünü gösterir (eğer b\u003e 0 ise, ilişki doğrudur, eğer b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Resmi olarak, a parametresinin değeri, sıfıra eşit x'teki ortalama y değeridir. Öznitelik faktörünün sıfır değeri yoksa ve olamazsa, bu durumda a parametresinin yukarıdaki yorumu bir anlam ifade etmez.

İşaretler arasındaki ilişkinin sıkılığının değerlendirilmesi doğrusal çift korelasyon katsayısı - r x, y kullanılarak gerçekleştirilir. Aşağıdaki formül kullanılarak hesaplanabilir: ... Ek olarak, doğrusal ikili korelasyon katsayısı, regresyon katsayısı b ile belirlenebilir: .
Doğrusal çift korelasyon katsayısının kabul edilebilir değerlerinin aralığı -1'den + 1'e kadardır. Korelasyon katsayısının işareti, bağlantının yönünü gösterir. R x, y\u003e 0 ise, bağlantı doğrudandır; eğer r x, y<0, то связь обратная.
Bu katsayı modülde bire yakınsa, özellikler arasındaki ilişki oldukça yakın doğrusal bir ilişki olarak yorumlanabilir. Modülü bir ê r x, y ê \u003d 1'e eşitse, özellikler arasındaki bağlantı fonksiyonel doğrusaldır. X ve y özellikleri doğrusal olarak bağımsızsa, r x, y 0'a yakındır.
R x, y'yi hesaplamak için ayrıca tablo 1'i de kullanabilirsiniz.

Elde edilen regresyon denkleminin kalitesini değerlendirmek için teorik belirleme katsayısı hesaplanır - R 2 yx:

,
burada d2, regresyon denklemi tarafından açıklanan y varyansıdır;
e 2 - artık (regresyon denklemi ile açıklanmamaktadır) varyans y;
s 2 y, y'nin toplam (toplam) varyansıdır.
Belirleme katsayısı, toplam varyasyonda (varyans) y regresyon (ve sonuç olarak, faktör x) ile açıklanan etkili y özelliğinin varyasyonunun (varyans) oranını karakterize eder. R 2 yx belirleme katsayısı, 0 ile 1 arasındaki değerleri alır. Buna göre, 1-R 2 yx değeri, modelde hesaba katılmayan diğer faktörlerin etkisinin ve spesifikasyon hatalarının neden olduğu y varyans oranını karakterize eder.
Eşleştirilmiş doğrusal regresyon ile R 2 yx \u003d r 2 yx.

DERS ÇALIŞMASI

En küçük kareler fonksiyon yaklaşımı


Giriş

ampirik mathcad yaklaşımı

Kurs çalışmasının amacı, bilgisayar bilimi bilgisini derinleştirmek, elektronik tablo işlemcisi Microsoft Excel ve MathCAD ile çalışma becerilerini geliştirmek ve pekiştirmektir. Araştırma ile ilgili konu alanından bir bilgisayar ile problem çözme uygulamaları.

Her görevde, problemin koşulları, ilk veriler, sonuçları verme şekli formüle edilir, problemi çözmek için temel matematiksel bağımlılıklar belirtilir.Kontrol hesaplaması, programın doğru çalıştığından emin olmanızı sağlar.

Yaklaşım kavramı, herhangi bir matematiksel nesnenin (örneğin, sayılar veya fonksiyonlar) diğer daha basit, kullanımı daha uygun veya basitçe daha iyi bilinen yaklaşık bir ifadesidir. Bilimsel araştırmada, tahmin, ampirik sonuçları tanımlamak, analiz etmek, genellemek ve daha fazla kullanmak için kullanılır.

Bildiğiniz gibi, bağımsız değişkenin bir değeri belirli bir değere karşılık geldiğinde miktarlar arasında kesin (işlevsel) bir ilişki ve bağımsız değişkenin belirli bir değeri yaklaşık bir değere veya bir işlevin az çok yakın olan bir değer kümesine karşılık geldiğinde daha az doğru (korelasyon) bir ilişki olabilir birbirlerine. Bilimsel araştırma yürütürken, gözlem veya deney sonuçlarını işlerken, genellikle ikinci seçenekle uğraşmak gerekir. Değerleri ampirik olarak belirlenen çeşitli göstergelerin nicel bağımlılıklarını incelerken, kural olarak bazı değişkenlikler vardır. Kısmen, kısmen gözlem hatası ve materyallerin niceliksel işlenmesi nedeniyle, cansız ve özellikle canlı doğa üzerinde çalışılan nesnelerin heterojenliği tarafından belirlenir. Son bileşenin tamamen dışarıda bırakılması her zaman mümkün değildir, ancak uygun bir araştırma yönteminin ve işin doğruluğunun dikkatli bir şekilde seçilmesiyle en aza indirilebilir.

Teknolojik süreçlerin ve endüstrilerin otomasyonu alanındaki uzmanlar, işlemek için bir bilgisayarın kullanıldığı büyük miktarda deneysel veriyle uğraşır. İlk veriler ve elde edilen hesaplamaların sonuçları, elektronik tablo işlemcileri (elektronik tablolar) ve özellikle Excel kullanılarak tablo biçiminde sunulabilir. Bilgisayar bilimlerinde ders, öğrencinin mesleki faaliyet alanındaki problemleri çözmede temel bilgisayar teknolojilerini kullanarak iş becerilerini pekiştirmesine ve geliştirmesine izin verir. - hesaplamalar ve görsel destek ile etkileşimli belgelerin hazırlanmasına odaklanan bilgisayar destekli tasarım sistemleri sınıfından bir bilgisayar cebir sistemi, kullanım ve uygulama kolaylığı ile ayırt edilir. takım çalışması için.


1. Genel bilgi


Çoğu zaman, özellikle deneysel verileri analiz ederken, değerler arasındaki işlevsel ilişkiyi açık bir biçimde bulmak gerekli hale gelir. x ve -deölçümler sonucunda elde edilen.

İki büyüklük x ve y arasındaki ilişkinin analitik bir çalışmasında, bir dizi gözlem yapılır ve sonuç bir değerler tablosudur:


xx1 x1 xbenXnyy1 y1 ybenYn

Bu tablo genellikle bazı deneyler sonucunda elde edilir. x, (bağımsız değer) deneyci tarafından verilir ve y, tecrübe sonucunda elde edilir. Bu nedenle bu değerler y,deneysel veya deneysel değerler olarak adlandırılacaktır.

X ve y değerleri arasında işlevsel bir ilişki vardır, ancak analitik biçimi genellikle bilinmemektedir, bu nedenle pratik olarak önemli bir görev ortaya çıkar - ampirik bir formül bulmak


y \u003df (x; bir 1, bir 2,…, Am ), (1)


(Nerede a1 , bir2 ,…, Am - parametreleri), değerleri x \u003d x, muhtemelen deneysel değerlerden biraz farklı olacaktır y, (i \u003d 1,2,…, p).

Genellikle, işlevin seçildiği işlev sınıfını (örneğin, doğrusal, üstel, üstel vb.) Gösterir. f (x)ve ardından parametrelerin en iyi değerleri belirlenir.

Ampirik formül (1) içindeyse, baştaki x, sonra teorik değerleri alırız

YTben \u003d f (xben; a 1, bir 2……am) nerede i \u003d 1,2,…, n.


Farklılıklar ybenT - içindeben, sapmalar denir ve noktalardan dikey mesafeleri temsil eder Mben ampirik fonksiyon grafiğine.

En küçük kareler yöntemine göre en iyi katsayılar a1 , bir2 ,…, Am Fonksiyonun verilen değerlerinden bulunan ampirik fonksiyonun sapmalarının karelerinin toplamı



minimum olacak.

En küçük kareler yönteminin geometrik anlamını açıklayalım.

Her sayı çifti ( xben, yben) kaynak tablodan noktayı tanımlar Mben yüzeyde XOY. Katsayıların farklı değerleri için formül (1) kullanma a1 , bir2 ,…, Am fonksiyonun grafikleri olan bir dizi eğri çizilebilir (1). Görev katsayıları belirlemektir a1 , bir2 ,…, Amböylece noktalardan dikey mesafelerin karelerinin toplamı Mben (xben, yben) önce (1) fonksiyonunun grafiği en küçüktü (Şekil 1).



Ampirik bir formülün oluşturulması iki aşamadan oluşur: bu formülün genel şeklini bulmak ve en iyi parametrelerini belirlemek.

X'in verilen değerleri arasındaki ilişkinin niteliği ve y, o zaman ampirik bağımlılık türü keyfidir. İyi doğrulukla basit formüller tercih edilir. Deneysel bir formülün başarılı seçimi, büyük ölçüde, teorik değerlendirmelerden işlev sınıfını gösterebileceği, konu alanındaki araştırmacının bilgisine bağlıdır. Elde edilen verilerin Kartezyen veya özel koordinat sistemlerinde (yarı logaritmik, logaritmik, vb.) Görüntülenmesi büyük önem taşır. Noktaların konumuna göre, çizilen grafik ile bilinen eğrilerin örnekleri arasındaki benzerliği kurarak, bağımlılığın genel formu kabaca tahmin edilebilir.

En iyi oranları belirlemek a1 , bir2,…, am Ampirik formüle dahil edilenler iyi bilinen analitik yöntemlerle üretilir.

Bir dizi katsayı bulmak için a a1 , bir2 … ..Am, formül (2) ile tanımlanan minimum S fonksiyonunu sağlayan, birkaç değişkenli bir fonksiyonun uç noktası için gerekli koşulu kullanıyoruz - kısmi türevlerin sıfıra eşitliği.

Sonuç olarak, katsayıları belirlemek için normal bir sistem elde ederiz. aben (i \u003d 1,2,…, m):



Böylece katsayıları bulmak aben çözme sistemine indirgenir (3). Ampirik formül (1) parametrelere göre doğrusal ise bu sistem basitleştirilmiştir. aben, sistem (3) doğrusal olacaktır.


1.1 Doğrusal bağımlılık


Sistemin (3) spesifik biçimi, bağımlılık aradığımız ampirik formül sınıfına bağlıdır (1). Doğrusal bağımlılık durumunda y \u003d a1 + a2 x system (3) şu şekilde olacaktır:


Bu doğrusal sistem, bilinen herhangi bir yöntemle (Gauss yöntemi, basit yinelemeler, Cramer'in formülleri) çözülebilir.


1.2 İkinci dereceden bağımlılık


İkinci dereceden bir bağımlılık durumunda y \u003d a1 + a2 x + a3x 2 system (3) şu şekilde olacaktır:



1.3 Üstel bağımlılık


Bazı durumlarda, deneysel bir formül olarak, tanımlanmamış katsayıların doğrusal olmayan bir şekilde girdiği bir fonksiyon alınır. Dahası, bazen problem doğrusallaştırılabilir, yani doğrusal olarak azaltın. Bu bağımlılıklar üstel bağımlılığı içerir


y \u003d a1 * ea2x (6)


burada bir 1 ve a 2, tanımsız oranlar.

Doğrusallaştırma, eşitliğin (6) logaritmasını alarak elde edilir, ardından ilişkiyi elde ederiz.

ln y \u003d ln a 1 + a 2x (7)


Biz ln -de ve ln ax sırasıyla t ve csonra bağımlılık (6) şöyle yazılabilir: t \u003d a1 + a2 xyerine formülleri (4) uygulamamıza izin verir. a1 açık c ve -deben açık tben


1.4 Korelasyon teorisinin unsurları


Kurtarılmış işlevsel bağımlılık grafiği y (x) ölçüm sonuçlarına göre (x ben, -deben), i \u003d 1,2, K, n regresyon eğrisi olarak adlandırılır. Oluşturulan regresyon eğrisinin deneysel sonuçlarla uyuşmasını kontrol etmek için, genellikle aşağıdaki sayısal özellikler sunulur: korelasyon katsayısı (doğrusal bağımlılık), korelasyon oranı ve determinizm katsayısı. Bu durumda, sonuçlar genellikle gruplandırılır ve bir korelasyon tablosu şeklinde sunulur. Bu tablonun her hücresi sayıları içerir niJ - bu çiftler (x, y)bileşenleri her değişken için uygun gruplama aralıklarına düşen. Gruplama aralıklarının (her değişken için) birbirine eşit uzunluklarını varsayarsak, merkezler x ben (sırasıyla -deben) bu aralıkların sayısı ve sayısı niJ- hesaplamalar için bir temel olarak.

Korelasyon katsayısı, bağımlı rastgele değişkenler arasındaki doğrusal ilişkinin bir ölçüsüdür: ortalama olarak, değişkenlerden birinin diğerinin doğrusal bir işlevi olarak ne kadar iyi temsil edilebileceğini gösterir.

Korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanır:


sırasıyla aritmetik ortalama nerede ve x ve -de.

Mutlak değerdeki rastgele değişkenler arasındaki korelasyon katsayısı 1'i geçmez. Daha yakın | p | 1'e, x ve arasındaki doğrusal ilişki ne kadar yakınsa içinde.

Doğrusal olmayan bir korelasyon durumunda, koşullu ortalama değerler eğri çizginin yakınında bulunur. Bu durumda, yorumlanması incelenen bağımlılığın türüne bağlı olmayan bağ kuvvetinin bir özelliği olarak korelasyon oranının kullanılması önerilir.

Korelasyon oranı aşağıdaki formülle hesaplanır:



nerede nben = , nf \u003d ve pay, koşullu araçların dağılımını karakterize eder y, mutlak ortalamaya yakın y.

Her zaman. Eşitlik = 0, ilintisiz rastgele değerlere karşılık gelir; = 1 sadece ve sadece arasında tam bir işlevsel bağlantı varsa y ve x. Doğrusal bağımlılık durumunda y x'in korelasyon oranı, korelasyon katsayısının karesiyle çakışır. Miktar - ? 2 doğrusal regresyondan sapmanın bir göstergesi olarak kullanılır.

Korelasyon oranı, korelasyonun bir ölçüsüdür y itibaren x herhangi bir biçimde olabilir, ancak deneysel verilerin özel bir biçime yakınlık derecesi hakkında bir fikir veremez. Çizilen eğrinin ampirik verileri ne kadar doğru yansıttığını bulmak için başka bir özellik tanıtıldı - determinizm katsayısı.

Açıklamak için aşağıdaki miktarları göz önünde bulundurun. ortalama karelerin toplamıdır.

Aşağıdaki eşitliği ispatlayabiliriz

İlk terim Sres \u003d 'e eşittir ve artık kareler toplamı olarak adlandırılır. Deneysel olanın teorikten sapmasını karakterize eder.

İkinci terim Sregr \u003d 2'ye eşittir ve karelerin regresyon toplamı olarak adlandırılır ve verilerin dağılımını karakterize eder.

Açıkçası, aşağıdaki eşitlik S full \u003d S ost + S regr.

Determinizm katsayısı aşağıdaki formülle belirlenir:



Toplam kareler toplamına kıyasla artık kareler toplamı ne kadar küçükse, determinizm katsayısının değeri o kadar büyüktür. r2 , regresyon denkleminin değişkenler arasındaki ilişkileri ne kadar iyi açıkladığını gösterir. 1'e eşitse, modelle tam bir korelasyon vardır, yani. gerçek ve tahmini y değerleri arasında fark yoktur. Aksi takdirde, determinizm katsayısı 0 ise, o zaman regresyon denklemi y değerlerini tahmin edemez.

Determinizm katsayısı her zaman korelasyon oranını aşmaz. Eşitlik durumunda r2 \u003d bu durumda oluşturulan ampirik formülün ampirik verileri en doğru şekilde yansıttığı düşünülebilir.


2. Sorunun açıklaması


1. Tabloda verilen fonksiyon olan en küçük kareler yöntemini kullanarak yaklaşık

a) birinci dereceden bir polinom;

b) ikinci dereceden bir polinom;

c) üstel bağımlılık.

Her bağımlılık için determinizm katsayısını hesaplayın.

Korelasyon katsayısını hesaplayın (sadece a durumunda).

Her bağımlılık için bir eğilim çizgisi çizin.

DOT işlevini kullanarak, bağımlılığın sayısal özelliklerini hesaplayın.

Hesaplamalarınızı LINEST kullanarak elde edilen sonuçlarla karşılaştırın.

Elde edilen formüllerden hangisinin işleve en iyi yaklaştığı sonucuna varın.

Programlama dillerinden birinde bir program yazın ve sayım sonuçlarını yukarıda elde edilenlerle karşılaştırın.


3. İlk veriler


Fonksiyon Şekil 1'de tanımlanmıştır.



4. Bir elektronik tablo işlemcisi Excel'de yaklaşımların hesaplanması


Hesaplamalar için bir Microsoft Excel elektronik tablosu kullanılması önerilir. Ve verileri Şekil 2'de gösterildiği gibi düzenleyin.



Bunu yapmak için şunu girin:

· a6: A30 hücrelerinde xi değerlerini giriyoruz .

· b6: B30 hücrelerinde уi değerlerini giriyoruz .

· c6 hücresinde \u003d A6 ^ formülünü giriyoruz 2.

· c7: C30 hücrelerinde bu formül kopyalanır.

· d6 hücresine \u003d A6 * B6 formülünü girin.

· d7: D30 hücrelerinde bu formül kopyalanır.

· f6 hücresine \u003d A6 ^ 4 formülünü girin.

· f7: F30 hücrelerinde bu formül kopyalanır.

· g6 hücresine \u003d A6 ^ 2 * B6 formülünü girin.

· bu formül G7: G30 hücrelerine kopyalanır.

· h6 hücresine \u003d LN (B6) formülünü girin.

· bu formül H7: H30 hücrelerine kopyalanır.

· i6 hücresine \u003d A6 * LN (B6) formülünü girin.

· i7: I30 hücrelerinde bu formül kopyalanır. Sonraki adımları autosum kullanarak yapıyoruz.

· a33 hücresine \u003d TOPLA (A6: A30) formülünü girin.

· b33 hücresine \u003d TOPLA (B6: B30) formülünü girin.

· c33 hücresine \u003d SUM (C6: C30) formülünü girin.

· d33 hücresine \u003d TOPLA (D6: D30) formülünü girin.

· e33 hücresine \u003d TOPLA (E6: E30) formülünü girin.

· f33 hücresine \u003d SUM (F6: F30) formülünü girin.

· g33 hücresine \u003d SUM (G6: G30) formülünü girin.

· h33 hücresine \u003d TOPLA (H6: H30) formülünü girin.

· i33 hücresinde \u003d SUM (I6: I30) formülünü girin.

İşlevi yaklaştırıyoruz y \u003d f (x) doğrusal fonksiyon y \u003d a1 + a2x. Katsayıları belirlemek için a 1 ve bir 2 system (4) kullanıyoruz. A33, B33, C33 ve D33 hücrelerinde bulunan Tablo 2'nin toplam toplamlarını kullanarak, sistemi (4) şeklinde yazıyoruz.



hangisini çözüyoruz, bir 1 \u003d -24.7164 ve a2 = 11,63183

Dolayısıyla, doğrusal yaklaşım şu şekle sahiptir: y \u003d -24,7164 + 11,63183x (12)

Sistem (11) Microsoft Excel araçları kullanılarak çözüldü. Sonuçlar Şekil 3'te gösterilmektedir:



A38: B39 hücrelerindeki tablo (\u003d MOBR (A35: B36)) formülünü içerir. E38: E39 hücreleri, (\u003d MULTIPLE (A38: B39, C35: C36)) formülünü içerir.


Sonra, fonksiyona yaklaşıyoruz y \u003d f (x) ikinci dereceden fonksiyon y \u003d a1 + a2 x + a3 x2... Katsayıları belirlemek için a 1, bir 2 ve bir 3 system (5) kullanıyoruz. A33, B33, C33, D33, E33, F33 ve G33 hücrelerinde bulunan Tablo 2'deki toplamları kullanarak system (5) 'i aşağıdaki gibi yazıyoruz:



Hangisini çözdükten sonra, bir 1 \u003d 1.580946, a 2 \u003d -0.60819 ve a3 = 0,954171 (14)

Dolayısıyla, ikinci dereceden yaklaşım:

y \u003d 1,580946 -0,60819x + 0,954171 x2

Sistem (13) Microsoft Excel araçları kullanılarak çözüldü. Sonuçlar Şekil 4'te gösterilmektedir.



A46: C48 hücrelerindeki tablo (\u003d MOBR (A41: C43)) formülünü içerir. F46: F48 hücreleri (\u003d MULTIPLE (A41: C43, D46: D48)) formülünü içerir.

Şimdi fonksiyona yaklaşıyoruz y \u003d f (x) üstel fonksiyon y \u003d a1 ea2x. Katsayıları belirlemek için a1 ve a2 logaritma değerleri yben ve A26, C26, H26 ve I26 hücrelerinde bulunan tablo 2'nin toplamlarını kullanarak sistemi elde ederiz:



nerede c \u003d ln (a1 ).

Çözme sistemi (10), buluyoruz c \u003d 0,506435, a2 = 0.409819.

Potansiyelleşmeden sonra, a1 alıyoruz = 1,659365.

Böylece, üstel yaklaşım şu şekle sahiptir: y \u003d 1.659365 * e0,4098194x

Sistem (15) Microsoft Excel araçları kullanılarak çözüldü. Sonuçlar Şekil 5'te gösterilmektedir.


A55: B56 hücrelerindeki tablo (\u003d MOBR (A51: B52)) formülünü içerir. E54: E56 hücreleri (\u003d ÇOKLU (A51: B52, C51: C52)) formülünü içerir. E56 hücresi \u003d EXP (E54) formülünü içerir.

X ve y'nin aritmetik ortalamasını aşağıdaki formüllerle hesaplıyoruz:



X ve hesaplamanın sonuçları y Microsoft Excel araçları Şekil 6'da gösterilmektedir.



B58 hücresi \u003d A33 / 25 formülünü içerir. B59 hücresi \u003d B33 / 25 formülünü içerir.

Tablo 2


Şekil 7'deki tablonun nasıl derlendiğini açıklayalım.

A6: A33 ve B6: B33 hücreleri zaten doldurulmuştur (bkz. Şekil 2).

· j6 hücresine \u003d (A6- $ B $ 58) * (B6- $ B $ 59) formülünü girin.

· bu formül J7: J30 hücrelerine kopyalanır.

· k6 hücresinde \u003d (A6- $ B $ 58) ^ formülünü giriyoruz 2.

· k7: K30 hücrelerinde bu formül kopyalanır.

· l6 hücresine \u003d (B1- $ B $ 59) ^ 2 formülünü girin.

· bu formül L7: L30 hücrelerine kopyalanır.

· m6 hücresine \u003d ($ E $ 38 + $ E $ 39 * A6-B6) ^ 2 formülünü girin.

· bu formül M7: M30 hücrelerine kopyalanır.

· n6 hücresine \u003d ($ F $ 46 + $ F $ 47 * A6 + $ F $ 48 * A6 A6-B6) ^ 2 formülünü girin.

· n7: N30 hücrelerinde bu formül kopyalanır.

· o6 hücresine \u003d ($ E $ 56 * EXP ($ E $ 55 * A6) - B6) ^ 2 formülünü girin.

· o7: O30 hücrelerinde bu formül kopyalanır.

Sonraki adımlar otomatik toplama kullanılarak yapılır.

· j33 hücresine \u003d CYMM (J6: J30) formülünü girin.

· k33 hücresine \u003d SUM (K6: K30) formülünü girin.

· l33 hücresine \u003d CYMM (L6: L30) formülünü girin.

· m33 hücresine \u003d SUM (M6: M30) formülünü girin.

· n33 hücresine \u003d TOPLA (N6: N30) formülünü girin.

· o33 hücresine \u003d SUM (06: 030) formülünü girin.

Şimdi formül (8) kullanarak korelasyon katsayısını (sadece doğrusal yaklaşım için) ve formül (10) kullanarak determinizm katsayısını hesaplayalım. Microsoft Excel araçları kullanılarak yapılan hesaplamaların sonuçları Şekil 7'de sunulmuştur.



Tablo 8'de, B61 hücresi \u003d J33 / (K33 * L33 ^ (1/2) formülünü içerir. B62 hücresi \u003d 1 - M33 / L33 formülünü içerir. B63 hücresi \u003d 1 - N33 / L33 formülünü içerir. B64 hücresi şunları içerir formül \u003d 1 - O33 / L33.

Hesaplama sonuçlarının analizi, ikinci dereceden yaklaşımın deneysel verileri en iyi şekilde tanımladığını göstermektedir.


4.1 Excel'de grafik çizme


A1: A25 hücrelerini seçin, ardından grafik sihirbazına dönün. Bir dağılım grafiği seçelim. Diyagram oluşturulduktan sonra, grafik çizgisine sağ tıklayın ve bir eğilim çizgisi eklemeyi seçin (sırasıyla doğrusal, üstel, üstel ve polinom ikinci derece).

Doğrusal Uyum Grafiği


Kuadratik Uyum Grafiği


Üstel uyum grafiği.


5. MathCAD kullanarak fonksiyon yaklaşımı


İstatistiksel parametreleri dikkate alınarak verilerin yaklaştırılması, regresyon problemlerini ifade eder. Genellikle doğası gereği istatistiksel olan (radyometri ve nükleer jeofizikteki ölçümler gibi) veya yüksek düzeyde parazit (gürültü) olan süreçlerin veya fiziksel olayların ölçümlerinden elde edilen deneysel verilerin işlenmesinde ortaya çıkarlar. Regresyon analizinin görevi, deneysel verileri en iyi tanımlayan matematiksel formülleri seçmektir.


.1 Doğrusal Regresyon


Mathcad sistemindeki doğrusal regresyon, argümanın vektörleri üzerinde gerçekleştirilir. X ve sayar Y fonksiyonlar:

kesişme (x, y) - parametreyi hesaplar ve1 , regresyon çizgisinin dikey yer değiştirmesi (şekle bakınız)

eğim (x, y) - parametreyi hesaplar a2 , regresyon çizgisinin eğimi (bkz. şek.)

y (x) \u003d a1 + a2 * x


Fonksiyon corr (y, y (x)) hesaplar Pearson korelasyon katsayısı. Ne kadar yakınsa 1, işlenen veriler daha doğru bir şekilde doğrusal ilişkiye karşılık gelir (bkz. Şek.)

.2 Polinom Regresyon


Mathcad'de rasgele bir polinom derecesi n ve rasgele örnek koordinatları ile tek boyutlu polinom regresyonu aşağıdaki fonksiyonlar tarafından gerçekleştirilir:

gerileme (x, y, n) - bir vektör hesaplar S, katsayıları içeren aipolinom nderece;

Katsayı değerleri ai vektörden çıkarılabilir S işlevi alt matris (S, 3, uzunluk (S) - 1, 0, 0).

Katsayıların elde edilen değerlerini regresyon denkleminde kullanıyoruz


y (x) \u003d a1 + a2 * x + a3 * x2 (şekle bakın)

.3 Doğrusal olmayan regresyon


Basit standart yaklaşım formülleri için, fonksiyonların parametrelerinin Mathcad programı tarafından seçildiği bir dizi doğrusal olmayan regresyon fonksiyonu sağlanmıştır.

Bunlar işlevi içerir expfit (x, y, s), katsayıları içeren bir vektör verir a1, a2ve a3 üstel fonksiyon

y (x) \u003d a1 ^ exp (a2x) + a3. Vektöre S katsayıların başlangıç \u200b\u200bdeğerleri tanıtıldı a1, a2ve a3 ilk yaklaşım.


Sonuç


Hesaplama sonuçlarının analizi, doğrusal yaklaşımın deneysel verileri en iyi şekilde tanımladığını göstermektedir.

MathCAD programı kullanılarak elde edilen sonuçlar, Excel kullanılarak elde edilen değerlerle tamamen örtüşmektedir. Bu, hesaplamaların doğruluğunu gösterir.


Kaynakça

  1. Bilişim: Ders Kitabı / Ed. prof. N.V. Makarova. Moskova: Finans ve İstatistik 2007
  2. Bilişim: Bilgisayar / Altında çalışma teknolojisi üzerine atölye çalışması. Ed. prof. N.V. Makarova. M Finans ve İstatistik, 2011.
  3. N.S. Piskunov. Diferansiyel ve integral hesabı, 2010.
  4. Bilişim, En küçük kareler yöntemiyle yaklaşım, kılavuzlar, St.Petersburg, 2009.
Ders verme

Bir konuyu keşfetme konusunda yardıma mı ihtiyacınız var?

Uzmanlarımız ilgilendiğiniz konularda size tavsiyelerde bulunacak veya özel ders hizmetleri sağlayacaktır.
İstek gönder Bir konsültasyon alma olasılığını öğrenmek için şu anda konunun belirtilmesi ile.

En küçük kareler yöntemi

Konunun son dersinde en ünlü uygulama ile tanışacağız. FNPçeşitli bilim ve uygulama alanlarında en geniş uygulamayı bulan. Fizik, kimya, biyoloji, ekonomi, sosyoloji, psikoloji ve benzeri olabilir. Kaderin iradesiyle, sık sık ekonomiyle uğraşmak zorunda kalıyorum ve bu nedenle bugün size harika bir ülkeye bilet vereceğim. Ekonometri \u003d) ... Nasıl istemezsin?! Orası çok iyi - sadece karar vermen gerekiyor! ... Ama muhtemelen kesinlikle istediğiniz şey, problemleri nasıl çözeceğinizi öğrenmektir. en küçük kareler... Ve özellikle çalışkan okuyucular, bunları yalnızca doğru değil, aynı zamanda ÇOK HIZLI ;-) Ama önce nasıl çözeceklerini öğrenecekler genel sorun bildirimi + ilgili örnek:

Bazı konu alanlarında kantitatif bir ifadesi olan göstergelerin araştırılmasına izin verin. Aynı zamanda, göstergenin göstergeye bağlı olduğuna inanmak için her türlü neden vardır. Bu varsayım hem bilimsel bir hipotez olabilir hem de temel sağduyuya dayanabilir. Ancak bilimi bir kenara bırakıp daha çok ağız sulandıran alanları, yani marketleri keşfetmek. Şunu ifade edelim:

- bir bakkalın perakende alanı, metrekare,
- bakkalın yıllık cirosu, milyon ruble.

Mağazanın alanı ne kadar büyükse, çoğu durumda cirosunun o kadar fazla olacağı kesinlikle açıktır.

Bir tef ile gözlemler / deneyler / hesaplamalar / danslar yaptıktan sonra elimizde sayısal veriler olduğunu varsayalım:

Marketlerde her şeyin açık olduğunu düşünüyorum: - burası 1. mağazanın alanı, - yıllık cirosu, - 2. mağazanın alanı, - yıllık cirosu, vb. Bu arada, sınıflandırılmış malzemelere erişime sahip olmak hiç gerekli değildir - ciro hakkında oldukça doğru bir tahmin elde edilebilir. matematiksel istatistikler... Bununla birlikte, dikkatinizi dağıtmayalım, ticari casusluğun seyri - zaten ödenmiştir \u003d)

Tablo verileri ayrıca nokta şeklinde yazılabilir ve bizim için her zamanki gibi gösterilebilir. kartezyen sistem .

Önemli bir soruyu cevaplayalım: nitel bir çalışma için kaç puan gereklidir?

Daha büyük daha iyi. İzin verilen minimum set 5-6 puandan oluşur. Ek olarak, az miktarda veriyle, örnek "anormal" sonuçları içeremez. Bu nedenle, örneğin, küçük bir elit mağaza, "meslektaşlarından" daha büyük emirlerle yardımcı olabilir ve böylece bulunması gereken genel düzeni bozabilir!



Oldukça basit, bir işlev seçmemiz gerekiyor program noktalara mümkün olduğunca yakın geçen ... Bu fonksiyona yaklaşan (yaklaşım - yaklaşım) veya teorik işlev ... Genel olarak, burada hemen belirgin bir "rakip" belirir - grafiği TÜM noktalardan geçen yüksek dereceli bir polinom. Ancak bu seçenek zordur ve genellikle yanlıştır. (çünkü grafik her zaman "bükülür" ve ana eğilimi kötü bir şekilde yansıtır).

Bu nedenle aranan işlev yeterince basit olmalı ve aynı zamanda bağımlılığı yeterince yansıtmalıdır. Tahmin edebileceğiniz gibi, bu tür işlevleri bulmanın yöntemlerinden biri en küçük kareler... Önce genel hatlarıyla özüne bakalım. Bazı fonksiyonların deneysel verilere yaklaşmasına izin verin:


Bu yaklaşımın doğruluğu nasıl değerlendirilir? Deneysel ve fonksiyonel değerler arasındaki farkları (sapmaları) hesaplayalım (çizimi incelemek)... Akla gelen ilk düşünce, toplamın ne kadar büyük olduğunu tahmin etmektir, ancak sorun, farklılıkların negatif olabilmesidir. (Örneğin, ) ve bu tür bir toplamadan kaynaklanan sapmalar birbirini iptal edecektir. Bu nedenle, yaklaşıklığın doğruluğunun bir tahmini olarak, toplamı kabul etmek gerekir. modüller sapmalar:

veya çöktü: (birdenbire kim bilmiyor: Toplam simgesi ve - yardımcı değişken - 1'den değerlere kadar olan "sayaç" ) .

Deneysel noktalara farklı işlevlerle yaklaştığımızda, farklı değerler elde edeceğiz ve bu toplamın daha az olduğu - bu işlev daha doğru olduğu açıktır.

Böyle bir yöntem vardır ve denir en düşük modül yöntemi... Ancak pratikte çok daha yaygın hale geldi. en küçük kareler yöntemiOlası negatif değerler modül tarafından değil, sapmaların karesi alınarak elimine edilir:



, bundan sonra çabalar böyle bir fonksiyonun seçilmesine yönlendirilir, böylece sapmaların karelerinin toplamı olabildiğince küçüktü. Aslında yöntemin adı da buradan gelmektedir.

Ve şimdi başka bir önemli noktaya dönüyoruz: Yukarıda belirtildiği gibi, seçilen işlev oldukça basit olmalıdır - ancak bu tür birçok işlev de vardır: doğrusal , hiperbolik , üstel , logaritmik , ikinci dereceden vb. Ve tabii ki, burada hemen "faaliyet alanını küçültmek" istiyorum. Araştırma için hangi sınıf fonksiyonlar seçilmeli? İlkel ama etkili bir numara:

- Puan çekmenin en kolay yolu çizim üzerinde ve konumlarını analiz edin. Düz bir çizgide olma eğilimindelerse, o zaman aramalısınız düz çizgi denklemi optimal değerlerle ve. Başka bir deyişle, görev SUCH katsayılarını bulmaktır - böylece sapmaların karelerinin toplamı en az olur.

Noktalar, örneğin, abartmabu durumda doğrusal fonksiyonun kötü bir yaklaşım vereceği açıktır. Bu durumda, hiperbol denklemi için en "uygun" katsayıları arıyoruz - minimum kareler toplamı verenler .

Şimdi her iki durumda da bahsettiğimizi unutmayın iki değişkenli fonksiyonlarkimin argümanları istenen bağımlılıkların parametreleri:

Ve özünde standart bir problemi çözmemiz gerekiyor - bulmak için iki değişkenin minimum fonksiyonu.

Örneğimizi hatırlayalım: "Mağaza" noktalarının düz bir çizgide bulunma eğiliminde olduğunu ve buna inanmak için her türlü neden olduğunu varsayalım. doğrusal ilişki perakende alanından ciro. SUCH katsayıları "a" ve "bs" yi bulalım, böylece sapmaların karelerinin toplamı en küçüğüydü. Her şey her zamanki gibi - önce 1. dereceden kısmi türevler... Göre doğrusallık kuralı doğrudan tutar simgesinin altında ayırt edebilirsiniz:

Bu bilgiyi bir kompozisyon veya ders kitabı için kullanmak isterseniz, kaynaklar listesindeki bağlantı için çok minnettar olacağım, bu kadar detaylı hesaplamaları birkaç yerde bulacaksınız:

Standart bir sistem oluşturalım:

Her denklemi "iki" azaltır ve ek olarak, toplamları "parçalara ayırırız":

Not : Toplam simgesi olarak "a" ve "bie" nin neden çıkarılabileceğini kendi kendinize analiz edin. Bu arada, resmi olarak bu, toplamla yapılabilir

Sistemi "uygulanmış" bir biçimde yeniden yazalım:

Bundan sonra problemimizi çözmek için algoritma çizilmeye başlar:

Noktaların koordinatlarını biliyor muyuz? Biliyoruz. Miktarlar bulabilir miyiz Kolayca. En basit olanı yapmak iki bilinmeyenli iki doğrusal denklem sistemi("A" ve "bh"). Sistemi çözüyoruz, örneğin, cramer yöntemiBunun sonucunda sabit bir nokta elde ederiz. Kontrol etme ekstremum için yeterli koşul, bu noktada işlevin tam olarak başarır minimum... Doğrulama ek hesaplamalarla ilişkilidir ve bu nedenle onu perde arkasında bırakacağız. (gerekirse, eksik çerçeve görüntülenebilirburaya ) ... Nihai sonucu çıkarıyoruz:

Fonksiyon en iyi yol (en azından diğer doğrusal işlevlerle karşılaştırıldığında) deneysel noktaları yakınlaştırır ... Kabaca konuşursak, grafiği bu noktalara olabildiğince yakın ilerler. Gelenekte ekonometrisonuçta ortaya çıkan yaklaştırma işlevi de denir eşleştirilmiş doğrusal regresyon denklemi .

İncelenen sorun pratik açıdan büyük önem taşımaktadır. Örneğimizdeki durumda, denklem hangi ciroyu tahmin etmenizi sağlar ("Oyun") mağazada perakende alanının bir veya daha fazla değeri ile olacak (bu veya bu değer "x")... Evet, elde edilen tahmin yalnızca bir tahmin olacaktır, ancak çoğu durumda oldukça doğru olacaktır.

"Gerçek" sayılarla sadece bir problemi analiz edeceğim, çünkü bunda hiçbir zorluk yok - tüm hesaplamalar 7-8 ilkokul müfredatı seviyesinde. Vakaların yüzde 95'inde sizden sadece doğrusal bir fonksiyon bulmanız istenecek, ancak makalenin en sonunda, optimal hiperbol, üs ve diğer bazı fonksiyonların denklemlerini bulmanın artık zor olmadığını göstereceğim.

Aslında, söz verilen çörekler dağıtmaya devam ediyor - böylece bu tür örnekleri yalnızca doğru değil, aynı zamanda hızlı bir şekilde nasıl çözeceğinizi öğrenebilirsiniz. Standardı dikkatlice inceliyoruz:

Bir görev

İki gösterge arasındaki ilişkinin incelenmesi sonucunda aşağıdaki sayı çiftleri elde edildi:

En küçük kareler yöntemini kullanarak, ampirik değere en iyi yaklaşan doğrusal fonksiyonu bulun. (Tecrübeli) veri. Kartezyen dikdörtgen koordinat sisteminde deneysel noktaları ve yaklaştırma fonksiyonunun grafiğini çizen bir çizim yapın ... Ampirik ve teorik değerler arasındaki kare sapmaların toplamını bulun. İşlevin daha iyi olup olmayacağını anlayın (en küçük kareler yöntemi açısından) deneysel noktaları yaklaştırın.

“X” anlamlarının doğal olduğuna ve bunun biraz sonra bahsedeceğim karakteristik anlamlı bir anlamı olduğuna dikkat edin; ama elbette kesirli olabilirler. Ek olarak, belirli bir sorunun içeriğine bağlı olarak, hem "x" hem de "oyun" değerleri tamamen veya kısmen negatif olabilir. "Yüzü olmayan" bir görevimiz var ve onu başlatıyoruz karar:

Optimal fonksiyonun katsayılarını sisteme bir çözüm olarak buluyoruz:

Daha kompakt bir gösterim uğruna, "sayaç" değişkeni ihmal edilebilir, çünkü toplamanın 1'den 1'e kadar gerçekleştirildiği zaten açıktır.

Gerekli miktarları tablo şeklinde hesaplamak daha uygundur:


Hesaplamalar bir mikro hesap makinesinde yapılabilir, ancak Excel'i kullanmak çok daha iyidir - hem daha hızlı hem de hatasız; kısa bir video izleyin:

Böylece aşağıdakileri elde ederiz sistemi:

Burada ikinci denklemi 3 ile çarpabilirsin ve terime göre 1. denklem teriminden 2. çıkarın... Ancak bu şanstır - pratikte, sistemler genellikle bir hediye değildir ve bu gibi durumlarda tasarruf sağlar cramer yöntemi:
Bu, sistemin benzersiz bir çözüme sahip olduğu anlamına gelir.

Hadi kontrol edelim. İstemediğimi anlıyorum, ancak neden tamamen önlenebilecek hataları atlayayım? Bulunan çözümü, sistemin her denkleminin sol tarafına koyarız:

Karşılık gelen denklemlerin sağ tarafları elde edilir, bu da sistemin doğru bir şekilde çözüldüğü anlamına gelir.

Böylece, aranan yaklaştırma işlevi: - tüm doğrusal fonksiyonların deneysel verilere en iyi şekilde yaklaşan odur.

Aksine düz mağazanın cirosunun alanına bağımlılığı, bulunan bağımlılık tersine çevirmek (ilke "ne kadar çok - o kadar az")ve bu gerçek olumsuz tarafından hemen ortaya çıkar eğim... Fonksiyon belirli bir göstergede 1 birim artışla, bağımlı göstergenin değerinin azaldığını söyler ortalama0.65 birim. Söylendiği gibi, karabuğdayın fiyatı ne kadar yüksekse, o kadar az satılır.

Yaklaşık fonksiyonun grafiğini çizmek için iki değerini bulacağız:

ve çizimi yürütün:

İnşa edilen hat denir trend çizgisi (yani, doğrusal bir eğilim çizgisi, yani genel durumda, bir eğilim mutlaka düz bir çizgi değildir)... Herkes "trend içinde ol" ifadesine aşinadır ve bu terimin ek yorumlara ihtiyacı olmadığını düşünüyorum.

Sapmaların karelerinin toplamını hesaplayalım ampirik ve teorik değerler arasında. Geometrik olarak, "kızıl" parçaların uzunluklarının karelerinin toplamıdır. (ikisi o kadar küçük ki onları göremiyorsun bile).

Hesaplamaları bir tabloda özetleyelim:


1. nokta için bir örnek vermem durumunda tekrar manuel olarak yapılabilir:

ancak bilinen bir şekilde hareket etmek çok daha etkilidir:

Tekrar edelim: elde edilen sonucun anlamı nedir? Nın-nin tüm doğrusal fonksiyonların işlevi gösterge en küçüğüdür, yani ailesinde bu en iyi yaklaşımdır. Ve burada, bu arada, sorunun son sorusu tesadüfi değil: Ya önerilen üstel fonksiyon deneysel noktalara yaklaşmak daha mı iyi olacak?

Karşılık gelen sapmaların karelerinin toplamını bulalım - ayırt etmek için onları "epsilon" harfiyle göstereceğim. Teknik tamamen aynı:


Ve yine, her itfaiyeci için, 1. nokta için hesaplamalar:

Excel'de standart işlevi kullanıyoruz tecrübe (sözdizimi Excel Yardımı'nda bulunabilir).

Sonuç:, bu, üstel fonksiyonun deneysel noktalara düz çizgiden daha kötü yaklaştığı anlamına gelir .

Ancak burada not edilmelidir ki "daha kötüsü" henüz demek değil, Yanlış olan ne. Şimdi bu üstel fonksiyonun grafiğini çizdim - ve aynı zamanda noktalara da yaklaşıyor - Öyle ki, analitik araştırma olmadan hangi fonksiyonun daha doğru olduğunu söylemek zor.

Bu, çözümü tamamlar ve argümanın doğal değerleri sorusuna geri dönüyorum. Çeşitli çalışmalarda, kural olarak, ekonomik veya sosyolojik, doğal "x" sayıları aylar, yıllar veya diğer eşit zaman aralıklarıdır. Örneğin şuna benzer bir problemi düşünün:

Yılın ilk yarısı için mağazanın perakende cirosu ile ilgili aşağıdaki verilere sahibiz:

Analitik düz çizgi hizalamasını kullanarak, Temmuz ayı satış hacmini belirleyin.

Evet, sorun değil: 1, 2, 3, 4, 5, 6. ayları numaralandırıyoruz ve bunun sonucunda bir denklem elde ettiğimiz olağan algoritmayı kullanıyoruz - zaman geldiğinde tek şey, genellikle "te" harfi kullanılır (bu kritik olmasa da)... Ortaya çıkan denklem, yılın ilk yarısında cironun ortalama 27,74 adet arttığını göstermektedir. her ay. Temmuz tahminini alın (7. ay): d.e.

Ve bu tür görevler - karanlık karanlıktır. Dileyenler ek bir hizmet yani benim excel hesap makinesi (demo versiyonu), hangisi analiz edilen problemi neredeyse anında çözer! Programın çalışan versiyonu mevcuttur karşılığında yada ... için jeton.

Dersin sonunda, diğer bazı türlerin bağımlılıklarını bulma konusunda kısa bilgi. Aslında, ilkeli yaklaşım ve çözüm algoritması aynı kaldığı için söylenecek özel bir şey yok.

Deneysel noktaların dizilişinin bir hiperbola benzediğini varsayalım. Ardından, en iyi hiperbolün katsayılarını bulmak için, fonksiyonun minimumunu bulmanız gerekir - dileyenler ayrıntılı hesaplamalar yapabilir ve benzer bir sisteme gelebilir:

Biçimsel ve teknik açıdan bakıldığında, "doğrusal" sistemden elde edilir. (bunu bir "yıldız işareti" ile belirleyelim) "x" yerine. Peki ve miktarlar hesaplayın ve ardından optimum "a" ve "be" katsayılarına elde.

Puanların olduğuna inanmak için her neden varsa logaritmik bir eğri boyunca yerleştirilir, daha sonra optimal değerleri aramak ve fonksiyonun minimumunu bulmak için ... Resmi olarak, sistemde (*) şu şekilde değiştirilmelidir:

Excel'de hesaplamalar yaparken işlevi kullanın LN... Kabul ediyorum, söz konusu vakaların her biri için hesap makineleri oluşturmam benim için zor olmayacak, ancak hesaplamaları kendiniz "programlamanız" yine de daha iyi olacaktır. Yardımcı olacak ders videoları.

Üstel bağımlılıkla durum biraz daha karmaşıktır. Konuyu doğrusal duruma indirgemek için, işlevi logaritmalı ve kullanalım logaritmanın özellikleri:

Şimdi, ortaya çıkan işlevi doğrusal bir işlevle karşılaştırarak, sistemde (*), ve - ile değiştirilmesi gerektiği sonucuna varıyoruz. Kolaylık sağlamak için şunları belirtiyoruz:

Lütfen sistemin göreceli olarak çözüldüğünü ve bu nedenle kökleri bulduktan sonra katsayının kendisini bulmayı hatırlamanız gerektiğini unutmayın.

Deneysel noktaları yakınlaştırmak için optimal parabol , bulunmalı üç değişkenin minimum fonksiyonu ... Standart eylemleri gerçekleştirdikten sonra aşağıdaki "çalışmayı" elde ederiz sistemi:

Evet, elbette, burada daha fazla meblağ var, ancak favori uygulamanızı kullanırken hiçbir zorluk yok. Son olarak, Excel'i kullanarak istenen trend çizgisini nasıl hızlı bir şekilde kontrol edip oluşturacağınızı anlatacağım: bir dağılım grafiği oluşturun, fareyle herhangi bir noktayı seçin ve sağ tıklama ile seçeneği seçin "Trend çizgisi ekle"... Ardından, grafik türünü seçin ve sekmede "Seçenekler"seçeneği etkinleştir Denklemi Grafikte Göster... tamam

Her zaman olduğu gibi, makaleyi güzel bir cümle ile bitirmek istiyorum ve neredeyse “Trendde ol!” Yazdım. Ama zamanla fikrini değiştirdi. Ve basmakalıp olduğu için değil. Kimsenin nasıl olduğunu bilmiyorum, ancak Amerika'nın ve özellikle de Avrupalıların yükselişini takip etmek istemiyorum \u003d) Bu nedenle, her birinizin kendi çizginize bağlı kalmasını diliyorum!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

En küçük kareler yöntemi, en yaygın ve en gelişmiş yöntemlerden biridir. doğrusal ekonometrik modellerin parametrelerini tahmin etmek için yöntemlerin basitliği ve etkinliği... Aynı zamanda, kullanımıyla oluşturulan modeller, parametrelerinin kalitesi için bir dizi gereksinimi karşılamayabileceğinden ve sonuç olarak, süreç geliştirme modellerini görüntülemek için "yeterince iyi" olmadığından, onu kullanırken dikkatli olunmalıdır.

En küçük kareler yöntemini kullanarak doğrusal bir ekonometrik modelin parametrelerini tahmin etme prosedürünü daha ayrıntılı olarak ele alalım. Genel formdaki böyle bir model, denklem (1.2) ile temsil edilebilir:

y t \u003d a 0 + a 1 х 1t + ... + a n х nt + ε t.

A 0, a 1, ..., a n parametrelerini tahmin ederken ilk veriler, bağımlı değişkenin değerlerinin vektörüdür y \u003d (y 1, y 2, ..., y T) "ve bağımsız değişkenlerin değer matrisi

birinci sütun modelin katsayısına karşılık gelir.

En küçük kareler yöntemi, adını, temel alınarak elde edilen parametre tahminlerinin karşılaması gereken temel ilkeye dayanarak almıştır: model hatasının karelerinin toplamı minimum olmalıdır.

En küçük kareler yöntemini kullanarak problem çözme örnekleri

Örnek 2.1.Ticari işletme, faaliyetleri hakkında bilgiler tabloda sunulan 12 mağazadan oluşan bir ağa sahiptir. 2.1.

Şirket yönetimi, yıllık cironun büyüklüğünün mağazanın perakende alanına nasıl bağlı olduğunu bilmek istiyor.

Tablo 2.1

Mağaza numarası Yıllık ciro, milyon RUB Ticaret alanı, bin m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

En küçük kareler çözümü.Belirleyelim - mağazanın yıllık cirosu, milyon ruble; - mağazanın satış alanı, bin m 2.

Şekil 2.1. Dağılım grafiği, örneğin 2.1

Değişkenler arasındaki işlevsel bağımlılığın şeklini belirlemek ve bir dağılım diyagramı oluşturmak için (Şekil 2.1).

Dağılım diyagramına dayanarak, yıllık cironun olumlu bir şekilde perakende alanına bağlı olduğu sonucuna varılabilir (yani, y büyümeyle büyüyecek). En uygun işlevsel iletişim şekli doğrusal.

Diğer hesaplamalar için bilgiler tabloda sunulmuştur. 2.2. En küçük kareler yöntemini kullanarak, doğrusal tek faktörlü bir ekonometrik modelin parametrelerini tahmin ediyoruz

Tablo 2.2

t YT x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Ortalama 68,29 0,89

Böylece,

Sonuç olarak, satış alanında 1 bin m 2, diğer şeyler eşit olmak üzere, yıllık ortalama ciro 67.8871 milyon ruble artmaktadır.

Örnek 2.2.Şirket yönetimi, yıllık cironun yalnızca mağazanın perakende alanına değil (bkz. Örnek 2.1), aynı zamanda ortalama ziyaretçi sayısına da bağlı olduğunu fark etti. İlgili bilgiler tabloda sunulmuştur. 2.3.

Tablo 2.3

Karar.Belirleyelim - günlük ortalama ziyaretçi sayısı, bin kişi.

Değişkenler arasındaki fonksiyonel ilişkinin şeklini belirlemek ve bir dağılım diyagramı oluşturmak (Şekil 2.2).

Dağılım grafiğine dayanarak, yıllık cironun pozitif olarak günlük ortalama ziyaretçi sayısına bağlı olduğu sonucuna varabiliriz (yani, y büyümeyle büyüyecek). İşlevsel bağımlılığın biçimi doğrusaldır.

Şekil: 2.2. Dağılım grafiği, örneğin 2.2

Tablo 2.4

t x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Ortalama 10,65

Genel olarak, iki faktörlü ekonometrik modelin parametrelerini belirlemek gerekir.

у t \u003d a 0 + a 1 х 1t + a 2 х 2t + ε t

Daha sonraki hesaplamalar için gerekli bilgiler tabloda sunulmuştur. 2.4.

Doğrusal iki faktörlü bir ekonometrik modelin parametrelerini en küçük kareler yöntemini kullanarak tahmin edelim.

Böylece,

\u003d 61.6583 katsayısının tahmini, diğer şeylerin eşit olması, satış alanında 1 bin m2'lik bir artışla, yıllık cironun ortalama 61.6583 milyon ruble artacağını göstermektedir.

Katsayı tahmini \u003d 2.2748, diğer her şeyin eşit olduğunu ve 1000 kişi başına ortalama ziyaretçi sayısının arttığını göstermektedir. günlük ciro ortalama 2.2748 milyon ruble artacak.

Örnek 2.3.Tabloda sunulan bilgileri kullanmak. 2.2 ve 2.4, tek faktörlü ekonometrik modelin parametresini tahmin edin

mağazanın yıllık cirosunun merkez değeri nerede, milyon ruble; - t-th mağazasına gelen ortalama günlük ziyaretçi sayısının ortalama değeri, bin kişi. (bkz. örnekler 2.1-2.2).

Karar. Hesaplamalar için gerekli ek bilgiler tabloda sunulmuştur. 2.5.

Tablo 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Miktar 48,4344 431,0566

Formül (2.35) kullanarak elde ederiz

Böylece,

http://www.cleverstudents.ru/articles/mnk.html

Misal.

Değişkenlerin değerlerine ilişkin deneysel veriler xve -detabloda verilmiştir.

Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

Kullanma en küçük kareler yöntemi, bu verileri doğrusal bir bağımlılıkla yaklaşık olarak hesaplayın y \u003d ax + b (parametreleri bul ve ve b). İki çizgiden hangisinin daha iyi olduğunu bulun (en küçük kareler yöntemi anlamında) deneysel verileri hizalar. Çizim yapmak.

Karar.

Örneğimizde n \u003d 5... İstenilen katsayıların formüllerinde yer alan miktarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, 2. satırın değerleri ile her sayı için 3. satırın değerleri çarpılarak elde edilir. ben.

Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. ben.

Tablonun son sütununun değerleri, değerlerin satır bazında toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz ve ve b... İçlerine tablonun son sütunundaki karşılık gelen değerleri koyarız:

Bu nedenle y \u003d 0,165x + 2,184 - gerekli yaklaşık düz çizgi.

Hatlardan hangisini bulmak için kalır y \u003d 0,165x + 2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahmin yapın.

Kanıt.

Böylece bulunduğunda ve ve b fonksiyon en küçük değeri alır, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. kesinlikle kesin. Hadi gösterelim.

İkinci dereceden diferansiyel şu forma sahiptir:

Yani

Bu nedenle, ikinci dereceden formun matrisi forma sahiptir

ve elemanların değerleri şunlara bağlı değildir veve b.

Matrisin pozitif tanımlı olduğunu gösterelim. Bu, köşedeki küçüklerin olumlu olmasını gerektirir.

Korner birinci dereceden minör ... Eşitsizlik katı, çünkü puanlar

Misal.

Değişkenlerin değerlerine ilişkin deneysel veriler x ve -de tabloda verilmiştir.

Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

Kullanma en küçük kareler yöntemi, bu verileri doğrusal bir bağımlılıkla yaklaşık olarak hesaplayın y \u003d ax + b (parametreleri bul ve ve b). İki çizgiden hangisinin daha iyi olduğunu bulun (en küçük kareler yöntemi anlamında) deneysel verileri hizalar. Çizim yapmak.

En küçük kareler (OLS) yönteminin özü.

Görev, iki değişkenin fonksiyonu için doğrusal bağımlılık katsayılarını bulmaktır. ve ve b en küçük değeri alır. Yani verilen ve ve b Deneysel verilerin bulunan düz çizgiden sapmalarının karelerinin toplamı en küçük olacaktır. En küçük kareler yönteminin tüm noktası budur.

Böylece, örneğin çözümü iki değişkenli bir fonksiyonun uç noktasını bulmaya indirgenmiştir.

Katsayıları bulmak için formüllerin türetilmesi.

İki bilinmeyenli iki denklem sistemi oluşturulur ve çözülür. Değişkenlere göre bir fonksiyonun kısmi türevlerini bulun ve ve b, bu türevleri sıfıra eşitliyoruz.

Ortaya çıkan denklem sistemini herhangi bir yöntemle çözüyoruz (örneğin ikame yöntemi veya) ve en küçük kareler yöntemini (OLS) kullanarak katsayıları bulmak için formüller elde ederiz.

Verilerle ve ve b işlevi en küçük değeri alır. Bu gerçeğin kanıtı verilmiştir.

En küçük kareler yöntemi budur. Parametreyi bulmak için formül a toplamları içerir ,,, ve parametre n - deneysel veri miktarı. Bu miktarların değerlerini ayrı ayrı hesaplamanızı tavsiye ederiz. Katsayı b hesaplamadan sonra a.

Orijinal örneği hatırlamanın zamanı geldi.

Karar.

Örneğimizde n \u003d 5... İstenilen katsayıların formüllerinde yer alan miktarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, 2. satırın değerleri ile her sayı için 3. satırın değerleri çarpılarak elde edilir. ben.

Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. ben.

Tablonun son sütununun değerleri, değerlerin satır bazında toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz ve ve b... İçlerine tablonun son sütunundaki karşılık gelen değerleri koyarız:

Bu nedenle y \u003d 0,165x + 2,184 - gerekli yaklaşık düz çizgi.

Hatlardan hangisini bulmak için kalır y \u003d 0,165x + 2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahmin yapın.

En küçük kareler yönteminin hatasının tahmini.

Bu, ilk verilerin bu çizgilerden sapmalarının karelerinin toplamının hesaplanmasını gerektirir. ve daha küçük değer, en küçük kareler yöntemi anlamında orijinal verilere daha iyi yaklaşan çizgiye karşılık gelir.

O zamandan beri düz y \u003d 0,165x + 2,184 orijinal verilere daha iyi yaklaşır.

En küçük kareler (mns) yönteminin grafiksel gösterimi.

Grafiklerde her şey açıkça görülebilir. Kırmızı çizgi, bulunan düz çizgidir y \u003d 0,165x + 2,184mavi çizgi , pembe noktalar ham verilerdir.

Ne için, tüm bu tahminler ne için?

Kişisel olarak veri yumuşatma, enterpolasyon ve ekstrapolasyon problemlerini çözmek için kullanıyorum (orijinal örnekte, gözlemlenen değerin değerini bulmayı istemiş olabilirsiniz. y -de x \u003d 3 veya x \u003d 6 OLS yöntemi ile). Ancak bunun hakkında daha sonra sitenin başka bir bölümünde daha ayrıntılı olarak konuşacağız.

Kanıt.

Böylece bulunduğunda ve ve b fonksiyon en küçük değeri alır, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. kesinlikle kesin. Hadi gösterelim.

Fonksiyonu derece 2 polinomu ile kestirelim. Bunun için normal denklem sisteminin katsayılarını hesaplıyoruz:

, ,

Şu biçime sahip normal bir en küçük kareler sistemi oluşturalım:

Sistem çözümünün bulunması kolaydır: ,,.

Böylece, 2. derecenin polinomu bulunur:

Teorik arka plan

Sayfaya dön<Введение в вычислительную математику. Примеры>

Örnek 2... Bir polinomun optimal derecesini bulma.

Sayfaya dön<Введение в вычислительную математику. Примеры>

Örnek 3... Ampirik bağımlılığın parametrelerini bulmak için normal denklem sisteminin türetilmesi.

Katsayıları ve işlevi belirlemek için bir denklem sistemi türetelim , verilen işlevin nokta ile ortalama karekök yaklaşımını gerçekleştirir. Bir fonksiyon oluşturalım ve bunun için gerekli ekstrem durumu yazın:

Daha sonra normal sistem şu şekli alacaktır:

Bilinmeyen parametreler için ve kolayca çözülebilen doğrusal bir denklem sistemi aldı.

Teorik arka plan

Sayfaya dön<Введение в вычислительную математику. Примеры>

Misal.

Değişkenlerin değerlerine ilişkin deneysel veriler x ve -de tabloda verilmiştir.

Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

Kullanma en küçük kareler yöntemi, bu verileri doğrusal bir bağımlılıkla yaklaşık olarak hesaplayın y \u003d ax + b (parametreleri bul ve ve b). İki çizgiden hangisinin daha iyi olduğunu bulun (en küçük kareler yöntemi anlamında) deneysel verileri hizalar. Çizim yapmak.

En küçük kareler (OLS) yönteminin özü.

Görev, iki değişkenin fonksiyonu için doğrusal bağımlılık katsayılarını bulmaktır. ve ve b en küçük değeri alır. Yani verilen ve ve b Deneysel verilerin bulunan düz çizgiden sapmalarının karelerinin toplamı en küçük olacaktır. En küçük kareler yönteminin tüm noktası budur.

Böylece, örneğin çözümü iki değişkenli bir fonksiyonun uç noktasını bulmaya indirgenmiştir.

Katsayıları bulmak için formüllerin türetilmesi.

İki bilinmeyenli iki denklem sistemi oluşturulur ve çözülür. Fonksiyonun kısmi türevlerini bulun değişkenlere göre ve ve b, bu türevleri sıfıra eşitliyoruz.

Ortaya çıkan denklem sistemini herhangi bir yöntemle çözüyoruz (örneğin ikame yöntemi veya Cramer'in yöntemi) ve en küçük kareler (OLS) yöntemiyle katsayıları bulmak için formüller elde edin.

Verilerle ve ve b işlevi en küçük değeri alır. Bu gerçeğin kanıtı aşağıda sayfanın sonundaki metinde verilmiştir.

En küçük kareler yöntemi budur. Parametreyi bulmak için formül a toplamları içerir ,,, ve parametre n - deneysel veri miktarı. Bu miktarların değerlerini ayrı ayrı hesaplamanızı tavsiye ederiz.

Katsayı b hesaplamadan sonra a.

Orijinal örneği hatırlamanın zamanı geldi.

Karar.

Örneğimizde n \u003d 5... İstenilen katsayıların formüllerinde yer alan miktarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, 2. satırın değerleri ile her sayı için 3. satırın değerleri çarpılarak elde edilir. ben.

Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. ben.

Tablonun son sütununun değerleri, değerlerin satır bazında toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz ve ve b... İçlerine tablonun son sütunundaki karşılık gelen değerleri koyarız:

Bu nedenle y \u003d 0,165x + 2,184 - gerekli yaklaşık düz çizgi.

Hatlardan hangisini bulmak için kalır y \u003d 0,165x + 2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahmin yapın.

En küçük kareler yönteminin hatasının tahmini.

Bu, ilk verilerin bu çizgilerden sapmalarının karelerinin toplamının hesaplanmasını gerektirir. ve daha küçük değer, en küçük kareler yöntemi anlamında orijinal verilere daha iyi yaklaşan çizgiye karşılık gelir.

O zamandan beri düz y \u003d 0,165x + 2,184 orijinal verilere daha iyi yaklaşır.

En küçük kareler (mns) yönteminin grafiksel gösterimi.

Grafiklerde her şey açıkça görülebilir. Kırmızı çizgi, bulunan düz çizgidir y \u003d 0,165x + 2,184mavi çizgi , pembe noktalar ham verilerdir.

Ne için, tüm bu tahminler ne için?

Kişisel olarak veri yumuşatma, enterpolasyon ve ekstrapolasyon problemlerini çözmek için kullanıyorum (orijinal örnekte, gözlemlenen değerin değerini bulmayı istemiş olabilirsiniz. y -de x \u003d 3 veya x \u003d 6 OLS yöntemi ile). Ancak bunun hakkında daha sonra sitenin başka bir bölümünde daha ayrıntılı olarak konuşacağız.

Sayfanın başına dön

Kanıt.

Böylece bulunduğunda ve ve b fonksiyon en küçük değeri alır, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. kesinlikle kesin. Hadi gösterelim.

İkinci dereceden diferansiyel şu forma sahiptir:

Yani

Bu nedenle, ikinci dereceden formun matrisi forma sahiptir

ve elemanların değerleri şunlara bağlı değildir ve ve b.

Matrisin pozitif tanımlı olduğunu gösterelim. Bu, köşedeki küçüklerin olumlu olmasını gerektirir.

Korner birinci dereceden minör ... Eşitsizlik kesin, çünkü puanlar çakışmıyor. Aşağıda bunu kasteteceğiz.

Köşe küçük ikinci derece

Bunu kanıtlayalım matematiksel tümevarım yöntemi ile.

Sonuç: bulunan değerler ve ve b en küçük fonksiyon değerine karşılık gelir bu nedenle, en küçük kareler yöntemi için gerekli parametrelerdir.

Çözecek zaman yok mu?
Bir çözüm sipariş edin

Sayfanın başına dön

En küçük kareler yöntemini kullanarak bir tahmin geliştirme. Problemi çözmenin bir örneği

Ekstrapolasyon Tahmin nesnesinin gelecekteki gelişimi için geçmiş ve şimdiki eğilimlerin, kalıpların, bağlantıların yayılmasına dayanan bilimsel bir araştırma yöntemidir. Ekstrapolasyon yöntemleri şunları içerir: hareketli ortalama yöntemi, üstel düzeltme yöntemi, en küçük kareler yöntemi.

Öz en küçük kareler yöntemi gözlemlenen ve hesaplanan değerler arasındaki standart sapmaların toplamının en aza indirilmesinden oluşur. Hesaplanan değerler, uyan denkleme - regresyon denklemine göre bulunur. Gerçek değerler ile hesaplananlar arasındaki mesafe ne kadar küçükse, regresyon denklemine dayalı tahmin o kadar doğru olur.

İncelenen olgunun özünün teorik analizi, değişimin bir zaman serisiyle görüntülenmesi, bir eğri seçmenin temelini oluşturur. Bazen serinin seviyelerinin büyümesinin doğası ile ilgili düşünceler dikkate alınır. Dolayısıyla, çıktıdaki büyüme aritmetik bir ilerlemede bekleniyorsa, düz bir çizgi boyunca düzleştirme gerçekleştirilir. Büyümenin geometrik ilerlemede olduğu ortaya çıkarsa, üssel fonksiyona göre düzeltme yapılmalıdır.

En Küçük Kareler Çalışma Formülü : Y t + 1 \u003d a * X + bt + 1, tahmin dönemidir; Уt + 1 - tahmin edilen gösterge; a ve b katsayılardır; X, zamanın bir sembolüdür.

A ve b katsayılarının hesaplanması aşağıdaki formüllere göre yapılır:

nerede, Uf - dinamik serisinin gerçek değerleri; n, zaman serisindeki düzeylerin sayısıdır;

Zaman serilerinin en küçük kareler yöntemiyle yumuşatılması, incelenen olgunun gelişim modellerini yansıtmaya yarar. Trendin analitik ifadesinde, zaman bağımsız bir değişken olarak kabul edilir ve serinin seviyeleri bu bağımsız değişkenin bir fonksiyonu olarak hareket eder.

Bir fenomenin gelişimi, başlangıç \u200b\u200banından bu yana kaç yıl geçtiğine değil, gelişimini hangi faktörlerin, hangi yönde ve hangi yoğunlukta etkilediğine bağlıdır. Dolayısıyla, bir fenomenin zaman içinde gelişmesinin, bu faktörlerin etkisinin bir sonucu olarak ortaya çıktığı açıktır.

Ön tahmine dayalı analizin en zor görevlerinden biri olan eğri türünü, zamana analitik bağımlılık türünü doğru bir şekilde belirleyin .

Parametreleri en küçük kareler yöntemiyle belirlenen eğilimi tanımlayan işlev türünün seçimi, çoğu durumda deneysel olarak, bir dizi işlev oluşturularak ve aşağıdaki formülle hesaplanan kök ortalama kare hatası değeriyle birbirleriyle karşılaştırılarak gerçekleştirilir:

nerede Uf - bir dizi dinamiğin gerçek değerleri; Ur - bir dizi dinamiğin hesaplanmış (düzleştirilmiş) değerleri; n, zaman serisindeki düzeylerin sayısıdır; p, eğilimi (gelişme eğilimini) tanımlayan formüllerde belirlenen parametrelerin sayısıdır.

En küçük kareler yönteminin dezavantajları :

  • incelenen ekonomik fenomeni matematiksel bir denklem kullanarak tanımlamaya çalışırken, tahmin kısa bir süre için doğru olacaktır ve yeni bilgiler elde edildikçe regresyon denklemi yeniden hesaplanmalıdır;
  • tipik bilgisayar programları kullanıldığında çözülebilen regresyon denkleminin seçiminin karmaşıklığı.

Bir tahmin geliştirmek için en küçük kareler yöntemini kullanma örneği

Bir görev ... Bölgedeki işsizlik oranını karakterize eden veriler var,%

  • Aşağıdaki yöntemleri kullanarak bölgedeki Kasım, Aralık, Ocak ayları için işsizlik oranı tahminini oluşturun: hareketli ortalama, üstel düzeltme, en küçük kareler.
  • Her yöntemi kullanarak elde edilen tahminlerin hatalarını hesaplayın.
  • Sonuçları karşılaştırın, sonuç çıkarın.

En küçük kareler çözümü

Sorunu çözmek için, gerekli hesaplamaları yapacağımız bir tablo hazırlayacağız:

ε \u003d 28,63 / 10 \u003d% 2,86 tahmin doğruluğu yüksek.

Sonuç : Hesaplamalarda elde edilen sonuçların karşılaştırılması hareketli ortalama yöntemi , üstel yumuşatma ve en küçük kareler yönteminde, üstel düzeltme yöntemi ile hesaplanırken ortalama bağıl hatanın% 20-50 aralığına düştüğünü söyleyebiliriz. Bu, bu durumda tahmin doğruluğunun yalnızca tatmin edici olduğu anlamına gelir.

Birinci ve üçüncü durumlarda, ortalama bağıl hata% 10'dan az olduğundan tahmin doğruluğu yüksektir. Ancak ortalamaları taşıma yöntemi, daha güvenilir sonuçlar elde etmeyi mümkün kıldı (Kasım için tahmin -% 1.52, Aralık için tahmin -% 1.53, Ocak için tahmin -% 1.49), çünkü bu yöntemi kullanırken ortalama bağıl hata en küçük - 1 ,% 13.

En küçük kareler yöntemi

Bu konuyla ilgili diğer makaleler:

Kullanılan kaynakların listesi

  1. Sosyal risklerin teşhisi ve zorlukların, tehditlerin ve sosyal sonuçların tahmin edilmesine ilişkin bilimsel ve metodolojik öneriler. Rusya Devlet Sosyal Üniversitesi. Moskova. 2010;
  2. Vladimirova L.P. Piyasa koşullarında tahmin ve planlama: Ders Kitabı. ödenek. M .: "Dashkov ve Co" Yayınevi, 2001;
  3. Novikova N.V., Pozdeeva O.G. Ulusal Ekonomiyi Tahmin Etmek: Öğretim Rehberi. Yekaterinburg: Ural Yayınevi. durum ekonomi. Üniversite, 2007;
  4. Slutskin L.N. İşletme tahmininde MBA kursu. M .: Alpina Business Books, 2006.

OLS programı

Verileri girin

Veriler ve yaklaşım y \u003d a + b x

ben - deneysel puan numarası;
x ben - noktadaki sabit parametrenin değeri ben;
sen ben - noktadaki ölçülen parametrenin değeri ben;
ω ben - bir noktada ölçüm ağırlığı ben;
y i, calc. - regresyon değeri ile ölçülen ve hesaplanan arasındaki fark y noktada ben;
S x ben (x ben) - hata tahmini x ben ölçerken y noktada ben.

Veriler ve yaklaşım y \u003d k x

ben x ben sen ben ω ben y i, calc. Ben S x ben (x ben)

Grafiğe tıklayın,

MNC çevrimiçi programının kullanıcısı için talimatlar.

Veri alanında, her ayrı satırda aynı test noktasında "x" ve "y" değerlerini girin. Değerler bir boşluk karakteri (boşluk veya sekme) ile ayrılmalıdır.

Üçüncü değer, "w" noktasının ağırlığı olabilir. Nokta ağırlığı belirtilmezse, bire eşittir. Vakaların ezici çoğunluğunda, deney noktalarının ağırlıkları bilinmiyor veya hesaplanmıyor, yani tüm deneysel veriler eşdeğer kabul edilir. Bazen incelenen değerler aralığındaki ağırlıklar kesinlikle eşdeğer değildir ve hatta teorik olarak hesaplanabilir. Örneğin, spektrofotometride ağırlıklar basit formüller kullanılarak hesaplanabilir, ancak temelde herkes bunu işgücü maliyetlerini düşürmek için ihmal eder.

Veriler, Microsoft Office'ten Excel veya Open Office'ten Calc gibi bir ofis paketi elektronik tablosundan pano aracılığıyla yapıştırılabilir. Bunu yapmak için elektronik tabloda kopyalanacak veri aralığını seçin, panoya kopyalayın ve verileri bu sayfadaki veri alanına yapıştırın.

En küçük kareler yöntemiyle hesaplama için, iki katsayı "b" - düz çizginin eğiminin tanjantı ve "a" - "y" eksenindeki düz çizgi tarafından kesilen değer - belirlemek için en az iki nokta gereklidir.

Hesaplanan regresyon katsayılarının hatasını tahmin etmek için, deneysel nokta sayısını ikiden fazla ayarlamanız gerekir.

En küçük kareler yöntemi (OLS).

Deneysel noktaların sayısı ne kadar büyükse, katsayıların istatistiksel tahmini o kadar doğru olur (Öğrenci katsayısındaki düşüş nedeniyle) ve tahmin, genel örneklemin tahminine daha yakın olur.

Her deney noktasında değer elde etmek genellikle emek yoğundur, bu nedenle deneylerin sayısında sindirilebilir bir tahmin veren ve aşırı işçilik maliyetlerine yol açmayan bir denge vardır. Kural olarak, iki katsayılı doğrusal en küçük kareler bağımlılığı için deney noktalarının sayısı 5-7 nokta bölgesini seçer.

Doğrusal bağımlılık için en küçük kareler yönteminin kısa teorisi

Değer çiftleri ["y_i`," x_i`] biçiminde bir dizi deneysel veriye sahip olduğumuzu varsayalım; burada "i", 1'den "n" ye kadar bir deneysel ölçümün sayısıdır; "y_i" - ölçülen değerin "i" noktasındaki değeri; `x_i` --` i` noktasında belirlediğimiz parametrenin değeri.

Örnek olarak, Ohm yasasının işleyişini düşünün. Elektrik devresinin bölümleri arasındaki voltajı (potansiyel farkı) değiştirerek bu bölümden geçen akım miktarını ölçüyoruz. Fizik bize deneysel olarak bulunan bağımlılığı verir:

`Ben \u003d U / R`,
nerede 'ben' - mevcut güç; "R" - direnç; "U" - voltaj.

Bu durumda, "y_i" ölçülen akım değeridir ve "x_i" voltaj değeridir.

Başka bir örnek olarak, bir çözelti içindeki bir maddenin bir çözeltisi tarafından ışığın emilmesini düşünün. Kimya bize şu formülü verir:

`A \u003d ε l C`,
burada "A", çözeltinin optik yoğunluğudur; `ε` - çözünen maddenin geçirgenliği; `l` - ışık, solüsyonlu küvette geçtiğinde yol uzunluğu; "C" - çözünen madde konsantrasyonu.

Bu durumda, "y_i", "A" optik yoğunluğunun ölçülen değerine sahibiz ve "x_i", ayarladığımız maddenin konsantrasyonunun değeridir.

"X_i" nin ayarlanmasındaki göreli hatanın göreli ölçüm hatası "y_i" den çok daha az olduğu durumu dikkate alacağız. Ayrıca ölçülen tüm değerlerin "y_i" rasgele ve normal olarak dağıldığını, yani normal dağıtım yasasına uyun.

"Y" nin "x" e doğrusal bağımlılığı durumunda, teorik bir bağımlılık yazabiliriz:
"y \u003d a + b x".

Geometrik bir bakış açısından, "b" katsayısı, doğrunun "x" eksenine olan eğim açısının tanjantını ve "a" katsayısını - doğrunun "y" ekseni ile kesişme noktasındaki değerini ("x \u003d 0" da) belirtir.

Regresyon doğrusunun parametrelerini bulma.

Deneyde, "y_i" nin ölçülen değerleri, gerçek hayatta her zaman var olan ölçüm hatalarından dolayı teorik düz çizgide tam olarak bulunamaz. Bu nedenle, doğrusal bir denklem bir denklem sistemi ile temsil edilmelidir:
`y_i \u003d a + b x_i + ε_i` (1),
burada "" i "," i ". deneyde" y "nin bilinmeyen ölçüm hatasıdır.

Bağımlılık (1) aynı zamanda gerilemeyani istatistiksel anlamlılık ile iki değerin birbirine bağımlılığı.

Bağımlılığı geri getirmenin görevi, deneysel noktalardan ["y_i", "x_i"] "a" ve "b" katsayılarını bulmaktır.

"A" ve "b" katsayılarını bulmak için genellikle kullanılır en küçük kareler yöntemi (OLS). Maksimum olabilirlik ilkesinin özel bir durumudur.

(1) 'i `ε_i \u003d y_i - a - b x_i` olarak yeniden yazalım.

Daha sonra hataların karelerinin toplamı
`Φ \u003d toplam_ (i \u003d 1) ^ (n) ε_i ^ 2 \u003d toplam_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2`. (2)

OLS'nin (en küçük kareler yöntemi) ilkesi, "a" ve "b" parametrelerine göre toplamı (2) en aza indirmektir..

Minimuma, (2) toplamının "a" ve "b" katsayılarına göre kısmi türevleri sıfıra eşit olduğunda ulaşılır:
`frac (kısmi Φ) (kısmi a) \u003d frac (kısmi toplam_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (kısmi a) \u003d 0`
`frac (kısmi Φ) (kısmi b) \u003d frac (kısmi toplam_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (kısmi b) \u003d 0`

Türevleri genişleterek, iki bilinmeyenli iki denklem sistemi elde ederiz:
`toplam_ (i \u003d 1) ^ (n) (2a + 2bx_i - 2y_i) \u003d toplam_ (i \u003d 1) ^ (n) (a + bx_i - y_i) \u003d 0`
`toplam_ (i \u003d 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) \u003d toplam_ (i \u003d 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) \u003d 0`

Parantezleri açıp toplamları aranan katsayılardan bağımsız olarak diğer yarısına aktarıyoruz, bir doğrusal denklem sistemi elde ediyoruz:
`toplam_ (i \u003d 1) ^ (n) y_i \u003d a n + b toplam_ (i \u003d 1) ^ (n) bx_i`
`toplam_ (i \u003d 1) ^ (n) x_iy_i \u003d bir toplam_ (i \u003d 1) ^ (n) x_i + b toplamı_ (i \u003d 1) ^ (n) x_i ^ 2`

Ortaya çıkan sistemi çözerek, "a" ve "b" katsayıları için formül buluyoruz:

`a \u003d frac (toplam_ (i \u003d 1) ^ (n) y_i toplamı_ (i \u003d 1) ^ (n) x_i ^ 2 - toplam_ (i \u003d 1) ^ (n) x_i toplam_ (i \u003d 1) ^ (n ) x_iy_i) (n toplam_ (i \u003d 1) ^ (n) x_i ^ 2 - (toplam_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.1)

`b \u003d frac (n toplam_ (i \u003d 1) ^ (n) x_iy_i - toplam_ (i \u003d 1) ^ (n) x_i toplam_ (i \u003d 1) ^ (n) y_i) (n toplam_ (i \u003d 1) ^ (n) x_i ^ 2 - (toplam_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.2)

Bu formüllerin, "n\u003e 1" (çizgi en az 2 nokta çizilebilir) ve determinant "D \u003d n toplam_ (i \u003d 1) ^ (n) x_i ^ 2 - (toplam_ (i \u003d 1) ^ (n) x_i) ^ 2! \u003d 0`, yani deneydeki "x_i" noktaları farklı olduğunda (yani, çizgi dikey olmadığında).

Regresyon çizgisinin katsayılarının hatalarının tahmini

"A" ve "b" katsayılarının hesaplanmasında hatanın daha doğru bir tahmini için çok sayıda deneysel nokta arzu edilir. "N \u003d 2" olduğunda, katsayıların hatasını tahmin etmek imkansızdır çünkü yaklaşan çizgi kesinlikle iki noktadan geçecektir.

Rastgele değişken "V" nin hatası belirlenir hata birikimi yasası
`S_V ^ 2 \u003d sum_ (i \u003d 1) ^ p (frac (kısmi f) (kısmi z_i)) ^ 2 S_ (z_i) ^ 2`,
burada "p", "S_V" hatasını etkileyen "S_ (z_i)" hatasına sahip z_i "parametrelerinin sayısıdır;
"f" - "V" nin "z_i" ye bağımlılık fonksiyonu.

"A" ve "b" katsayılarının hatası için hata birikimi yasasını yazalım.
`S_a ^ 2 \u003d toplam_ (i \u003d 1) ^ (n) (frac (kısmi a) (kısmi y_i)) ^ 2 S_ (y_i) ^ 2 + toplam_ (i \u003d 1) ^ (n) (frac (kısmi a ) (kısmi x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (kısmi a) (kısmi y_i)) ^ 2 `,
`S_b ^ 2 \u003d toplam_ (i \u003d 1) ^ (n) (frac (kısmi b) (kısmi y_i)) ^ 2 S_ (y_i) ^ 2 + toplam_ (i \u003d 1) ^ (n) (frac (kısmi b ) (kısmi x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (kısmi b) (kısmi y_i)) ^ 2 `,
dan beri `S_ (x_i) ^ 2 \u003d 0` (daha önce bir rezervasyon yaptık ki` x` hatası ihmal edilebilir).

"S_y ^ 2 \u003d S_ (y_i) ^ 2" - "y" ölçümündeki hata (varyans, standart sapmanın karesi), hatanın "y" nin tüm değerleri için tekdüze olduğunu varsayarsak.

Elde edilen ifadeler "a" ve "b" yi hesaplamak için formülleri değiştirerek şunu elde ederiz

`S_a ^ 2 \u003d S_y ^ 2 frac (toplam_ (i \u003d 1) ^ (n) (toplam_ (i \u003d 1) ^ (n) x_i ^ 2 - x_i toplam_ (i \u003d 1) ^ (n) x_i) ^ 2 ) (D ^ 2) \u003d S_y ^ 2 frac ((n toplam_ (i \u003d 1) ^ (n) x_i ^ 2 - (toplam_ (i \u003d 1) ^ (n) x_i) ^ 2) toplam_ (i \u003d 1) ^ (n) x_i ^ 2) (D ^ 2) \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) x_i ^ 2) (D) `(4.1)

`S_b ^ 2 \u003d S_y ^ 2 frac (toplam_ (i \u003d 1) ^ (n) (n x_i - toplam_ (i \u003d 1) ^ (n) x_i) ^ 2) (D ^ 2) \u003d S_y ^ 2 frac ( n (n toplam_ (i \u003d 1) ^ (n) x_i ^ 2 - (toplam_ (i \u003d 1) ^ (n) x_i) ^ 2)) (D ^ 2) \u003d S_y ^ 2 frac (n) (D) `(4.2)

Gerçek yaşam deneylerinin çoğunda "Sy" değeri ölçülmez. Bunu yapmak için, planın bir veya daha fazla noktasında birkaç paralel ölçüm (deney) yapmanız gerekir, bu da deneyin süresini (ve muhtemelen maliyetini) artırır. Bu nedenle, genellikle "y" nin regresyon çizgisinden sapmasının rasgele kabul edilebileceği varsayılır. Bu durumda "y" varyansının tahmini formülle hesaplanır.

`S_y ^ 2 \u003d S_ (y, kalan) ^ 2 \u003d frac (toplam_ (i \u003d 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)`.

Bölen "n-2", aynı deneysel veri örneği için iki katsayının hesaplanması nedeniyle serbestlik derecesi sayısını azalttığımız için ortaya çıkar.

Bu tahmin aynı zamanda "S_ (y, kalan) ^ 2" regresyon çizgisine göre artık varyans olarak da adlandırılır.

Katsayıların öneminin değerlendirilmesi Öğrenci kriterine göre yapılır.

`t_a \u003d frac (| a |) (S_a)`, `t_b \u003d frac (| b |) (S_b)`

Hesaplanan "t_a", "t_b" ölçütleri "t (P, n-2)" tablo ölçütlerinden daha küçükse, karşılık gelen katsayının belirli bir olasılıkla "P" ile sıfırdan önemli ölçüde farklı olmadığı kabul edilir.

Doğrusal bir ilişkinin tanımının kalitesini değerlendirmek için, Fisher testini kullanarak ortalamaya göre "S_ (y, kalan) ^ 2" ve "S_ (bar y)" karşılaştırabilirsiniz.

`S_ (bar y) \u003d frac (toplam_ (i \u003d 1) ^ n (y_i - bar y) ^ 2) (n-1) \u003d frac (toplam_ (i \u003d 1) ^ n (y_i - (toplam_ (i \u003d 1) ^ n y_i) / n) ^ 2) (n-1) `- ortalamaya göre 'y` varyansının örnek tahmini.

Regresyon denkleminin ilişkiyi tanımlamadaki etkinliğini değerlendirmek için Fisher katsayısı hesaplanır
`F \u003d S_ (bar y) / S_ (y, kalan) ^ 2`,
bu, Fisher katsayısı `` F (p, n-1, n-2) '' tablosu ile karşılaştırılır.

"F\u003e F (P, n-1, n-2)" ise, regresyon denklemini kullanan "y \u003d f (x)" bağımlılığının açıklaması ile ortalamayı kullanan açıklama arasındaki fark, "P" olasılığı ile istatistiksel olarak anlamlı kabul edilir. Şunlar. regresyon, ilişkiyi ortalamaya göre "y" nin yayılmasından daha iyi tanımlar.

Grafiğe tıklayın,
tabloya değerler eklemek için

En küçük kareler yöntemi. En küçük kareler yöntemi, bilinmeyen parametrelerin a, b, c, benimsenen fonksiyonel bağımlılığın belirlenmesi olarak anlaşılır.

En küçük kareler yöntemi, bilinmeyen parametrelerin belirlenmesi anlamına gelir a, b, c, ... kabul edilen işlevsel bağımlılık

y \u003d f (x, a, b, c, ...),

minimum ortalama kare (varyans) hatası sağlayacak

, (24)

burada x i, y i deneyden elde edilen bir sayı çiftleri kümesidir.

Birkaç değişkenli bir fonksiyonun uç koşulu, kısmi türevlerinin sıfıra eşit olması koşulu olduğundan, parametreler a, b, c, ...denklem sisteminden belirlenir:

; ; ; … (25)

Fonksiyondan sonra parametreleri seçmek için en küçük kareler yönteminin kullanıldığı unutulmamalıdır. y \u003d f (x) tanımlı.

Teorik değerlendirmelerden, ampirik formülün ne olması gerektiğine dair herhangi bir sonuca varmak imkansızsa, o zaman öncelikle gözlenen verilerin grafiksel bir gösterimi olmak üzere görsel temsillerle yönlendirilmelidir.

Uygulamada, çoğunlukla aşağıdaki işlev türleriyle sınırlıdırlar:

1) doğrusal ;

2) ikinci dereceden a.

{!LANG-a130d04c2f2b505c7f4d12e589b89d38!}{!LANG-eececfefcade4194353233c1afc164b5!}