Mnk para sa isang linear function. Hindi bababa sa mga parisukat na pamamaraan ng mga halimbawa ng paglutas ng problema. Pagtatantya gamit ang iba pang mga pagpapaandar

Pinakamababang paraan ng parisukat ay ginagamit upang tantyahin ang mga parameter ng equation ng pagbabalik.

Isa sa mga pamamaraan para sa pag-aaral ng mga stochastic na koneksyon sa pagitan ng mga tampok ay pagsusuri sa pag-urong.
Ang pag-aaral ng pag-urong ay ang paghango ng equation ng pagbabalik, sa tulong ng kung saan ang average na halaga ng isang random variable (tampok na resulta) ay matatagpuan, kung ang halaga ng isa pang (o iba pang) mga variable (tampok na salik) ay nalalaman. Kabilang dito ang mga sumusunod na hakbang:

  1. pagpili ng anyo ng komunikasyon (uri ng equation ng analitikal na pagbabalik ng pagkakasunod);
  2. pagtatantya ng mga parameter ng equation;
  3. pagtatasa ng kalidad ng equation ng analitikal na pagbabalik.
Kadalasan, ginagamit ang isang linear form upang ilarawan ang ugnayan ng istatistika ng mga tampok. Ang pansin sa linear na ugnayan ay ipinaliwanag ng isang malinaw na interpretasyon ng ekonomiya ng mga parameter nito, ang limitadong pagkakaiba-iba ng mga variable at ang katunayan na sa karamihan ng mga kaso ang mga hindi linya na paraan ng komunikasyon ay na-convert (sa pamamagitan ng logarithm o pagbabago ng mga variable) sa isang linear form upang maisagawa ang mga kalkulasyon.
Sa kaso ng isang linear na pares ng magkakaroon ng relasyon, ang equation ng pagbabalik ay magkakaroon ng form: y i \u003d a + b x i + u i. Ang mga parameter ng equation na ito a at b ay tinatayang mula sa data ng statistic na pagmamasid x at y. Ang resulta ng naturang pagtatasa ay ang equation :, kung saan, ang mga pagtatantya ng mga parameter a at b, ay ang halaga ng mabisang katangian (variable), na nakuha ng equation ng pagbabalik (kinakalkula na halaga).

Ang pinaka-madalas na ginagamit upang tantyahin ang mga parameter paraan ng hindi bababa sa mga parisukat (OLS).
Ang pinakamaliit na pamamaraan ng mga parisukat ay nagbibigay ng pinakamahusay (pare-pareho, mahusay at walang pinapanigan) na mga pagtatantya ng mga parameter ng equation ng pagbabalik. Ngunit kung natutugunan lamang ang ilang mga kinakailangan sa patungkol sa random na term (u) at ang independiyenteng variable (x) (tingnan ang OLS prerequisites).

Ang problema sa pagtantya ng mga parameter ng isang linear na ipinares na equation ng hindi bababa sa mga parisukat na pamamaraan binubuo sa mga sumusunod: upang makakuha ng naturang mga pagtatantya ng parameter, kung saan ang kabuuan ng mga parisukat ng mga paglihis ng mga aktwal na halaga ng mabisang tagapagpahiwatig - y i mula sa mga kinakalkula na halaga - ay minimal.
Pormal pamantayan ng OLS maaaring maisulat ng ganito: .

Pag-uuri ng hindi bababa sa mga pamamaraan ng mga parisukat

  1. Pinakamababang paraan ng parisukat.
  2. Pinakamataas na paraan ng posibilidad (para sa normal na klasikal na modelo ng linear regression, ang normalidad ng mga residual na regression ay nailarawan).
  3. Ang pangkalahatang hindi bababa sa mga parisukat na pamamaraan ng OLS ay ginagamit sa kaso ng autocorrelation ng mga error at sa kaso ng heteroscedasticity.
  4. Tinimbang na hindi bababa sa mga parisukat na pamamaraan (isang espesyal na kaso ng OLS na may mga heteroscedastic residual).

Ilarawan natin ang kakanyahan ang klasikal na hindi bababa sa mga parisukat na pamamaraan ng grapiko... Upang magawa ito, magtatayo kami ng isang tuldok na tuldok alinsunod sa data ng pagmamasid (x i, y i, i \u003d 1; n) sa isang hugis-parihaba na sistema ng coordinate (ang naturang tuldok na tuldok ay tinatawag na patlang ng ugnayan). Subukan nating hanapin ang isang tuwid na linya na pinakamalapit sa mga punto ng patlang ng ugnayan. Ayon sa pamamaraan ng hindi bababa sa mga parisukat, ang linya ay pinili upang ang kabuuan ng mga parisukat ng mga patayong distansya sa pagitan ng mga punto ng patlang ng ugnayan at ang linyang ito ay magiging minimal.

Talaang pang-matematika ng problemang ito: .
Alam namin ang mga halaga ng y i at x i \u003d 1 ... n, ang mga ito ay data ng pagmamasid. Sa pagpapaandar ng S, ang mga ito ay pare-pareho. Ang mga variable sa pagpapaandar na ito ay ang kinakailangang mga pagtatantya ng parameter -,. Upang hanapin ang minimum ng isang pagpapaandar ng dalawang variable, kinakailangan upang makalkula ang bahagyang derivatives ng pagpapaandar na ito para sa bawat isa sa mga parameter at ipantay ang mga ito sa zero, i. .
Bilang isang resulta, nakakakuha kami ng isang sistema ng 2 normal na mga linear equation:
Paglutas ng sistemang ito, nakita namin ang kinakailangang mga pagtatantya ng parameter:

Ang kawastuhan ng pagkalkula ng mga parameter ng equation ng pagbabalik ay maaaring masuri sa pamamagitan ng paghahambing ng mga kabuuan (maaaring may ilang pagkakaiba dahil sa pag-ikot ng mga kalkulasyon).
Upang makalkula ang mga pagtatantya ng parameter, maaari kang bumuo ng talahanayan 1.
Ang palatandaan ng coefficient ng regression b ay nagpapahiwatig ng direksyon ng relasyon (kung b\u003e 0, ang relasyon ay direkta, kung b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Pormal, ang halaga ng parameter a ay ang average na halaga ng y sa x katumbas ng zero. Kung ang kadahilanan ng katangian ay hindi at hindi maaaring magkaroon ng zero na halaga, kung gayon ang interpretasyon sa itaas ng parameter na a ay walang katuturan.

Pagsusuri sa higpit ng ugnayan sa pagitan ng mga palatandaan ay isinasagawa gamit ang coefficient ng linear na ugnayan ng pares - r x, y. Maaari itong kalkulahin gamit ang formula: ... Bilang karagdagan, ang linear na pares na coefficient ng ugnayan ay maaaring matukoy sa pamamagitan ng coefficient ng regression b: .
Ang saklaw ng mga tinatanggap na halaga ng linear coefficient ng ugnayan ng pares ay mula sa –1 hanggang +1. Ang pag-sign ng coefficient ng ugnayan ay nagpapahiwatig ng direksyon ng link. Kung r x, y\u003e 0, pagkatapos ay direkta ang koneksyon; kung r x, y<0, то связь обратная.
Kung ang koepisyent na ito ay malapit sa isa sa ganap na halaga, kung gayon ang ugnayan sa pagitan ng mga tampok ay maaaring ipakahulugan bilang isang malapit na guhit. Kung ang modulus nito ay katumbas ng isang ê r x, y ê \u003d 1, kung gayon ang koneksyon sa pagitan ng mga tampok ay functional linear. Kung ang mga tampok na x at y ay tuwid na nakapag-iisa, kung gayon ang r x, y ay malapit sa 0.
Upang makalkula ang r x, y, maaari mo ring gamitin ang talahanayan 1.

Upang masuri ang kalidad ng nakuha na equation ng pagbabalik, ang teoretikal na koepisyent ng pagpapasiya ay kinakalkula - R 2 yx:

,
kung saan ang d 2 ay ang pagkakaiba-iba y ipinaliwanag ng equation ng pag-urong;
e 2 - natitirang (hindi ipinaliwanag ng equation ng pag-urong) pagkakaiba-iba y;
s 2 y - kabuuang (kabuuang) pagkakaiba-iba ng y.
Ang koepisyent ng pagpapasiya ay naglalarawan sa proporsyon ng pagkakaiba-iba (pagkakaiba-iba) ng mabisang ugali y, na ipinaliwanag ng pagbabalik (at, dahil dito, ang kadahilanan x), sa kabuuang pagkakaiba-iba (pagkakaiba-iba) y. Ang koepisyent ng pagpapasiya R 2 yx ay kumukuha ng mga halaga mula 0 hanggang 1. Alinsunod dito, ang halagang 1-R 2 yx ay nagpapakilala sa proporsyon ng pagkakaiba-iba y na dulot ng impluwensya ng iba pang mga kadahilanan na hindi isinasaalang-alang ang mga error sa modelo at detalye.
Na may ipares na linear regression R 2 yx \u003d r 2 yx.

TRABAHO NG COURSE

Ang pinakakaunting mga parisukat ay gumagana sa paglapit


Panimula

empirical na matematika ng matematika

Ang layunin ng gawain sa kurso ay upang palalimin ang kaalaman sa agham ng computer, paunlarin at pagsamahin ang mga kasanayan sa pagtatrabaho sa isang spreadsheet processor na Microsoft Excel at MathCAD. Ang kanilang aplikasyon para sa paglutas ng mga problema gamit ang isang computer mula sa paksang lugar na nauugnay sa pananaliksik.

Sa bawat gawain, ang mga kundisyon ng problema, ang paunang data, ang form ng pag-isyu ng mga resulta ay formulated, ang pangunahing mga pag-asa sa matematika para sa paglutas ng problema ay ipinahiwatig. Pinapayagan ka ng pagkalkula ng pagkontrol na tiyakin na ang programa ay gumagana nang tama.

Ang konsepto ng approximation ay isang tinatayang pagpapahayag ng ilang mga bagay sa matematika (halimbawa, mga numero o pag-andar) sa pamamagitan ng iba pang mas simple, mas maginhawang gamitin, o mas kilala. Sa siyentipikong pagsasaliksik, ginagamit ang pamamaraang upang ilarawan, pag-aralan, gawing pangkalahatan at karagdagang paggamit ng mga empirical na resulta.

Tulad ng alam mo, maaaring mayroong isang eksaktong (pagganap) na ugnayan sa pagitan ng mga dami, kapag ang isang halaga ng argumento ay tumutugma sa isang tiyak na halaga, at isang hindi gaanong tumpak (ugnayan) na ugnayan, kapag ang isang tiyak na halaga ng argumento ay tumutugma sa isang tinatayang halaga o isang hanay ng mga halaga ng isang pagpapaandar na higit o mas malapit. sa isa't-isa. Kapag nagsasagawa ng pang-agham na pagsasaliksik, pagproseso ng mga resulta ng pagmamasid o eksperimento, karaniwang kailangang harapin ng isa ang pangalawang pagpipilian. Kapag pinag-aaralan ang dami ng mga pagpapakandili ng iba't ibang mga tagapagpahiwatig, ang mga halaga na kung saan ay natutukoy empirically, bilang isang panuntunan, mayroong ilang pagkakaiba-iba. Ito ay bahagyang itinakda ng heterogeneity ng mga pinag-aralan na bagay ng walang buhay at, lalo na, pamumuhay na kalikasan, bahagyang sanhi ng error sa pagmamasid at dami ng pagproseso ng mga materyales. Ang huling sangkap ay hindi laging posible na maibukod nang buo, maaari lamang itong mabawasan ng maingat na pagpili ng isang sapat na pamamaraan ng pagsasaliksik at kawastuhan ng trabaho.

Ang mga dalubhasa sa larangan ng awtomatiko ng mga teknolohikal na proseso at industriya ay nakikipag-usap sa isang malaking halaga ng pang-eksperimentong data, kung saan ginagamit ang isang computer upang magproseso. Ang paunang data at ang mga nakuhang resulta ng mga kalkulasyon ay maaaring ipakita sa form na tabular gamit ang mga prosesor ng spreadsheet (spreadsheet) at, lalo na, ang Excel. Pinapayagan ng kurso sa computer science ang mag-aaral na pagsamahin at paunlarin ang mga kasanayan sa trabaho gamit ang mga pangunahing teknolohiya ng computer kapag nalulutas ang mga problema sa larangan ng propesyonal na aktibidad. para sa pagtutulungan.


1. Pangkalahatang Impormasyon


Kadalasan, lalo na kapag pinag-aaralan ang data ng empirical, kinakailangan upang makita sa isang malinaw na form ang pagganap na ugnayan sa pagitan ng mga halaga x at sa, na nakuha bilang isang resulta ng mga sukat.

Sa isang mapag-aralan na pag-aaral ng ugnayan sa pagitan ng dalawang dami x at y, isang bilang ng mga obserbasyon ang ginawa at ang resulta ay isang talahanayan ng mga halaga:


xx1 x1 xakoXnyy1 y1 yakoYn

Ang talahanayan na ito ay karaniwang nakuha bilang isang resulta ng ilang mga eksperimento kung saan x, (independiyenteng halaga) ay ibinigay ng eksperimento, at y, ay nakuha bilang isang resulta ng karanasan. Samakatuwid, ang mga halagang ito y,tatawaging empirical o pang-eksperimentong halaga.

Mayroong isang ugnayan sa pagganap sa pagitan ng mga halaga ng x at y, ngunit ang analitikal na form na ito ay karaniwang hindi alam, kaya isang praktikal na mahalagang gawain ang lilitaw - upang makahanap ng isang empirical na pormula


y \u003df (x; a 1, a 2,…, Am ), (1)


(Kung saan a1 , a2 ,…, Am - mga parameter), ang mga halaga kung saan sa x \u003d x, marahil ay naiiba nang kaunti sa mga halagang pang-eksperimentong y, (i \u003d 1,2,…, p).

Karaniwan ay nagpapahiwatig ng isang klase ng mga pagpapaandar (halimbawa, isang hanay ng mga linear, exponential, exponential, atbp.) Kung saan napili ang pagpapaandar f (x), at pagkatapos ay natutukoy ang mga pinakamahusay na halaga ng mga parameter.

Kung sa empirical formula (1) pinapalitan namin ang paunang x, pagkatapos makuha natin ang mga halagang panteorya

YTako \u003d f (xako; a 1, a 2……am) kung saan ako \u003d 1,2,…, n.


Pagkakaiba-iba yakoT - saako, ay tinatawag na mga paglihis at kumakatawan sa mga patayong distansya mula sa mga puntos Mako sa graph ng empirical function.

Ayon sa pamamaraan ng hindi bababa sa mga parisukat, ang pinakamahusay na mga coefficients a1 , a2 ,…, Am ay ang mga kung saan ang kabuuan ng mga parisukat ng mga paglihis ng nahanap na empirical na pag-andar mula sa mga naibigay na halaga ng pag-andar



ay magiging minimal.

Ipaliwanag natin ang kahulugan ng geometriko ng pinakamaliit na pamamaraan ng mga parisukat.

Ang bawat pares ng mga numero ( xako, yako) mula sa pinagmulan ng talahanayan ay tumutukoy sa punto Mako sa ibabaw XOY. Paggamit ng formula (1) para sa iba't ibang mga halaga ng mga coefficients a1 , a2 ,…, Am ang isang serye ng mga curve ay maaaring mailagay, na mga graph ng pagpapaandar (1). Ang gawain ay upang matukoy ang mga coefficients a1 , a2 ,…, Amupang ang kabuuan ng mga parisukat ng mga patayong distansya mula sa mga puntos Mako (xako, yako) bago ang graph ng pagpapaandar (1) ay ang pinakamaliit (Larawan 1).



Ang pagtatayo ng isang empirical na formula ay binubuo ng dalawang yugto: pag-alam ang pangkalahatang anyo ng pormulang ito at pagtukoy ng mga pinakamahusay na parameter.

Kung ang likas na katangian ng ugnayan sa pagitan ng mga naibigay na halaga ng x at y, kung gayon ang uri ng empirical dependence ay arbitrary. Ibinibigay ang kagustuhan sa mga simpleng pormula na may mahusay na kawastuhan. Ang matagumpay na pagpili ng isang empirical formula na higit sa lahat ay nakasalalay sa kaalaman ng mananaliksik sa paksang lugar, gamit kung saan maaari niyang ipahiwatig ang klase ng mga pagpapaandar mula sa mga pagsasaalang-alang sa teoretikal. Sa labis na kahalagahan ay ang imahe ng nakuha na data sa Cartesian o sa mga espesyal na koordinasyong sistema (semi-logarithmic, logarithmic, atbp.). Sa pamamagitan ng posisyon ng mga puntos, maaaring mahulaan ng isa ang pangkalahatang anyo ng pagtitiwala sa pamamagitan ng pagtataguyod ng pagkakapareho sa pagitan ng naka-plot na grap at mga sample ng mga kilalang kurba.

Natutukoy ang pinakamahusay na mga posibilidad a1 , a2,…, am kasama sa empirical na pormula ay ginawa ng mga kilalang pamamaraang analytical.

Upang makahanap ng isang hanay ng mga coefficients a a1 , a2 ... ..Am, na nagbibigay ng minimum ng pagpapaandar na S na tinukoy ng pormula (2), ginagamit namin ang kinakailangang kondisyon para sa sukat ng isang pagpapaandar ng maraming mga variable - ang pagkakapantay-pantay sa zero ng mga bahagyang derivatives.

Bilang isang resulta, nakakakuha kami ng isang normal na system para sa pagtukoy ng mga coefficients aako (i \u003d 1,2,…, m):



Kaya, paghahanap ng mga coefficients aako binabawasan sa paglutas ng system (3). Ang sistemang ito ay pinadali kung ang empirical formula (1) ay linear na patungkol sa mga parameter aako, pagkatapos ang system (3) ay magiging linear.


1.1 Pag-asa sa Linear


Ang tiyak na anyo ng system (3) ay nakasalalay sa aling klase ng mga empirical na pormula na hinahanap namin ang pagtitiwala (1). Sa kaso ng linear dependence y \u003d a1 + a2 x kukuha ng form ang system (3):


Ang linyang sistema na ito ay maaaring malutas ng anumang kilalang pamamaraan (Gauss na pamamaraan, simpleng mga pag-ulit, mga formula ng Cramer).


1.2 Pag-asa sa quadratic


Sa kaso ng isang quadratic dependence y \u003d a1 + a2 x + a3x 2 kukuha ng form ang system (3):



1.3 Exponential dependence


Sa isang bilang ng mga kaso, bilang isang empirical na pormula, isang pag-andar ay kinuha kung saan ang mga hindi natukoy na mga koepisyent ay pumapasok nang hindi linya. Bukod dito, kung minsan ang problema ay maaaring maging linya, oo. bawasan sa linear. Kasama sa mga nasabing pagtitiwala ang exponential dependance


y \u003d a1 * ea2x (6)


kung saan a 1 at a 2, hindi natukoy na mga ratio.

Ang Linearization ay nakamit sa pamamagitan ng pagkuha ng logarithm ng pagkakapantay-pantay (6), pagkatapos na makuha namin ang ugnayan

ln y \u003d ln a 1 + a 2x (7)


Isinasaad namin ang ln sa at ln ax ayon sa pagkakasunod t at c, kung gayon ang pagsalig (6) ay maaaring maisulat bilang t \u003d a1 + a2 x, na nagpapahintulot sa amin na mag-apply ng mga formula (4) na may kapalit a1 sa c at saako sa tako


1.4 Mga elemento ng teorya ng ugnayan


Nabawi ang grapiko ng pag-andar sa paggana y (x) ayon sa mga resulta ng pagsukat (x ako, saako), i \u003d 1,2, K, n tinatawag na isang curve ng regression. Upang suriin ang kasunduan ng itinayo na curve ng regression na may mga pang-eksperimentong resulta, ang mga sumusunod na katangian na bilang ay karaniwang ipinakilala: ang coefficient ng korelasyon (linear dependence), ang ratio ng ugnayan, at ang koefisyen ng determinism. Sa kasong ito, ang mga resulta ay karaniwang nakapangkat at ipinakita sa anyo ng isang talahanayan ng ugnayan. Ang bawat cell ng talahanayan na ito ay naglalaman ng mga numero niJ - mga pares na iyon (x, y)na ang mga sangkap ay nahuhulog sa naaangkop na mga agwat ng pagpapangkat para sa bawat variable. Ipagpalagay ang haba ng mga agwat ng pagpapangkat (para sa bawat variable) na pantay sa bawat isa, ang mga sentro x ako (ayon sa pagkakabanggit saako) ng mga agwat na ito at ang bilang niJ- bilang batayan para sa mga kalkulasyon.

Ang coefficient ng ugnayan ay isang sukatan ng tuwid na ugnayan sa pagitan ng mga umaasang random na variable: ipinapakita nito kung gaano kahusay, sa average, ang isa sa mga variable ay maaaring kinatawan bilang isang linear na pagpapaandar ng iba pa.

Ang koepisyent ng ugnayan ay kinakalkula gamit ang formula:


kung saan, at ang ibig sabihin ng arithmetic, ayon sa pagkakabanggit x at sa.

Ang koepisyent ng ugnayan sa pagitan ng mga random na variable sa ganap na halaga ay hindi hihigit sa 1. Ang mas malapit | p | sa 1, mas malapit ang guhit na ugnayan sa pagitan ng x at sa

Sa kaso ng isang hindi linya na ugnayan, ang mga kondisyonal na halaga ng halaga ay matatagpuan malapit sa linya ng kurba. Sa kasong ito, inirerekumenda na gamitin ang ratio ng ugnayan bilang isang katangian ng lakas ng bono, ang interpretasyon na kung saan ay hindi nakasalalay sa uri ng pinag-aralan na pagpapakandili.

Ang ratio ng ugnayan ay kinakalkula ng formula:



kung saan nako = , nf \u003d, at ang numerator ay naglalarawan sa pagpapakalat ng mga kondisyonal na paraan y, malapit sa unconditional average y.

Palagi Pagkakapantay-pantay = 0 ay tumutugma sa hindi pinagsamang mga random na halaga; = 1 kung at lamang kung mayroong isang eksaktong koneksyon sa pagganap sa pagitan y at x. Sa kaso ng linear dependence y ng x, ang ratio ng ugnayan ay tumutugma sa parisukat ng coefficient ng ugnayan. Ang dami - ? Ang 2 ay ginagamit bilang isang tagapagpahiwatig ng paglihis mula sa linear regression.

Ang ratio ng ugnayan ay isang sukatan ng ugnayan y mula sa x sa anumang anyo, ngunit hindi maaaring magbigay ng isang ideya ng antas ng pagiging malapit ng empirical data sa isang espesyal na form. Upang malaman kung gaano katumpakan ang naka-plot na curve na sumasalamin sa empirical data, isa pang katangian ang ipinakilala - ang koepisyent ng determinism.

Upang ilarawan ito, isaalang-alang ang mga sumusunod na dami. ay ang kabuuang kabuuan ng mga parisukat, kung saan ang ibig sabihin.

Maaaring patunayan ng isa ang sumusunod na pagkakapantay-pantay

Ang unang termino ay katumbas ng Sres \u003d at tinatawag na natitirang kabuuan ng mga parisukat. Nailalarawan nito ang paglihis ng pang-eksperimentong mula sa teoretikal.

Ang pangalawang termino ay katumbas ng Sregr \u003d 2 at tinawag itong regression sum ng mga parisukat at kinikilala nito ang pagkalat ng data.

Malinaw na, ang sumusunod na pagkakapantay-pantay S puno \u003d S ost + S regr.

Ang koepisyent ng determinism ay natutukoy ng formula:



Mas maliit ang natitirang kabuuan ng mga parisukat kumpara sa kabuuang bilang ng mga parisukat, mas malaki ang halaga ng koepisyent ng determinism r2 , na nagpapakita kung gaano kahusay na ipinapaliwanag ng equation ng pagbabalik ang mga ugnayan sa pagitan ng mga variable. Kung ito ay katumbas ng 1, pagkatapos ay mayroong isang kumpletong ugnayan sa modelo, ibig sabihin walang pagkakaiba sa pagitan ng aktwal at tinatayang y-halaga. Kung hindi man, kung ang koepisyent ng determinism ay 0, pagkatapos ay nabigo ang equation ng pagbabalik na mahulaan ang mga halaga ng y

Ang koepisyent ng determinism ay hindi palaging lumampas sa ratio ng ugnayan. Sa kaso kung kailan ang pagkakapantay-pantay r2 \u003d kung gayon maisaalang-alang na ang binuong empirical formula na pinaka tumpak na sumasalamin sa empirical data.


2. Paglalahad ng problema


1. Gamit ang pamamaraan ng hindi bababa sa mga parisukat, ang pagpapaandar na ibinigay sa talahanayan, tinatayang

a) isang polynomial ng unang degree;

b) isang polynomial ng pangalawang degree;

c) exponential dependence.

Kalkulahin ang koepisyent ng determinism para sa bawat pagpapakandili.

Kalkulahin ang coefficient ng ugnayan (kung sakali a).

Gumuhit ng isang linya ng trend para sa bawat pagpapakandili.

Gamit ang LINEST function, kalkulahin ang mga numerong katangian ng pagtitiwala sa.

Ihambing ang iyong mga kalkulasyon sa mga resulta na nakuha gamit ang LINEST.

Gumawa ng isang konklusyon alin sa mga nakuha na mga formula ang pinakamahusay na tinatayang ang pagpapaandar.

Sumulat ng isang programa sa isa sa mga wika ng programa at ihambing ang mga resulta sa pagbibilang sa mga nakuha sa itaas.


3. Paunang datos


Ang pagpapaandar ay tinukoy sa Larawan 1.



4. Pagkalkula ng mga pagtatantya sa isang spreadsheet processor na Excel


Para sa mga kalkulasyon, ipinapayong gumamit ng isang spreadsheet ng Microsoft Excel. At ayusin ang data tulad ng ipinakita sa Larawan 2.



Upang magawa ito, ipasok ang:

· sa mga cell A6: A30 ipinasok namin ang mga halagang xi .

· sa mga cell B6: B30 ipinasok namin ang mga halaga ng уi .

· sa cell C6 ipinasok namin ang formula \u003d A6 ^ 2.

· sa mga cell C7: C30 ang formula na ito ay nakopya.

· sa cell D6, ipasok ang formula \u003d A6 * B6.

· sa mga cell D7: D30 ang formula na ito ay nakopya.

· sa cell F6, ipasok ang formula \u003d A6 ^ 4.

· sa mga cell F7: F30 ang formula na ito ay nakopya.

· sa cell G6, ipasok ang formula \u003d A6 ^ 2 * B6.

· ang formula na ito ay nakopya sa mga cell G7: G30.

· sa cell H6, ipasok ang formula \u003d LN (B6).

· ang formula na ito ay nakopya sa mga cell H7: H30.

· sa cell I6, ipasok ang pormula \u003d A6 * LN (B6).

· sa mga cell I7: I30 ang formula na ito ay nakopya. Ginagawa namin ang mga susunod na hakbang gamit ang autosum.

· sa cell A33, ipasok ang formula \u003d SUM (A6: A30).

· sa cell B33, ipasok ang formula \u003d SUM (B6: B30).

· sa cell C33, ipasok ang formula \u003d SUM (C6: C30).

· sa cell D33, ipasok ang formula \u003d SUM (D6: D30).

· sa cell E33, ipasok ang formula \u003d SUM (E6: E30).

· sa cell F33, ipasok ang formula \u003d SUM (F6: F30).

· sa cell G33, ipasok ang formula \u003d SUM (G6: G30).

· sa cell H33, ipasok ang formula \u003d SUM (H6: H30).

· sa cell I33, ipasok ang formula \u003d SUM (I6: I30).

Tinatantiya namin ang pagpapaandar y \u003d f (x) linear function y \u003d a1 + a2x. Upang matukoy ang mga koepisyent a 1 at a 2 gumagamit kami ng system (4). Gamit ang kabuuang kabuuan ng Talahanayan 2 na matatagpuan sa mga cell A33, B33, C33 at D33, nagsusulat kami ng system (4) sa form



paglutas ng alin, nakakakuha tayo ng 1 \u003d -24.7164 at a2 = 11,63183

Samakatuwid, ang linear approximation ay may form y \u003d -24.7164 + 11.63183x (12)

Ang sistema (11) ay nalutas gamit ang mga tool ng Microsoft Excel. Ang mga resulta ay ipinapakita sa Larawan 3:



Ang talahanayan sa mga cell A38: Ang B39 ay naglalaman ng pormula (\u003d MOBR (A35: B36)). Ang mga cell E38: naglalaman ang E39 ng pormula (\u003d MULTIPLE (A38: B39, C35: C36)).


Susunod, tinatantiya namin ang pagpapaandar y \u003d f (x) pagpapaandar ng quadratic y \u003d a1 + a2 x + a3 x2... Upang matukoy ang mga koepisyent a 1, a 2 at a 3 gumagamit kami ng system (5). Gamit ang mga kabuuan ng Talahanayan 2, na matatagpuan sa mga cell A33, B33, C33, D33, E33, F33 at G33, nagsusulat kami ng system (5) tulad ng sumusunod:



Nalutas ang alin, nakakakuha kami ng 1 \u003d 1.580946, a 2 \u003d -0.60819 at a3 = 0,954171 (14)

Kaya, ang quadratic approximation ay:

y \u003d 1.580946 -0.60819x + 0.954171 x2

Ang sistema (13) ay nalutas gamit ang mga tool ng Microsoft Excel. Ang mga resulta ay ipinapakita sa Larawan 4.



Ang talahanayan sa mga cell A46: C48 naglalaman ng pormula (\u003d MOBR (A41: C43)). Ang mga Cell F46: naglalaman ang F48 ng pormula (\u003d MULTIPLE (A41: C43, D46: D48)).

Ngayon tinatantiya namin ang pagpapaandar y \u003d f (x) exponential function y \u003d a1 ea2x. Upang matukoy ang mga coefficients a1 at a2 logarithm ang mga halaga yako at ginagamit ang mga kabuuan ng talahanayan 2 na matatagpuan sa mga cell A26, C26, H26 at I26, nakukuha natin ang system:



kung saan c \u003d ln (a1 ).

Ang paglutas ng system (10), nakita namin c \u003d 0.506435, a2 = 0.409819.

Pagkatapos ng potentiation, nakakakuha kami ng a1 = 1,659365.

Kaya, ang exponential approximation ay mayroong form y \u003d 1.659365 * e0.4098194x

Ang sistema (15) ay nalutas gamit ang mga tool ng Microsoft Excel. Ang mga resulta ay ipinapakita sa Larawan 5.


Ang talahanayan sa mga cell A55: B56 naglalaman ng pormula (\u003d MOBR (A51: B52)). Ang mga cell E54: E56 ay naglalaman ng pormula (\u003d MULTIPLE (A51: B52, C51: C52)). Naglalaman ang cell E56 ng formula \u003d EXP (E54).

Kinakalkula namin ang ibig sabihin ng arithmetic ng x at y ng mga formula:



Ang mga resulta ng pagkalkula ng x at y Ang mga tool ng Microsoft Excel ay ipinapakita sa Larawan 6.



Naglalaman ang cell B58 ng formula \u003d A33 / 25. Naglalaman ang cell B59 ng pormula \u003d B33 / 25.

talahanayan 2


Ipaliwanag natin kung paano naipon ang talahanayan sa Larawan 7.

Ang mga cell A6: A33 at B6: B33 ay napunan na (tingnan ang Larawan 2).

· sa cell J6, ipasok ang formula \u003d (A6- $ B $ 58) * (B6- $ B $ 59).

· ang formula na ito ay nakopya sa mga cell J7: J30.

· sa cell K6 ipinasok namin ang formula \u003d (A6- $ B $ 58) ^ 2.

· sa mga cell K7: K30 ang formula na ito ay nakopya.

· sa cell L6, ipasok ang formula \u003d (B1- $ B $ 59) ^ 2.

· ang formula na ito ay nakopya sa mga cell L7: L30.

· sa cell M6, ipasok ang pormula \u003d ($ E $ 38 + $ E $ 39 * A6-B6) ^ 2.

· ang formula na ito ay nakopya sa mga cell M7: M30.

· sa cell N6, ipasok ang formula \u003d ($ F $ 46 + $ F $ 47 * A6 + $ F $ 48 * A6 A6-B6) ^ 2.

· sa mga cell N7: N30 ang formula na ito ay nakopya.

· sa cell O6, ipasok ang formula \u003d ($ E $ 56 * EXP ($ E $ 55 * A6) - B6) ^ 2.

· sa mga cell O7: O30 ang formula na ito ay nakopya.

Ang mga susunod na hakbang ay tapos na gamit ang auto-sumation.

· sa cell J33, ipasok ang pormula \u003d CYMM (J6: J30).

· sa cell K33, ipasok ang formula \u003d SUM (K6: K30).

· sa cell L33, ipasok ang formula \u003d CYMM (L6: L30).

· sa cell M33, ipasok ang formula \u003d SUM (M6: M30).

· sa cell N33, ipasok ang formula \u003d SUM (N6: N30).

· sa cell O33, ipasok ang formula \u003d SUM (06: 030).

Ngayon ay kalkulahin natin ang coefficient ng ugnayan na gumagamit ng formula (8) (para lamang sa linear approximation) at ang coefficient ng determinism na gumagamit ng formula (10). Ang mga resulta ng mga kalkulasyon gamit ang mga tool ng Microsoft Excel ay ipinakita sa Larawan 7.



Sa talahanayan 8, naglalaman ang cell B61 ng pormula \u003d J33 / (K33 * L33 ^ (1/2). Ang Cell B62 ay naglalaman ng pormula \u003d 1 - M33 / L33. Ang Cell B63 ay naglalaman ng pormula \u003d 1 - N33 / L33. Naglalaman ang Cell B64 pormula \u003d 1 - O33 / L33.

Ang pagtatasa ng mga resulta ng pagkalkula ay nagpapakita na ang quadratic approximation na pinakamahusay na naglalarawan sa pang-eksperimentong data.


4.1 Mga graph ng paglalagay ng plano sa Excel


Piliin ang mga cell A1: A25, pagkatapos ay buksan ang tsart wizard. Pumili tayo ng isang nakakalat na balangkas. Matapos maitayo ang diagram, mag-right click sa linya ng grap at piliin upang magdagdag ng isang linya ng trend (linear, exponential, exponential, at polynomial ng pangalawang degree, ayon sa pagkakabanggit).

Linear Fit Plot


Quadratic Fit Plot


Exponential fit plot.


5. Pag-aplay ng pagpapaandar gamit ang MathCAD


Ang pagtatantya ng data na isinasaalang-alang ang kanilang mga statistic na parameter ay tumutukoy sa mga problema sa pagbabalik. Karaniwan silang lumitaw sa pagproseso ng pang-eksperimentong data na nakuha bilang isang resulta ng mga sukat ng mga proseso o pisikal na phenomena na likas sa istatistika (tulad ng mga sukat sa radiometry at mga geopisiko nukleyar), o sa isang mataas na antas ng pagkagambala (ingay). Ang gawain ng pagsusuri sa pag-urong ay upang pumili ng mga formula sa matematika na pinakamahusay na naglalarawan sa pang-eksperimentong data.


.1 Linear Regression


Ang Linear regression sa sistema ng Mathcad ay ginaganap sa mga vector ng pagtatalo X at binibilang Y pagpapaandar:

maharang (x, y) - kinakalkula ang parameter at1 , patayong pag-aalis ng linya ng pagbabalik (tingnan ang fig.)

slope (x, y) - kinakalkula ang parameter a2 , slope ng linya ng pagbabalik (tingnan ang fig.)

y (x) \u003d a1 + a2 * x


Pag-andar corr (y, y (x)) kinakalkula Coefficient ng ugnayan ni Pearson. Ang lapit nito 1, mas tumpak ang naprosesong data na tumutugma sa linear na relasyon (tingnan ang Larawan.)

.2 Polynomial Regression


Ang isang-dimensional na polynomial regression na may isang di-makatwirang degree n ng polynomial at may di-makatwirang mga coordinate ng mga sample sa Mathcad ay ginaganap ng mga pag-andar:

pag-urong (x, y, n) - kinakalkula ang isang vector S, na kasama ang mga coefficients aipolynomial n-th degree;

Mga halaga ng koepisyent ai maaaring makuha mula sa vector S pagpapaandar submatrix (S, 3, haba (S) - 1, 0, 0).

Ginagamit namin ang nakuha na mga halaga ng mga coefficients sa equation ng pagbabalik


y (x) \u003d a1 + a2 * x + a3 * x2 (tingnan ang fig.)

.3 Non-linear regression


Para sa simpleng tipikal na mga formula ng approximation, isang bilang ng mga nonlinear na pagbabalik na pag-andar ang ibinibigay, kung saan ang mga parameter ng mga pagpapaandar ay napili ng programang Mathcad.

Kasama rito ang pagpapaandar expfit (x, y, s), na nagbabalik ng isang vector na naglalaman ng mga coefficients a1, a2at a3 exponential function

y (x) \u003d a1 ^ exp (a2x) + a3. Sa vector S ang mga paunang halaga ng mga coefficients ay ipinakilala a1, a2at a3 unang pagtatantya.


Konklusyon


Ipinapakita ng pagsusuri ng mga resulta ng pagkalkula na ang linear approximation na pinakamahusay na naglalarawan sa pang-eksperimentong data.

Ang mga resulta na nakuha gamit ang programa ng MathCAD ganap na nag-tutugma sa mga halagang nakuha gamit ang Excel. Ipinapahiwatig nito ang kawastuhan ng mga kalkulasyon.


Bibliograpiya

  1. Mga Impormasyon: Aklat / Ed. prof N.V. Makarova. Moscow: Pananalapi at Istatistika 2007
  2. Informatics: Workshop sa teknolohiya ng pagtatrabaho sa isang computer / Under. Ed. prof N.V. Makarova. M Pananalapi at Istatistika, 2011.
  3. N.S. Piskunov. Pagkakaiba at integral na calculus, 2010.
  4. Informatics, Approximation ng pamamaraan ng hindi bababa sa mga parisukat, mga alituntunin, St. Petersburg, 2009.
Pagtuturo

Kailangan mo ng tulong sa pagtuklas ng isang paksa?

Papayuhan o ibibigay ng aming mga dalubhasa ang mga serbisyo sa pagtuturo sa mga paksang nais mo.
Magpadala ng isang kahilingan na may pahiwatig ng paksa ngayon upang malaman ang tungkol sa posibilidad ng pagkuha ng isang konsulta.

Pinakamababang paraan ng parisukat

Sa huling aralin ng paksa, makikilala natin ang pinakatanyag na application FNP, na nakakahanap ng pinakamalawak na aplikasyon sa iba't ibang larangan ng agham at kasanayan. Maaari itong maging pisika, kimika, biolohiya, ekonomiya, sosyolohiya, sikolohiya, at iba pa, at iba pa. Sa kagustuhan ng kapalaran, madalas kong makitungo sa ekonomiya, at samakatuwid ngayon bibigyan kita ng isang tiket sa isang kamangha-manghang bansa na tinatawag na Mga Econometric \u003d) ... Paano mo ito ayaw?! Napakabuti doon - kailangan mo lamang na magpasya! ... Ngunit ang malamang na nais mong malaman ay kung paano malutas ang mga problema hindi bababa sa pamamaraan ng mga parisukat... At lalo na ang masigasig na mga mambabasa ay matututunan kung paano malutas ang mga ito hindi lamang tumpak, ngunit napakabilis din ;-) Ngunit una pangkalahatang pahayag ng problema + nauugnay na halimbawa:

Hayaan sa ilang mga paksang lugar ang mga tagapagpahiwatig ay sinisiyasat na mayroong isang dami ng pagpapahayag. Sa parehong oras, mayroong bawat dahilan upang maniwala na ang tagapagpahiwatig ay nakasalalay sa tagapagpahiwatig. Ang palagay na ito ay maaaring kapwa isang pang-agham na teorya at batay sa batayang sentido ng elementarya. Ang pag-iwan sa agham, gayunpaman, at paggalugad ng mas maraming mga lugar na nakaka-bibig - lalo na ang mga grocery store. Tukuyin natin sa pamamagitan ng:

- tingiang puwang ng isang grocery store, sq.m.,
- taunang paglilipat ng tungkulin sa tindahan, milyong rubles.

Ito ay ganap na malinaw na kung mas malaki ang lugar ng tindahan, mas maraming paglilipat ng tungkulin sa karamihan ng mga kaso.

Ipagpalagay na pagkatapos ng pagsasagawa ng mga obserbasyon / eksperimento / kalkulasyon / sayaw gamit ang isang tamborin, mayroon kaming data na bilang na magagamit namin:

Sa mga grocery store, sa palagay ko malinaw ang lahat: - ito ang lugar ng ika-1 na tindahan, - taunang paglilipat nito, - ang lugar ng ika-2 tindahan, - taunang paglilipat ng tungkulin, atbp Sa pamamagitan ng paraan, hindi kinakailangan na magkaroon ng pag-access sa mga classified na materyales - isang tumpak na pagtatantya ng paglilipat ng tungkulin ay maaaring makuha sa pamamagitan ng paraan istatistika ng matematika... Gayunpaman, huwag tayong makagambala, ang kurso ng komersyal na paniniktik - nabayaran na ito \u003d)

Ang data ng tabular ay maaari ding isulat sa anyo ng mga puntos at inilalarawan sa dati para sa amin sistema ng Cartesian .

Sagutin natin ang isang mahalagang tanong: gaano karaming mga puntos ang kinakailangan para sa isang husay na pag-aaral?

Ang mas malaki, mas mabuti. Ang minimum na pinapayagan na hanay ay binubuo ng 5-6 na puntos. Bilang karagdagan, na may isang maliit na halaga ng data, ang sample ay hindi maaaring isama ang mga "anomalya" na mga resulta. Kaya, halimbawa, ang isang maliit na elite store ay maaaring makatulong sa pamamagitan ng mga order ng lakas na higit na "mga kasamahan nito", sa gayong paraan pagbaluktot ng pangkalahatang pattern na kailangang matagpuan!



Medyo simple, kailangan naming pumili ng isang pagpapaandar iskedyul na pumasa sa malapit na maaari sa mga puntos ... Ang pagpapaandar na ito ay tinawag tinatayang (approximation - approximation) o pagpapaandar ng teoretikal ... Sa pangkalahatan, isang malinaw na "kandidato" ang agad na lilitaw dito - isang mataas na degree na polynomial na ang graph ay dumadaan sa LAHAT ng mga puntos. Ngunit ang pagpipiliang ito ay mahirap, at madalas na simpleng mali. (dahil ang tsart ay palaging "iikot" at hindi masasalamin ang pangunahing trend).

Kaya, ang hinahangad na pag-andar ay dapat na sapat na simple at sa parehong oras ay nagpapakita ng sapat na pagtitiwala. Tulad ng maaari mong hulaan, ang isa sa mga pamamaraan para sa paghahanap ng gayong mga pagpapaandar ay tinawag hindi bababa sa pamamaraan ng mga parisukat... Una, tingnan natin ang kakanyahan nito sa pangkalahatang mga termino. Hayaan ang ilang pagpapaandar na tantyahin ang pang-eksperimentong data:


Paano susuriin ang kawastuhan ng approximation na ito? Kalkulahin natin ang mga pagkakaiba (deviations) sa pagitan ng mga pang-eksperimentong at halaga ng pagganap (pinag-aaralan ang pagguhit)... Ang unang kaisipang pumapasok sa isipan ay upang tantyahin kung gaano kalaki ang halaga, ngunit ang problema ay ang mga pagkakaiba ay maaaring maging negatibo. (hal. ) at ang mga paglihis bilang isang resulta ng naturang pagbubuod ay magkakansela sa bawat isa. Samakatuwid, bilang isang pagtatantiya ng kawastuhan ng pagtatantya, humihiling ito na tanggapin ang kabuuan mga modyul paglihis:

o gumuho: (biglang sino ang hindi nakakaalam: Ang sum icon ba, at - variable ng auxiliary - "counter", na kumukuha ng mga halaga mula 1 hanggang ) .

Tinatantiya ang mga pang-eksperimentong puntos na may iba't ibang mga pag-andar, makakakuha kami ng iba't ibang mga halaga, at halata kung saan mas mababa ang kabuuan na ito - mas tumpak ang pagpapaandar na iyon.

Ang nasabing pamamaraan ay umiiral at ito ay tinatawag hindi bababa sa pamamaraan ng modulus... Gayunpaman, sa pagsasagawa, naging mas malawak ito. hindi bababa sa parisukat na pamamaraan, kung saan ang mga posibleng negatibong halaga ay tinanggal hindi ng modulus, ngunit sa pamamagitan ng pag-square ng mga deviations:



, pagkatapos kung saan ang mga pagsisikap ay nakadirekta sa pagpili ng naturang pag-andar upang ang kabuuan ng mga parisukat ng mga paglihis ay kasing liit hangga't maaari. Sa totoo lang, kaya ang pangalan ng pamamaraan.

At ngayon bumalik kami sa isa pang mahalagang punto: tulad ng nabanggit sa itaas, ang napiling pag-andar ay dapat na medyo simple - ngunit marami rin ang mga naturang pag-andar: guhit-guhit , hyperbolic , exponential , logarithmic , quadratic atbp. At, syempre, narito agad kong nais na "bawasan ang larangan ng aktibidad." Aling uri ng mga pagpapaandar ang pipiliin para sa pagsasaliksik? Isang primitive ngunit mabisang trick:

- Ang pinakamadaling paraan upang gumuhit ng mga puntos sa pagguhit at pag-aralan ang kanilang lokasyon. Kung may posibilidad silang maging sa isang tuwid na linya, dapat mong hanapin equation ng tuwid na linya na may pinakamainam na halaga at. Sa madaling salita, ang gawain ay upang makahanap ng mga ganitong mga koepisyent - upang ang kabuuan ng mga parisukat ng mga paglihis ay ang pinakamaliit.

Kung ang mga puntos ay matatagpuan, halimbawa, kasama hyperbole, kung gayon malinaw na malinaw na ang linear na pagpapaandar ay magbibigay ng isang masamang paglalapit. Sa kasong ito, naghahanap kami ng pinaka-kanais-nais na mga koepisyent para sa equation ng hyperbola - ang mga nagbibigay ng pinakamaliit na kabuuan ng mga parisukat .

Ngayon tandaan na sa parehong mga kaso pinag-uusapan natin mga pag-andar ng dalawang variablena ang mga argumento ay mga parameter ng nais na mga dependency:

At sa kakanyahan kailangan nating malutas ang isang karaniwang problema - upang makahanap minimum na pag-andar ng dalawang variable.

Tandaan natin ang ating halimbawa: ipagpalagay na ang mga "shop" point ay may posibilidad na matatagpuan sa isang tuwid na linya at mayroong bawat dahilan upang maniwala na linear na ugnayan paglilipat ng tungkulin mula sa puwang sa tingi. Humanap tayo ng mga GANAP na koepisyent na "a" at "bs" upang ang kabuuan ng mga parisukat ng mga paglihis ay ang pinakamaliit. Lahat ay tulad ng dati - una 1st order bahagyang derivatives... Ayon kay panuntunan sa linearity maaari mong makilala nang direkta sa ilalim ng icon ng halaga:

Kung nais mong gamitin ang impormasyong ito para sa isang sanaysay o libro ng kurso, labis akong magpapasalamat sa link sa listahan ng mga mapagkukunan, mahahanap mo ang detalyadong mga kalkulasyon sa ilang mga lugar:

Bumuo tayo ng isang karaniwang sistema:

Binabawasan namin ang bawat equation ng "dalawa" at, bilang karagdagan, "paghiwalayin" ang mga kabuuan:

Tandaan : Pag-aralan ang iyong sarili kung bakit maaaring makuha ang "a" at "bie" para sa sum icon. Sa pamamagitan ng paraan, pormal na magagawa ito sa kabuuan

Isulat muli ang system sa isang "inilapat" na form:

pagkatapos nito ay nagsisimula nang iguhit ang algorithm para sa paglutas ng aming problema:

Alam ba natin ang mga coordinate ng mga puntos? Alam namin. Mga halaga maaari ba nating hanapin? Madali Ang pagbubuo ng pinakasimpleng system ng dalawang linear equation sa dalawang hindi alam("A" at "bh"). Nalulutas namin ang system, halimbawa, paraan ng Cramer, bilang isang resulta kung saan nakakakuha kami ng isang nakatigil na punto. Pagsisiyasat sapat na kondisyon para sa sukdulan, maaari nating tiyakin na sa puntong ito ang pagpapaandar eksaktong umabot minimum... Ang pag-verify ay nauugnay sa mga karagdagang pagkalkula at samakatuwid ay iiwan namin ito sa likod ng mga eksena. (kung kinakailangan, maaaring matingnan ang nawawalang framedito ) ... Ginagawa namin ang pangwakas na konklusyon:

Pag-andar ang pinakamahusay na paraan (hindi bababa sa kung ihahambing sa anumang iba pang mga linear function) inilalapit ang mga pang-eksperimentong puntos ... Mahirap na pagsasalita, ang grap nito ay tumatakbo hangga't maaari sa mga puntong ito. Sa tradisyon econometricang nagresultang approximating function ay tinatawag ding ipinares na equation ng linear regression .

Ang problemang isinasaalang-alang ay may malaking praktikal na kahalagahan. Sa sitwasyon sa aming halimbawa, ang equation ay nagbibigay-daan sa iyo upang hulaan kung anong paglilipat ng tungkulin ("Laro") ay sa tindahan na may isa o ibang halaga ng puwang sa tingi (ito o ang halagang "x")... Oo, ang tinatayang nakuha ay magiging isang pagtataya lamang, ngunit sa maraming mga kaso ito ay magiging tumpak.

Susuriin ko lamang ang isang problema sa mga "totoong" numero, dahil walang mga paghihirap dito - lahat ng mga kalkulasyon ay nasa antas ng 7-8 na antas ng kurikulum sa paaralan. Sa 95 porsyento ng mga kaso, hihilingin sa iyo na makahanap lamang ng isang linear function, ngunit sa pinakadulo ng artikulo ay ipapakita ko na hindi talaga mahirap hanapin ang mga equation ng pinakamainam na hyperbola, exponent at ilang iba pang mga pagpapaandar.

Sa katunayan, nananatili itong ibigay ang mga ipinangakong buns - upang malaman mo kung paano malutas ang mga nasabing halimbawa hindi lamang tumpak, ngunit mabilis din. Maingat naming pinag-aaralan ang pamantayan:

Isang gawain

Bilang resulta ng pag-aaral ng ugnayan sa pagitan ng dalawang tagapagpahiwatig, ang mga sumusunod na pares ng mga numero ay nakuha:

Gamit ang pinakamaliit na pamamaraan ng mga parisukat, hanapin ang linear na pagpapaandar na pinakamahusay na humigit-kumulang sa empirical (may karanasan) data Gumawa ng isang guhit kung saan, sa isang Cartesian hugis-parihaba na coordinate system, balangkas ng mga pang-eksperimentong puntos at isang grap ng tinatayang pagpapaandar ... Hanapin ang kabuuan ng mga parisukat na paglihis sa pagitan ng mga halaga ng empiriko at panteorya. Alamin kung ang pagpapaandar ay magiging mas mahusay (mula sa pananaw ng paraan ng hindi bababa sa mga parisukat) ilapit ang mga pang-eksperimentong puntos.

Tandaan na ang mga halagang "x" ay natural, at mayroon itong isang katangian na makabuluhang kahulugan, na pag-uusapan ko nang kaunti sa paglaon; ngunit sila, syempre, ay maaaring maging praksyonal. Bilang karagdagan, nakasalalay sa nilalaman ng isang partikular na problema, ang parehong "x" at "laro" na mga halaga ay maaaring maging ganap o bahagyang negatibo. Sa gayon, mayroon kaming isang "walang mukha" na gawain, at sinisimulan namin ito desisyon:

Nahanap namin ang mga coefficients ng pinakamainam na pag-andar bilang isang solusyon sa system:

Para sa kapakanan ng isang mas siksik na notasyon, ang variable na "counter" ay maaaring alisin, dahil malinaw na na ang kabuuan ay isinasagawa mula 1 hanggang.

Mas maginhawa upang makalkula ang mga kinakailangang halaga sa isang form na tabular:


Ang mga kalkulasyon ay maaaring isagawa sa isang microcalculator, ngunit mas mahusay na gamitin ang Excel - parehong mas mabilis at walang mga pagkakamali; manuod ng isang maikling video:

Sa gayon, nakukuha natin ang mga sumusunod sistema:

Dito maaari mong i-multiply ang pangalawang equation ng 3 at ibawas ang ika-2 mula sa ika-1 na term ng equation ayon sa term... Ngunit ito ang swerte - sa pagsasagawa, ang mga system ay madalas na hindi regalo, at sa mga ganitong kaso ay nakakatipid ito paraan ng Cramer:
, na nangangahulugang ang system ay may natatanging solusyon.

Suriin natin Naiintindihan ko na ayaw ko, ngunit bakit laktawan ang mga pagkakamali kung saan sila ay ganap na maiiwasan? Pinalitan namin ang nahanap na solusyon sa kaliwang bahagi ng bawat equation ng system:

Ang mga kanang bahagi ng mga kaukulang equation ay nakuha, na nangangahulugang ang sistema ay malulutas nang tama.

Kaya, ang hinahangad para sa tinatayang pagpapaandar: - mula sa ng lahat ng mga linear function siya ang humigit-kumulang sa pang-eksperimentong data sa pinakamahusay na paraan.

Hindi katulad tuwid pagpapakandili ng turnover ng tindahan sa lugar nito, ang nahanap na pagpapakandili ay baligtarin (prinsipyo "mas - mas kaunti"), at ang katotohanang ito ay agad na isiniwalat ng negatibo dalisdis... Pag-andar Ipinaaalam sa amin na sa isang pagtaas sa isang tiyak na tagapagpahiwatig ng 1 yunit, bumababa ang halaga ng umaasa na tagapagpahiwatig averageng 0.65 na yunit. Tulad ng sinasabi ng kasabihan, mas mataas ang presyo ng bakwit, mas mababa ang ibinebenta.

Upang mailagay ang grap ng tinatayang pagpapaandar, mahahanap namin ang dalawa sa mga halagang ito:

at isagawa ang pagguhit:

Ang itinayo na linya ay tinatawag na linya ng kalakaran (katulad, isang linear na linya ng trend, ibig sabihin, sa pangkalahatang kaso, ang isang trend ay hindi kinakailangang isang tuwid na linya)... Pamilyar ang bawat isa sa ekspresyong "maging nasa trend", at sa palagay ko ang term na ito ay hindi nangangailangan ng karagdagang mga komento.

Kalkulahin natin ang kabuuan ng mga parisukat ng mga paglihis sa pagitan ng mga empirical at theoretical na halaga. Heometriko, ito ang kabuuan ng mga parisukat ng haba ng mga "pulang-pula" na mga segment (dalawa sa mga ito ay napakaliit na hindi mo sila nakikita).

Ibuod natin ang mga kalkulasyon sa isang talahanayan:


Maaari silang magawa nang manu-mano, kung sakali magbibigay ako ng isang halimbawa para sa ika-1 na punto:

ngunit mas mahusay ito upang kumilos sa isang kilalang paraan:

Ulitin natin: ano ang kahulugan ng nakuha na resulta? Ng ng lahat ng mga linear function pagpapaandar ang tagapagpahiwatig ay ang pinakamaliit, iyon ay, sa pamilya nito, ito ang pinakamahusay na pagtatantya. At narito, sa pamamagitan ng paraan, ang pangwakas na tanong ng problema ay hindi sinasadya: paano kung ang ipinanukalang pagpapaandar na pagpapaandar mas makakabuti bang tantyahin ang mga pang-eksperimentong puntos?

Hanapin natin ang kaukulang kabuuan ng mga parisukat ng mga paglihis - upang makilala, itatalaga ko ang mga ito sa titik na "epsilon". Ang pamamaraan ay eksaktong pareho:


At muli, para sa bawat bumbero, mga kalkulasyon para sa ika-1 na punto:

Sa Excel, ginagamit namin ang karaniwang pagpapaandar EXP (ang syntax ay matatagpuan sa Tulong sa Excel).

Konklusyon:, na nangangahulugang tinatayang ng exponential function ang mga pang-eksperimentong puntos na mas masahol kaysa sa tuwid na linya .

Ngunit narito dapat pansinin na ang "mas masahol" ay hindi pa ibig sabihin, ano ang mali Ngayon ay binabalak ko ang exponential function na ito - at malapit din ito sa mga puntos - Napakaraming sa gayon na walang pansaliksik na pansaliksik mahirap sabihin kung aling pagpapaandar ang mas tumpak.

Nakumpleto nito ang solusyon, at babalik ako sa tanong ng mga likas na halaga ng pagtatalo. Sa iba`t ibang pag-aaral, bilang panuntunan, pang-ekonomiya o sosyolohikal, natural na "xes" na bilang ng buwan, taon o iba pang pantay na agwat ng oras. Isaalang-alang, halimbawa, ang isang problema tulad nito:

Mayroon kaming sumusunod na data sa paglilipat ng tingi ng tindahan sa unang kalahati ng taon:

Paggamit ng analytical straight line alignment, tukuyin ang dami ng mga benta para sa Hulyo.

Oo, walang problema: binibilang namin ang mga buwan na 1, 2, 3, 4, 5, 6 at ginagamit ang karaniwang algorithm, bilang isang resulta kung saan nakakakuha kami ng isang equation - ang tanging bagay pagdating sa oras, ang letrang "te" ay karaniwang ginagamit (bagaman hindi ito kritikal)... Ipinapakita ng nagresultang equation na sa unang kalahati ng taon, ang pagtaas ng paglilipat ay tumaas ng isang average ng 27.74 na mga yunit. kada buwan. Kunin ang forecast para sa Hulyo (buwan Blg. 7): d.e.

At ang mga nasabing gawain - madilim ang kadiliman. Ang mga interesado ay maaaring gumamit ng isang karagdagang serbisyo, katulad ng aking calculator ng Excel (bersyon ng demo), kung saan ang malulutas agad ang pinag-aralan na problema! Magagamit ang bersyon ng pagtatrabaho ng programa sa kapalit o para sa token.

Sa pagtatapos ng aralin, maikling impormasyon sa paghahanap ng mga dependency ng ilang iba pang mga uri. Sa totoo lang, walang espesyal na sasabihin, dahil ang prinsipyo na diskarte at solusyon sa algorithm ay mananatiling pareho.

Ipagpalagay na ang pag-aayos ng mga pang-eksperimentong puntos ay kahawig ng isang hyperbola. Pagkatapos, upang mahanap ang mga coefficients ng pinakamahusay na hyperbola, kailangan mong hanapin ang minimum ng pagpapaandar - ang mga nais na maaaring magsagawa ng detalyadong mga kalkulasyon at makarating sa isang katulad na system:

Mula sa isang pormal at panteknikal na pananaw, nakuha ito mula sa sistemang "linear" (markahan natin ito ng isang "asterisk") pinapalitan ang "x" ng. Kaya, at ang halaga ay kalkulahin, pagkatapos kung saan hanggang sa pinakamainam na mga koepisyent na "a" at "maging" nasa kamay na.

Kung mayroong bawat dahilan upang maniwala na ang mga puntos ay matatagpuan sa kahabaan ng isang logarithmic curve, pagkatapos ay upang maghanap para sa pinakamainam na mga halaga at hanapin ang minimum ng pagpapaandar ... Pormal, sa system (*) ay dapat mapalitan ng:

Kapag gumagawa ng mga kalkulasyon sa Excel, gamitin ang pagpapaandar LN... Inaamin ko, hindi magiging mahirap para sa akin na lumikha ng mga calculator para sa bawat kaso na isinasaalang-alang, ngunit magiging mas mabuti pa rin kung "i-program" mo mismo ang mga kalkulasyon. Mga video ng aralin na makakatulong.

Sa exponential dependence, ang sitwasyon ay medyo kumplikado. Upang mabawasan ang bagay sa linear na kaso, i-logarithm natin ang pagpapaandar at paggamit mga katangian ng logarithm:

Ngayon, sa paghahambing ng nakuha na pag-andar sa linear na pag-andar, napagpasyahan natin na sa system (*) ay dapat mapalitan ng, at - ng. Para sa kaginhawahan ipinahiwatig namin:

Mangyaring tandaan na ang sistema ay nalutas na may kaugnayan sa at, at samakatuwid, pagkatapos hanapin ang mga ugat, dapat mong tandaan na hanapin ang koepisyent mismo.

Upang mailapit ang mga pang-eksperimentong puntos pinakamainam na parabola , dapat hanapin minimum na pag-andar ng tatlong variable ... Matapos magsagawa ng mga karaniwang pagkilos, nakukuha namin ang sumusunod na "gumagana" sistema:

Oo, syempre, maraming halaga dito, ngunit kapag ginagamit mo ang iyong paboritong application, wala kang mga paghihirap. At sa wakas, sasabihin ko sa iyo kung paano mabilis na suriin at buuin ang nais na linya ng trend gamit ang Excel: lumikha ng isang tsart na nagkalat, pumili ng alinman sa mga puntos gamit ang mouse at sa pamamagitan ng tamang pag-click piliin ang pagpipilian "Magdagdag ng linya ng takbo"... Susunod, piliin ang uri ng tsart at sa tab "Mga Pagpipilian"buhayin ang pagpipilian Ipakita ang Equation Sa Tsart... OK lang

Tulad ng dati, nais kong wakasan ang artikulo ng ilang magagandang parirala, at halos mai-type ko ang "Mag-trend!". Ngunit nagbago ang isip niya sa oras. At hindi dahil ito ay stereotype. Hindi ko alam kung paano ang sinuman, ngunit hindi ko nais na sundin ang na-promosyong Amerikano at lalo na ang uso sa Europa \u003d) Samakatuwid, hinihiling kong ang bawat isa sa inyo ay sumunod sa iyong sariling linya!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Ang pinakamaliit na pamamaraan ng mga parisukat ay isa sa pinakakaraniwan at pinaka-nabuo dahil dito pagiging simple at kahusayan ng mga pamamaraan para sa pagtantya ng mga parameter ng mga linear econometric na modelo... Sa parehong oras, ang ilang pag-iingat ay dapat na sundin kapag ginagamit ito, dahil ang mga modelo na itinayo kasama ang paggamit nito ay maaaring hindi nasiyahan ang isang bilang ng mga kinakailangan para sa kalidad ng kanilang mga parameter at, bilang isang resulta, hindi "sapat na mahusay" upang ipakita ang mga pattern ng pag-unlad ng proseso.

Isaalang-alang natin ang pamamaraan para sa pagtantya ng mga parameter ng isang linear na modelo ng econometric gamit ang pinakamaliit na pamamaraan ng mga parisukat nang mas detalyado. Ang nasabing modelo sa pangkalahatang anyo ay maaaring kinatawan ng equation (1.2):

y t \u003d a 0 + a 1 х 1t + ... + a n х nt + ε t.

Ang paunang data kapag tinatantya ang mga parameter ng 0, isang 1, ..., isang n ay ang vector ng mga halaga ng umaasang variable y \u003d (y 1, y 2, ..., y T) "at ang matrix ng mga halaga ng mga independiyenteng variable

kung saan ang unang haligi ng mga ay tumutugma sa koepisyent ng modelo.

Ang pamamaraan ng hindi bababa sa mga parisukat ay nakakuha ng pangalan nito, na nagpapatuloy mula sa pangunahing prinsipyo, na kung saan ang mga pagtatantya ng parameter na nakuha sa batayan nito ay dapat masiyahan: ang kabuuan ng mga parisukat ng error sa modelo ay dapat na minimal.

Mga halimbawa ng paglutas ng mga problema gamit ang hindi bababa sa pamamaraan ng mga parisukat

Halimbawa 2.1.Ang negosyong pangkalakalan ay may isang network ng 12 mga tindahan, impormasyon sa mga aktibidad na kung saan ay ipinakita sa talahanayan. 2.1.

Nais malaman ng pamamahala ng kumpanya kung paano nakasalalay sa laki ng tingi ng tindahan ang laki ng taunang paglilipat ng tungkulin.

Talahanayan 2.1

Numero ng tindahan Taunang turnover, RUB mln Kalakal na lugar, libong m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Hindi bababa sa solusyon sa mga parisukat.Italaga natin - ang taunang paglilipat ng tindahan ng thn, mln rubles; - ang lugar ng pangangalakal ng th store, libong m 2.

Larawan 2.1. Ikalat ang balangkas halimbawa 2.1

Upang matukoy ang anyo ng ugnayan sa pagganap sa pagitan ng mga variable at bumuo ng isang diagram ng pagsabog (Larawan 2.1).

Batay sa nakakalat na diagram, mahihinuha na ang taunang paglilipat ng tungkulin ay positibong umaasa sa puwang ng tingi (ibig sabihin, y ay lalago sa paglaki). Ang pinakaangkop na anyo ng komunikasyon sa pagganap ay guhit-guhit.

Ang impormasyon para sa karagdagang mga kalkulasyon ay ipinakita sa talahanayan. 2.2. Gamit ang pinakamaliit na pamamaraan ng mga parisukat, tinatantiya namin ang mga parameter ng isang linear na isang-factor na modelo ng econometric

Talahanayan 2.2

t y t x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Ang karaniwan 68,29 0,89

Sa ganitong paraan,

Dahil dito, na may pagtaas sa lugar ng pagbebenta ng 1 libong m 2, lahat ng iba pang mga bagay na pantay, ang average na taunang paglilipat ng tungkulin ay tumataas ng 67.8871 milyong rubles.

Halimbawa 2.2.Napansin ng pamamahala ng kumpanya na ang taunang paglilipat ng tungkulin ay nakasalalay hindi lamang sa puwang ng tingi ng tindahan (tingnan ang halimbawa 2.1), kundi pati na rin sa average na bilang ng mga bisita. Ang nauugnay na impormasyon ay ipinakita sa talahanayan. 2.3.

Talahanayan 2.3

Desisyon.Italaga natin - ang average na bilang ng mga bisita sa th store bawat araw, libong katao.

Upang matukoy ang anyo ng pagganap na ugnayan sa pagitan ng mga variable at bumuo ng isang diagram ng pagsabog (Larawan 2.2).

Batay sa nakakalat na balangkas, mahihinuha na ang taunang paglilipat ng tungkulin ay positibong nakasalalay sa average na bilang ng mga bisita bawat araw (ibig sabihin, y ay lalago sa paglaki). Ang form ng pag-andar sa pagganap ay linear.

Larawan: 2.2. Ikalat ang balangkas halimbawa 2.2

Talahanayan 2.4

t x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Average 10,65

Sa pangkalahatan, kinakailangan upang matukoy ang mga parameter ng modelo ng econometric na dalawang-kadahilanan

у t \u003d a 0 + a 1 х 1t + a 2 х 2t + ε t

Ang impormasyong kinakailangan para sa karagdagang mga kalkulasyon ay ipinakita sa talahanayan. 2.4.

Tantiyahin natin ang mga parameter ng isang linear na dalawang-factor na modelo ng econometric gamit ang pinakamaliit na pamamaraan ng mga parisukat.

Sa ganitong paraan,

Ang pagtatantya ng koepisyent \u003d 61.6583 ay nagpapakita na, iba pang mga bagay na pantay, na may pagtaas sa lugar ng pagbebenta ng 1 libong m 2, ang taunang paglilipat ng tungkulin ay tataas ng isang average ng 61.6583 milyong rubles.

Ang pagtatantya ng koepisyent \u003d 2.2748 ay nagpapakita na, iba pang mga bagay na pantay, na may pagtaas sa average na bilang ng mga bisita bawat 1,000 katao. bawat araw, ang taunang paglilipat ng tungkulin ay tataas ng isang average ng 2.2748 milyong rubles.

Halimbawa 2.3.Gamit ang impormasyong ipinakita sa talahanayan. 2.2 at 2.4, tantyahin ang parameter ng isang-factor na modelo ng econometric

kung saan ang nakasentro na halaga ng taunang paglilipat ng tindahan, milyong rubles; - ang nakasentro na halaga ng average na pang-araw-araw na bilang ng mga bisita sa t-th store, libong katao. (tingnan ang mga halimbawa 2.1-2.2).

Desisyon. Ang karagdagang impormasyon na kinakailangan para sa mga kalkulasyon ay ipinakita sa talahanayan. 2.5.

Talahanayan 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Halaga 48,4344 431,0566

Gamit ang formula (2.35), nakukuha namin

Sa ganitong paraan,

http://www.cleverstudents.ru/articles/mnk.html

Halimbawa.

Pang-eksperimentong data sa mga halaga ng mga variable xat saay ibinibigay sa talahanayan.

Bilang isang resulta ng kanilang pagkakahanay, ang pagpapaandar

Gamit hindi bababa sa parisukat na pamamaraan, tantyahin ang data na ito na may isang linear na pagtitiwala y \u003d palakol + b (maghanap ng mga parameter at at b). Alamin kung alin sa dalawang linya ang mas mahusay (sa kahulugan ng hindi gaanong paraan ng mga parisukat) na nakahanay sa pang-eksperimentong data. Gumawa ng isang guhit.

Desisyon.

Sa aming halimbawa n \u003d 5... Pinupunan namin ang talahanayan para sa kaginhawaan ng pagkalkula ng mga halaga na kasama sa mga formula ng nais na mga koepisyent.

Ang mga halaga sa ika-apat na hilera ng talahanayan ay nakuha sa pamamagitan ng pag-multiply ng mga halaga ng ika-2 hilera ng mga halaga ng ika-3 hilera para sa bawat numero ako.

Ang mga halaga sa ikalimang hilera ng talahanayan ay nakuha sa pamamagitan ng pag-square ng mga halaga ng ika-2 hilera para sa bawat numero ako.

Ang mga halaga ng huling haligi ng talahanayan ay ang mga kabuuan ng mga halaga ayon sa hilera.

Gumagamit kami ng hindi bababa sa mga formula ng mga parisukat upang mahanap ang mga coefficients at at b... Pinapalitan namin sa kanila ang mga katumbas na halaga mula sa huling haligi ng talahanayan:

Samakatuwid, y \u003d 0.165x + 2.184 - ang kinakailangang tinatayang tuwid na linya.

Nananatili ito upang malaman kung alin sa mga linya y \u003d 0.165x + 2.184 o mas mahusay na tinatayang ang orihinal na data, iyon ay, gumawa ng isang pagtatantya gamit ang hindi bababa sa mga parisukat na pamamaraan.

Katibayan.

Kaya na kapag nahanap at at b Kinakailangan ng pagpapaandar ang pinakamaliit na halaga, kinakailangan na sa puntong ito ang matrix ng quadratic form ng pangalawang-order na kaugalian para sa pagpapaandar positibong tinukoy. Ipakita natin ito.

Ang pagkakaiba sa pangalawang order ay may form:

I.e

Samakatuwid, ang matrix ng quadratic form ay mayroong form

at ang mga halaga ng mga elemento ay hindi nakasalalay sa atat b.

Ipakita natin na ang matrix ay positibong tiyak. Kinakailangan nito na maging positibo ang mga menor de edad na sulok.

Corner unang order menor de edad ... Ang hindi pagkakapantay-pantay ay mahigpit, dahil ang mga puntos

Halimbawa.

Pang-eksperimentong data sa mga halaga ng mga variable x at sa ay ibinibigay sa talahanayan.

Bilang isang resulta ng kanilang pagkakahanay, ang pagpapaandar

Gamit hindi bababa sa parisukat na pamamaraan, tantyahin ang data na ito na may isang linear na pagtitiwala y \u003d palakol + b (maghanap ng mga parameter at at b). Alamin kung alin sa dalawang linya ang mas mahusay (sa kahulugan ng hindi gaanong paraan ng mga parisukat) na nakahanay sa pang-eksperimentong data. Gumawa ng isang guhit.

Ang kakanyahan ng pamamaraan ng hindi bababa sa mga parisukat (OLS).

Ang gawain ay upang hanapin ang mga coefficients ng linear dependence kung saan ang pagpapaandar ng dalawang variable at at b Kinukuha ang pinakamaliit na halaga. Iyon ay, naibigay at at b ang kabuuan ng mga parisukat ng mga paglihis ng pang-eksperimentong data mula sa nahanap na tuwid na linya ang magiging pinakamaliit. Ito ang buong punto ng hindi bababa sa pamamaraan ng mga parisukat.

Kaya, ang solusyon ng halimbawa ay nabawasan sa paghahanap ng sukat ng isang pagpapaandar ng dalawang variable.

Pagmumula ng mga formula para sa paghahanap ng mga coefficients.

Ang isang sistema ng dalawang mga equation na may dalawang hindi alam ay binubuo at nalulutas. Hanapin ang bahagyang derivatives ng isang pagpapaandar na may paggalang sa mga variable at at b, pinapantay namin ang mga derivatives na ito sa zero.

Nalulutas namin ang nagresultang sistema ng mga equation sa pamamagitan ng anumang pamamaraan (halimbawa paraan ng pagpapalit o) at nakakakuha kami ng mga formula para sa paghahanap ng mga coefficients gamit ang pinakamaliit na mga parisukat na pamamaraan (OLS).

Gamit ang data at at b pagpapaandar kumukuha ng pinakamaliit na halaga. Ang katibayan ng katotohanang ito ay ibinigay.

Iyon ang buong pinakamaliit na pamamaraan ng mga parisukat. Formula para sa paghahanap ng parameter a naglalaman ng mga kabuuan ,,, at ang parameter n - ang dami ng data ng pang-eksperimentong. Inirerekumenda namin na kalkulahin ang mga halaga ng mga halagang ito nang magkahiwalay. Coefficient b ay pagkatapos ng pagkalkula a.

Panahon na upang alalahanin ang orihinal na halimbawa.

Desisyon.

Sa aming halimbawa n \u003d 5... Pinupunan namin ang talahanayan para sa kaginhawaan ng pagkalkula ng mga halaga na kasama sa mga formula ng nais na mga koepisyent.

Ang mga halaga sa ika-apat na hilera ng talahanayan ay nakuha sa pamamagitan ng pag-multiply ng mga halaga ng ika-2 hilera ng mga halaga ng ika-3 hilera para sa bawat numero ako.

Ang mga halaga sa ikalimang hilera ng talahanayan ay nakuha sa pamamagitan ng pag-square ng mga halaga ng ika-2 hilera para sa bawat numero ako.

Ang mga halaga ng huling haligi ng talahanayan ay ang mga kabuuan ng mga halaga ayon sa hilera.

Gumagamit kami ng hindi bababa sa mga formula ng mga parisukat upang mahanap ang mga coefficients at at b... Pinapalitan namin sa kanila ang mga katumbas na halaga mula sa huling haligi ng talahanayan:

Samakatuwid, y \u003d 0.165x + 2.184 - ang kinakailangang tinatayang tuwid na linya.

Nananatili ito upang malaman kung alin sa mga linya y \u003d 0.165x + 2.184 o mas mahusay na tinatayang ang orihinal na data, iyon ay, gumawa ng isang pagtatantya gamit ang hindi bababa sa mga parisukat na pamamaraan.

Pagtantya ng error ng hindi bababa sa pamamaraan ng mga parisukat.

Upang gawin ito, kailangan mong kalkulahin ang kabuuan ng mga parisukat ng mga paglihis ng paunang data mula sa mga linyang ito at , ang mas maliit na halaga ay tumutugma sa linya na mas mahusay na tinatayang ang orihinal na data sa kahulugan ng pinakamaliit na pamamaraan ng mga parisukat.

Simula noon diretso y \u003d 0.165x + 2.184 mas tinatayang ang orihinal na data.

Graphic na paglalarawan ng paraan ng hindi bababa sa mga parisukat (mns).

Ang lahat ay perpektong nakikita sa mga graph. Ang pulang linya ay ang tuwid na linya na natagpuan y \u003d 0.165x + 2.184, ang asul na linya ay , ang mga rosas na tuldok ay hilaw na data.

Para saan ito, para saan ang lahat ng mga pamamaraang ito?

Personal kong ginagamit upang malutas ang mga problema sa mga problema sa pag-ayos ng data, interpolation at extrapolation (sa orihinal na halimbawa, maaaring hiniling mong hanapin ang halaga ng naobserbahang halaga y sa x \u003d 3 o sa x \u003d 6 sa pamamagitan ng pamamaraang OLS). Ngunit pag-uusapan pa namin ang tungkol dito sa ibang bahagi ng site.

Katibayan.

Kaya na kapag nahanap at at b Kinakailangan ng pagpapaandar ang pinakamaliit na halaga, kinakailangan na sa puntong ito ang matrix ng quadratic form ng pangalawang-order na kaugalian para sa pagpapaandar positibong tinukoy. Ipakita natin ito.

Tantanan natin ang pagpapaandar ng isang polynomial ng degree 2. Para sa mga ito, kinakalkula namin ang mga coefficients ng normal na sistema ng mga equation:

, ,

Bumuo tayo ng isang normal na sistema ng hindi bababa sa mga parisukat, na may form:

Madaling mahanap ang solusyon sa system: ,,.

Kaya, ang polynomial ng ika-2 degree ay matatagpuan:

Teoretikal na background

Bumalik sa pahina<Введение в вычислительную математику. Примеры>

Halimbawa 2... Paghahanap ng pinakamainam na antas ng isang polynomial.

Bumalik sa pahina<Введение в вычислительную математику. Примеры>

Halimbawa 3... Paggawa ng normal na sistema ng mga equation para sa paghahanap ng mga parameter ng empirical dependence.

Kumuha tayo ng isang sistema ng mga equation para sa pagtukoy ng mga coefficients at ang pagpapaandar , na gumaganap ng root-mean-square na paglalapit ng ibinigay na pag-andar ng mga puntos. Bumuo tayo ng isang pagpapaandar at isulat ang kinakailangang kondisyon ng labis na kalagayan para dito:

Pagkatapos ang normal na system ay kukuha ng form:

Nakatanggap ng isang linear na sistema ng mga equation na patungkol sa hindi kilalang mga parameter at, na madaling malulutas.

Teoretikal na background

Bumalik sa pahina<Введение в вычислительную математику. Примеры>

Halimbawa.

Pang-eksperimentong data sa mga halaga ng mga variable x at sa ay ibinibigay sa talahanayan.

Bilang isang resulta ng kanilang pagkakahanay, ang pagpapaandar

Gamit hindi bababa sa parisukat na pamamaraan, tantyahin ang data na ito na may isang linear na pagtitiwala y \u003d palakol + b (maghanap ng mga parameter at at b). Alamin kung alin sa dalawang linya ang mas mahusay (sa kahulugan ng hindi gaanong paraan ng mga parisukat) na nakahanay sa pang-eksperimentong data. Gumawa ng isang guhit.

Ang kakanyahan ng pamamaraan ng hindi bababa sa mga parisukat (OLS).

Ang gawain ay upang hanapin ang mga coefficients ng linear dependence kung saan ang pagpapaandar ng dalawang variable at at b Kinukuha ang pinakamaliit na halaga. Iyon ay, naibigay at at b ang kabuuan ng mga parisukat ng mga paglihis ng pang-eksperimentong data mula sa nahanap na tuwid na linya ang magiging pinakamaliit. Ito ang buong punto ng hindi bababa sa pamamaraan ng mga parisukat.

Kaya, ang solusyon ng halimbawa ay nabawasan sa paghahanap ng sukat ng isang pagpapaandar ng dalawang variable.

Pagmumula ng mga formula para sa paghahanap ng mga coefficients.

Ang isang sistema ng dalawang mga equation na may dalawang hindi alam ay binubuo at nalulutas. Hanapin ang bahagyang derivatives ng pagpapaandar sa pamamagitan ng mga variable at at b, pinapantay namin ang mga derivatives na ito sa zero.

Nalulutas namin ang nagresultang sistema ng mga equation sa pamamagitan ng anumang pamamaraan (halimbawa paraan ng pagpapalit o pamamaraan ng Cramer) at nakakakuha kami ng mga formula para sa paghahanap ng mga coefficients gamit ang pinakamaliit na paraan ng mga parisukat (OLS).

Gamit ang data at at b pagpapaandar Kinukuha ang pinakamaliit na halaga. Ang katibayan ng katotohanang ito ay ibinibigay sa ibaba sa teksto sa dulo ng pahina.

Iyon ang buong pinakamaliit na pamamaraan ng mga parisukat. Formula para sa paghahanap ng parameter a naglalaman ng mga kabuuan ,,, at ang parameter n - ang dami ng data ng pang-eksperimentong. Inirerekumenda namin na kalkulahin ang mga halaga ng mga halagang ito nang magkahiwalay.

Coefficient b ay pagkatapos ng pagkalkula a.

Panahon na upang alalahanin ang orihinal na halimbawa.

Desisyon.

Sa aming halimbawa n \u003d 5... Pinupunan namin ang talahanayan para sa kaginhawaan ng pagkalkula ng mga halaga na kasama sa mga formula ng nais na mga koepisyent.

Ang mga halaga sa ika-apat na hilera ng talahanayan ay nakuha sa pamamagitan ng pag-multiply ng mga halaga ng ika-2 hilera ng mga halaga ng ika-3 hilera para sa bawat numero ako.

Ang mga halaga sa ikalimang hilera ng talahanayan ay nakuha sa pamamagitan ng pag-square ng mga halaga ng ika-2 hilera para sa bawat numero ako.

Ang mga halaga ng huling haligi ng talahanayan ay ang mga kabuuan ng mga halaga ayon sa hilera.

Gumagamit kami ng hindi bababa sa mga formula ng mga parisukat upang mahanap ang mga coefficients at at b... Pinapalitan namin sa kanila ang mga katumbas na halaga mula sa huling haligi ng talahanayan:

Samakatuwid, y \u003d 0.165x + 2.184 Ay ang kinakailangang tinatayang straight line.

Nananatili ito upang malaman kung alin sa mga linya y \u003d 0.165x + 2.184 o mas mahusay na tinatayang ang orihinal na data, iyon ay, gumawa ng isang pagtatantya gamit ang hindi bababa sa mga parisukat na pamamaraan.

Pagtantya ng error ng hindi bababa sa pamamaraan ng mga parisukat.

Upang gawin ito, kailangan mong kalkulahin ang kabuuan ng mga parisukat ng mga paglihis ng paunang data mula sa mga linyang ito at , ang mas maliit na halaga ay tumutugma sa linya na mas mahusay na tinatayang ang orihinal na data sa kahulugan ng pinakamaliit na pamamaraan ng mga parisukat.

Simula noon diretso y \u003d 0.165x + 2.184 mas tinatayang ang orihinal na data.

Graphic na paglalarawan ng paraan ng hindi bababa sa mga parisukat (mns).

Ang lahat ay perpektong nakikita sa mga graph. Ang pulang linya ay ang tuwid na linya na natagpuan y \u003d 0.165x + 2.184, ang asul na linya ay , ang mga rosas na tuldok ay hilaw na data.

Para saan ito, para saan ang lahat ng mga pamamaraang ito?

Personal kong ginagamit upang malutas ang mga problema sa mga problema sa pag-ayos ng data, interpolation at extrapolation (sa orihinal na halimbawa, maaaring hiniling mong hanapin ang halaga ng naobserbahang halaga y sa x \u003d 3 o sa x \u003d 6 sa pamamagitan ng pamamaraang OLS). Ngunit pag-uusapan pa namin ang tungkol dito sa ibang bahagi ng site.

Bumalik sa tuktok ng pahina

Katibayan.

Kaya na kapag nahanap at at b Kinakailangan ng pagpapaandar ang pinakamaliit na halaga, kinakailangan na sa puntong ito ang matrix ng quadratic form ng pangalawang-order na kaugalian para sa pagpapaandar positibong tinukoy. Ipakita natin ito.

Ang pagkakaiba sa pangalawang order ay may form:

I.e

Samakatuwid, ang matrix ng quadratic form ay mayroong form

at ang mga halaga ng mga elemento ay hindi nakasalalay sa at at b.

Ipakita natin na ang matrix ay positibong tiyak. Kinakailangan nito na maging positibo ang mga menor de edad na sulok.

Corner unang order menor de edad ... Mahigpit ang hindi pagkakapantay-pantay, dahil ang mga puntos ay hindi nagkataon. Sa mga sumusunod, bibigyan namin ito ng kahulugan.

Sulok menor de edad pangalawang order

Patunayan natin yan sa pamamagitan ng pamamaraan ng induction ng matematika.

Konklusyon: nahanap na mga halaga at at b tumutugma sa pinakamaliit na halaga ng pag-andar , samakatuwid, ang kinakailangang mga parameter para sa hindi bababa sa pamamaraan ng mga parisukat.

Walang oras upang malaman ito?
Mag-order ng solusyon

Bumalik sa tuktok ng pahina

Pagbubuo ng isang pagtataya gamit ang hindi bababa sa pamamaraan ng mga parisukat. Isang halimbawa ng paglutas ng problema

Extrapolation Ay isang pamamaraan ng siyentipikong pagsasaliksik, na batay sa pagpapalaganap ng nakaraan at kasalukuyang mga uso, pattern, link para sa pag-unlad sa hinaharap na bagay. Kasama ang mga pamamaraang extrapolation paglipat ng average na pamamaraan, exponential smoothing na pamamaraan, hindi bababa sa mga parisukat na pamamaraan.

Ang kakanyahan hindi bababa sa pamamaraan ng mga parisukat binubuo sa pagliit ng kabuuan ng karaniwang mga paglihis sa pagitan ng napansin at kinakalkula na mga halaga. Ang mga kinakalkula na halaga ay matatagpuan ayon sa nilagyan na equation - ang equation ng pagbabalik. Mas maliit ang distansya sa pagitan ng mga aktwal na halaga at mga kinakalkula na halaga, mas tumpak ang pagtataya batay sa equation ng pagbabalik.

Ang isang teoretikal na pagsusuri ng kakanyahan ng hindi pangkaraniwang bagay na pinag-aaralan, ang pagbabago kung saan ipinakita ng isang serye ng oras, ay nagsisilbing batayan sa pagpili ng isang curve. Minsan isinasaalang-alang ang mga pagsasaalang-alang tungkol sa likas na katangian ng paglago ng mga antas ng serye. Kaya, kung ang paglago ng output ay inaasahan sa arithmetic na pag-unlad, pagkatapos ay ang pagpapakinis ay ginaganap kasama ang isang tuwid na linya. Kung lumabas na ang paglago ay nasa pag-unlad na geometriko, pagkatapos ay dapat gawin ang pagpapakinis ayon sa exponential function.

Pinakamababang Mga Form sa Paggawa ng Mga Squares : Y t + 1 \u003d a * X + b, kung saan ang t + 1 ay ang panahon ng pagtataya; +t + 1 - hinulaang tagapagpahiwatig; a at b ay mga coefficients; Ang X ay isang simbolo ng oras.

Ang pagkalkula ng mga coefficients a at b ay isinasagawa ayon sa mga sumusunod na formula:

kung saan, Uf - ang aktwal na mga halaga ng serye ng dynamics; n ang bilang ng mga antas sa serye ng oras;

Ang pag-Smoothing ng serye ng oras sa pamamagitan ng hindi bababa sa mga parisukat na pamamaraan ay nagsisilbing sumasalamin sa mga pattern ng pag-unlad ng hindi pangkaraniwang bagay na pinag-aaralan. Sa analytical expression ng takbo, ang oras ay isinasaalang-alang bilang isang independiyenteng variable, at ang mga antas ng serye ay kumikilos bilang isang pagpapaandar ng independiyenteng variable na ito.

Ang pag-unlad ng isang kababalaghan ay hindi nakasalalay sa kung gaano karaming mga taon ang lumipas mula sa panimulang sandali, ngunit sa kung anong mga kadahilanan ang nakaimpluwensya sa pag-unlad nito, saang direksyon at sa kung anong tindi. Samakatuwid malinaw na ang pagbuo ng isang hindi pangkaraniwang bagay sa oras ay lilitaw bilang isang resulta ng pagkilos ng mga kadahilanang ito.

Tamang itinataguyod ang uri ng curve, ang uri ng analytical dependence sa oras ay isa sa pinakamahirap na gawain ng paunang nahulaan na pagtatasa. .

Ang pagpili ng uri ng pagpapaandar na naglalarawan sa trend, ang mga parameter na kung saan ay natutukoy ng hindi bababa sa mga parisukat na pamamaraan, ay ginaganap sa karamihan ng mga kaso empirically, sa pamamagitan ng pagbuo ng isang bilang ng mga pag-andar at paghahambing sa mga ito sa bawat isa sa pamamagitan ng halaga ng mga mean square error na kinakalkula ng formula:

kung saan Uf - ang aktwal na mga halaga ng isang bilang ng mga dinamika; Kinakalkula (na-smoothed) ang mga halaga ng isang bilang ng mga dinamika; n ang bilang ng mga antas sa serye ng oras; Ang p ay ang bilang ng mga parameter na tinutukoy sa mga pormula na naglalarawan sa takbo (trend ng pag-unlad).

Mga disadvantages ng hindi bababa sa pamamaraan ng mga parisukat :

  • kapag sinusubukang ilarawan ang pinag-aralan na kababalaghang pangkabuhayan gamit ang isang equation ng matematika, ang pagtataya ay magiging tumpak sa isang maikling panahon at ang equation ng pagbabalik ay dapat na muling kalkulahin habang may magagamit na bagong impormasyon;
  • ang pagiging kumplikado ng pagpili ng equation ng pagbabalik, na malulutas kapag gumagamit ng mga tipikal na programa ng computer.

Isang halimbawa ng paggamit ng hindi bababa sa mga parisukat na pamamaraan upang makabuo ng isang pagtataya

Isang gawain ... Mayroong data na nagpapakilala sa rate ng pagkawala ng trabaho sa rehiyon,%

  • Bumuo ng isang pagtataya ng rate ng pagkawala ng trabaho sa rehiyon para sa Nobyembre, Disyembre, Enero buwan gamit ang mga sumusunod na pamamaraan: average na paglipat, exponential smoothing, hindi bababa sa mga parisukat.
  • Kalkulahin ang mga error ng nakuha na mga hula gamit ang bawat pamamaraan.
  • Ihambing ang mga resulta, kumuha ng konklusyon.

Hindi bababa sa solusyon sa mga parisukat

Upang malutas ang problema, gaguhit kami ng isang talahanayan kung saan gagawin namin ang mga kinakailangang kalkulasyon:

ε \u003d 28.63 / 10 \u003d 2.86% kawastuhan ng pagtataya mataas

Konklusyon : Paghahambing ng mga resulta na nakuha sa mga kalkulasyon paglipat ng average na pamamaraan , exponential smoothing at ang pinakamaliit na pamamaraan ng mga parisukat, maaari nating sabihin na ang average na kamag-anak na error kapag nagkakalkula sa pamamagitan ng exponential smoothing na pamamaraan ay nahuhulog sa loob ng saklaw na 20-50%. Nangangahulugan ito na ang katumpakan ng pagtataya sa kasong ito ay kasiya-siya lamang.

Sa una at pangatlong kaso, ang katumpakan ng pagtataya ay mataas, dahil ang average na kamag-anak na error ay mas mababa sa 10%. Ngunit ang pamamaraan ng paglipat ng mga average na ginawang posible upang makakuha ng mas maaasahang mga resulta (forecast para sa Nobyembre - 1.52%, forecast para sa Disyembre - 1.53%, forecast para sa Enero - 1.49%), dahil ang average na kamag-anak error kapag ginagamit ang pamamaraang ito ay ang pinakamaliit - 1 , 13%.

Pinakamababang paraan ng parisukat

Iba pang mga artikulo sa paksang ito:

Listahan ng mga ginamit na mapagkukunan

  1. Mga rekomendasyong pang-agham at pamamaraan sa pag-diagnose ng mga panganib sa lipunan at mga hamon sa pagtataya, pagbabanta at mga kahihinatnan sa lipunan. Russian State Social University. Moscow. 2010;
  2. Vladimirova L.P. Pagtataya at pagpaplano sa mga kundisyon sa merkado: Teksbuk. allowance M.: Publishing House na "Dashkov and Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Pagtataya sa Pambansang Ekonomiya: Gabay sa Pagtuturo. Yekaterinburg: Ural Publishing House. estado ekonomiya Unibersidad, 2007;
  4. Slutskin L.N. Kursong MBA sa pagtataya sa negosyo. M.: Mga Alpina Business Book, 2006.

Programa ng OLS

Ipasok ang data

Data at approximation y \u003d a + b x

ako - numero ng pang-eksperimentong punto;
x i - ang halaga ng naayos na parameter sa punto ako;
y ako - ang halaga ng sinusukat na parameter sa punto ako;
ω ako - bigat ng pagsukat sa isang punto ako;
y i, calcul. - Pagkakaiba sa pagitan ng sinusukat at kinakalkula ng halaga ng pagbabalik y sa puntong ito ako;
S x i (x i) - pagtatantya ng error x i kapag sumusukat y sa puntong ito ako.

Data at approximation y \u003d k x

ako x i y ako ω ako y i, calcul. Δy ako S x i (x i)

Mag-click sa grap,

Mga tagubilin para sa gumagamit ng online na programa ng MNC.

Sa patlang ng data, ipasok ang mga halagang `x` at` y` sa parehong punto ng pagsubok sa bawat magkakahiwalay na linya. Ang mga halaga ay dapat na paghiwalayin ng isang whitespace character (puwang o tab).

Ang pangatlong halaga ay maaaring bigat ng puntong `w`. Kung ang timbang ng point ay hindi tinukoy, pagkatapos ito ay katumbas ng isa. Sa napakaraming kaso, ang mga timbang ng mga pang-eksperimentong puntos ay hindi alam o hindi kinakalkula, ibig sabihin ang lahat ng pang-eksperimentong data ay itinuturing na katumbas. Minsan ang mga timbang sa pinag-aralan na saklaw ng mga halaga ay ganap na hindi katumbas at maaaring makalkula nang teoretikal. Halimbawa, sa spectrophotometry, ang mga timbang ay maaaring kalkulahin gamit ang mga simpleng pormula, bagaman karaniwang pinapabayaan ito ng lahat upang mabawasan ang mga gastos sa paggawa.

Maaaring mai-paste ang data sa pamamagitan ng clipboard mula sa isang spreadsheet ng suite ng tanggapan, tulad ng Excel mula sa Microsoft Office o Calc mula sa Open Office. Upang magawa ito, sa spreadsheet, piliin ang saklaw ng data na makopya, kopyahin sa clipboard at i-paste ang data sa patlang ng data sa pahinang ito.

Para sa pagkalkula sa pamamagitan ng pamamaraan ng hindi bababa sa mga parisukat, hindi bababa sa dalawang puntos ang kinakailangan upang matukoy ang dalawang mga coefficients `b` - ang tangent ng slope ng tuwid na linya at` a` - ang halaga na pinutol ng tuwid na linya sa` y` axis.

Upang matantya ang error ng kinakalkula na mga coefficient ng pagbabalik, kailangan mong itakda ang bilang ng mga pang-eksperimentong puntos na higit sa dalawa.

Pinakamababang pamamaraan ng mga parisukat (OLS).

Ang mas malaki ang bilang ng mga pang-eksperimentong puntos, mas tumpak ang estatistika na tinatantiya ng mga coefficients (dahil sa pagbaba ng koepisyent ng Mag-aaral) at mas malapit ang pagtantya sa pagtantya ng pangkalahatang sample.

Ang pagkuha ng mga halaga sa bawat pang-eksperimentong punto ay madalas na masinsin sa paggawa, kaya madalas may isang trade-off sa bilang ng mga eksperimento na nagbibigay ng isang natutunaw na pagtatantya at hindi humantong sa labis na gastos sa paggawa. Bilang isang patakaran, ang bilang ng mga pang-eksperimentong puntos para sa isang linear na pagtitiwala sa OLS na may dalawang mga koepisyent ay napili sa rehiyon ng 5-7 na puntos.

Maikling teorya ng pamamaraan ng hindi bababa sa mga parisukat para sa linear na pagtitiwala

Ipagpalagay na mayroon kaming isang hanay ng pang-eksperimentong data sa anyo ng mga pares ng mga halaga [`y_i`,` x_i`], kung saan ang `i` ay ang bilang ng isang pang-eksperimentong pagsukat mula 1 hanggang` n`; `y_i` - halaga ng sinusukat na halaga sa point` i`; `x_i` - ang halaga ng parameter na itinakda namin sa point` i`.

Bilang isang halimbawa, isaalang-alang ang pagpapatakbo ng batas ng Ohm. Sa pamamagitan ng pagbabago ng boltahe (potensyal na pagkakaiba) sa pagitan ng mga seksyon ng de-koryenteng circuit, sinusukat namin ang dami ng kasalukuyang dumadaan sa seksyong ito. Binibigyan tayo ng pisika ng pag-asa na natagpuan nang eksperimento:

`I \u003d U / R`,
kung saan `ako` - kasalukuyang lakas; `R` - paglaban; `U` - boltahe.

Sa kasong ito, ang `y_i` ay ang sinusukat kasalukuyang halaga, at ang` x_i` ay ang halaga ng boltahe.

Bilang isa pang halimbawa, isaalang-alang ang pagsipsip ng ilaw ng isang solusyon ng isang sangkap sa isang solusyon. Binibigyan tayo ng kimika ng pormula:

`A \u003d ε l C`,
kung saan ang `A` ay ang optical density ng solusyon; `ε` - ang pagpapadala ng natutunaw; `l` - haba ng landas kapag ang ilaw ay dumadaan sa isang cuvette na may solusyon; `C` - konsentrasyon ng solute.

Sa kasong ito, `y_i` mayroon kaming sinusukat na halaga ng optical density` A`, at ang` x_i` ay ang halaga ng konsentrasyon ng sangkap na itinakda namin.

Isasaalang-alang namin ang kaso kung ang kamag-anak na error sa setting ng `x_i` ay mas mababa kaysa sa kamag-anak na error sa pagsukat` y_i`. Ipagpalagay din namin na ang lahat ng sinusukat na halagang `y_i` ay sapalaran at normal na ibinahagi, ibig sabihin sundin ang normal na batas sa pamamahagi.

Sa kaso ng isang linear na pagpapakandili ng `y` on` x`, maaari kaming magsulat ng isang teoretikal na pagpapakandili:
`y \u003d a + b x`.

Mula sa isang geometric point of view, ang coefficient `b` ay nangangahulugang ang galaw ng anggulo ng pagkahilig ng linya sa` x` axis, at ang coefficient` a` - ang halaga ng` y` sa punto ng intersection ng linya na may `y` axis (at` x \u003d 0`).

Paghahanap ng mga parameter ng linya ng pagbabalik.

Sa eksperimento, ang mga sinusukat na halaga ng `y_i` ay hindi maaaring eksaktong magsinungaling sa theoretical straight line dahil sa mga error sa pagsukat na laging likas sa totoong buhay. Samakatuwid, ang isang linear equation ay dapat na kinatawan ng isang sistema ng mga equation:
`y_i \u003d a + b x_i + ε_i` (1),
kung saan ang "ε_i` ay ang hindi kilalang error sa pagsukat ng` y` sa eksperimento na` i`-th.

Ang pagtitiwala (1) ay tinatawag ding pag-urong, ibig sabihin pag-asa ng dalawang halaga mula sa bawat isa na may kahalagahan sa istatistika.

Ang gawain ng pagpapanumbalik ng pagpapakandili ay upang mahanap ang mga coefficients `a` at` b` mula sa mga pang-eksperimentong puntos [` y_i`, `x_i`].

Upang hanapin ang mga coefficient na "a` at` b`, karaniwang ginagamit ito hindi bababa sa parisukat na pamamaraan (OLS). Ito ay isang espesyal na kaso ng pinakamataas na prinsipyo ng posibilidad.

Isulat natin muli ang (1) bilang `ε_i \u003d y_i - a - b x_i`.

Pagkatapos ang kabuuan ng mga parisukat ng mga error ay magiging
`Φ \u003d sum_ (i \u003d 1) ^ (n) ε_i ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2`. (2)

Ang prinsipyo ng OLS (hindi bababa sa pamamaraan ng mga parisukat) ay upang i-minimize ang kabuuan (2) na patungkol sa mga parameter na "a` at` b`.

Naabot ang minimum kung ang bahagyang derivatives ng kabuuan (2) na patungkol sa mga coefficient na "a` at` b` ay katumbas ng zero:
`frac (bahagyang Φ) (bahagyang a) \u003d frac (bahagyang kabuuan_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (bahagyang a) \u003d 0`
`frac (bahagyang Φ) (bahagyang b) \u003d frac (bahagyang kabuuan_ (i \u003d 1) ^ (n) (y_i - a - b x_i) ^ 2) (bahagyang b) \u003d 0`

Pagpapalawak ng mga derivatives, nakakakuha kami ng isang sistema ng dalawang mga equation na may dalawang hindi alam:
`sum_ (i \u003d 1) ^ (n) (2a + 2bx_i - 2y_i) \u003d sum_ (i \u003d 1) ^ (n) (a + bx_i - y_i) \u003d 0`
`sum_ (i \u003d 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) \u003d sum_ (i \u003d 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) \u003d 0`

Binubuksan namin ang mga braket at inililipat ang mga kabuuan na independiyente sa hinahangad na mga koepisyent sa iba pang kalahati, nakakakuha kami ng isang sistema ng mga linear equation:
`sum_ (i \u003d 1) ^ (n) y_i \u003d a n + b sum_ (i \u003d 1) ^ (n) bx_i`
`sum_ (i \u003d 1) ^ (n) x_iy_i \u003d a sum_ (i \u003d 1) ^ (n) x_i + b sum_ (i \u003d 1) ^ (n) x_i ^ 2`

Paglutas ng nagresultang system, mahahanap namin ang mga formula para sa mga coefficients na "a` at` b`:

`a \u003d frac (sum_ (i \u003d 1) ^ (n) y_i sum_ (i \u003d 1) ^ (n) x_i ^ 2 - sum_ (i \u003d 1) ^ (n) x_i sum_ (i \u003d 1) ^ (n ) x_iy_i) (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.1)

`b \u003d frac (n sum_ (i \u003d 1) ^ (n) x_iy_i - sum_ (i \u003d 1) ^ (n) x_i sum_ (i \u003d 1) ^ (n) y_i) (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) `(3.2)

Ang mga formula na ito ay may mga solusyon kapag `n\u003e 1` (ang linya ay maaaring iguhit mula sa hindi bababa sa 2 puntos) at kung kailan ang tumutukoy` D \u003d n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2! \u003d 0`, ibig sabihin kapag ang mga puntong `x_i` sa eksperimento ay magkakaiba (ibig sabihin kapag ang linya ay hindi patayo).

Pagtatantiya ng mga pagkakamali ng mga coefficients ng linya ng pagbabalik

Para sa isang mas tumpak na pagtatantya ng error sa pagkalkula ng mga coefficients na "a` at` b`, kanais-nais ang isang malaking bilang ng mga pang-eksperimentong puntos. Kapag `n \u003d 2`, imposibleng matantya ang error ng mga coefficients, dahil ang tinatayang linya ay tiyak na dumadaan sa dalawang puntos.

Natukoy ang error ng random variable na "V` ang batas ng akumulasyon ng mga error
`S_V ^ 2 \u003d sum_ (i \u003d 1) ^ p (frac (bahagyang f) (bahagyang z_i)) ^ 2 S_ (z_i) ^ 2`,
kung saan ang `p` ay ang bilang ng mga parameter` z_i` na may error na` S_ (z_i) `na nakakaapekto sa error na` S_V`;
`f` - pagpapaandar ng pagpapakandili ng` V` sa` z_i`.

Isulat natin ang batas ng akumulasyon ng mga error para sa error ng mga coefficients na 'a` at` b`
`S_a ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (frac (bahagyang a) (bahagyang y_i)) ^ 2 S_ (y_i) ^ 2 + sum_ (i \u003d 1) ^ (n) (frac (bahagyang a ) (bahagyang x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (bahagyang a) (bahagyang y_i)) ^ 2 `,
`S_b ^ 2 \u003d sum_ (i \u003d 1) ^ (n) (frac (bahagyang b) (bahagyang y_i)) ^ 2 S_ (y_i) ^ 2 + sum_ (i \u003d 1) ^ (n) (frac (bahagyang b ) (bahagyang x_i)) ^ 2 S_ (x_i) ^ 2 \u003d S_y ^ 2 sum_ (i \u003d 1) ^ (n) (frac (bahagyang b) (bahagyang y_i)) ^ 2 `,
mula noon `S_ (x_i) ^ 2 \u003d 0` (gumawa kami ng isang pagpapareserba nang mas maaga na ang error` x` ay bale-wala).

`S_y ^ 2 \u003d S_ (y_i) ^ 2` - error (pagkakaiba-iba, square na karaniwang paglihis) sa pagsukat` y`, ipinapalagay na ang error ay pare-pareho para sa lahat ng mga halaga ng` y`.

Ang pagpapalit ng mga formula para sa pagkalkula ng `a` at` b` sa mga nakuha na expression, nakukuha namin

`S_a ^ 2 \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) (sum_ (i \u003d 1) ^ (n) x_i ^ 2 - x_i sum_ (i \u003d 1) ^ (n) x_i) ^ 2 ) (D ^ 2) \u003d S_y ^ 2 frac ((n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2) sum_ (i \u003d 1) ^ (n) x_i ^ 2) (D ^ 2) \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) x_i ^ 2) (D) `(4.1)

`S_b ^ 2 \u003d S_y ^ 2 frac (sum_ (i \u003d 1) ^ (n) (n x_i - sum_ (i \u003d 1) ^ (n) x_i) ^ 2) (D ^ 2) \u003d S_y ^ 2 frac ( n (n sum_ (i \u003d 1) ^ (n) x_i ^ 2 - (sum_ (i \u003d 1) ^ (n) x_i) ^ 2)) (D ^ 2) \u003d S_y ^ 2 frac (n) (D) `(4.2)

Sa karamihan ng mga totoong eksperimento sa buhay, hindi sinusukat ang halaga na `Sy`. Upang magawa ito, kailangan mong magsagawa ng maraming mga parallel na sukat (mga eksperimento) sa isa o higit pang mga punto ng plano, na nagdaragdag ng oras (at posibleng gastos) ng eksperimento. Samakatuwid, karaniwang ipinapalagay na ang paglihis ng `y` mula sa linya ng pagbabalik ay maaaring maituring na sapalaran. Ang pagtatantya ng pagkakaiba-iba `y` sa kasong ito ay kinakalkula ng formula.

`S_y ^ 2 \u003d S_ (y, rest) ^ 2 \u003d frac (sum_ (i \u003d 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)`.

Lumilitaw ang divider `n-2` sapagkat nabawasan namin ang bilang ng mga degree ng kalayaan dahil sa pagkalkula ng dalawang mga koepisyent para sa parehong sample ng pang-eksperimentong data.

Ang pagtatantya na ito ay tinatawag ding natitirang pagkakaiba-iba na may kaugnayan sa linya ng pagbabalik na 'S_ (y, pahinga) ^ 2`.

Ang pagtatasa ng kahalagahan ng mga coefficients ay isinasagawa alinsunod sa pamantayan ng Mag-aaral

`t_a \u003d frac (| a |) (S_a)`, `t_b \u003d frac (| b |) (S_b)`

Kung ang kinakalkula na pamantayan na `t_a`,` t_b` ay mas mababa sa pamantayan ng talahanayan `t (P, n-2)`, pagkatapos ito ay isinasaalang-alang na ang kaukulang koepisyent ay hindi naiiba nang malaki mula sa zero na may isang naibigay na posibilidad na P.

Upang masuri ang kalidad ng paglalarawan ng isang linear na relasyon, maaari mong ihambing ang `S_ (y, pahinga) ^ 2` at` S_ (bar y)` na may kaugnayan sa ibig sabihin ng paggamit ng pagsubok ni Fisher.

`S_ (bar y) \u003d frac (sum_ (i \u003d 1) ^ n (y_i - bar y) ^ 2) (n-1) \u003d frac (sum_ (i \u003d 1) ^ n (y_i - (sum_ (i \u003d 1) ^ n y_i) / n) ^ 2) (n-1) `- halimbawang pagtatantya ng pagkakaiba-iba` y` na may kaugnayan sa ibig sabihin.

Upang masuri ang pagiging epektibo ng equation ng pagbabalik upang ilarawan ang ugnayan, kinakalkula ang koepisyent ng Fisher
`F \u003d S_ (bar y) / S_ (y, pahinga) ^ 2`,
na kung saan ay inihambing sa coefficient ng talahanayan ng Fisher `F (p, n-1, n-2)`.

Kung ang `F\u003e F (P, n-1, n-2)`, ang pagkakaiba sa pagitan ng paglalarawan ng pagpapakandili `y \u003d f (x)` gamit ang equation ng regression at ang paglalarawan gamit ang mean ay itinuturing na makabuluhan sa istatistika na may posibilidad na 'P`. Yung. inilalarawan ng pagbabalik ang ugnayan nang mas mahusay kaysa sa pagkalat ng `y` na may kaugnayan sa ibig sabihin.

Mag-click sa grap,
upang magdagdag ng mga halaga sa talahanayan

Pinakamababang paraan ng parisukat. Ang pinakamaliit na pamamaraan ng mga parisukat ay naiintindihan bilang pagpapasiya ng hindi kilalang mga parameter a, b, c, ang pinagtibay na umaasa sa pagganap

Ang pinakamaliit na pamamaraan ng mga parisukat ay nangangahulugang ang pagpapasiya ng mga hindi kilalang mga parameter a, b, c, ... tinanggap na umaasa sa pag-andar

y \u003d f (x, a, b, c, ...),

na magbibigay ng isang minimum na ibig sabihin ng error na square (pagkakaiba-iba)

, (24)

kung saan ang x i, y ako ay isang hanay ng mga pares ng mga numero na nakuha mula sa eksperimento.

Dahil ang kalagayan para sa sukat ng isang pag-andar ng maraming mga variable ay ang kondisyon ng pagkakapantay-pantay sa zero ng bahagyang derivatives nito, ang mga parameter a, b, c, ...ay natutukoy mula sa sistema ng mga equation:

; ; ; … (25)

Dapat tandaan na ang pinakamaliit na pamamaraan ng mga parisukat ay ginagamit upang pumili ng mga parameter pagkatapos ng pagpapaandar y \u003d f (x) tinukoy

Kung mula sa mga pagsasaalang-alang sa teoretikal imposibleng makalabas ng anumang mga konklusyon tungkol sa kung ano ang dapat na empirical na pormula, kung gayon ang isang tao ay dapat na magabayan ng mga visual na representasyon, pangunahing isang grapikong representasyon ng naobserbahang data.

Sa pagsasagawa, madalas na limitado ang mga ito sa mga sumusunod na uri ng pag-andar:

1) guhit ;

2) quadratic a.

error:{!LANG-eececfefcade4194353233c1afc164b5!}