Iné
Ich klasifikácia Faktorová analýza sa v modernej štatistike chápe ako súbor metód, ktoré na základe reálnych súvislostí medzi znakmi, objektmi alebo javmi umožňujú identifikovať latentný

(skryté a neprístupné na priame meranie) zovšeobecňujúce charakteristiky organizovanej štruktúry a mechanizmu vývoja skúmaných javov alebo procesov.

Koncept latencie je kľúčový a znamená implicitnosť charakteristík odhalených pomocou metód faktorovej analýzy. Myšlienka faktorovej analýzy je pomerne jednoduchá. V dôsledku merania máme do činenia so súborom elementárnych znakov X i , merané na niekoľkých mierkach. toto - explicitné premenné. Ak sa znaky neustále menia, potom môžeme predpokladať existenciu určitých spoločných príčin

Keďže faktory sú kombináciou určitých premenných, vyplýva z toho, že tieto premenné spolu súvisia, t.j. majú medzi sebou koreláciu (kovarianciu), navyše väčšiu ako s inými premennými zahrnutými v inom faktore. Metódy zisťovania faktorov sú založené na použití korelačných koeficientov (kovariancie) medzi premennými. Faktorová analýza dáva netriviálne riešenie, t.j. riešenie nemožno predpovedať bez použitia špeciálnej techniky extrakcie faktorov. Toto rozhodnutie má veľký význam pre charakterizáciu javu, pretože spočiatku bol charakterizovaný pomerne veľkým počtom premenných a ako výsledok aplikácie analýzy sa ukázalo, že ho možno charakterizovať menším počtom iných premenných - faktorov. .

Nielen explicitné premenné môžu korelovať Myšlienka faktorovej analýzy je pomerne jednoduchá. V dôsledku merania máme do činenia so súborom elementárnych znakov X , ale aj pozorovateľné objekty N X. V závislosti od toho, aký typ korelácie sa uvažuje - medzi znakmi alebo objektmi - sa rozlišujú techniky spracovania údajov R a Q, resp.

V súlade so všeobecnými princípmi faktorovej analýzy je výsledok každého merania určený pôsobením všeobecných faktorov, špecifických faktorov a „faktora“ chyby merania. generál faktory, ktoré ovplyvňujú výsledky meraní na viacerých meracích škálach sa nazývajú. Každý z špecifické faktory ovplyvňujú výsledok merania len na jednej zo škál. Pod chyba merania znamená súbor dôvodov, ktoré nemožno brať do úvahy a ktoré určujú výsledky merania. Variabilita získaných empirických údajov sa zvyčajne popisuje pomocou ich rozptylu.


Už dobre viete, že korelačný koeficient sa najčastejšie používa na kvantitatívne popísanie vzťahu medzi dvoma premennými. Existuje mnoho druhov tohto koeficientu a výber primeranej miery spojenia je určený špecifikami empirických údajov a meracej stupnice.

Existuje však aj geometrická možnosť popísať vzťah medzi znakmi. Graficky možno korelačný koeficient medzi dvoma premennými znázorniť ako dva vektory – šípky, vychádzajúce z toho istého bodu. Tieto vektory sú umiestnené navzájom pod uhlom, ktorého kosínus sa rovná korelačnému koeficientu. Kosínus uhla je goniometrická funkcia, ktorej hodnotu možno nájsť v referenčnej knihe. V tejto téme sa nebudeme zaoberať goniometrickou kosínusovou funkciou, stačí vedieť, kde nájsť príslušné údaje.

Tabuľka 7.1 zobrazuje niekoľko hodnôt kosínusov uhlov, ktoré o nich poskytnú všeobecnú predstavu.

Tabuľka 7.1

Kosínusová tabuľka pre grafický obrázok

korelácie medzi premennými.

V súlade s touto tabuľkou celkovej pozitívnej korelácie ( r1) bude zodpovedať uhlu 0 ( cos 0 1), t.j. graficky to bude zodpovedať úplnej zhode oboch vektorov (pozri obr. 7.3 a).

Celková negatívna korelácia ( r -1) znamená, že oba vektory ležia na rovnakej priamke, ale sú nasmerované opačnými smermi ( cos 180 -1). (obr. 7.3 b).

Vzájomná nezávislosť premenných ( r = 0) je ekvivalentná vzájomnej kolmosti (ortogonality) vektorov ( cos 90° = 0). (obr. 7.3 c).

Medzihodnoty korelačného koeficientu sú znázornené ako dvojice vektorov tvoriacich buď ostré ( r > 0) alebo tupé ( r   0 0 , r 1  180, r -1

V 1

V 2

A b
 90, r 0   90, r  0   90, r  0

V 2

V 1
Obrázok 7.3. Geometrická interpretácia korelačných koeficientov.

Geometrický prístup k faktorovej analýze


Vyššie uvedená geometrická interpretácia korelačného koeficientu je základom pre grafické znázornenie celej korelačnej matice a následnú interpretáciu údajov vo faktorovej analýze.

Konštrukcia matice začína konštrukciou vektora reprezentujúceho akúkoľvek premennú. Ostatné premenné sú reprezentované vektormi rovnakej dĺžky, pričom všetky pochádzajú z rovnakého bodu. Ako príklad uvažujme geometrické vyjadrenie korelácií medzi piatimi premennými. (Obrázok 7.4.)


V 1

V 5 V 2

V 4
Obrázok 7.4. Geometrická interpretácia korelačnej matice (5x5).
Je jasné, že nie vždy je možné znázorniť koreláciu v dvoch rozmeroch (v rovine). Niektoré premenné vektory by museli byť v uhle k stránke. Táto skutočnosť nie je problémom pre samotné matematické postupy, vyžaduje si to však určitú predstavivosť zo strany čitateľa. Na obrázku 7.5. môžete vidieť, že korelácia medzi premennými V1 V2 je veľká a pozitívna (keďže uhly medzi týmito vektormi sú malé). Premenné V2 V3 sú od seba prakticky nezávislé, pretože uhol medzi nimi je veľmi blízky 90 , t.j. korelácia je 0. Premenné V3 - V5 spolu silne a negatívne súvisia. Vysoké korelácie medzi V1 a V2 sú dôkazom toho, že obe tieto premenné prakticky merajú rovnakú vlastnosť a že v skutočnosti možno jednu z týchto premenných vylúčiť z ďalšieho uvažovania bez významnej straty informácií. Najinformatívnejšie sú pre nás premenné, ktoré sú na sebe nezávislé, t.j. ktoré majú medzi sebou minimálne korelácie alebo uhly zodpovedajúce 90  (obr. 7.5.)

V 1

Obrázok 7.5. Geometrická interpretácia korelačnej matice
Z tohto obrázku je zrejmé, že existujú dve skupiny korelácií: V 1, V 2, V 3 a V 4, V5. Korelácie medzi premennými V 1, V 2, V 3 sú veľmi veľké a pozitívne (medzi týmito vektormi sú malé uhly a následne veľké hodnoty kosínusu). Podobne veľká a pozitívna je aj korelácia medzi premennými V 4 a V 5 . Ale medzi týmito skupinami premenných je korelácia blízka nule, keďže tieto skupiny premenných sú navzájom prakticky ortogonálne, t.j. umiestnené voči sebe v pravých uhloch. Vyššie uvedený príklad ukazuje, že existujú dve skupiny korelácií a informácie získané z týchto premenných je možné aproximovať dvomi spoločnými faktormi (F 1 a F 2), ktoré sú v tomto prípade navzájom ortogonálne. Nie vždy to však platí. Odrody faktorovej analýzy, v ktorej sa počítajú korelácie medzi faktormi, ktoré nie sú ortogonálne umiestnené, sa nazývajú šikmé riešenie. V tomto kurze však nebudeme uvažovať o takýchto prípadoch a zameriame sa výlučne na ortogonálne riešenia.

Meraním uhla medzi každým spoločným faktorom a každou spoločnou premennou možno vypočítať korelácie medzi týmito premennými a ich zodpovedajúcimi faktormi. Korelácia medzi premenným a spoločným faktorom sa zvyčajne nazýva faktor zaťaženia. Geometrický výklad tohto pojmu je uvedený na obr. 7.6.

F 2

Základné ustanovenia

Faktorová analýza je jednou z nových sekcií viacrozmernej štatistickej analýzy. Táto metóda bola pôvodne vyvinutá na vysvetlenie korelácie medzi vstupnými parametrami. Výsledkom korelačnej analýzy je matica korelačných koeficientov. Ak je počet funkcií (premenných) malý, môžete vykonať vizuálnu analýzu tejto matice. Keď sa počet znakov zvyšuje (10 alebo viac), vizuálna analýza neprinesie pozitívne výsledky. Ukazuje sa, že celú škálu korelácií možno vysvetliť pôsobením niekoľkých zovšeobecnených faktorov, ktoré sú funkciami skúmaných parametrov, pričom samotné faktory môžu byť neznáme, ale možno ich vyjadriť prostredníctvom skúmaných charakteristík. Zakladateľom faktorovej analýzy je americký vedec L. Thurstone.

Moderní štatistici chápu faktorovú analýzu ako súbor metód, ktoré na základe reálneho prepojenia medzi charakteristikami umožňujú identifikovať latentné (skryté) zovšeobecňujúce charakteristiky organizačnej štruktúry a mechanizmov vývoja skúmaných javov a procesov.

Príklad: Predpokladajme, že n áut sa hodnotí na základe 2 kritérií:

x 1 – cena auta,

x 2 – dĺžka životnosti motora.

Za predpokladu, že x 1 a x 2 sú korelované, v súradnicovom systéme sa objaví usmernený a pomerne hustý zhluk bodov, formálne zobrazený novými osami a (obr. 5).

Obr.6

Funkcia F 1 a F 2 je, že prechádzajú cez husté zhluky bodov a následne korelujú s x 1 x 2.Maximálne

počet nových osí sa bude rovnať počtu elementárnych prvkov. Ďalší vývoj faktorovej analýzy ukázal, že túto metódu možno úspešne použiť v problémoch zoskupovania a klasifikácie objektov.

Prezentácia informácií vo faktorovej analýze.

Na vykonanie faktorovej analýzy musia byť informácie prezentované vo forme matice veľkosti m x n:

Riadky matice zodpovedajú objektom pozorovania (i=) a stĺpce zodpovedajú prvkom (j=).

Vlastnosti, ktoré charakterizujú objekt, majú rôzne rozmery. Aby sa dostali do rovnakej dimenzie a zabezpečila sa porovnateľnosť funkcií, matica zdrojových údajov sa zvyčajne normalizuje zavedením jednej stupnice. Najbežnejšou metódou normalizácie je štandardizácia. Od premenných prejdite k premenným

Priemerná hodnota j znamenie,

Smerodajná odchýlka.

Táto transformácia sa nazýva štandardizácia.

Základný model faktorovej analýzy

Základný model faktorovej analýzy má tvar:

z j – j- znak (náhodná hodnota);

F 1 , F 2 , ..., F p– všeobecné faktory (náhodné, normálne rozdelené hodnoty);

u j– charakteristický faktor;

j1 , j2 , …, jp zaťažujúce faktory charakterizujúce významnosť vplyvu každého faktora (určia sa parametre modelu);

Všeobecné faktory sú nevyhnutné pre analýzu všetkých charakteristík. Charakteristické faktory ukazujú, že sa vzťahuje len na danú charakteristiku, ide o špecifickosť charakteristiky, ktorú nemožno vyjadriť prostredníctvom faktorov. Zaťaženia faktorov j1 , j2 , …, jp charakterizovať veľkosť vplyvu jedného alebo druhého všeobecného faktora na variáciu danej charakteristiky. Hlavnou úlohou faktorovej analýzy je určiť faktorové zaťaženie. Rozptyl S j 2 každej charakteristiky možno rozdeliť na 2 zložky:

    prvá časť určuje pôsobenie všeobecných faktorov - zhodnosť h j 2;

    druhá časť určuje pôsobenie charakteristického činiteľa - charakteristika - d j 2.

Všetky premenné sú prezentované v štandardizovanej forme, teda rozptyl - štátny znak S j2 = 1.

Ak všeobecné a charakteristické faktory navzájom nekorelujú, potom rozptyl j-tej charakteristiky možno znázorniť ako:

kde je podiel rozptylu vlastností, ktorý možno pripísať k- faktor.

Celkový príspevok ktoréhokoľvek faktora k celkovému rozptylu sa rovná:

Príspevok všetkých spoločných faktorov k celkovému rozptylu:

Je vhodné prezentovať výsledky faktorovej analýzy vo forme tabuľky.

Zaťaženia faktorov

Spoločné znaky

a 11 a 21 ... a p1

a 12 a 22 a p2

… … … …

a 1 m a 2 m a popoludní

faktory

V 1 V 2 ... V p

A- matica faktorových zaťažení. Dá sa získať rôznymi spôsobmi v súčasnosti najpoužívanejšou metódou je metóda hlavných komponentov alebo hlavných faktorov.

Postup výpočtu metódy hlavného faktora.

Riešenie problému pomocou hlavných komponentov spočíva v postupnej transformácii matice zdrojových údajov X :

Myšlienka faktorovej analýzy je pomerne jednoduchá. V dôsledku merania máme do činenia so súborom elementárnych znakov- matica zdrojových údajov;

Z– matica štandardizovaných hodnôt vlastností,

R– matica párových korelácií:

Diagonálna matica vlastných (charakteristických) čísel,

j nájdené riešením charakteristickej rovnice

E- matica identity,

 j – indikátor disperzie každej hlavnej zložky,

podlieha štandardizácii zdrojových údajov, potom = m

U– matica vlastných vektorov, ktoré nájdeme z rovnice:

V skutočnosti to znamená riešenie m sústavy lineárnych rovníc pre každú z nich

Tie. Každá vlastná hodnota zodpovedá sústave rovníc.

Potom nájdu V- matica normalizovaných vlastných vektorov.

Matica mapovania faktorov A sa vypočíta pomocou vzorca:

Potom nájdeme hodnoty hlavných komponentov pomocou jedného z ekvivalentných vzorcov:

Súbor štyroch priemyselných podnikov bol hodnotený podľa troch charakteristických znakov:

    priemerná ročná produkcia na zamestnanca x 1;

    úroveň ziskovosti x 2;

Úroveň kapitálovej produktivity x 3.

Výsledok je prezentovaný v štandardizovanej matici Z:

Podľa matrice Z bola získaná matica párových korelácií R:

    Nájdite determinant párovej korelačnej matice (napríklad pomocou Faddeevovej metódy):

    Zostavme charakteristickú rovnicu:

    Vyriešením tejto rovnice zistíme:

Počiatočné elementárne charakteristiky x 1, x 2, x 3 teda možno zovšeobecniť hodnotami troch hlavných komponentov a:

F 1 vysvetľuje približne všetky variácie,

F 2 -, a F 3 -

Všetky tri hlavné zložky vysvetľujú variácie úplne na 100 %.

Pri riešení tohto systému zistíme:

Systémy pre  2 a  3 sú konštruované podobne. Pre  2 systémové riešenie:

Matica vlastného vektora U má podobu:

    Každý prvok matice vydelíme súčtom druhých mocnín prvkov j-tej

dostaneme normalizovanú maticu V.

Všimnite si, že musí byť splnená rovnosť = E.

    Maticu faktorového mapovania získame z maticového vzťahu

=

Význam každého prvku matice A predstavuje parciálne koeficienty korelačnej matice medzi pôvodným znakom x j a hlavné zložky F r. Preto všetky prvky.

Rovnosť znamená podmienku r- počet komponentov.

Celkový príspevok každého faktora k celkovému rozptylu charakteristík sa rovná:

Model faktorovej analýzy bude mať podobu:

Nájdite hodnoty hlavných komponentov (matice F) podľa vzorca

Stred rozloženia hodnôt hlavných komponentov je v bode (0,0,0).

Po rozhodnutí o počte významných znakov a hlavných komponentov a určení názvov hlavných komponentov nasledujú analytické závery na základe výsledkov výpočtu. Úlohy rozpoznávania hlavných komponentov a určovania ich mien sa riešia subjektívne na základe váhových koeficientov z mapovacej matice. A.

Zoberme si otázku formulácie názvov hlavných komponentov.

Označme w 1 – súbor nevýznamných váhových koeficientov, ktorý obsahuje prvky blízke nule,

w 2 - súbor významných váhových koeficientov,

w 3 – podmnožina významných váhových koeficientov, ktoré sa nezúčastňujú na tvorbe názvu hlavného komponentu.

w 2 - w 3 – podmnožina váhových koeficientov podieľajúcich sa na tvorbe názvu.

Pre každý hlavný faktor vypočítame koeficient obsahu informácie

Súbor vysvetliteľných znakov považujeme za vyhovujúci, ak hodnoty koeficientov informatívnosti ležia v rozmedzí 0,75-0,95.

a 11 =0,776 a 12 =-0,130 a 13 =0,308

a 12 =0,904 a 22 =-0,210 a 23 =-0,420

A 31 =0,616 A 32 =0,902 A 33 =0,236

Pre j=1 w 1 = ,w 2 ={a 11 ,a 21 ,a 31 },

.

Pre j=2 w 1 ={a 12 ,a 22 }, w 2 ={ A 32 },

Pre j=3 w 1 ={A 33 }, w 2 ={a 13 ,a 33 },

Hodnoty funkcií x 1 , x 2 , x 3 sa určí zloženie hlavnej zložky na 100 %. v tomto prípade najväčší prínos funkcie x 2, ktorého významom je ziskovosť. správne pre názov atribútu F 1 bude efektívnosť výroby.

F 2 je určená zložkou x 3 (produktivita kapitálu), nazvime to efektívnosť využívania fixných výrobných aktív.

F 3 určený komponentmi x 1 ,x 2 – nemožno pri analýze zohľadniť, pretože vysvetľuje len 10 % z celkovej variácie.

Literatúra.

    Popov A.A.

Excel: Praktická príručka, DES COM.-M.-2000.

    Dyakonov V.P., Abramenkova I.V. Mathcad7 v matematike, fyzike a internete.

    Vydavateľstvo "Nomidzh", M.-1998, sekcia 2.13.

    Vykonávanie regresie.

    L.A.

Soshniková, V.N. Tomashevich a kol. Viacrozmerná štatistická analýza v ekonómii, ed. V.N. Tomaševič - M. -Nauka, 1980.

Kolemaev V.A., O.V. Staroverov, V.B. Turundaevsky Teória pravdepodobnosti a matematická štatistika. –M. – Vyššia škola - 1991.

Do Iberly. Faktorová analýza.-M. Štatistika - 1980.

Porovnanie dvoch normálnych populačných priemerov, ktorých rozptyly sú známe

Nech sú všeobecné populácie X a Y normálne rozdelené a ich rozptyly sú známe (napríklad z predchádzajúcich skúseností alebo zistené teoreticky). Na základe nezávislých vzoriek objemov n a m, extrahovaných z týchto populácií, sa našli priemery vzoriek x in a y in.

Na testovanie nulovej hypotézy je potrebné použiť priemer vzorky na danej hladine významnosti, čo je, že všeobecné priemery (matematické očakávania) uvažovaných populácií sa navzájom rovnajú, t. j. H 0: M(X) = M( Y).

Vzhľadom na to, že výberové priemery sú nezaujaté odhady všeobecných priemerov, t. j. M(x in) = M(X) a M(y in) = M(Y), nulovú hypotézu možno zapísať takto: H 0: M(x v ) = M(y in).

Ako test nulovej hypotézy použijeme náhodnú premennú.

Kritérium Z je normalizovaná normálna náhodná premenná. Hodnota Z je skutočne normálne rozdelená, pretože ide o lineárnu kombináciu normálne rozdelených hodnôt X a Y; tieto hodnoty samy osebe sú normálne rozdelené ako priemer vzoriek nájdených zo vzoriek odobratých zo všeobecných populácií; Z je normalizovaná hodnota, pretože M(Z) = 0, ak je nulová hypotéza pravdivá, D(Z) = 1, pretože vzorky sú nezávislé.

Kritická oblasť je konštruovaná v závislosti od typu konkurenčnej hypotézy.

Prvý prípad.

Nulová hypotéza H0:M(X)=M(Y).

Konkurenčná hypotéza H 1: M(X) ¹M(Y).

V tomto prípade je obojstranná kritická oblasť skonštruovaná na základe požiadavky, že pravdepodobnosť, že kritérium spadne do tejto oblasti, za predpokladu, že nulová hypotéza je pravdivá, sa rovná prijatej hladine významnosti.< zлев.кр)=a¤2,

Najväčšia sila kritéria (pravdepodobnosť, že kritérium spadne do kritickej oblasti, ak je konkurenčná hypotéza pravdivá) sa dosiahne vtedy, keď sa „ľavý“ a „pravý“ kritický bod vyberú tak, že pravdepodobnosť, že kritérium bude spadať do každého intervalu kritickej oblasti sa rovná:

P(Z

P(Z > zright.cr)=a¤2.

(1)< -zкр, Z >Keďže Z je normalizovaná normálna veličina a rozdelenie takejto veličiny je symetrické okolo nuly, kritické body sú symetrické okolo nuly.

Ak teda označíme pravú hranicu obojstrannej kritickej oblasti zcr, potom ľavá hranica je zcr.

Stačí teda nájsť správnu hranicu na nájdenie samotnej obojstrannej kritickej oblasti Z< Z

zcr a oblasť prijatia nulovej hypotézy (-zcr, zcr).< Z < zкр)+Р(Z >Ukážme si, ako nájsť zcr - pravú hranicu obojstrannej kritickej oblasti pomocou Laplaceovej funkcie Ф(Z). Je známe, že Laplaceova funkcia určuje pravdepodobnosť normalizovanej normálnej náhodnej premennej, napríklad Z, spadajúcej do intervalu (0;z):

P(0

Keďže rozdelenie Z je symetrické okolo nuly, pravdepodobnosť, že Z spadne do intervalu (0; ¥) sa rovná 1/2.

Potom je obojstranná kritická oblasť určená nerovnosťami Z< – zкр, Z >zcr alebo ekvivalentná nerovnosť ½Z½ > zcr a rozsah prijatia nulovej hypotézy nerovnicou – zcr< Z < zкр или равносильным неравенством çZ ç< zкр.

Označme hodnotu kritéria vypočítaného z pozorovacích údajov zobserved a sformulujme pravidlo na testovanie nulovej hypotézy.

Pravidlo.

1. Vypočítajte pozorovanú hodnotu kritéria

2. Pomocou tabuľky Laplaceovej funkcie nájdite kritický bod podľa rovnosti Ф(zкр)=(1-a)/2.

3. Ak ç zpozorované ç< zкр – нет оснований отвергнуть нулевую гипотезу.

Ak ç zob ç> zcr, nulová hypotéza sa zamietne.

Druhý prípad.

Nulová hypotéza H0: M(X)=M(Y). Konkurenčná hypotéza H1: M(X)>M(Y).

V praxi k takémuto prípadu dochádza, ak odborné úvahy naznačujú, že všeobecný priemer jednej populácie je väčší ako všeobecný priemer inej populácie. Ak sa napríklad zavedie zlepšenie technologického procesu, potom je prirodzené predpokladať, že to povedie k zvýšeniu produkcie produktu.

V tomto prípade je pravostranná kritická oblasť vytvorená na základe požiadavky, že pravdepodobnosť, že kritérium spadajúce do tejto oblasti, za predpokladu, že nulová hypotéza je pravdivá, sa rovná prijatej hladine významnosti:

P(Z> zcr)=a.

(3) Ukážme si, ako nájsť zcr - pravú hranicu obojstrannej kritickej oblasti pomocou Laplaceovej funkcie Ф(Z). Je známe, že Laplaceova funkcia určuje pravdepodobnosť normalizovanej normálnej náhodnej premennej, napríklad Z, spadajúcej do intervalu (0;z):

Ukážme si, ako nájsť kritický bod pomocou Laplaceovej funkcie. Použime vzťah

P(0< zкр.

Pravidlo.

Na základe (2) a (3) máme Ф(zкр)+a=1/2.

Preto Ф(zкр)=(1-2a)/2.

Z toho vyvodíme, že na nájdenie hranice pravostrannej kritickej oblasti (zcr) stačí nájsť hodnotu Laplaceovej funkcie rovnú (1-2a)/2. Potom je pravá kritická oblasť určená nerovnosťou Z > zcr a oblasť, kde je akceptovaná nulová hypotéza, je určená nerovnosťou Z< z кр – нет оснований отвергнуть нулевую гипотезу. Если Z набл >1. Vypočítajte pozorovanú hodnotu kritéria zob.

2. Pomocou tabuľky Laplaceovej funkcie nájdite kritický bod z rovnosti Ф(zкр)=(1-2a)/2. 3. Ak Z obs.

z cr – zamietame nulovú hypotézu.

Tretí prípad.< z’кр)=a, т.е. z’кр= – zкр. Таким образом, для того чтобы найти точку z’кр, достаточно сначала найти “вспомогательную точку” zкр а затем взять найденное значение со знаком минус. Тогда левосторонняя критическая область определяется неравенством Z < -zкр, а область принятия нулевой гипотезы – неравенством Z >Nulová hypotéza H0: M(X)=M(Y). Konkurenčná hypotéza H1: M(X)

Pravidlo.

V tomto prípade je ľavostranná kritická oblasť skonštruovaná na základe požiadavky, predpokladá sa pravdepodobnosť, že kritérium spadá do tejto oblasti

platnosť nulovej hypotézy sa rovnala akceptovanej hladine významnosti P(Z

-zcr.

1. Vypočítajte Zob.< -zкр, – нулевую гипотезу отвергают.

Všetky ekonomické procesy podnikov sú vzájomne prepojené a vzájomne závislé. Niektoré z nich spolu priamo súvisia, niektoré sa objavujú nepriamo. Dôležitou otázkou v ekonomickej analýze je teda posúdenie vplyvu faktora na konkrétny ekonomický ukazovateľ a na tento účel sa používa faktorová analýza.

Faktorová analýza podniku. Definícia. Ciele. Druhy

Faktorová analýza označuje vo vedeckej literatúre sekciu viacrozmernej štatistickej analýzy, kde sa hodnotenie pozorovaných premenných vykonáva pomocou kovariančných alebo korelačných matíc.

Faktorová analýza bola prvýkrát použitá v psychometrii av súčasnosti sa používa takmer vo všetkých vedách, od psychológie po neurofyziológiu a politológiu. Základné koncepty faktorovej analýzy definoval anglický psychológ Galton a potom ich vyvinuli Spearman, Thurstone a Cattell.

Môžete si vybrať 2 ciele faktorovej analýzy:
– určenie vzťahu medzi premennými (klasifikácia).
– zníženie počtu premenných (zhlukovanie).

Faktorová analýza podniku– komplexná metodika na systematické skúmanie a hodnotenie vplyvu faktorov na hodnotu ukazovateľa výkonnosti.

Je možné rozlíšiť nasledovné typy faktorovej analýzy:

  1. Funkčný, kde efektívny ukazovateľ je definovaný ako súčin alebo algebraický súčet faktorov.
  2. Korelácia (stochastická) – vzťah medzi ukazovateľom výkonnosti a faktormi je pravdepodobnostný.
  3. Priame / Reverzné – od všeobecného k špecifickému a naopak.
  4. Jednostupňový/viacstupňový.
  5. Retrospektívne/perspektívne.

Pozrime sa na prvé dva podrobnejšie.

Aby bolo možné uskutočniť je potrebná faktorová analýza:
– Všetky faktory musia byť kvantitatívne.
– Počet faktorov je 2-krát väčší ako ukazovatele výkonnosti.
– Homogénna vzorka.
– Normálne rozdelenie faktorov.

Faktorová analýza realizované v niekoľkých etapách:
1. fáza Faktory sú vybrané.
2. fáza Faktory sú klasifikované a systematizované.
3. fáza Modeluje sa vzťah medzi ukazovateľom výkonnosti a faktormi.
4. fáza Posúdenie vplyvu každého faktora na ukazovateľ výkonnosti.
5. fáza. Praktické využitie modelu.

Rozlišujú sa metódy deterministickej faktorovej analýzy a metódy stochastickej faktorovej analýzy.

Deterministická faktorová analýza– štúdia, v ktorej faktory funkčne ovplyvňujú ukazovateľ výkonnosti. Metódy deterministickej faktorovej analýzy - metóda absolútnych rozdielov, metóda logaritmu, metóda relatívnych rozdielov. Tento typ analýzy je najbežnejší vďaka svojmu jednoduchému použitiu a umožňuje vám pochopiť faktory, ktoré je potrebné zmeniť, aby sa ukazovateľ výkonu zvýšil/znížil.

Stochastická faktorová analýza– štúdia, v ktorej faktory ovplyvňujú ukazovateľ výkonnosti pravdepodobnostne, t.j. keď sa faktor zmení, môže existovať niekoľko hodnôt (alebo rozsah) výsledného ukazovateľa. Metódy stochastickej faktorovej analýzy - teória hier, matematické programovanie, viacnásobná korelačná analýza, maticové modely.

Zadanie na samostatnú projektovú prácu v disciplíne Psychologický workshop č.5 (SPSS).

Predmet:"Faktorová analýza".

Dokončené:

študent 4. ročníka

Sociálno-psychologické

fakulty

(denné oddelenie)

Laletina Svetlana Valerievna

Faktorová analýza.

1.1 Definícia štatistického postupu.

Štatistická metóda, ktorá sa používa pri spracovaní veľkého množstva experimentálnych údajov. Súbor analytických metód, ktoré umožňujú identifikovať skryté latentné znaky, ako aj dôvody ich výskytu a vnútorné vzorce ich vzťahu.

Ciele faktorovej analýzy sú:

* zníženie počtu premenných,

* určenie štruktúry vzťahov medzi premennými, t.j. klasifikácia premenných.

Faktorová analýza sa preto používa ako metóda redukcie údajov alebo ako metóda štrukturálnej klasifikácie.

Dôležitým rozdielom medzi faktorovou analýzou a všetkými ostatnými metódami je, že ju nemožno použiť na spracovanie primárnych, alebo, ako sa hovorí, „surových“ experimentálnych údajov, t. získané priamo zo skúšky predmetov. Materiálom pre faktorovú analýzu sú korelácie, presnejšie Pearsonove korelačné koeficienty, ktoré sú vypočítané medzi premennými zahrnutými v prieskume. Inými slovami, korelačné matice sú podrobené faktorovej analýze.

Používa sa na navrhovanie testov a metód; študovať akékoľvek experimentálne pozorovania, ich štruktúru na základe vonkajších znakov.

Hlavným konceptom faktorovej analýzy je faktor. Ide o umelý štatistický ukazovateľ, ktorý vzniká ako výsledok špeciálnych transformácií tabuľky korelačných koeficientov medzi skúmanými psychologickými charakteristikami, prípadne korelačnej matice. V dôsledku faktorizácie možno z korelačnej matice extrahovať iný počet faktorov až do počtu, ktorý sa rovná počtu pôvodných premenných. Faktory identifikované ako výsledok faktorizácie však spravidla nemajú rovnakú dôležitosť.

Metóda umožňuje formulovať hypotézy týkajúce sa prírodných procesov, ktoré sú súčasťou meranej vlastnosti. Faktorová analýza tiež umožňuje stanoviť pre veľký počet charakteristík úzky súbor vlastností, ktoré charakterizujú vzťah medzi charakteristikami a faktormi.

Faktorová analýza má 4 fázy:

1. výpočet korelačnej matice pre všetky premenné zahrnuté do analýzy,

2. extrakcia faktora,

3. rotácia faktorov na vytvorenie zjednodušenej štruktúry,

4. interpretácia faktorov.

1.2 Vzorec, normy, aplikácia.



Všetky moderné štatistické balíky majú programy na koreláciu a faktorovú analýzu. Počítačový program faktorovej analýzy sa v podstate pokúša „vysvetliť“ korelácie medzi premennými z hľadiska malého počtu faktorov.

Príklad faktorovej matice:

Variabilné Faktor 1 Faktor 2
V 1 0,91 0,01
V 2 0,20 0,96
V 3 0,94 - 0,15

Z matice je vidieť, že korelácia medzi premennou V 1 a prvým faktorom = 0,91. Čím vyššie je zaťaženie faktorom, tým väčší je jeho vzťah s faktorom.

Existuje jedna zásadne dôležitá vlastnosť korelačného koeficientu, vďaka ktorej sa zostavujú popisné charakteristiky. Koeficient štvorcovej korelácie ukazuje, aká veľká časť variácie (variability) vlastnosti je zdieľaná medzi dvoma premennými, alebo, jednoduchšie povedané, do akej miery sa tieto premenné prekrývajú. Napríklad 2 premenné s koreláciou 0,9 sa prekrývajú do stupňa 0,9 * 0,9 = 0,81. Tie. 81 % rozptylu oboch premenných je spoločných, t.j. zápas.

Ak chcete vypočítať vlastné hodnoty faktora 1, umocnite zaťaženie faktorov a pridajte ich do stĺpca. 0,91*0,91 + 0,20*0,20 + 0,94*0,94 = 1,7517. Ak sa vlastná hodnota faktora vydelí počtom premenných, výsledné číslo bude udávať, aká veľká časť rozptylu je vysvetlená týmto faktorom. 1,7517:3 = 0,5839. Faktor 1 vysvetľuje približne 58 % informácií.

KMO - Koeficient charakterizujúci mieru použiteľnosti faktorovej analýzy pre danú vzorku.

0,9 a viac – bezpodmienečná primeranosť,

0,8 – vysoká použiteľnosť,



0,7 – prijateľné,

0,6 – uspokojivé,

0,5 – nízka,

Faktorová analýza menšia ako 0,5 nie je pre túto vzorku prijateľná.

Hodnota Bartletta musí byť aspoň 0,05.

Podmienky použitia faktorovej analýzy:

1. nie je možné faktorizovať kvalitatívne údaje získané na škále mien, napríklad farba vlasov, farba očí atď.

2. všetky premenné musia byť nezávislé a ich rozdelenie sa musí približovať k normálu.

3. vzťahy medzi premennými by mali byť približne lineárne alebo nie jasne krivočiare,

4. v pôvodnej korelačnej matici by malo byť niekoľko korelácií s modulom vyšším ako 0,3. V opačnom prípade je ťažké extrahovať akékoľvek faktory z matrice.

5. Vzorka subjektov by mala byť dostatočne veľká (najlepšie 100 subjektov).


Téma výskumu:

Fungovanie akéhokoľvek sociálno-ekonomického systému (ktorý zahŕňa fungujúci podnik) prebieha v podmienkach komplexnej interakcie komplexu vnútorných a vonkajších faktorov. Faktor- to je príčina, hybná sila procesu alebo javu, určujúca jeho charakter alebo jeden z jeho hlavných znakov.

Pod faktorovou analýzou rozumie metodike komplexného a systematického štúdia a merania vplyvu faktorov na hodnotu ukazovateľov výkonnosti.

Vo všeobecnosti možno rozlíšiť tieto hlavné: etapy (úlohy) faktorová analýza:

    Stanovenie účelu analýzy.

    Výber faktorov, ktoré určujú sledované ukazovatele výkonnosti.

    Klasifikácia a systematizácia faktorov s cieľom poskytnúť integrovaný a systematický prístup k štúdiu ich vplyvu na výsledky hospodárskej činnosti.

    Určenie formy závislosti medzi faktormi a ukazovateľom výkonnosti.

    Modelovanie vzťahov medzi výkonnostnými a faktorovými ukazovateľmi.

    Výpočet vplyvu faktorov a posúdenie úlohy každého z nich pri zmene hodnoty ukazovateľa výkonnosti.

Práca s faktorovým modelom (jeho praktické využitie pre riadenie ekonomických procesov).

Inými slovami, metóda úloha- prechod od skutočne veľkého počtu znakov alebo príčin určujúcich pozorovanú variabilitu k malému počtu najdôležitejších premenných (faktorov) s minimálnou stratou informácie (metódy, ktoré sú v podstate podobné, ale nie z matematického hľadiska - analýza komponentov, kanonické analýza atď.).

Metóda vznikla a spočiatku sa rozvíjala v problémoch psychológie a antropológie (na prelome 19. a 20. storočia), ale v súčasnosti je rozsah jej aplikácie oveľa širší.

Účel faktorovej analýzy

Faktorová analýza- zisťovanie vplyvu faktorov na výsledok - je jedným z najsilnejších metodických riešení pri analýze ekonomických aktivít podnikov pre rozhodovanie. Pre manažérov - ďalší argument, ďalší „uhol pohľadu“.

Možnosť použitia faktorovej analýzy

Ako viete, všetko môžete analyzovať donekonečna. V prvej fáze sa odporúča vykonať analýzu odchýlok a tam, kde je to potrebné a opodstatnené, použiť metódu faktorovej analýzy. V mnohých prípadoch stačí jednoduchá analýza odchýlok, aby sme pochopili, že odchýlka je „kritická“ a kedy vôbec nie je potrebné poznať mieru jej vplyvu.

Faktory sa delia na vnútorné a vonkajšie v závislosti od toho, či ich činnosť daného podniku ovplyvňuje alebo nie. Analýza sa zameriava na interné faktory, ktoré môže podnik ovplyvniť.

Faktory sa delia na cieľ, nezávislý od vôle a túžob ľudí, a subjektívny, ovplyvnené činnosťou právnických a fyzických osôb.

Podľa stupňa prevalencie sa faktory delia na všeobecné a špecifické. Spoločné faktory pôsobia vo všetkých odvetviach hospodárstva. Špecifické faktory pôsobia v rámci určitého odvetvia alebo konkrétneho podniku.

Typy faktorovej analýzy

Existujú nasledujúce typy faktorovej analýzy:

1) Deterministický (funkčný) – efektívny ukazovateľ je prezentovaný vo forme súčinu, kvocientu alebo algebraického súčtu faktorov.

2) Stochastické (korelačné) - vzťah medzi efektívnym a faktorovým ukazovateľom je neúplný alebo pravdepodobnostný.

3) Priame (deduktívne) – od všeobecného ku konkrétnemu.

4) Reverzný (induktívny) – od konkrétneho k všeobecnému.

5) Jednostupňové a viacstupňové.

6) Statické a dynamické.

7) Retrospektívne a perspektívne.

V závislosti od typu faktorového modelu existujú dva hlavné typy faktorovej analýzy - deterministické a stochastické.

Deterministická faktorová analýza je technika na štúdium vplyvu faktorov, ktorých spojenie s efektívnym ukazovateľom je funkčného charakteru, to znamená, keď efektívny ukazovateľ faktorového modelu je prezentovaný vo forme súčinu, kvocientu alebo algebraického súčtu faktorov.

Tento typ faktorovej analýzy je najbežnejší, pretože je pomerne jednoduchý na používanie (v porovnaní so stochastickou analýzou) a umožňuje vám pochopiť logiku pôsobenia hlavných faktorov rozvoja podniku, kvantifikovať ich vplyv, pochopiť, ktoré faktory a v akom pomere je možné a vhodné meniť pre zvýšenie efektivity výroby.

Deterministická faktorová analýza má pomerne prísnu postupnosť postupov:

1.vybudovanie ekonomicky zdravého modelu deterministických faktorov;

2. výber metódy faktorovej analýzy a príprava podmienok na jej realizáciu;

3.implementácia postupov počítania pre modelovú analýzu;

Základné metódy deterministickej faktorovej analýzy

Metóda nahradenia reťazca; Metóda absolútneho rozdielu; Metóda relatívneho rozdielu;

Integrálna metóda; Logaritmická metóda. Stochastická analýza je metodika štúdia faktorov, ktorých spojenie s ukazovateľom výkonnosti je na rozdiel od funkčného neúplné a pravdepodobnostné (korelácia). Podstatou stochastickej metódy je meranie vplyvu stochastických závislostí s neistými a približnými faktormi. Stochastická metóda

Je vhodné použiť pre ekonomický výskum s neúplnou (pravdepodobnostnou) koreláciou: napríklad pri marketingových problémoch. Ak pri funkčnej (úplnej) závislosti so zmenou argumentu vždy dôjde k zodpovedajúcej zmene funkcie, potom s korelačným spojením môže zmena argumentu poskytnúť niekoľko hodnôt zvýšenia funkcie v závislosti od kombinácie. iných faktorov, ktoré určujú tento ukazovateľ. Napríklad produktivita práce na rovnakej úrovni pomeru kapitálu a práce môže byť v rôznych podnikoch odlišná. To závisí od optimálnej kombinácie ďalších faktorov ovplyvňujúcich tento ukazovateľ.:

Stochastické modelovanie je do určitej miery doplnkom a prehĺbením deterministickej faktorovej analýzy.

Vo faktorovej analýze sa tieto modely používajú podľa troch hlavných

Je potrebné študovať vplyv komplexných faktorov, ktoré nemožno vyjadriť v jednom kvantitatívnom ukazovateli (napríklad úroveň vedecko-technického pokroku).

Tiež je potrebné rozlišovať statické A dynamický faktorová analýza. Prvý typ sa používa pri štúdiu vplyvu faktorov na ukazovatele výkonnosti k príslušnému dátumu.

Ďalším typom je technika na štúdium vzťahov príčin a následkov v dynamike. Nakoniec môže byť faktorová analýza retrospektíva, ktorý skúma dôvody nárastu ukazovateľov výkonnosti za minulé obdobia a sľubný,

ktorá skúma správanie faktorov a ukazovateľov výkonnosti v perspektíve. Faktorová analýza môže byť jednostupňová alebo viacstupňová

. Prvý typ sa používa na štúdium faktorov iba jednej úrovne (jednej úrovne) podriadenosti bez toho, aby sa podrobne rozdelili na ich jednotlivé časti. Napríklad . Vo viacstupňovej faktorovej analýze sú faktory a a b podrobne rozpísané na jednotlivé prvky, aby sa študovalo ich správanie. V popise faktorov možno pokračovať ďalej. V tomto prípade sa študuje vplyv faktorov na rôznych úrovniach podriadenosti.