statistika je vědní obor, který vykresluje různé nástroje a analytické techniky, aby se vypořádal s obrovským rozsahem dat, jednoduše řečeno, je to věda o sestavování, klasifikaci, analýze a interpretaci & projevující číselnou formu dat pro vyvozování závěrů o populaci, z vybraných vzorových dat, která mohou být použita obchodními odborníky k řešení jejich problémů.
proto se ve snaze uspořádat data a předvídat budoucí trendy v závislosti na informacích mnoho organizací silně spoléhá na statistickou analýzu.
přesněji řečeno, statistická analýza dat se týká sběru, interpretace a prezentace dat. Při manipulaci s daty lze přistupovat k řešení složitých problémů. Přesněji řečeno, statistická analýza přináší význam nevýznamným / irelevantním údajům nebo číslům.
klíčové typy statistické analýzy jsou
statistická analýza je zejména proces konsolidace a analýzy odlišných vzorků dat za účelem prozrazení vzorců nebo trendů a předvídání budoucích událostí/situací za účelem přijetí vhodných rozhodnutí.
statistická analýza má následující typy, které značně závisí na datových typech.
7 typy statistické analýzy
1. Popisná Statistická analýza
v zásadě se zabývá organizováním a shrnutím dat pomocí čísel a grafů. Usnadňuje obrovské množství dat pro srozumitelnou interpretaci i bez vytváření závěrů nad rámec analýzy nebo reakce na jakékoli hypotézy.
místo zpracování dat v surové formě nám deskriptivní statistická analýza umožňuje efektivněji reprezentovat a interpretovat data pomocí numerických výpočtů, grafů nebo tabulek.
od všech nezbytných přípravných kroků až po závěrečnou analýzu a interpretaci zahrnuje popisná statistická analýza různé procesy, jako je tabulka, míra centrální tendence (průměr, medián, režim), míra rozptylu nebo rozptylu (rozsah, variace, směrodatná odchylka), měření šikmosti a analýza časových řad.
Vzorcový graf, zdroj
pod popisnou analýzou jsou data shrnuta v tabulkové formě a spravována & prezentována ve formě grafů a grafů pro sčítání dat, za předpokladu, že je pro celou populaci.
(nejvíce související: Popisná statistika v R)
navíc pomáhá při extrahování odlišných charakteristik dat a při shrnutí a vysvětlení základních vlastností dat. A co víc, nejsou čerpány žádné poznatky týkající se skupin, které nejsou pozorovány / vzorkovány.
2. Inferenční Statistická analýza
inferenční statistická analýza se v zásadě používá, když kontrola každé jednotky z populace není dosažitelná, a proto extrapoluje získané informace na celou populaci.
jednoduše řečeno, inferenční statistická analýza nám umožňuje otestovat hypotézu v závislosti na vzorových datech, ze kterých můžeme extrahovat závěry pomocí pravděpodobností a zobecnit celá data, a také můžeme učinit závěry s ohledem na budoucí výsledky nad rámec dostupných údajů.
tímto způsobem je velmi výhodné při vyvozování závěrů a rozhodování o celé populaci na základě vzorových údajů. Jako takový, tato metoda zahrnuje teorii vzorkování, různé testy významnosti, Statistická kontrola atd.
popisná vs inferenční Statistická analýza
3. Prediktivní analýza
prediktivní analýza je implementována tak, aby předpověděla budoucí události nebo to, co se pravděpodobně bude konat dále, na základě současných a minulých faktů a čísel.
jednoduše řečeno, prediktivní analytika používá statistické techniky a algoritmy strojového učení k popisu možnosti budoucích výsledků, chování a trendů v závislosti na nedávných a předchozích datech. Široce používané techniky v rámci prediktivní analýzy zahrnují dolování dat, modelování dat, umělou inteligenci, strojové učení atd. dělat imperativní předpovědi.
v současném obchodním systému je tato analýza oslovena marketingovými společnostmi, pojišťovacími organizacemi, poskytovateli online služeb, marketingem založeným na datech a finančními společnostmi, avšak jakýkoli podnik ji může využít plánováním nepředvídatelné budoucnosti, jako je získání konkurenční výhody a zúžení rizika spojeného s nepředvídatelnou budoucí událostí.
prediktivní analýza konverguje k předpovídání nadcházejících událostí pomocí dat a zjišťování pravděpodobnosti několika trendů v chování dat. Proto podniky používají tento přístup k získání odpovědi „co se může stát?“kde základem tvorby předpovědí je míra pravděpodobnosti.
4. Normativní analýza
normativní analýza zkoumá data s cílem zjistit, co je třeba udělat, je široce používán v obchodní analýze pro identifikaci nejlepšího možného opatření pro situaci.
zatímco jiná statistická analýza může být použita pro vyloučení z řízení, poskytuje skutečnou odpověď. V zásadě se zaměřuje na objevování optimálního návrhu pro proces rozhodování.
několik technik, implementovaných v rámci normativní analýzy, jsou simulace, analýza grafů, algoritmy, komplexní zpracování událostí, strojové učení, motor doporučení, obchodní pravidla atd.
téměř však souvisí s popisnou a prediktivní analýzou, kde deskriptivní analýza vysvětluje data z hlediska toho, co se stalo, prediktivní analýza předvídá, co by se mohlo stát, a zde se normativní analýza zabývá poskytováním vhodných návrhů mezi dostupnými preferencemi.
5. Exploratory Data Analysis (EDA)
Exploratory data analysis, nebo EDA, jak je známo, je protějškem inferenční statistiky a je velmi implementován odborníky na data. Je to obecně první krok procesu analýzy dat, který se provádí před jinými technikami statistické analýzy.
EDA není nasazen sám pro předpovídání nebo zobecnění, poskytuje náhled dat a pomáhá při získávání některých klíčových poznatků.
tato metoda se plně zaměřuje na analýzu vzorců v datech za účelem rozpoznání potenciálních vztahů. EDA může být oslovena pro objevování neznámých asociací v datech, kontrolu chybějících dat ze shromážděných dat a získání maximálních poznatků, zkoumání předpokladů a hypotéz.
6. Kauzální analýza
kauzální analýza obecně pomáhá pochopit a určit důvody „proč“ se věci vyskytují nebo proč jsou věci jako takové, jak se objevují.
například v současném podnikatelském prostředí existuje mnoho nápadů nebo podniků, které selhávají kvůli některým událostem, v tomto stavu kauzální analýza identifikuje hlavní příčinu selhání nebo jednoduše základní důvod, proč by se něco mohlo stát.
v IT průmyslu se používá ke kontrole zajištění kvality konkrétního softwaru, například proč tento software selhal, pokud došlo k chybě, narušení dat atd., a brání společnostem v závažných nezdarech.
můžeme zvážit kauzální analýzu, když;
- identifikace významných problémových oblastí uvnitř dat,
- zkoumání a identifikace hlavních příčin problému nebo selhání,
- pochopení toho, co se stane s poskytnutou proměnnou, pokud se změní jedna další proměnná.
7. Mechanistická analýza
mezi výše uvedenou statistickou analýzou je mechanistická nejméně běžným typem, je však hodna v procesu analýzy velkých dat a biologické vědy. Je nasazen k pochopení a vysvětlení toho, jak se věci dějí, spíše než k tomu, jak konkrétní věci se budou odehrávat ulteriorly.
používá jasný koncept porozumění individuálním změnám v proměnných, které způsobují změny v jiných proměnných odpovídajícím způsobem, přičemž vylučují vnější vlivy a zvažují předpoklad, že celý systém je ovlivněn interakcí vlastních vnitřních prvků.
základní cíle mechanistické analýzy zahrnují;
- pochopení definitivních změn, které by mohly způsobit změny v jiných proměnných
- jasné vysvětlení děje minulé události v kontextu dat, zejména pokud se konkrétní subjekt / koncern zabývá konkrétními činnostmi.
například v biologické vědě při studiu a kontrole toho, jak jsou různé části viru ovlivněny změnami v medicíně.
kromě výše uvedených typů statistické analýzy stojí za to diskutovat o tom, že tato statistická léčba nebo techniky statistické analýzy dat se hluboce spoléhají na způsob, jakým jsou data používána. Při počítání s funkcí a požadavkem konkrétní studie mohou být data a statistická analýza použity pro mnoho účelů, například lékaři mohou použít různé statistické analýzy pro testování účinnosti léku nebo účinnosti.
a co víc, spousta dostupných údajů může informovat o mnoha věcech, odborníci na data chtějí prozkoumat, proto statistická analýza dokáže získat nějaké informativní výsledky a učinit určité závěry. V některých případech lze také přistupovat ke statistické analýze, aby se shromažďovaly informace o preferencích lidí a jejich zvycích.
například uživatelská data na webech jako Facebook a Instagram mohou analytici použít k pochopení vnímání uživatelů, jako je to, co používá a co je motivuje. Tyto informace mohou být přínosem pro komerční reklamy, kde je konkrétní skupina uživatelů zaměřena na prodej věcí. Je také užitečné, aby vývojáři aplikací porozuměli reakci a zvyklostem uživatelů a odpovídajícím způsobem provedli změny v produktech.
závěr
hlubší pochopení dat může rozšířit četné příležitosti pro podnikání, s implementací obchodní analýzy může organizace dosáhnout při kontrole dat, například při řízení předpovědí, poznatků nebo závěrů z dat a to je to, co může statistická analýza udělat, například;
- kompilace a manifestace dat ve formě grafů nebo grafů pro zobrazení klíčových zjištění,
- zkoumání významných prvků / měření z dat, jako je průměr, rozptyl, šikmost atd.,
- testování hypotézy z více experimentů,
- předvídání nadcházející předvídavosti na základě chování minulých dat a mnoho dalších.
a proto může podnik využít výhod statistické analýzy různými způsoby, například k určení nižší výkonnosti prodeje, k odhalení trendů z údajů o zákaznících, provádění finančních auditů atd.
(podívejte se na můj další blog o Bayesovské statistice)