Hakuna matokeo yaliyopatikana
Hatuwezi kupata chochote kwa neno hilo kwa sasa, jaribu kutafuta kitu kingine.
Kokotoa wastani, midiani, modi na reji ya data yoyote kwa haraka. Tumia kikokotoo chetu cha takwimu cha bure kupata mwelekeo wa kati hapo hapo.
| Matokeo | |||
|---|---|---|---|
| Wastani x̄ | 16.75 | Thamani potofu | 6, 33, 35 |
| Mediani x̃ | 15 | Kwataili Q1 | 12.5 |
| Moda | 15 ilionekana mara 3 | Kwataili Q2 | 15 |
| Masafa | 29 | Kwataili Q3 | 16 |
| Kiwango cha chini | 6 | Masafa ya ndani ya kwataili MDK | 3.5 |
| Kiwango cha juu | 35 | ||
| Jumla | 201 | ||
| Idadi n | 12 | ||
Kulikuwa na hitilafu katika hesabu yako.
Data ghafi za kitakwimu katika majedwali na grafu mara nyingi zinaweza kuwa ngumu kufasiriwa kwa mtazamo mmoja. Ili kupata ufahamu wenye maana, tunahitaji kufupisha seti za data na kutambua sifa zake kuu.
Katika takwimu, vipimo mbalimbali hutumika kufupisha na kuelezea data. Baadhi ya vipimo hubainisha kitovu cha seti ya data, vinavyojulikana kama vipimo vya mwelekeo wa kati. Vipimo vingine, vinavyoitwa vipimo vya mtawanyiko, hutueleza jinsi thamani za data zilivyotawanyika au kusambaa. Zaidi ya hayo, vipimo vya nafasi huonyesha uwiano wa data unaoanguka chini ya thamani maalum.
Lengo kuu la kikokotoo hiki cha takwimu ni kukokotoa vipimo vya mwelekeo wa kati—haswa wastani na midiani—ambavyo huwakilisha thamani ya kawaida au ya kati ndani ya seti ya data. Lengo la pili la zana hii ni kubainisha kiwango cha mtawanyiko katika data yako kwa kukokotoa reji, robota (quartiles), na reji ya kati ya robota (IQR).
Wastani ni wastani wa kihisabati, unaokokotolewa kwa kujumlisha thamani zote na kugawanya kwa jumla ya idadi ya thamani hizo. Ndicho kipimo kinachotumiwa zaidi kupata wastani na hukokotolewa kwa kutumia fomula ifuatayo kwa sampuli:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
Fomula ya kukokotoa wastani wa idadi kamili ya watu (population) ni:
$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$
Katika milinganyo hii, kiasi (numerator) kinawakilisha jumla ya thamani zote katika seti ya data, huku asili (denominator) ikiwakilisha idadi kamili ya thamani hizo.
Faida kuu ya kutumia wastani wa kihisabati ni kwamba hujumuisha kila pointi ya data katika seti yako ya data.
Hata hivyo, kizuizi chake kikuu ni unyeti wake kwa thamani zilizokithiri. Nambari zilizo juu au chini sana, zinazojulikana kama thamani potofu (outliers), zinaweza kupotosha wastani kwa kiasi kikubwa.
Ni muhimu pia kutambua kwamba wastani si mara zote thamani ya "kawaida" ya data. Kwa hakika, wastani uliokokotolewa unaweza kuwa nambari ambayo hata haipo ndani ya seti ya data yenyewe.
Idadi ya watu (population) inajumuisha seti nzima ya thamani unazosoma. Sampuli ni kundi dogo, lenye uwakilishi lililotolewa kutoka kwa idadi hiyo.
Mbinu ya kihisabati ya kukokotoa wastani ni sawa kwa sampuli na idadi ya watu. Tofauti pekee iko katika alama za kitakwimu.
Ikiwa x₁, x₂,..., xₙ inawakilisha sampuli, wastani uliokokotolewa unaitwa wastani wa sampuli, unaoashiriwa na alama x̄. Ikiwa unakokotoa wastani wa idadi kamili ya watu, huashiriwa kwa herufi ya Kigiriki 𝜇 (mu).
Katika takwimu, tunatumia herufi ndogo n kuashiria ukubwa wa sampuli na herufi kubwa N kuashiria ukubwa wa idadi ya watu.
Hebu tuangalie mfano wa kivitendo: Luigi ni mpishi stadi na mpenda piza anayetaka kufungua mkahawa mpya wa piza huko Bali. Ili kupata mwekezaji, Luigi anaandika mpango wa biashara na anahitaji kubainisha wastani wa gharama ya piza katika mikahawa tofauti kisiwani humo ili kutabiri utendaji wake wa kifedha wa baadaye.
Alifanya utafiti kuhusu bei ya piza ya Margherita katika mikahawa mbalimbali ya karibu na kukusanya seti ya data. Ili kurahisisha hesabu, hebu tuondoe sifuri tatu za mwisho na tutumie bei kwa maelfu. Kwa mfano, thamani ya 60 katika hesabu zetu inawakilisha Rupia 60,000 za Indonesia (IDR).
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Luigi hakuweza kutembelea kila mkahawa wa piza kisiwani humo, kwa hivyo alichagua mikahawa 20 bila mpangilio maalum. Kwa hivyo, tunafanya kazi na sampuli.
Hebu tukokotoe thamani ya wastani kwa seti hii ya data kwa kutumia fomula ya wastani wa sampuli:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
Wastani unaopatikana ni x̄ = 71.9.
Utafiti wa Luigi unaonyesha kuwa 71,900 IDR ndiyo bei ya wastani ya piza ya Margherita huko Bali. Sasa anaweza kutumia takwimu hii ya msingi kwa makadirio yake ya kifedha.
Midiani ni kipimo cha nafasi kinachowakilisha thamani iliyo katikati kabisa mwa seti ya data inapopangwa kwa mtiririko wa kupanda au kushuka.
Wakati wa kukokotoa midiani, tunatafuta nambari inayopasua data kikamilifu katikati. Asilimia 50 barabara ya thamani za data itakuwa chini ya midiani, na asilimia 50 itakuwa kubwa zaidi. Hii ndiyo sababu kubainisha midiani kwa njia ya kawaida—bila msaada wa kikokotoo cha midiani—kunahitaji wewe kupanga nambari kwanza.
Mbinu ya kukokotoa inatofautiana kidogo kutegemeana na kama jumla ya idadi ya thamani katika seti yako ya data ni shufwa (even) au witiri (odd).
Ikiwa jumla ya idadi ya vipengee ni witiri (ikimaanisha n au N ni nambari witiri), unatumia fomula ifuatayo:
$$Median=(\frac{n+1}{2})-th \ element$$
Hata hivyo, ikiwa idadi ya vipengee ni shufwa, fomula ifuatayo hutumika:
$$Median=\frac{\left[(\frac{n}{2})-th \ element+(\frac{n}{2}+1)-th \ element\right]}{2}$$
Faida kubwa ya kutumia midiani ni upinzani wake dhidi ya thamani potofu. Tofauti na wastani, midiani huathiriwa kidogo sana na thamani za juu sana au za chini sana.
Kwa kutumia sampuli ya Luigi ya bei ishirini za piza:
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Tunaweza kukokotoa midiani hatua kwa hatua:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Bainisha idadi ya thamani katika seti ya data. Hapa, n = 20.
Ikiwa n ni witiri, midiani ni thamani ya kati. Ikiwa n ni shufwa, midiani ni wastani wa kihisabati wa nambari mbili za kati (zijumlishe pamoja kisha ugawe kwa 2).
Kwa kuwa 20 ni nambari shufwa, tunatafuta thamani mbili za kati.
Thamani za kati katika sampuli yetu iliyopangwa ni 69 na 70. Tunakokotoa midiani kama ifuatavyo:
$$Median = \frac{69 + 70}{2} = 69.5$$
Ikiwa Luigi angekusanya seti witiri ya thamani 21, kwa mfano:
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70
Angepanga thamani:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160
Na kuchagua tu thamani ya katikati kabisa katika nafasi ya 11, ambayo ni 70.
Ingawa wastani na midiani hutumika kama vipimo vya mwelekeo wa kati, ni muhimu kuelewa jinsi vinavyotofautiana katika uchanganuzi wa kitakwimu.
Tofauti ya kimsingi ni kwamba wastani hujumuisha kila thamani moja katika seti ya data, ilhali midiani inabainishwa tu na nambari ya kati (au nambari mbili za kati).
Tofauti hii ni muhimu sana hasa wakati wa kushughulika na seti za data zilizo na nambari kubwa au ndogo isivyo kawaida, zinazojulikana kama thamani potofu. Thamani potofu zitapotosha wastani kwa kiasi kikubwa, lakini zitakuwa na athari ndogo au hazitakuwa na athari yoyote kwa midiani.
Katika takwimu, kipimo huchukuliwa "kistahimilivu" ikiwa thamani zilizokithiri haziathiri sana. Kwa hivyo, midiani ni kipimo kistahimilivu sana, ilhali wastani si kistahimilivu.
Vipimo hivi viwili hupima "kitovu" kwa njia tofauti. Wastani hufanya kazi kama sehemu ya kusawazisha uzani wa data. Midiani ni nukta ya kati inayotenganisha asilimia 50 ya chini ya data kutoka kwa asilimia 50 ya juu. Katika seti ya data linganifu kabisa (symmetric), wastani na midiani zitakuwa sawa.
Hata hivyo, katika data za ulimwengu halisi, ni nadra sana kulingana kabisa.
Wakati wastani na midiani vinatofautiana, seti ya data inasemekana kuwa imepotoka (skewed).
Ikiwa wastani ni mdogo sana kuliko midiani, seti ya data imepotoka upande wa kushoto (negatively skewed). Ikiwa wastani ni mkubwa sana kuliko midiani, seti ya data imepotoka upande wa kulia (positively skewed).
Hakuna kipimo ambacho ni "bora" ulimwenguni kote kati ya wastani au midiani. Vinatimiza tu malengo tofauti. Wachanganuzi wa data mara nyingi hupendelea midiani wakati seti ya data imepotoka sana au ina thamani potofu kubwa, kwani midiani hutoa uwakilishi sahihi zaidi wa thamani ya "kawaida".
Modi ni thamani inayoonekana mara nyingi zaidi katika seti ya data.
Ikiwa seti ya data ina thamani moja wazi inayotokea mara nyingi zaidi kuliko nyingine yoyote, inaelezwa kama yenye modi moja (unimodal).
Ikiwa thamani mbili tofauti zinalingana kwa kasi ya juu zaidi, zote zinachukuliwa kuwa modi, na kuifanya seti ya data kuwa ya modi mbili (bimodal).
Ikiwa thamani tatu au zaidi zinashiriki kasi ya juu zaidi, kila moja ni modi, na seti ya data inaainishwa kama ya modi nyingi (multimodal).
Ikiwa kila thamani katika seti ya data inaonekana mara moja tu, seti ya data haina modi. Kumbuka kuwa "haina modi" si sawa na modi ya sufuri. Sufuri inaweza kuwa modi halali ikiwa ndiyo nambari inayoonekana mara nyingi zaidi katika seti ya data (kwa mfano, katika vipimo vya halijoto wakati wa baridi).
Faida kuu ya modi ni kwamba ni rahisi kupatikana na haiathiriwi kabisa na thamani potofu zilizokithiri. Hasara kuu ni kwamba baadhi ya seti za data zinaweza zisiwe na modi hata kidogo.
Kwa kutumia seti yetu ya data ya awali ya bei ishirini za piza:
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Tunaweza kupata modi kwa hatua hizi:
Kwanza, panga seti ya data kwa mfuatano:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Kisha, tambua nambari inayojirudia mara nyingi zaidi. Katika orodha hii, 70 inaonekana mara nne, ambayo ni zaidi ya nambari nyingine yoyote. Kwa hivyo, thamani ya modi ni 70.
Ingawa modi ni kipimo cha mwelekeo wa kati, haiwakilishi kila mara kitovu halisi cha data, hasa katika misambao iliyopotoka sana. Kinadharia, modi inaweza kuwa thamani ya juu zaidi, thamani ya chini zaidi, au mahali popote katikati. Kwa mfano, fikiria seti hii ya data:
42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120
Hapa, modi ni 120. Hata hivyo, ni wazi kwamba 120 haionyeshi mwelekeo wa kati wa kundi hilo.
Cha kuvutia ni kwamba, ingawa wastani na midiani vinaweza kukokotolewa tu kwa data za kiasi (numerical), modi inaweza kutumika kwa data za kiasi na za ubora (categorical).
Kwa mfano, hebu wazia Anna anakula piza mara 12 kwa mwezi, iliyogawanywa hivi:
Katika seti hii ya data ya ubora, kuna modi mbili: Napoletana na Margherita.
Vipimo vya mtawanyiko, vinavyojulikana pia kama vipimo vya mabadiliko (variability), hubainisha kuenea au kusambaa ndani ya seti ya data. Vinaonyesha jinsi pointi za data zinavyokengeuka kutoka kwa thamani ya kati. Tunaweza kuchanganua tofauti hii kwa kutumia vipimo vitatu muhimu: reji, robota (quartiles), na reji ya kati ya robota (IQR).
Reji ndicho kipimo rahisi zaidi cha mtawanyiko. Inawakilisha tofauti kamili kati ya thamani ya juu zaidi na ya chini zaidi katika seti ya data. Fomula yake ni rahisi:
Reji = Thamani kubwa zaidi - Thamani ndogo zaidi
Tukiangalia nyuma kwenye seti yetu ya data ya bei ishirini za piza:
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Ili kukokotoa reji, kwanza panga data ili kutambua kwa urahisi nambari za mwisho:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Thamani ya juu zaidi ni 160, na thamani ya chini zaidi ni 42. Kwa kutumia fomula:
Reji = thamani kubwa zaidi - thamani ndogo zaidi = 160 - 42 = 118
Reji ya seti hii ya data ni 118.
Robota ni thamani za kitakwimu zinazogawanya seti ya data iliyopangwa katika sehemu nne sawa, au robo, kwa kutumia pointi tatu za kugawa: robota ya kwanza, ya pili, na ya tatu.
Robota ya kwanza (Q₁) ni asilimia ya 25. Asilimia 25 barabara ya data iko chini ya thamani hii, ikibakiza asilimia 75 juu yake.
Robota ya pili (Q₂) ni asilimia ya 50, ambayo ni sawa kabisa na midiani. Inapasua data moja kwa moja katikati.
Robota ya tatu (Q₃) ni asilimia ya 75. Hapa, asilimia 75 ya data iko chini ya thamani hii, na asilimia 25 iko juu yake.
Ili kukokotoa robota za seti ya data, fuata utaratibu huu:
Panga pointi za data kwa mtiririko wa kupanda.
Bainisha robota ya pili kwa kukokotoa midiani. Kwa robota ya kwanza na ya tatu, endelea kwa hatua zinazofuata ukitumia n (jumla ya idadi ya thamani katika seti ya data).
Ili kupata nafasi ya robota ya kwanza, kokotoa L = 0.25n. Ili kupata nafasi ya robota ya tatu, kokotoa L = 0.75n.
Ikiwa L ni nambari kamili, robota ni wastani wa thamani katika nafasi ya L na thamani katika nafasi ya L + 1.
Ikiwa L si nambari kamili, izungushe hadi nambari kamili inayofuata iliyo juu zaidi. Robota ni thamani inayopatikana katika nafasi hiyo iliyozungushwa.
Kwa kutumia seti yetu ya bei ishirini za piza:
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Hebu tukokotoe robota:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Midiani = 70
Kokotoa L kwa robota ya kwanza: 0.25 × 20 = 5. Kokotoa L kwa robota ya tatu: 0.75 × 20 = 15.
Kwa sababu 5 ni nambari kamili, Q₁ ni wastani wa thamani ya 5 na 6 (55 na 59):
$$Q₁=\frac{55+59}{2}=57$$
$$Q₃=\frac{72+75}{2}=73.5$$
Kwa seti hii ya data, robota ya kwanza ni 57, ya pili (midiani) ni 70, na robota ya tatu ni 73.5.
Reji ya kati ya robota (IQR) hupima usambazaji wa asilimia 50 ya kati ya seti yako ya data. Inafafanuliwa kama tofauti kati ya robota ya tatu (Q₃) na robota ya kwanza (Q₁). Ni kipimo thabiti sana cha mtawanyiko wa kitakwimu, kinachokokotolewa kwa fomula hii:
IQR = Q₃ - Q₁
Kwa kuwa tayari tumekokotoa robota ya kwanza na ya tatu (57 na 73.5), kukokotoa reji ya kati ya robota ni rahisi kama kuziingiza kwenye fomula:
IQR = Q₃ - Q₁ = 73.5 - 57 = 16.5
Reji ya kati ya robota kwa seti yetu ya data ya piza ni 16.5.
Kutokana na uchanganuzi wake wa kitakwimu wa bei za piza ya Margherita, Luigi anaweza kufikia hitimisho kadhaa za kibiashara zinazotekelezeka.
Kwanza, ingawa wastani (71.9) na midiani (69.5) hazifanani—ikionyesha kupotoka kidogo upande wa kulia kutokana na mikahawa michache ya gharama kubwa—tofauti ni ndogo sana. Wastani na midiani hutumika kama vipimo vya kuaminika vya mwelekeo wa kati hapa.
Ikiwa Luigi anataka kuweka bei ya wastani na yenye ushindani kwa piza zake, angeweza kutumia kipimo chochote kati ya hivyo. Hata hivyo, bei zisizo za kawaida kama 71,900 IDR au 69,500 IDR zinaweza kuwa ngumu kwa wateja kukumbuka. Kwa bahati nzuri, modi ya seti yake ya data inakaa katikati kabisa mwa wastani na midiani katika 70,000 IDR barabara. Hili linafanya modi kuwa kiwango cha bei kinachofaa sana na cha kukumbukwa kwa mkakati wa biashara wa Luigi.
Vinginevyo, ikiwa Luigi ataamua kulenga kundi la watu wanaojali zaidi bajeti, angeweza kupanga bei za piza zake karibu na robota ya kwanza, akilenga takriban 57,000 IDR. Kutegemea robota ya tatu (73,500 IDR) kuwalenga wateja wa hadhi ya juu kungekuwa na ufanisi mdogo katika hali hii, kwani robota ya juu imepotoka kidogo na haiwakilishi vizuri kikomo halisi cha soko la kifahari.