logowanie

matematyka » forum » forum zadaniowe - uczelnie wyższe » zadanie

Statystyka, zadanie nr 3614

ostatnie wiadomości  |  regulamin  |  latex

AutorZadanie / Rozwiązanie

focus
postów: 5
2015-09-10 17:29:19

metoda jakosc
dobra zla
A 30 80
B 50 140

Wyrob jest wytwarzany z wykorzystaniem dwoch metod.
W celu sprawdzenia czy istnieje zwiazek miedzy metoda produkcji zbadano 300 sztuk wyrobu i uzyskano powyzsze informacje.

Czy istnieje i jak silna jest zaleznosc miedzy analizowanymi cechami ?


Czy moglby mi ktos pomoc to rozwiazac ? Jutro mam poprawe kolokwium i to jest jedyne zadanie z ktorym sobie nie moge poradzic :/
Nie chodzi tyle o cale rozwiazanie co chociaz o podanie wzoru ktorym nalezy sie posluzyc
Z gory dziekuje


janusz78
postów: 820
2015-09-10 21:05:01

Test niezależności $\chi^2$

Hipotezy:

$H_{0}: p_{ij}=p_{i*}\cdot p_{j*}.$

$H_{1}:p_{ij}\neq p_{i*}\cdot p_{j*}.$

Statystyka testowa:

$ \chi^2= \sum_{i=1}^{r}\sum_{j=1}^{s}\frac{(n_{ij}-\hat{n}_{ij})^2}{\hat{n}_{ij}}.$

gdzie liczebności teoretyczne (czyli takie, których należy oczekiwać, gdyby cechy były niezależne) obliczamy ze wzoru

$ \hat{n}_{ij}= \frac{n_{i*}\cdot n_{j*}}{n}.$ (1)

Obliczamy kolejno wartość statystyki testowej dla danych z próby na podstawie tablicy:

$n_{*1}= 30+50 =110,$
$n_{*2}=80 +140 =220,$
$ n_{1*}= 30+80 =110,$
$ n_{2*}= 50+140 =190.$

Z (1)

$\hat{n}_{11}=\frac{110\cdot 80}{300}= 29.33333.$

itd.
........
Obliczenie wartości statystyki $\chi^2$ za pomocą programu R

> n11= (110*80)/300
> n11
29.33333
> n12=(110*220)/300
> n12
80.66667
> n21= 190*80/300
> n21
50.66667
> n22= 190*220/300
> n22
139.3333
> chikwadrat = (30-29.33333)^2/(29.33333)+(80- 80.66667)^2/(80.66667)+(50.66667-50)^2/(50.66667)+(140-139.3333)^2/(139.3333)
> chikwadrat
0.03262349

Statystyka ta ma asymptotyczny rozkład $\chi^2$ z liczbą stopni swobody wyznaczoną rozmiarami tablicy

$\nu = (2-1)\cdot (2-1)= 1\cdot 1=1.$

Obszar krytyczny testu określa relacja

$Pr(\chi^2\geq \chi^2_{\alpha})=\alpha.$

gdzie $ \chi^2_{\alpha}$ jest wartością krytyczną testu odczytaną z tablic rozkładu $\chi^2$ przy danym poziomie istotności $\alpha$ i liczbie stopni swobody
$\nu= (r-1)(s-1).$

W naszym przypadku, przyjmując $\alpha = 0,05$ (nie podano w treści zadania), otrzymujemy wartość kwantyla:

> qchisq(0.05,1)
0.00393214

$\chi^2(0,05,1)=0,00393214.$

Decyzja

Wartość statystyki obliczona z próby jest większa od wartości krytycznej odczytanej z tablic, a zatem należy ona do obszaru krytycznego testu.
Powoduje to odrzucenie hipotezy zerowej, zakładającej niezależność między metodą i jakością produkcji i przyjęcie hipotezy alternatywnej, że jakość wyrobu zależy od metody jego produkcji.







focus
postów: 5
2015-09-10 21:19:51

Dzieki wielkie za wytlumaczenie

A co jezeli nie mam podanego poziomu istotnosci ? Jest to zadanie z kolokwium i ta informacja nie byla podana. Mam sobie sam przyjac przykladowo α=0,05 ?


janusz78
postów: 820
2015-09-10 21:34:09


Przyjmujemy najczęściej stosowany poziom istotności testu

$\alpha = 0,05.$


focus
postów: 5
2015-09-10 21:39:42

Dziekuje raz jeszcze ;)

Mam jeszcze jedna prosbe czy moglbys zinterpretowac odpowiedzi do tych danych ? Rozwiazalem zadanie ale nie mam pojecia jak zinterpretowac odpowiedz ...

"czas reklamy : 10 18 13 14 20 15
sprzedana auta : 2.5 4.6 3.2 4.0 5.6 3.2

na podstawie przedstawionego szeregu korelacyjnego oszacuj parametry linii regresji liczby sprzedanych samochodow wzgledem czasu reklamy.

Czy ktos moglby sprawdzic czy to jest dobrze ?

srednia x 15
srednia y 3.85

b = 0.295
a = -0.57

y^ = -0.57 + 0.295x"


janusz78
postów: 820
2015-09-10 23:20:05

Jest późno "zatrudnię" program R

> x<-c(10,18,13,14,20,15)
> y<-c(2.5,4.6,3.2,4.0,5.6,3.2)
> lm(y~x)

Call:
lm(formula = y ~ x)

Coefficients:
(Intercept) x
-0.5797 0.2953

> summary(x,y)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.00 13.25 14.50 15.00 17.25 20.00

Współczynik korelacji
> cor(x,y)
0.940124

Równanie linii regresji znalazłeś poprawnie

$ y = 0,295x -0,57.$

Interpretacja

Call:
lm(formula = y ~ x)

Residuals:
1 2 3 4 5 6
0.12656 -0.13594 -0.05937 0.44531 0.27344 -0.65000

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.57969 0.82178 -0.705 0.51947
x 0.29531 0.05353 5.517 0.00527

Residual standard error: 0.4283 on 4 degrees of freedom
Multiple R-squared: 0.8838, Adjusted R-squared: 0.8548
F-statistic: 30.43 on 1 and 4 DF, p-value: 0.00527

Test Fishera - Snedecora
> qt(0.975,4)
2.776445
$ 2,776 > 0,005$

Decyzja

Przryjmujemy hipotezę zerową, że nachylenie linii regresji jest prawie zerowe.
Istnieje silna zależność liniowa między czasem reklamy a ilością sprzedawanych aut.


Wiadomość była modyfikowana 2015-09-10 23:34:30 przez janusz78

focus
postów: 5
2015-09-11 08:48:08

Dzieki wielkie ! Piwo sie nalezy chociaz nie mam jak postawic heh

strony: 1

Prawo do pisania przysługuje tylko zalogowanym użytkownikom. Zaloguj się lub zarejestruj





© 2019 Mariusz Śliwiński      o serwisie | kontakt online: 29 drukuj