Statystyka, zadanie nr 4347
ostatnie wiadomo艣ci | regulamin | latex
| Autor | Zadanie / Rozwi膮zanie |
kasiaaa33 post贸w: 2 | 2016-03-01 12:19:50Cze艣膰, jako cz臋艣膰 projektu nad kt贸rym pracuj臋 potrzebuj臋 sposobu na aproksymacj臋 nast臋puj膮cych danych: ilo艣膰 pracownik贸w 1, ilo艣膰 firm 1 000 000, ilo艣膰 pracownik贸w od 2 do 9, ilo艣膰 1 000 000, ilo艣膰 pracownik贸w od 10 do 49, ilo艣膰 117 486, ilo艣膰 pracownik贸w od 50 do 249, ilo艣膰 2 453, ilo艣膰 pracownik贸w od 250 do 999, ilo艣膰 2 453, ilo艣膰 pracownik贸w od 1000, ilo艣膰 462 Potrzebna jest metoda, aby na podstawie tych danych wygenerowa膰 wz贸r funkcji kt贸ry da艂by mi mo偶liwo艣膰 otrzymania na wyj艣ciu ilo艣ci firm dla podanej liczby pracownik贸w. Prosz臋 o pomoc, a w razie czego informacj臋 na ile wed艂ug Was mo偶liwe jest rozs膮dne wykonanie takiego zadania. |
janusz78 post贸w: 820 | 2016-03-01 15:53:43Znajd藕 prost膮 regresji $ y=\hat{\alpha}x +\hat{\beta}$ dla Twojego szeregu rozdzielczego. |
kasiaaa33 post贸w: 2 | 2016-03-03 11:24:12Niestety nie dosz艂am z Twoj膮 pomoc膮 do odpowiednich wynik贸w. Mo偶e upro艣膰my - wystarczy mi dobra estymacja. Mo偶e by膰 kilka r贸偶nych funkcji - osobnych dla ka偶dego z przedzia艂贸w - oboj臋tnie. Byleby te funkcje 艂膮czy艂y si臋 w przej艣ciach mi臋dzy przedzia艂ami - czyli, 偶eby nie by艂o ostrych skok贸w oraz aby sumy w przedzia艂ach by艂y zbli偶one do podanych. Wa偶niejsze s膮 dla mnie przedzia艂y powy偶ej 10 ilo艣ci pracownik贸w. Ten milion na pocz膮tku mo偶emy pomin膮膰 w estymacji funkcji. To co realnie potrzebuj臋, to wyliczy膰 ile jest firm w przedziale od 50-99 oraz 100-499. Mo偶e same te przedzia艂y kto艣 wie jak przeliczy膰? |
tumor post贸w: 8070 | 2016-03-03 13:41:42Popatrz, funkcji jest niesko艅czenie wiele. Wybra膰 odpowiedni膮 z niesko艅czenie wielu to do艣膰 mocno zaryzykowa膰. Og贸lnie u偶ycie jakie艣 funkcji powinno mie膰 sens. Czyli musimy dysponowa膰 jakimi艣 przypuszczeniami, 偶e zale偶no艣膰 ilo艣ci firm od ilo艣ci pracownik贸w jest akurat logarytmiczna albo akurat liniowa albo akurat wyk艂adnicza albo akurat jaka艣 jeszcze. Je艣li si臋 takich przypuszcze艅 nie ma, to zgadywanie jest dziwne. Mo偶na oczywi艣cie zauwa偶y膰 jaki艣 charakterystyczny kszta艂t wykresu, ale czemu bra膰 go np za fragment krzywej wyk艂adniczej, a nie na przyk艂ad arctg albo sum臋 kilku funkcji pot臋gowych? Je艣li znasz warto艣ci dla ilo艣ci firm z maksymalnie 1,9,49,249, 999, pracownikami, to ju偶 mo偶esz sobie pozwoli膰 na szacowanie z pi臋cioma parametrami. Mo偶esz mie膰 zatem wielomian maksymalnie czwartego stopnia (ale kszta艂t wykresu nie bardzo wskazuje na zale偶no艣膰 wielomianow膮), albo sum臋 kilku pot臋g logarytm贸w, albo jakie艣 wyk艂adnicze. Mo偶esz sobie zrobi膰 dla 偶artu tak: $F(x)=ab^x+\frac{c}{x}+d +elnx$, gdzie a,b,c,d,e s膮 nieznanymi parametrami. Robimy uk艂ad r贸wna艅 $\left\{\begin{matrix} F(1)=10^6 \\ F(9)=2*10^6 \\ F(49)= 2117 486 \\ ... \end{matrix}\right.$ I tak dalej, gdzie F(x) oznacza liczb臋 firm, w kt贸rej pracuje x lub mniej pracownik贸w. Czemu wybra艂em akurat takie funkcje? No w艂a艣nie. Bez dobrego uzasadnienia. R贸wnie dobrze mo偶na kombinowa膰 jakie艣 inne. Mo偶esz dorzuci膰 jaki艣 sk艂adnik liniowy $fx$, albo $g*arctgx$, albo $h*ln^ix$. Bez teoretycznej analizy zagadnienia, co i w jaki spos贸b wp艂ywa na kszta艂t funkcji, wszelkie przybli偶enia s膮 tylko zgadywaniem. Istotne jest to, 偶e masz 5 parametr贸w, kt贸re mo偶esz dowolnie rozdysponowa膰. Mo偶esz zrobi膰 kilka wariant贸w funkcji, ale ka偶dy wariant b臋dzie r贸wnie nieuzasadniony. Zatem gdyby to by艂a niezbyt wa偶na kwestia wymagaj膮ca szybkiego byle jakiego rozwi膮zania, to po prostu wymy艣liliby艣my kilka wariant贸w, sprawdzili, kt贸ry najlepiej oddaje Twoje dane i ju偶. Ale w przypadku powa偶nej pracy nie mo偶emy sobie pozwoli膰 na tak arbitralne wybieranie kilku funkcji spo艣r贸d niesko艅czono艣ci. Nie ma to sensu. Janusz do艣膰 bezsensownie zaproponowa艂 regresj臋 liniow膮, cho膰 dane uk艂adaj膮 si臋 bardzo daleko od linii prostej. Wielomiany b臋d膮 nieco lepsze, ale kszta艂t wykresu pozwala przypuszcza膰, 偶e dla skrajnych danych (ma艂o lub du偶o pracownik贸w) wyniki przybli偶ane wielomianem by艂yby kiepskie. Mo偶esz spr贸bowa膰 kilku takich mieszanych funkcji z odpowiednimi wsp贸艂czynnikami. Mo偶esz mie膰 pewno艣膰, 偶e osoba, kt贸ra to potem przeczyta, z艂apie si臋 za g艂ow臋, bo te funkcje bierzesz z powietrza. Bez uzasadnienia. Magia. Ale je艣li to, czego potrzebujesz, jest po prostu jakim艣 przybli偶eniem, to mo偶esz otrzyma膰 funkcj臋 o zadowalaj膮cym Ci臋 kszta艂cie. Ta funkcja zaczyna si臋 stromo (dla 1 mamy $10^6$, dla 9 mamy ju偶 $2*10^6$), a potem si臋 wyp艂aszcza, r贸偶nica mi臋dzy 249 a 999 jest znikoma w stosunku do warto艣ci funkcji. Strome na pocz膮tku a potem bli偶sze p艂asko艣ci s膮 homografie, w mniejszym stopniu logarytmy czy pierwiastki. Zatem mo偶esz pr贸bowa膰 jakiej艣 sumy sk艂adnik贸w $\frac{a}{x}$ $\sqrt[b]{x}$ $\frac{c}{x^2}$ $dln^e{x}$ i innych $f*arctg{x}$, gdzie a,b,c,d,e,f,... s膮 parametrami. Mo偶esz dodawa膰/mno偶y膰/dzieli膰 takie funkcje, ale by uk艂ad mia艂 rozwi膮zanie pozosta艅 przy maksymalnie 5 parametrach 艂膮cznie. Jedn膮 z takich funkcji jest zaproponowana F, ale pami臋taj, NIC, ABSOLUTNIE NIC nie uzasadnia takiego jej wyboru. Jedynie dla praktycznego przybli偶enia jakich艣 warto艣ci mo偶na sobie na takie fiku艣ne rozwi膮zanie pozwoli膰 - stworzy膰 kilka kandydatur na funkcje, przetestowa膰 je i wybra膰 najlepsz膮. Ale to wci膮偶 losowanie kilku opcji z niesko艅czono艣ci. |
janusz78 post贸w: 820 | 2016-03-03 14:59:03Pierwszy przedzia艂 ze wzgl臋du na du偶膮 liczb臋 - odbiegaj膮c膮 od reszty liczby firm odrzu膰- traktuj膮c jako odzieln膮 warto艣膰 funkcji $ f(n)= 1000000$ dla $ n\in <2, \ \ 9>.$ Dla pozosta艂ych przedzia艂贸w liczbowych pracownik贸w znajd藕 ich 艣rodki. Z tego nier贸wnomiernego szeregu rozdzielczego przejd藕 na szereg szczeg贸艂owy. Znajd藕 r贸wnanie linii regresji dla tego szeregu, przyjmuj膮c dla ostatniego przedzia艂u $ (x_{4},\ \ y_{4})= ( 1000, 462).$ Wiadomo艣膰 by艂a modyfikowana 2016-03-03 15:54:53 przez janusz78 |
tumor post贸w: 8070 | 2016-03-03 19:27:16A za艂o偶enie o liniowo艣ci to Janusz bierzesz z kryszta艂owej kuli? :) |
| strony: 1 | |
Prawo do pisania przys艂uguje tylko zalogowanym u偶ytkownikom. Zaloguj si臋 lub zarejestruj
2016-03-01 12:19:50