Różnice między wybraną wersją a wersją aktualną.
Poprzednia rewizja po obu stronachPoprzednia wersja | |||
narzedzia:php_global_warming [2025/05/17 23:02] – [Matematyka: regresja liniowa] administrator | narzedzia:php_global_warming [2025/05/17 23:07] (aktualna) – [Matematyka: regresja liniowa] administrator | ||
---|---|---|---|
Linia 96: | Linia 96: | ||
</ | </ | ||
- | W celu wyznaczenia prostoliniowego trendu danych | + | Poniższy fragment opisuje metodę najmniejszych kwadratów |
+ | Metoda polega na minimalizacji sumy kwadratów odchyleń (residuals) pomiędzy rzeczywistymi wartościami \(y_i\) a wartościami przewidywanymi \(\hat{y}_i\) przez model liniowy $$y = \beta_0 + \beta_1 x$$, co wyraża funkcja kryterium: | ||
$$ | $$ | ||
- | y = a \cdot x + b | + | S(\beta_0, \beta_1) \; |
- | $$ | + | $$ |
- | + | ||
- | Gdzie: | + | |
- | * $x$ – niezależna zmienna (czas, indeks daty), | + | |
- | * $y$ – zmienna zależna | + | |
- | * $a$ – współczynnik kierunkowy | + | |
- | * $b$ – wyraz wolny (punkt przecięcia z osią Y). | + | |
- | + | ||
- | Aby obliczyć | + | |
+ | Aby znaleźć optymalne \(\beta_0\) i \(\beta_1\), | ||
$$ | $$ | ||
- | a = \frac{n \sum x_i y_i - \sum x_i \sum y_i}{n \sum x_i^2 - (\sum x_i)^2} | + | \begin{cases} |
- | $$ | + | \displaystyle |
+ | \displaystyle \frac{\partial S}{\partial \beta_0} \;=\; -2 \sum_{i=1}^n | ||
+ | \end{cases} | ||
+ | $$ | ||
- | $$ | + | Rozwiązując ten układ, otrzymujemy wzory na estymatory: |
- | b = \frac{\sum y_i - a \sum x_i}{n} | + | * $$\hat{\beta}_1 |
- | $$ | + | |
+ | gdzie \(\bar{x} = \frac{1}{n}\sum x_i\) i \(\bar{y} = \frac{1}{n}\sum y_i\). | ||
- | Gdzie: | + | Inna, równoważna postać wzoru na nachylenie prostej korzysta z sum iloczynów i sum kwadratów: |
- | | + | multiline |
- | * $\sum x_i$ – suma wszystkich wartości $x$ (np. indeksów dat), | + | \hat{\beta}_1 |
- | * $\sum y_i$ – suma wszystkich temperatur, | + | = \frac{n\sum_{i=1}^n |
- | * $\sum x_i y_i$ – suma iloczynów $x_i \cdot y_i$, | + | {n\sum_{i=1}^n |
- | * $\sum x_i^2$ | + | $$ |
+ | a wyraz wolny: | ||
+ | multiline | ||
+ | \hat{\beta}_0 | ||
+ | = \frac{\sum_{i=1}^n y_i - \hat{\beta}_1\sum_{i=1}^n x_i}{n} | ||
+ | =\bar{y}-\hat{\beta}_1\bar{x}\, | ||
+ | $$ | ||
- | Następnie dla każdego punktu $x_i$ obliczamy odpowiadające $y_i$ na linii trendu: | + | W praktycznej implementacji, |
- | + | $$x_i = i, | |
- | $$ | + | pozwalając łatwo wygenerować tablicę wartości |
- | \hat{y_i} = a \cdot x_i + b | + | $$\hat{y}_i = \hat{\beta}_0 |
- | $$ | + | |
- | Wartości $\hat{y_i}$ tworzą prostą linię trendu, | + | Interpretacja parametrów: |
+ | * \(\hat{\beta}_1\) – średnia zmiana \(y\) przy wzroście \(x\) o jednostkę, czyli nachylenie | ||
+ | * \(\hat{\beta}_0\) – przewidywana wartość \(y\) dla \(x=0\), czyli punkt przecięcia z osią OY | ||
- | Dzięki | + | Dzięki |