Narzędzia użytkownika

Narzędzia witryny


narzedzia:php_global_warming

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Poprzednia rewizja po obu stronachPoprzednia wersja
narzedzia:php_global_warming [2025/05/17 23:02] – [Matematyka: regresja liniowa] administratornarzedzia:php_global_warming [2025/05/17 23:07] (aktualna) – [Matematyka: regresja liniowa] administrator
Linia 96: Linia 96:
 </WRAP> </WRAP>
  
-W celu wyznaczenia prostoliniowego trendu danych (tzw. regresji liniowej) stosujemy model matematyczny:+Poniższy fragment opisuje metodę najmniejszych kwadratów (ang*least squares*) stosowaną do wyznaczenia parametrów prostej regresji liniowej, czyli współczynników nachylenia i wyrazu wolnego.  
  
 +Metoda polega na minimalizacji sumy kwadratów odchyleń (residuals) pomiędzy rzeczywistymi wartościami \(y_i\) a wartościami przewidywanymi \(\hat{y}_i\) przez model liniowy $$y = \beta_0 + \beta_1 x$$, co wyraża funkcja kryterium:  
 $$ $$
-y = a \cdot x + b +S(\beta_0\beta_1\;=\;\sum_{i=1}^n \bigl(y_i - (\beta_0 + \beta_1 x_i)\bigr)^2
-$$ +$$ 
- +
-Gdzie: +
-  * $x$ – niezależna zmienna (czasindeks daty)+
-  * $y$ – zmienna zależna (temperatura), +
-  * $a$ – współczynnik kierunkowy (nachylenie)+
-  * $b$ – wyraz wolny (punkt przecięcia z osią Y). +
- +
-Aby obliczyć $ai $b$, używamy poniższych wzorów:+
  
 +Aby znaleźć optymalne \(\beta_0\) i \(\beta_1\), rozwiązujemy układ tzw. równań normalnych:
 $$ $$
-a = \frac{\sum x_i y_i - \sum x_i \sum y_i}{\sum x_i^2 - (\sum x_i)^2+\begin{cases} 
-$$+\displaystyle \frac{\partial S}{\partial \beta_1} \;=\; -2 \sum_{i=1}^n x_i\,(y_i - \beta_0 - \beta_1 x_i)\;=\;0,\\[1em] 
 +\displaystyle \frac{\partial S}{\partial \beta_0} \;=\; -2 \sum_{i=1}^n (y_i - \beta_0 - \beta_1 x_i)\;=\;0. 
 +\end{cases
 +$$ 
  
-$$ +Rozwiązując ten układ, otrzymujemy wzory na estymatory:   
-= \frac{\sum y_i - \sum x_i}{n} +  * $$\hat{\beta}_1 = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^(x_i - \bar{x})^2},$$  
-$$+  $$\hat{\beta}_0 = \bar{y} - \hat{\beta}_1\,\bar{x},$$  
 +gdzie \(\bar{x} = \frac{1}{n}\sum x_i\) i \(\bar{y} = \frac{1}{n}\sum y_i\).  
  
-Gdzie+Inna, równoważna postać wzoru na nachylenie prostej korzysta z sum iloczynów i sum kwadratów
-  $n– liczba punktów danych, +multiline $$ 
-  * $\sum x_i$ – suma wszystkich wartości $x$ (np. indeksów dat), +\hat{\beta}_1 
-  * $\sum y_i$ – suma wszystkich temperatur, +\frac{n\sum_{i=1}^n x_i y_i \;-\; \sum_{i=1}^n x_i \sum_{i=1}^n y_i} 
-  * $\sum x_i y_i$ – suma iloczynów $x_i \cdot y_i$, +       {n\sum_{i=1}^n x_i^2 \;-\; \bigl(\sum_{i=1}^n x_i\bigr)^2}\,, 
-  * $\sum x_i^2$ – suma kwadratów wartości $x_i$.+$$   
 +a wyraz wolny: 
 +multiline $
 +\hat{\beta}_0 
 += \frac{\sum_{i=1}^n y_i - \hat{\beta}_1\sum_{i=1}^n x_i}{n} 
 +=\bar{y}-\hat{\beta}_1\bar{x}\,. 
 +$$ 
  
-Następnie dla każdego punktu $x_i$ obliczamy odpowiadające $y_i$ na linii trendu: +W praktycznej implementacji, gdy \(x_i\) to kolejne indeksy czasowe (0, 1, …, n‑1), obliczenia skracają się do wersji:\\ 
- +$$x_i = i,\quad y_i = \text{Temp}[i],$$   
-$$ +pozwalając łatwo wygenerować tablicę wartości trendu:\\ 
-\hat{y_i} = \cdot x_i +$$\hat{y}_i = \hat{\beta}_0 \hat{\beta}_1\,i.$$
-$$+
  
-Wartości $\hat{y_i}$ tworzą prostą linię trendu, którą dodajemy do wykresu obok rzeczywistych danych.+Interpretacja parametrów:   
 +  * \(\hat{\beta}_1\) – średnia zmiana \(y\) przy wzroście \(x\) o jednostkę, czyli nachylenie trendu liniowego  
 +  * \(\hat{\beta}_0\) – przewidywana wartość \(y\) dla \(x=0\)czyli punkt przecięcia z osią OY 
  
-Dzięki temu możemy łatwo zauważyć, czy dane wykazują tendencję rosnącąmalejącą, czy są stabilne w czasie.+Dzięki tym wzorom możemy obliczyć linię trenduktóra najlepiej przybliża dane w sensie najmniejszych kwadratówułatwiając analizę długoterminowych tendencji.
  
  
narzedzia/php_global_warming.1747515728.txt.gz · ostatnio zmienione: 2025/05/17 23:02 przez administrator