Geostatystyka

class: inverse, left, nonum, clear
background-image: url("figs/Malvern.jpg")
background-size: cover

.titlestyle[Geostatystyka:]
 
.captionstyle[Analiza autokorelacji przestrzennej 1]

.captionstyle[Jakub Nowosad, *nowosad@amu.edu.pl*]

---
class: inverse, left, bottom
# Postępowanie geostatystyczne

---
# Postępowanie geostatystyczne

<center>
<div class="DiagrammeR html-widget html-fill-item-overflow-hidden html-fill-item" id="htmlwidget-3e09cae0b32d75a94050" style="width:792px;height:504px;"></div>
<script type="application/json" data-for="htmlwidget-3e09cae0b32d75a94050">{"x":{"diagram":"\n graph TB;\n Pozyskanie[<center>Pozyskanie i wstępna weryfikacja danych<\/center>];\n Pozyskanie-->Eksploracja[<center>Nieprzestrzenna i przestrzenna eksploracja danych<\/center>];\n Eksploracja-->Analiza[<center>Analiza i interpretacja struktury przestrzennej<\/center>];\n Analiza -->Modelowanie[\"<center>Modelowanie matematyczne struktury przestrzennej (autokorelacji przestrzennej) <\/center>\"];\n \n Modelowanie -->Estymacja;\n Modelowanie -->Optymalizacja;\n Estymacja -->Symulacja;\n \n Modelowanie -->Symulacja;\n Estymacja -->Optymalizacja;\n Symulacja -->Optymalizacja;\n Optymalizacja -->Pozyskanie;\n \n \n style Analiza fill:#babaf7\n "},"evals":[],"jsHooks":[]}</script>
</center>

Ścieżka postępowania geostatystycznego

---
# Terminologia

**Cecha** - fizyczna właściwość (parametr) oznaczana kursywą małą literą np. `$z$` lub `$s$`

- **Cechy ciągłe** takie jak np. stężenia, są oznaczane na skali ilościowej
- **Cechy kategoryzowane** mogą przybierać określoną, limitowaną ilość wartości, zazwyczaj nie mających charakteru porządkowego np. typ skał czy kategoria użytkowania terenu

---
# Terminologia

**Zmienna** - zbiór wartości lub stanów cechy `$z$` lub `$s$` oznaczany kursywą i duża literą np. `$Z$` lub `$S$`

- Zmienne mogą występować na analizowanym obszarze lub w punkcie o wektorze współrzędnych `$u$`
- W tym wypadku zmienna jest oznaczana `$Z(u)$` lub `$S(u)$`

---
# Terminologia

**Obiekt** - cecha jest określana (mierzona) na fizycznej próbce, jak na przykład okruch skały, czy rdzeń glebowy, itp.
W przypadku analizy eksploracyjnej nieprzestrzennej (bez uwzględniania lokalizacji) o próbce mówimy obiekt.
We wszystkich innych sytuacjach każda próbka jest związana ze ścisłą lokalizacją miejsca jej poboru, które określamy `$u_\alpha$`

**Populacja** - zbiór wszystkich pomiarów interesującej nas cechy, które mogą być dokonane w obrębie obszaru badań

**Próba** (lub podzbiór) - skończona ilość pomiarów, która dysponujemy

---
# Terminologia

**Parametr** - stała wartość (nie losowa) charakteryzująca model, na przykład wariancja nuggetowa semiwariogramu, lub średnia rozkładu funkcji prawdopodobieństwa na podstawie której modelujemy teoretyczny histogram

---
# Terminologia

**Statystyka** - wielkość charakteryzująca rozkład, która może dotyczyć jednej lub większej ilości cech, i/lub jednej lub większej ilości lokalizacji w przestrzeni
- Jednozmienna, dwuzmienna lub wielozmienna statystyka jest związana z charakterystyką jednej, dwóch lub wielu cech
- Terminy statystyka jednopunktowa, dwupunktowa lub wielopunktowa są stosowane są stosowane kiedy odnosi się ona do tej samej cechy w jednej, dwóch lub wielu lokalizacjach
- Na przykład, współczynnik korelacji jest statystyka dwuzmienną, podczas gdy semiwariogram – dwupunktową.
- Krossemiwariogram jest statystyką dwuzmienną i dwupunktową, ponieważ uwzględnia dwie różne cechy zarejestrowane w dwóch odmiennych lokalizacjach

---
# Zmienna zregionalizowana

**Zmienna zregionalizowana** - zmienna rozłożona w przestrzeni, używana do opisu zjawisk zachodzących na pewnym obszarze (Matheron, 1965)

**Zmienne zregionalizowane** mają właściwości pośrednie między **zmiennymi losowymi** i **zmiennymi deterministycznymi**

.pull-left[
Z jednej strony charakteryzują się wzajemną korelacją związaną z przestrzennym rozkładem danego zjawiska, z drugiej zaś strony mogą być traktowane lokalnie, jako zmienne losowe - mające określony rozkład prawdopodobieństwa
]
.pull-right[
<img src="04-analiza_autokorelacji_przestrzennej1_files/figure-html/unnamed-chunk-7-1.png" style="display: block; margin: auto;" />
]

*Przykłady:* zanieczyszczenie gleb określoną substancją na pewnym obszarze, jasność spektralna pikseli na zdjęciu satelitarnym, temperatura powietrza, wilgotność gleby, natężenie określonego procesu społecznego lub gospodarczego na badanym obszarze

---
class: inverse, left, bottom

# Miary relacji przestrzennych

---
# Miary relacji przestrzennych

Przestrzenna **kowariancja**, **korelacja** i **semiwariancja** to miary określające przestrzenną zmienność analizowanej cechy.

- **Kowariancja** i **korelacja** to miary podobieństwa pomiędzy dwoma zmiennymi
- Przenosząc to na aspekt przestrzenny, porównujemy wartości jednej i tej samej cechy (zmiennej), ale pomiędzy dwoma punktami odległymi od siebie o pewien dystans (określany jako *lag*, `$h$` )
- Przestrzenna **autokowariancja** i **autokorelacja** to miary podobieństwa pomiędzy jedną zmienną, ale w wielu lokalizacjach oddalonych o przedział odległości
- **Semiwariancja** to miara niepodobieństwa

---
# Miary zmienności jednej zmiennej

Określają przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej.

.pull-left[
**Wariancja** jest średnią arytmetyczną kwadratów odchyleń poszczególnych obserwacji od średniej arytmetycznej zbiorowości

`$$\sigma^2 = \frac{1}{N} \sum_{\alpha=1}^N (z(\alpha) - m)^2$$`
, gdzie

- `$z(\alpha)$` - wartość wybranej obserwacji
  - `$m$` - średnia arytmetyczna zbiorowości
]

.pull-right[
**Odchylenie standardowe** jest pierwiastkiem kwadratowym z wariancji

`$$s = \sqrt{\sigma^2}$$`
]

---
# Miary zmienności dwóch zmiennych

Określają zależność między dwoma zmiennymi.

**Kowariancja** - jej wielkość uzależniona jest od przyjętej skali zmiennych
`$$\sigma_{ij} = \frac{1}{N} \sum_{\alpha=1}^N (z_i(\alpha) - m_i) \cdot (z_j(\alpha) - m_j)$$`
, gdzie:

- `$m_i$` i `$m_j$` to średnie arytmetyczne zmiennych `$i$` i `$j$`

**Korelacja** - jej wartość mieści się między -1 a 1
`$$\rho=\frac{\sigma_{ij}}{s_i \cdot s_j}$$`

---
# Wykres rozrzutu

Pozwala na obrazowanie relacji między dwoma zmiennymi.

Korelacja: 0,14

---
# Wykres rozrzutu

Pozwala na obrazowanie relacji między dwoma zmiennymi.

Korelacja: 0,94

---
# Przedział odległości

Powyższe miary odległości, zamiast badania relacji dwóch zmiennych, można wykorzystać do porównania wartości jednej zmiennej, ale w wielu parach lokalizacji oddalonych o przedział odległości inaczej nazywany "odstępem" lub "przesunięciem" ( `$h$` ).