class: inverse, left, nonum, clear background-image: url("figs/pencil2.jpg") background-size: cover .titlestyle[Statystyka:] <br> .captionstyle[Wizualizacja danych 2] <br><br><br><br><br><br> <br><br><br><br><br><br><br> .captionstyle[Jakub Nowosad, *nowosad@amu.edu.pl*] <!-- https://www.si.edu/object/map-making-pencils:nmah_1825017 --> --- class: inverse, left, bottom # Typy wykresów --- # Typy wykresów [Directory of visualizations (*jedna z możliwych klasyfikacji*)](https://clauswilke.com/dataviz/directory-of-visualizations.html): - Ilości - Rozkłady - Proporcje - Relacje - Niepewność - Dane przestrzenne <!-- inne typy wykresów (klasyfikacja przykladowa -- https://clauswilke.com/dataviz/directory-of-visualizations.html) --> --- # Typy wykresów: Ilości *Wykresy słupkowe (2 zmienne)* .pull-left[ <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-2-1.png" style="display: block; margin: auto;" /> ] -- .pull-right[ <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-3-1.png" style="display: block; margin: auto;" /> ] --- # Typy wykresów: Ilości *Wykresy słupkowe (3 zmienne)* .pull-left[ <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-5-1.png" style="display: block; margin: auto;" /> ] -- .pull-right[ <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-6-1.png" style="display: block; margin: auto;" /> ] --- # Typy wykresów: Ilości *Wykresy słupkowe (3 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-7-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Ilości *Wykresy kropkowe (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-8-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Ilości [*Heatmapy*](https://poradniajezykowa.uw.edu.pl/porady/heat-map/) *(3 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-9-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Rozkłady *Histogramy i wykresy gęstości (1 zmienna)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-11-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Rozkłady *Wykresy gęstości (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-12-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Rozkłady *Wykresy grzbietowe (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-13-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Rozkłady *Wykresy pudełkowe (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-14-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Rozkłady *Wykresy skrzypcowe (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-15-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Rozkłady *Dystrybuanta (ang. cumulative distribution function - CDF)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-16-1.png" style="display: block; margin: auto;" /> *Inne: piramidy wieku* --- # Typy wykresów: Proporcje *Wykresy słupkowe częstości (1 lub 2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-17-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Proporcje *Wykresy kołowe (1 lub 2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-18-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Proporcje *Wykresy skumulowane słupkowe (1 lub 2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-19-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Proporcje *Wykresy skumulowane słupkowe (3 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-20-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Proporcje *Wykresy mozaikowe (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-21-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Proporcje *Tree map (2/3/4 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-22-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Relacje *Wykresy punktowe (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-23-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: *Wykresy punktowe (3 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-24-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Relacje *Wykresy punktowe (3 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-25-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Relacje <!-- https://clauswilke.com/dataviz/visualizing-associations.html#associations-correlograms --> <!-- korelacje --> *Korelogramy (2+ zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-26-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Relacje *Wykresy liniowe (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-27-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Relacje *Wykresy liniowe z wypełnionym obszarem (2 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-28-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Relacje *Wykresy liniowe (3 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-29-1.png" style="display: block; margin: auto;" /> --- # Typy wykresów: Relacje *Wykresy liniowe (3 zmienne)* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-30-1.png" style="display: block; margin: auto;" /> Inne: https://jakubnowosad.com/iiasa2023/#/supercells-2 --- # Typy wykresów: Relacje <!-- trendy --> https://clauswilke.com/dataviz/visualizing-trends.html --- # Typy wykresów: Niepewność https://clauswilke.com/dataviz/visualizing-uncertainty.html --- # Typy wykresów: Dane przestrzenne - https://r.geocompx.org/adv-map - https://r-tmap.github.io/tmap-book/ --- class: inverse, left, bottom # Skale pomiarowe --- # Skale pomiarowe *Układ współrzędnych kartezjańskich* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-31-1.png" style="display: block; margin: auto;" /> --- # Skale pomiarowe *Układ współrzędnych kartezjańskich*: ta sama jednostka na obu osiach (błędnie) <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-32-1.png" style="display: block; margin: auto;" /> --- # Skale pomiarowe *Układ współrzędnych kartezjańskich*: ta sama jednostka na obu osiach (poprawnie) <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-33-1.png" style="display: block; margin: auto;" /> --- # Skale pomiarowe *Układ współrzędnych kartezjańskich*: zmienna posiada bardzo zróżnicowane wartości (błędnie) <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-34-1.png" style="display: block; margin: auto;" /> --- # Skale pomiarowe *Zastowowanie skali logarytmicznej*: zmienna posiada bardzo zróżnicowane wartości (poprawnie) <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-35-1.png" style="display: block; margin: auto;" /> Inne: [skala pierwiastkowa, skala cykliczna, przestrzenne układy współrzędnych](https://clauswilke.com/dataviz/coordinate-systems-axes.html) --- class: inverse, left, bottom # Skale kolorystyczne --- # Skale kolorystyczne Skale jakościowe: - brak konkretnego uporządkowania kategorii - każdy kolor powinien otrzymać taką samą wagę percepcyjną *Set3*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-37-1.png" style="display: block; margin: auto;" /> *Set2*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-38-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-39-1.png" style="display: block; margin: auto;" /> <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-40-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne Sekwencyjne/Ilościowe: - uporządkowana informacja - kolory zmieniają się od wartości wysokiej do niskiej (lub odwrotnie) *Greens*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-41-1.png" style="display: block; margin: auto;" /> *Viridis*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-42-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-43-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-44-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-45-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne Rozbieżne (dwubiegunowe): - Informacja wokół centralnej neutralnej wartości - Kolory rozchodzą się od neutralnej do dwóch skrajnych wartości *Temps*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-46-1.png" style="display: block; margin: auto;" /> *Earth*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-47-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-48-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne *Ślepota barw* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-49-1.png" style="display: block; margin: auto;" /> ``` ## name n tolerance ncp ndcp min_dist mean_dist max_dist ## 1 normal 7 15.22036 21 21 15.220363 36.65304 66.55783 ## 2 deuteranopia 7 15.22036 21 12 5.294656 19.22404 41.68858 ## 3 protanopia 7 15.22036 21 12 3.192646 20.36599 42.73267 ## 4 tritanopia 7 15.22036 21 17 8.576467 35.96531 64.52385 ``` --- # Skale kolorystyczne *Temps*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-50-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne *Earth*: <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-51-1.png" style="display: block; margin: auto;" /> --- # Skale kolorystyczne <!-- https://clauswilke.com/dataviz/color-basics.html#color-as-a-tool-to-highlight --> <!-- accent color scales --> *Stosowanie kolorów jako wyróżnienia* <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-53-1.png" style="display: block; margin: auto;" /> --- class: inverse, left, bottom # Tekst na wykresach --- # Tekst na wykresach Dodanie informacji z danych lub jej podkreślenie <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-54-1.png" style="display: block; margin: auto;" /> --- # Tekst na wykresach Dodanie zewnętrznej informacji <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-55-1.png" style="display: block; margin: auto;" /> --- # Tekst na wykresach Dodanie komentarza <img src="04-wizualizacja_danych2_files/figure-html/unnamed-chunk-56-1.png" style="display: block; margin: auto;" /> --- # Tekst na wykresach Inne: [dobór czcionki](https://r-tmap.github.io/tmap-book/layout.html) --- class: inverse, left, bottom # Złe praktyki --- # Złe praktyki https://socviz.co/lookatdata.html#what-makes-bad-figures-bad 1. Zły gust 2. Błędne dane 3. Problematyczna percepcja https://github.com/cxli233/FriendsDontLetFriends https://clauswilke.com/dataviz/no-3d.html http://biecek.pl/Eseje/indexPomylka.html Lie Factor: współczynnik mierzący jak bardzo wykres przekłamuje relacje obecne w danych <!-- czego nie robić: --> <!-- za dużo kolorów --> --- class: inverse, left, bottom # Dobre praktyki --- # Dobre praktyki https://clauswilke.com/dataviz/proportional-ink.html https://clauswilke.com/dataviz/overlapping-points.html https://clauswilke.com/dataviz/color-pitfalls.html https://stat545.com/effective-graphs.html#do-make-the-data-stand-out https://cedricscherer.netlify.app/2019/05/17/the-evolution-of-a-ggplot-ep.-1/ https://medium.economist.com/mistakes-weve-drawn-a-few-8cdd8a42d368 <!-- ideas - przetworzenie przed wizualizacją - style wykresów (e.g., theme/czarne tło) - animacje - wykresy interaktywne - infografiki, etc. - workflows --> --- class: inverse, left, bottom # Dodatkowe źródła informacji --- # Dodatkowe źródła informacji - książka [Odkrywać! Ujawniać! Objaśniać! Zbiór esejów o sztuce prezentowania danych](http://biecek.pl/Eseje/index.html) - książka [Fundamentals of Data Visualization](https://clauswilke.com/dataviz/) - książka [Data Visualization: A practical introduction](http://socviz.co/) - strona [from Data to Viz](https://www.data-to-viz.com/) - strona [Top 50 ggplot2 Visualizations - The Master List (With Full R Code)](http://r-statistics.co/Top50-Ggplot2-Visualizations-MasterList-R-Code.html) - strona [BBC Visual and Data Journalism cookbook for R graphics](https://bbc.github.io/rcookbook/) - post [Do’s and Don’ts for Effective Graphs](http://stat545.com/block015_graph-dos-donts.html) - post [Real Chart Rules to Follow](http://flowingdata.com/2015/08/11/real-chart-rules-to-follow/) - post [Mistakes, we’ve drawn a few: Learning from our errors in data visualisation](https://medium.economist.com/mistakes-weve-drawn-a-few-8cdd8a42d368) - post [The Evolution of a ggplot (Ep. 1)](https://cedricscherer.netlify.com/2019/05/17/the-evolution-of-a-ggplot-ep.-1/) - galeria [R Graph Catalog](https://shiny.srvanderplas.com/r-graph-catalog/) <!-- - galeria [Data is ugly](https://www.reddit.com/r/dataisugly/) -->