Tag ggplot2
Wer mit ggplot2 ansprechende Grafiken erstellen will, findet mit den vier fortgeschrittenen Schichten flexible Möglichkeiten dafür.
The post ggplot2: Die vier fortgeschrittenen Schichten first appeared on Statistik Dresden.... mehr auf statistik-dresden.de
Vor gut 30 Jahren wurde die Programmiersprache R veröffentlicht. Geschichte im Überblick: Meilensteine wie CRAN, UseR, ggplot2, ROpenSci, dplyr, R-Ladies, Shiny, tidyverse, Tidy Tuesday, Quarto, Posit, WebR, Positron, ...
The post 30 Jahre: Meilensteine de... mehr auf statistik-dresden.de
Zeitreihenanalyse ist ein Spezialthema, das in R von spezialisierten Paketen abgedeckt wurde und wird. So entstand eine Nische, die sich weitgehend unabhängig von neueren R-Paketen zur Datenanalyse entwickelte. tidyquant von Matt Dancho und Davis Vaughan baut eine Brücke zwischen zeitreihen-spezifischen Paketen wie quantmod, xts, zoo, Performan... mehr auf statistik-dresden.de
Fehlwerte können große Herausforderungen in der Datenanalyse darstellen. Warum fehlen Datenpunkte? Welche Eigenschaften weisen diese Fälle auf im Vergleich zu Fällen, deren Daten vollständig vorliegen? Gibt es Muster, oder fehlen Daten „zufällig“? Visualisierung kann die Beantwortung solcher Fragen sehr vereinfachen. Das naniar-Paket... mehr auf statistik-dresden.de
Mit dem R-Paket ggstatsplot kann man sehr leicht Gruppenvergleiche mit statistischen Kennzahlen grafisch darstellen. Unterstützt werden Tests für abhängige und unabhängige Stichproben, parametrische und nichtparametrische Tests, robuste Tests sowie Bayes-Verfahren.
The post Statistische G... mehr auf statistik-dresden.de
Der Erfolg von Datenanalysen beruht nicht nur auf den Ergebnissen selbst, sondern zunehmend auch darauf, wie sie präsentiert und anderen zugänglich gemacht werden. R bietet mit Shiny ein großartiges Werkzeug, um interaktive Webapplikationen zu erstellen. Dazu sind weder HTML- noch CSS- oder Javascript-Kenntnisse erforderlich. Shiny: Umdenken von... mehr auf statistik-dresden.de
ggplot2 ist der de-facto-Standard, um professionelle, ansprechende Grafiken in R zu erstellen. Heute sehen wir uns die drei Basisschichten an, die für jede ggplot2-Grafik erforderlich sind. ggplot2 basiert auf der Grammatik der grafischen Darstellung (Grammar of Graphics), die auf Leland Wilkinson zurückgeht. Er beschrieb das Konzept unabhängig ... mehr auf statistik-dresden.de
Einfache Codebeispiele für Balkendiagramme in Base R und mit ggplot2, inkl. horizontaler Balken, Legende, gestapelte und gruppierte Balken. Beitrag basiert auf Gastvideo von Joachim Schork von Statistics Globe - Dank an Joachim!
The post Balkendiagramme erstellen in Base R und mit ggplot2... mehr auf statistik-dresden.de
Wie kann man große Datenmengen in R so darstellen, dass sie gut lesbar sind und viele Informationen preisgeben? „Große Datenmengen“ verstehen wir hier im Sinne von „viele Untergruppen“, nicht unbedingt im Sinne von vielen Gigabyte. Wer versiert ist, denkt vielleicht an eine Shiny App, die große Flexibilität und viele Nutz... mehr auf statistik-dresden.de
Regressionsmodelle sind nach wie vor sehr populär in der Statistik, dem Data Mining, Data Science und Machine Learning – das belegen aktuelle Zahlen, die KDNuggets kürzlich via Twitter präsentierte: Heute geht es um Möglichkeiten, solche Modelle mit der frei erhältlichen Software R / RStudio zu visualisieren. Wir nutzen den weit verbreiteten ... mehr auf statistik-dresden.de
Bing Crosby’s White Christmas drückt die Sehnsucht nach Weißer Weihnacht so überzeugend aus, dass es als bestverkaufte Single aller Zeiten gilt (Roy J. Harris Jr. im Wall Street Journal 2009). Gilt das auch für den Charterfolg? tsort.info hat ein ausgefeiltes Punktesystem entwickelt: Je länger in den Charts und je höher, desto mehr Punkte; be... mehr auf statistik-dresden.de
2016 machte Hadley Wickham eine Idee populär, von der er zunächst selbst nicht sicher war, ob sie gut ist: genistete Datensätze (nested data frames). Das Prinzip ist einfach: Eine Spalte eines Datensatzes kann selbst ein Datensatz sein. Was zunächst umständlich oder verwirrend klingt, kann zum mächtigen Werkzeug werden – vor allem, wenn man v... mehr auf statistik-dresden.de
Wie kann man die Beträge, die die Bundesländer im Rahmen des Länderfinanzausgleichs zahlten oder erhielten, in einer Grafik darstellen, sodass Veränderungen im Zeitverlauf deutlich werden? Hier eine animierte Grafik, die den Zeitraum von 1988, also kurz vor der Wende, bis 2018 abbildet: Länderfinanzausgleich: Entwicklungen 1988 bis 2018 In diesen 3... mehr auf statistik-dresden.de
Bis vor kurzem habe ich das plotly-Paket von Carson Sievert fast nur mit der ggploty()-Funktion genutzt. Doch plotly kann so viel mehr! Hier verknüpfen wir zwei interaktive Diagramme, sodass man aus einem Übersichtsdiagramm Gruppen auswählen kann, die dann in einem detaillierteren Diagramm automatisch hervorgehoben werden. Präsentation per Dashb... mehr auf statistik-dresden.de
Diagramme zu erstellen und zu speichern kann viel Zeit in Anspruch nehmen, vor allem bei großen Datenmengen oder wenn sehr viele Diagramme automatisiert zu generieren sind. Wie kann man den Vorgang für Diagramme mit dem beliebten ggplot2-Paket beschleunigen? Das ragg-Paket von Thomas Lin Pedersen Das ragg-Paket von Thomas Lin Pedersen ist eine R... mehr auf statistik-dresden.de
2019 legte Claus O. Wilke mit Fundamentals of Data Visualization ein sehr lesenswertes Buch über Datenvisualisierung vor, das einige Vorzüge gegenüber vergleichbaren Werken bietet: Wer es gerne physisch in Papierform in der Hand hält, kann es selbstverständlich käuflich erwerben. Es steht jedoch auch kostenlos online im Volltext zur Verfügung. D... mehr auf statistik-dresden.de
Die erfolgreichsten Alben der 1960er Jahre stammten von den Beatles: sie beherrschten die Top 5 der Gesamtwertung seit 1949 ab 1968 komplett. Welche Alben der 1970er Jahre schaffen es, Beatles-Alben auf den vorderen Plätzen zu verdrängen? Auf Basis der Daten von tsort.info, Version 2.7.0010 stellen wir wiederum jeweils die Top 5 eines Jahres, die T... mehr auf statistik-dresden.de
Zwei Beatles-Alben überstanden die 1970er Jahre an der Spitze der Top 5 der erfolgreichsten Alben der Chartgeschichte: Sgt. Pepper’s Lonely Hearts Club Band und Abbey Road. Dahinter folgen die Bee Gees mit Saturday Night Fever, Pink Floyd mit Dark Side Of The Moon und Fleetwood Mac mit Rumours. Wie verändern sich die Top 5 im … ... mehr auf statistik-dresden.de
In den letzten Jahren wurden mehrfach Artikel publiziert, die auf ein gravierendes Problem hinwiesen: Schätzungen zufolge sind deutlich mehr als die Hälfte der prä-klinischen Studienergebnisse nicht reproduzierbar. Wissenschaftliche Studienergebnisse oft nicht reproduzierbar So titelte das Wall Street Journal im Dezember 2011: “ScientistsR... mehr auf statistik-dresden.de
Boxplots geben einen schnellen Überblick über Verteilungen. Wie kann man sie informativer gestalten als das Standard-Boxplot? Hier geht es um Ideen mit ggplot2 sowie einigen Erweiterungspaketen. Das folgende Video ist mein erstes, das auf einem Storyboard basiert – umgesetzt mit dem flexdashboard-Paket, das eine Erweiterung des R Markdown-... mehr auf statistik-dresden.de
2019 legte Claus O. Wilke mit Fundamentals of Data Visualization ein sehr lesenswertes Buch über Datenvisualisierung vor, das einige Vorzüge gegenüber vergleichbaren Werken bietet: Wer es gerne physisch in Papierform in der Hand hält, kann es selbstverständlich käuflich erwerben. Es steht jedoch auch kostenlos online im Volltext zur Verfügung. D... mehr auf statistik-dresden.de
Welche Alben waren die erfolgreichsten der Chartgeschichte – nach Jahr, Jahrzehnt, und insgesamt? Wie beim letzten Mal beziehen wir uns auf das Punktesystem von tsort.info. Nur diesmal zeigen wir Animationen, bei denen man beobachten kann, wie sich Jahr für Jahr die Top-5 des Jahrzehnts und der Gesamtwertung verändern. Die Punkte beziehen sic... mehr auf statistik-dresden.de
Was sind die erfolgreichsten Alben der 1960er Jahre? Wie im Gesamt-Überblick 1949-1999 stellen wir jeweils die Top-5 eines Jahres dar, daneben die Top-5 des Jahrzehnts, wie sie sich Jahr für Jahr verändert (oder auch nicht), und die Top-5 der Gesamtwertung seit 1949, ebenfalls bis zu diesem Zeitpunkt. Datenbasis ist wiederum tsort.info, Version 2.7... mehr auf statistik-dresden.de
ggplot2 ist ein mächtiges Werkzeug, um professionelle Diagramme zu erstellen. Für Einsteiger ist die Syntax nicht immer intuitiv. Abhilfe schafft eine grafische Oberfläche, mit der man Variablen mit der Maus auswählen und in Felder schieben kann („drag and drop“): esquisse. So erhält man schnell aussagekräftige Diagramme und kann Dat... mehr auf statistik-dresden.de
Wenn R-Code zu langsam läuft, sind es oft nur ganz bestimmte Stellen, die optimiert werden müssen. Nicht immer ist sofort klar, welche Codezeilen das sind. Daher ist es sinnvoll zu wissen, wie man solche Flaschenhälse (oder „Bremsklötze“) effizient und elegant finden kann. Ein hilfreiches Werkzeug dafür ist das sogenannte Profiling: ... mehr auf statistik-dresden.de
Welche Alben der 1990er Jahre erreichten den größten Chart-Erfolg? Die Top 5 der erfolgreichsten Alben, die bis 1989 erschienen, waren laut der Daten von tsort.info (Version 2.7.0010): The Beatles (1967): Sgt. Pepper’s Lonely Hearts Club Band Michael Jackson (1982): Thriller The Beatles (1969): Abbey Road U2 (1987): The Joshua Tree Bee Gees (... mehr auf statistik-dresden.de
Die Open-Source-Software R ist ein großartiges Werkzeug zur Datenanalyse. Zahlreiche statistische Verfahren und Visualisierungen können mit wenigen Codezeilen erstellt werden. Dafür steht eine Vielzahl an Funktionen zur Verfügung. Funktionales Programmieren und Objektorientiertes Programmieren Automatisiert man solche Analysen, so bewegt man sich i... mehr auf statistik-dresden.de
ggplot2 ist ein mächtiges Werkzeug, um ansprechende Grafiken zu erstellen. Will man Zuhörer oder Leser „mitnehmen“, empfiehlt es sich, nicht nur Daten zu präsentieren, sondern auch eine Geschichte damit zu erzählen. Unser Storytelling-Beispiel bezieht sich auf den Länderfinanzausgleich. Unter Storytelling verstehe ich hier: Bestimmte Aspekte hervor... mehr auf statistik-dresden.de
Fehlwerte können große Herausforderungen in der Datenanalyse darstellen. Warum fehlen Datenpunkte? Welche Eigenschaften weisen diese Fälle auf im Vergleich zu Fällen, deren Daten vollständig vorliegen? Gibt es Muster, oder fehlen Daten „zufällig“? Visualisierung kann die Beantwortung solcher Fragen sehr vereinfachen. Das naniar-Paket... mehr auf statistik-dresden.de
Der Erfolg von Datenanalysen beruht nicht nur auf den Ergebnissen selbst, sondern zunehmend auch darauf, wie sie präsentiert und anderen zugänglich gemacht werden. R bietet mit Shiny ein großartiges Werkzeug, um interaktive Webapplikationen zu erstellen. Dazu sind weder HTML- noch CSS- oder Javascript-Kenntnisse erforderlich. Shiny: Umdenken von... mehr auf statistik-dresden.de
Seit etwa 6 Jahren liegt mein beruflicher Fokus auf der Entwicklung und Durchführung von R-Workshops / R-Seminaren / R-Kursen. Zeit, über einige Erfahrungen zu reflektieren. R-Seminare: Wie kam es dazu? Nach dem Soziologie-Studium und einer kurz befristeten Stelle an der Medizinischen Fakultät der Universität Leipzig, wo ich Zusammenhänge von Le... mehr auf statistik-dresden.de
Manche Kennzahlen in unserer verrückten Welt wachsen exponentiell. In vielen Fällen zählen Staatsschulden und Haushaltsdefizite dazu. Oft werden solche Zusammenhänge in Liniendiagrammen dargestellt. Hier möchte ich eine alternative Darstellung vorschlagen: animierte Treemaps. Anstieg des US-Haushaltsdefizits nach Präsident: Animierte Treemap Hier g... mehr auf statistik-dresden.de
Diagrammerstellung mit großen Datenmengen aus Datenbanken kann herausfordernd sein. Wie geht das möglichst effizient? Ad-hoc-Datenbank im Arbeitsspeicher Wir nutzen Daten über weltweite Chart-Erfolge von Songs und Alben und packen sie in eine Ad-hoc-Datenbank im Arbeitsspeicher. Das genügt, um die Ideen zu demonstrieren, und erspart Aufwand mit ... mehr auf statistik-dresden.de
Seit etwa 6 Jahren liegt mein beruflicher Fokus auf der Entwicklung und Durchführung von R-Workshops / R-Seminaren / R-Kursen. Zeit, über einige Erfahrungen zu reflektieren. R-Seminare: Wie kam es dazu? Nach dem Soziologie-Studium und einer kurz befristeten Stelle an der Medizinischen Fakultät der Universität Leipzig, wo ich Zusammenhänge von Le... mehr auf statistik-dresden.de