Tag suchen

Tag:

Tag tidyverse

R 4.1.0: Base R Pipe! |> 24.05.2021 17:36:02

bench dplyr pipe magrittr praxisbeispiel data.table tidyverse r-programmierung
Am 18.5.2021 wurde R Version 4.1.0 veröffentlicht, und sie brachte (fast) eine Revolution: Einen Pipe Operator, nativ in Base R eingebaut! Pipe Operator in R seit 2014: magrittr / dplyr Mit dem magrittr-Paket wurde 2014 der Pipe-Operator %>% in R zur Verfügung gestellt. Er hat sich rasch durchgesetzt und erfreut sich sehr großer Beliebtheit.... mehr auf statistik-dresden.de

30 Jahre: Meilensteine der Programmiersprache R 12.08.2024 17:40:44

kurt hornik robert gentleman bioconductor gnu leaflet rstudio quarto tidyverse positron r-programmierung john chambers r-ladies gpl ross ihaka ggplot2 friedrich leisch webr hadley wickham posit cran jenny bryan
Vor gut 30 Jahren wurde die Programmiersprache R veröffentlicht. Geschichte im Überblick: Meilensteine wie CRAN, UseR, ggplot2, ROpenSci, dplyr, R-Ladies, Shiny, tidyverse, Tidy Tuesday, Quarto, Posit, WebR, Positron, ... The post 30 Jahre: Meilensteine de... mehr auf statistik-dresden.de

Zeitreihen visualisieren in R: tidyquant / Amazon-Kurse in der Pandemie 01.12.2021 19:06:48

time series tidyquant ggplot2 r-programmierung tidyverse ggthemes zeitreihenanalyse zeitreihe praxisbeispiel
Zeitreihenanalyse ist ein Spezialthema, das in R von spezialisierten Paketen abgedeckt wurde und wird.  So entstand eine Nische, die sich weitgehend unabhängig von neueren R-Paketen zur Datenanalyse entwickelte. tidyquant von Matt Dancho und Davis Vaughan baut eine Brücke zwischen zeitreihen-spezifischen Paketen wie quantmod, xts, zoo, Performan... mehr auf statistik-dresden.de

Fehlwerte visualisieren in R: Das naniar-Paket 31.01.2022 21:37:23

r-programmierung tidyverse ggplot2 fehlwert praxisbeispiel missing datenvisualisierung
Fehlwerte können große Herausforderungen in der Datenanalyse darstellen. Warum fehlen Datenpunkte? Welche Eigenschaften weisen diese Fälle auf im Vergleich zu Fällen, deren Daten vollständig vorliegen? Gibt es Muster, oder fehlen Daten „zufällig“? Visualisierung kann die Beantwortung solcher Fragen sehr vereinfachen. Das naniar-Paket... mehr auf statistik-dresden.de

R 4.4.0: Was ist neu? 10.05.2024 15:03:20

tailcall hadley wickham rlang rekursiv praxisbeispiel r-programmierung tidyverse
R Version 4.4.0 enthält einige Neuerungen: elegante NULL-Abfragen mit %||% aus rlang, speichereffiziente rekursive Funktionen, Sicherheitspatch beim RDS-Format, und mehr. Fast zeitgleich erschien RStudio 2024.04.0. The post R 4.4.0: Was ist neu? first appeared on ... mehr auf statistik-dresden.de

Von SAS zu R in der Pharmaindustrie: Paradigmenwechsel! 31.01.2024 21:18:39

pharmaindustrie pharmaverse klinische studien r-programmierung open source tidyverse
In den Biowissenschaften und der Pharmaindustrie spielen Datenverarbeitung und insbesondere statistische Datenanalysen eine fundamentale Rolle. Seit Jahrzehnten dominierte dabei die kommerzielle Software SAS (Statistical Analysis System). Nun sind starke Initiativen auf mehreren Ebenen hin zum Einsatz von R in der Pharmaindustrie zu beobachten -... mehr auf statistik-dresden.de

Balkendiagramme erstellen in Base R und mit ggplot2 – Gast-Video von Joachim Schork / Statistics Globe 25.01.2022 18:32:06

praxisbeispiel ggplot2 tidyverse r-programmierung legende balkendiagramm gestapelte balken base r gruppierte balken
Einfache Codebeispiele für Balkendiagramme in Base R und mit ggplot2, inkl. horizontaler Balken, Legende, gestapelte und gruppierte Balken. Beitrag basiert auf Gastvideo von Joachim Schork von Statistics Globe - Dank an Joachim! The post Balkendiagramme erstellen in Base R und mit ggplot2... mehr auf statistik-dresden.de

Textantworten (offene Nennungen) automatisch zuordnen in R nach Ähnlichkeit 22.04.2020 18:19:00

stringr tidyr praxisbeispiel tidyverse regular expression textanalyse dplyr regulärer ausdruck r / rstats / rstudio textantwort regulã¤rer ausdruck
Wie kann man Textantworten automatisch in R codieren, wenn es viele ähnliche, aber nicht exakt gleiche Einträge gibt? Mit dem R-Paket tidystringdist! The post Textantworten (offene Nennungen) automatisch zuordnen in R nach Ähnlichkeit first appeared on ... mehr auf statistik-dresden.de

Regressionsmodelle visualisieren in R: Mit Interaktionseffekten, 3D (ggplot2, plotly) 12.12.2017 14:53:36

visualisierung broom grafische darstellung moderator hadley wickham interaktionseffekt ggfortify tidyverse ggplot2 regression mtcars r / rstats / r studio praxisbeispiel plotly
Regressionsmodelle sind nach wie vor sehr populär in der Statistik, dem Data Mining, Data Science und Machine Learning – das belegen aktuelle Zahlen, die KDNuggets kürzlich via Twitter präsentierte: Heute geht es um Möglichkeiten, solche Modelle mit der frei erhältlichen Software R / RStudio zu visualisieren. Wir nutzen den weit verbreiteten ... mehr auf statistik-dresden.de

data.table vs. dplyr und dtplyr: Benchmarks 27.07.2020 13:29:08

lazy evaluation microbenchmark data.table tidyverse praxisbeispiel r / rstats / rstudio dtplyr dplyr
Zwei der populärsten Pakete zur Datenaufbereitung in R sind data.table (Matt Dowle, Arun Srinivasan, viele Mitarbeiter) und dplyr (Hadley Wickham, viele Mitarbeiter). Während data.table zu Recht den Ruf hat, sehr schnell zu sein, hat dplyr vielen den Einstieg in R enorm erleichtert. Geschwindigkeitsvergleiche: data.table vs. dplyr – beacht... mehr auf statistik-dresden.de

SQL-Datenbanken mit R ansprechen: Drei Strategien 28.03.2022 18:15:48

praxisbeispiel dbi rstudio markdown r-programmierung datenbank tidyverse sql dplyr hadley wickham dbplyr
R bietet mehrere Möglichkeiten, mit Datenbanken zu kommunizieren. Dieser Artikel richtet sich sowohl an R-Anwender, die noch nicht von R aus mit Datenbanken gearbeitet haben, als auch an solche, die dies bereits tun, aber bisher nur eine Möglichkeit genutzt haben. So kann jedeR den Ansatz auswählen, der für den jeweiligen Anwendungsfall am beste... mehr auf statistik-dresden.de

Doubletten ausschließen in R: unique() und wie man es schneller macht 27.12.2020 16:48:30

bench unique dplyr doublette r / rstats / rstudio praxisbeispiel duplicated jim hester data.table tidyverse garbage collector microbenchmark
Eine Kundin erzählte mir kürzlich, dass sie die Base R-Funktion unique() nutzt, um Doubletten aus ihren Daten auszuschließen. Sie erhält damit das gewünschte Resultat, allerdings sei ihr Code zu langsam. Zwei Ideen kamen mir, den Code zu beschleunigen: 1. Statt alle Spalten bei der Suche nach Doubletten zu berücksichtigen, müsste eine Auswahl an... mehr auf statistik-dresden.de

Textantworten (offene Nennungen) codieren mit R: stringr und regex 21.04.2020 19:15:06

tidyverse regular expression textanalyse praxisbeispiel stringr textantwort regulã¤rer ausdruck regulärer ausdruck r / rstats / rstudio funktionales programmieren dplyr
Oft wird ein großer Teil der Projektzeit nicht für die spannenden Modelle, sondern für die meist etwas weniger spannend empfundene Datenaufbereitung verwendet. Ein typischer Stolperstein dabei ist die Codierung von Textantworten (offene Nennungen). Wie können wir uns diese Arbeit mit R erleichtern? Anhand eines einfachen Beispiels („Warum ... mehr auf statistik-dresden.de

Storytelling mit R und ggplot2: Länderfinanzausgleich 28.08.2019 09:53:11

r / rstats / rstudio visualisierung praxisbeispiel tidy data ggplot2 tidyverse
ggplot2 ist ein mächtiges Werkzeug, um ansprechende Grafiken zu erstellen. Will man Zuhörer oder Leser „mitnehmen“, empfiehlt es sich, nicht nur Daten zu präsentieren, sondern auch eine Geschichte damit zu erzählen. Unser Storytelling-Beispiel bezieht sich auf den Länderfinanzausgleich. Unter Storytelling verstehe ich hier: Bestimmte Aspekte hervor... mehr auf statistik-dresden.de

SQL-Datenbanken mit R ansprechen: Drei Strategien 28.03.2022 18:15:48

sql dplyr hadley wickham dbplyr praxisbeispiel dbi rstudio markdown r-programmierung datenbank tidyverse
R bietet mehrere Möglichkeiten, mit Datenbanken zu kommunizieren. Dieser Artikel richtet sich sowohl an R-Anwender, die noch nicht von R aus mit Datenbanken gearbeitet haben, als auch an solche, die dies bereits tun, aber bisher nur eine Möglichkeit genutzt haben. So kann jedeR den Ansatz auswählen, der für den jeweiligen Anwendungsfall am beste... mehr auf statistik-dresden.de

Fehlwerte visualisieren in R: Das naniar-Paket 31.01.2022 21:37:23

datenvisualisierung missing praxisbeispiel tidyverse r-programmierung fehlwert ggplot2
Fehlwerte können große Herausforderungen in der Datenanalyse darstellen. Warum fehlen Datenpunkte? Welche Eigenschaften weisen diese Fälle auf im Vergleich zu Fällen, deren Daten vollständig vorliegen? Gibt es Muster, oder fehlen Daten „zufällig“? Visualisierung kann die Beantwortung solcher Fragen sehr vereinfachen. Das naniar-Paket... mehr auf statistik-dresden.de

6 Jahre R-Seminare / R-Kurse / R-Workshops: Erfahrungsbericht 05.01.2024 16:31:59

xaringan ggplot2 rmarkdown r-programmierung tidyverse quarto markdown plotly shiny powerpoint
Seit etwa 6 Jahren liegt mein beruflicher Fokus auf der Entwicklung und Durchführung von R-Workshops / R-Seminaren / R-Kursen. Zeit, über einige Erfahrungen zu reflektieren. R-Seminare: Wie kam es dazu? Nach dem Soziologie-Studium und einer kurz befristeten Stelle an der Medizinischen Fakultät der Universität Leipzig, wo ich Zusammenhänge von Le... mehr auf statistik-dresden.de

Diagramme mit Daten aus Datenbanken in R: dbplot 24.03.2021 14:53:56

histogramm balkendiagramm forcats datenvisualisierung dplyr dbplyr tidyverse dbplot datenbank r-programmierung streudiagramm ggplot2 xaringan praxisbeispiel raster plot
Diagrammerstellung mit großen Datenmengen aus Datenbanken kann herausfordernd sein. Wie geht das möglichst effizient? Ad-hoc-Datenbank im Arbeitsspeicher Wir nutzen Daten über weltweite Chart-Erfolge von Songs und Alben und packen sie in eine Ad-hoc-Datenbank im Arbeitsspeicher. Das genügt, um die Ideen zu demonstrieren, und erspart Aufwand mit ... mehr auf statistik-dresden.de

6 Jahre R-Seminare / R-Kurse / R-Workshops: Erfahrungsbericht 05.01.2024 16:31:59

shiny powerpoint ggplot2 xaringan rmarkdown r-programmierung tidyverse markdown quarto plotly
Seit etwa 6 Jahren liegt mein beruflicher Fokus auf der Entwicklung und Durchführung von R-Workshops / R-Seminaren / R-Kursen. Zeit, über einige Erfahrungen zu reflektieren. R-Seminare: Wie kam es dazu? Nach dem Soziologie-Studium und einer kurz befristeten Stelle an der Medizinischen Fakultät der Universität Leipzig, wo ich Zusammenhänge von Le... mehr auf statistik-dresden.de