Tag suchen

Tag:

Tag dplyr

R 4.1.0: Base R Pipe! |> 24.05.2021 17:36:02

pipe tidyverse data.table r-programmierung magrittr bench praxisbeispiel dplyr
Am 18.5.2021 wurde R Version 4.1.0 veröffentlicht, und sie brachte (fast) eine Revolution: Einen Pipe Operator, nativ in Base R eingebaut! Pipe Operator in R seit 2014: magrittr / dplyr Mit dem magrittr-Paket wurde 2014 der Pipe-Operator %>% in R zur Verfügung gestellt. Er hat sich rasch durchgesetzt und erfreut sich sehr großer Beliebtheit.... mehr auf statistik-dresden.de

Textantworten (offene Nennungen) automatisch zuordnen in R nach Ähnlichkeit 22.04.2020 18:19:00

textantwort tidyverse regular expression textanalyse regulã¤rer ausdruck regulärer ausdruck r / rstats / rstudio praxisbeispiel tidyr dplyr stringr
Wie kann man Textantworten automatisch in R codieren, wenn es viele ähnliche, aber nicht exakt gleiche Einträge gibt? Mit dem R-Paket tidystringdist! The post Textantworten (offene Nennungen) automatisch zuordnen in R nach Ähnlichkeit first appeared on ... mehr auf statistik-dresden.de

data.table vs. dplyr und dtplyr: Benchmarks 27.07.2020 13:29:08

dplyr praxisbeispiel dtplyr data.table tidyverse microbenchmark r / rstats / rstudio lazy evaluation
Zwei der populärsten Pakete zur Datenaufbereitung in R sind data.table (Matt Dowle, Arun Srinivasan, viele Mitarbeiter) und dplyr (Hadley Wickham, viele Mitarbeiter). Während data.table zu Recht den Ruf hat, sehr schnell zu sein, hat dplyr vielen den Einstieg in R enorm erleichtert. Geschwindigkeitsvergleiche: data.table vs. dplyr – beacht... mehr auf statistik-dresden.de

SQL-Datenbanken mit R ansprechen: Drei Strategien 28.03.2022 18:15:48

dbplyr rstudio markdown dbi praxisbeispiel hadley wickham dplyr sql tidyverse datenbank r-programmierung
R bietet mehrere Möglichkeiten, mit Datenbanken zu kommunizieren. Dieser Artikel richtet sich sowohl an R-Anwender, die noch nicht von R aus mit Datenbanken gearbeitet haben, als auch an solche, die dies bereits tun, aber bisher nur eine Möglichkeit genutzt haben. So kann jedeR den Ansatz auswählen, der für den jeweiligen Anwendungsfall am beste... mehr auf statistik-dresden.de

Doubletten ausschließen in R: unique() und wie man es schneller macht 27.12.2020 16:48:30

r / rstats / rstudio microbenchmark garbage collector tidyverse data.table jim hester duplicated doublette unique dplyr bench praxisbeispiel
Eine Kundin erzählte mir kürzlich, dass sie die Base R-Funktion unique() nutzt, um Doubletten aus ihren Daten auszuschließen. Sie erhält damit das gewünschte Resultat, allerdings sei ihr Code zu langsam. Zwei Ideen kamen mir, den Code zu beschleunigen: 1. Statt alle Spalten bei der Suche nach Doubletten zu berücksichtigen, müsste eine Auswahl an... mehr auf statistik-dresden.de

Textantworten (offene Nennungen) codieren mit R: stringr und regex 21.04.2020 19:15:06

textanalyse regulã¤rer ausdruck regular expression tidyverse textantwort r / rstats / rstudio regulärer ausdruck dplyr praxisbeispiel funktionales programmieren stringr
Oft wird ein großer Teil der Projektzeit nicht für die spannenden Modelle, sondern für die meist etwas weniger spannend empfundene Datenaufbereitung verwendet. Ein typischer Stolperstein dabei ist die Codierung von Textantworten (offene Nennungen). Wie können wir uns diese Arbeit mit R erleichtern? Anhand eines einfachen Beispiels („Warum ... mehr auf statistik-dresden.de

SQL-Datenbanken mit R ansprechen: Drei Strategien 28.03.2022 18:15:48

r-programmierung tidyverse datenbank sql dplyr hadley wickham praxisbeispiel dbi markdown rstudio dbplyr
R bietet mehrere Möglichkeiten, mit Datenbanken zu kommunizieren. Dieser Artikel richtet sich sowohl an R-Anwender, die noch nicht von R aus mit Datenbanken gearbeitet haben, als auch an solche, die dies bereits tun, aber bisher nur eine Möglichkeit genutzt haben. So kann jedeR den Ansatz auswählen, der für den jeweiligen Anwendungsfall am beste... mehr auf statistik-dresden.de

R-Version 4.5.0: Was ist neu? 27.05.2025 21:40:04

r-programmierung python blas use lapack dplyr praxisbeispiel rstudio rig r-paket
Im April wurde turnusmäßig eine neue R-Version veröffentlicht: 4.5.0. Was ist neu – und lohnt sich ein zeitnahes Update? Spoiler: Ja! Unter anderem wurde R in mehrerlei Hinsicht schneller. Es gibt eine Menge Änderungen, die man mit news() in der R-Konsole aufrufen kann. Schnellere Paket-Installationen install.packages() und download.packag... mehr auf statistik-dresden.de

R-Programmierung: Was ist %>% ? dplyr vs. Base R 11.09.2019 13:26:32

magrittr praxisbeispiel hadley wickham dplyr pipe r / rstats / rstudio
Was bedeutet die sonderbar anmutende Zeichenkombination %>% , die man seit ein paar Jahren häufig in R-Skripten findet? Woher kommt sie und wie können wir sie nutzen, um eleganteren und besser lesbaren R-Code zu schreiben? R und moderne Kunst: René Magritte R inspiriert uns mit %>% , wenigstens einen kurzen Abstecher in die moderne Kunst … ... mehr auf statistik-dresden.de

Diagramme mit Daten aus Datenbanken in R: dbplot 24.03.2021 14:53:56

raster plot dbplyr praxisbeispiel dplyr datenvisualisierung forcats balkendiagramm streudiagramm ggplot2 xaringan tidyverse histogramm datenbank dbplot r-programmierung
Diagrammerstellung mit großen Datenmengen aus Datenbanken kann herausfordernd sein. Wie geht das möglichst effizient? Ad-hoc-Datenbank im Arbeitsspeicher Wir nutzen Daten über weltweite Chart-Erfolge von Songs und Alben und packen sie in eine Ad-hoc-Datenbank im Arbeitsspeicher. Das genügt, um die Ideen zu demonstrieren, und erspart Aufwand mit ... mehr auf statistik-dresden.de

R-Projekte vor Paket-Updates schützen: renv 23.03.2021 15:44:00

r-programmierung projekte packrat rstudio praxisbeispiel renv dplyr
„Never change a running system!“„Ändere nie ein System, das funktioniert!“ In aller Regel ist es eine gute Idee, Software aktuell zu halten: also etwa bei R, RStudio und Erweiterungspaketen Updates mitzunehmen. Manchmal haben Updates jedoch die unangenehme Nebenwirkung, bisher funktionierenden Code zu „brechen“... mehr auf statistik-dresden.de