Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.
Beide Seiten, vorherige ÜberarbeitungVorherige ÜberarbeitungNächste Überarbeitung | Vorherige Überarbeitung | ||
lv-wikis-oeffentlich:boot2024:2._arbeiten_mit_r [2025/04/22 22:20] – schirmer | lv-wikis-oeffentlich:boot2024:2._arbeiten_mit_r [2025/04/22 22:35] (aktuell) – schirmer | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
+ | ===== kleine Einführung in R ===== | ||
+ | |||
+ | Dies ist eine kleine Einführung in die Arbeit mit R aus einem Seminar. Es ist noch nicht final für die Veröffentlichung bearbeitet / korrigiert. Sie können es aber schon als Einstieg in R nutzen. | ||
+ | |||
====1. Was ist R?==== | ====1. Was ist R?==== | ||
Zeile 57: | Zeile 61: | ||
Auf der Seite werden euch Links angezeigt, auf die ihr zum Runterladen greifen könnt, je nachdem mit welchem Betriebssystem euer Gerät funktioniert. Bei mir ist das MacOS. | Auf der Seite werden euch Links angezeigt, auf die ihr zum Runterladen greifen könnt, je nachdem mit welchem Betriebssystem euer Gerät funktioniert. Bei mir ist das MacOS. | ||
- | {{: | + | {{:lv-wikis-oeffentlich: |
Wenn du da drauf klickst, werden dir unterschiedliche Informationen zu verschiedenen Versionen gegeben. Je nachdem wie neu oder alt dein Macbook ist, hat es nur Zugriff auf bestimmte MacOs Versionen und demnach musst du dich orientieren. Hier kannst du zwischen zwei Versionen unterscheiden. | Wenn du da drauf klickst, werden dir unterschiedliche Informationen zu verschiedenen Versionen gegeben. Je nachdem wie neu oder alt dein Macbook ist, hat es nur Zugriff auf bestimmte MacOs Versionen und demnach musst du dich orientieren. Hier kannst du zwischen zwei Versionen unterscheiden. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
[Exkurs: Dafür muss dir bewusst sein, welche Version du auf dem Laptop hast. Das findest du beim Macbook in den Systemeinstellungen raus, wenn du auf „Allgemein“ drückst.] | [Exkurs: Dafür muss dir bewusst sein, welche Version du auf dem Laptop hast. Das findest du beim Macbook in den Systemeinstellungen raus, wenn du auf „Allgemein“ drückst.] | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Dann wählst du die passende Version und das Paket wird geladen – in der Regel geht das sehr schnell und braucht nur ein paar Sekunden. Wenn es runtergeladen ist, klickst du drauf und folgendes Fenster öffnet sich: | Dann wählst du die passende Version und das Paket wird geladen – in der Regel geht das sehr schnell und braucht nur ein paar Sekunden. Wenn es runtergeladen ist, klickst du drauf und folgendes Fenster öffnet sich: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Dem folgst du nacheinander, | Dem folgst du nacheinander, | ||
Zeile 76: | Zeile 80: | ||
Zuerst öffnest du diese Webseite dafür: [[https:// | Zuerst öffnest du diese Webseite dafür: [[https:// | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Auch das ist normalerweise recht schnell runtergeladen. Wenn du drauf klickst, öffnet sich folgendes Fenster. Zur Benutzung von R öffnest du einfach die App „RStudio“. | Auch das ist normalerweise recht schnell runtergeladen. Wenn du drauf klickst, öffnet sich folgendes Fenster. Zur Benutzung von R öffnest du einfach die App „RStudio“. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wahrscheinlich wirst du gefragt, ob du die App wirklich öffnen willst, dann klickst du einfach auf " | Wahrscheinlich wirst du gefragt, ob du die App wirklich öffnen willst, dann klickst du einfach auf " | ||
Zeile 88: | Zeile 92: | ||
Was du nach dem Öffnen zuerst siehst, ist das GUI: das Graphical User Interface und dieses besteht aus vier Bereichen: | Was du nach dem Öffnen zuerst siehst, ist das GUI: das Graphical User Interface und dieses besteht aus vier Bereichen: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Fangen wir mit dem „Editor“ an: hiermit wirst du wohl am meisten arbeiten. Du kannst ihn dir wie ein Bereich vorstellen, indem du dein Skript erstellst. Du schreibst hier also deinen Code. Hier kannst du von unterschiedlichen Funktionen Gebrauch machen. Wenn du auf das weiße „Blatt“ mit Plus klickst, erstellst du eine neue „Seite“, | Fangen wir mit dem „Editor“ an: hiermit wirst du wohl am meisten arbeiten. Du kannst ihn dir wie ein Bereich vorstellen, indem du dein Skript erstellst. Du schreibst hier also deinen Code. Hier kannst du von unterschiedlichen Funktionen Gebrauch machen. Wenn du auf das weiße „Blatt“ mit Plus klickst, erstellst du eine neue „Seite“, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Mit dem Symbol daneben (R mit einem Plus) kannst du ein neues Projekt starten und zwischen unterschiedlichen Möglichkeiten wählen, je nachdem was du brauchst. | Mit dem Symbol daneben (R mit einem Plus) kannst du ein neues Projekt starten und zwischen unterschiedlichen Möglichkeiten wählen, je nachdem was du brauchst. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Auf das Symbol mit dem Ordner kannst du klicken, wenn du vorhandene Dateien auf deinem Laptop in R laden magst. | Auf das Symbol mit dem Ordner kannst du klicken, wenn du vorhandene Dateien auf deinem Laptop in R laden magst. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Die folgenden drei Symbole sind dir wahrscheinlich von anderen Systemen wie „Word“ bekannt. Die ersten beiden sind zum Speichern, mit dem anderen Symbol kannst du dein Skript drucken. | Die folgenden drei Symbole sind dir wahrscheinlich von anderen Systemen wie „Word“ bekannt. Die ersten beiden sind zum Speichern, mit dem anderen Symbol kannst du dein Skript drucken. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Gleich darunter werden dir die Dateien angezeigt, die du gerade offen hast. Bei mir ist das gerade ein Skript (Das Dokument „DatenSamml.rmd“, | Gleich darunter werden dir die Dateien angezeigt, die du gerade offen hast. Bei mir ist das gerade ein Skript (Das Dokument „DatenSamml.rmd“, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Diese Datei kann natürlich auch umbenannt werden, indem du die Datei speicherst. Achte darauf, wo du deine Datei auf deinem Laptop abspeicherst, | Diese Datei kann natürlich auch umbenannt werden, indem du die Datei speicherst. Achte darauf, wo du deine Datei auf deinem Laptop abspeicherst, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
In der „Console“ wird dir der ausgeführte Code zusammen mit den Ergebnissen angezeigt. Dort führt R also deine Befehle aus. Auch Fehlermeldungen werden dir dort angezeigt, die dir dann den Hinweis liefern, wieso und wo genau eine Fehlermeldung eingetreten ist. Mit dem „Environment“ erhälst du einen Überblick über die selbst erstellten Objekte. Es werden dir Daten, Variablen, Werte, usw. angezeigt. Im unteren rechten Bereich werden dir unterschiedliche Dateien, Plots, Hilfsangebote und eine Übersicht über die verschiedenen Pakete angezeigt, die du dir installieren kannst. Zu diesen drei Bereichen werden im Laufe der Anleitung ausführlichere Übersichten und Erklärungen kommen. | In der „Console“ wird dir der ausgeführte Code zusammen mit den Ergebnissen angezeigt. Dort führt R also deine Befehle aus. Auch Fehlermeldungen werden dir dort angezeigt, die dir dann den Hinweis liefern, wieso und wo genau eine Fehlermeldung eingetreten ist. Mit dem „Environment“ erhälst du einen Überblick über die selbst erstellten Objekte. Es werden dir Daten, Variablen, Werte, usw. angezeigt. Im unteren rechten Bereich werden dir unterschiedliche Dateien, Plots, Hilfsangebote und eine Übersicht über die verschiedenen Pakete angezeigt, die du dir installieren kannst. Zu diesen drei Bereichen werden im Laufe der Anleitung ausführlichere Übersichten und Erklärungen kommen. | ||
Zeile 124: | Zeile 128: | ||
2. Wenn du die Ergebnisse schneller und einfacher haben willst, kannst du auch folgenden Shortcut benutzen (dieser berechnet dann alle Zeilen): cmd+shift+enter beim Mac, strg+shift+enter bei Windows/ | 2. Wenn du die Ergebnisse schneller und einfacher haben willst, kannst du auch folgenden Shortcut benutzen (dieser berechnet dann alle Zeilen): cmd+shift+enter beim Mac, strg+shift+enter bei Windows/ | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wie du siehst, erscheinen die Ergebnisse unten in der " | Wie du siehst, erscheinen die Ergebnisse unten in der " | ||
Zeile 130: | Zeile 134: | ||
Für komplexere Geschichten in R, müssen z.B. Variablen vorerst definiert werden, damit du anschließend damit weiterrechnen kannst. Das geht, indem du einer Variable (z.B. x) einen Wert zuweist, dafür brauchst du einen Pfeil (<-). Der Pfeil steht fürs Definieren (z.B. x definiert 10, y definiert 30. Also x+y=40). Das kannst du theoretisch auch mit beliebigen anderen Wörtern/ | Für komplexere Geschichten in R, müssen z.B. Variablen vorerst definiert werden, damit du anschließend damit weiterrechnen kannst. Das geht, indem du einer Variable (z.B. x) einen Wert zuweist, dafür brauchst du einen Pfeil (<-). Der Pfeil steht fürs Definieren (z.B. x definiert 10, y definiert 30. Also x+y=40). Das kannst du theoretisch auch mit beliebigen anderen Wörtern/ | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Im Moment, indem du die Berechnung durchläufst, | Im Moment, indem du die Berechnung durchläufst, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Definieren wir mal eine Variable und rechnen den Mittelwert aus. Zusätzlich wollen wir ein Histogramm erstellen. In der „Console“ werden dir die Ergebnisse und deine eingegebenen Definitionen angezeigt. Im „Environment“ entsteht dann deine Variable (grün umrandet), die du einsehen kannst. Wenn du beispielsweise Histogramme erstellst, werden dir die im „Plot“-Bereich angezeigt. | Definieren wir mal eine Variable und rechnen den Mittelwert aus. Zusätzlich wollen wir ein Histogramm erstellen. In der „Console“ werden dir die Ergebnisse und deine eingegebenen Definitionen angezeigt. Im „Environment“ entsteht dann deine Variable (grün umrandet), die du einsehen kannst. Wenn du beispielsweise Histogramme erstellst, werden dir die im „Plot“-Bereich angezeigt. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
===3.1 Pakete=== | ===3.1 Pakete=== | ||
Zeile 146: | Zeile 150: | ||
1. Methode: hauptsächlich, | 1. Methode: hauptsächlich, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
(Die Tabelle habe ich aus Chatgpt, hier der Link für die Konversation: | (Die Tabelle habe ich aus Chatgpt, hier der Link für die Konversation: | ||
Zeile 152: | Zeile 156: | ||
Du kannst das Paket „manuell“ runterladen, | Du kannst das Paket „manuell“ runterladen, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
2. Methode: wenn du mehrere Packages runterladen musst, kannst du eine Variable mit den Packages erstellen und diese im anschließenden Schritt ausführen. Das sieht dann folgendermaßen aus: | 2. Methode: wenn du mehrere Packages runterladen musst, kannst du eine Variable mit den Packages erstellen und diese im anschließenden Schritt ausführen. Das sieht dann folgendermaßen aus: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
===3.2 Good to know=== | ===3.2 Good to know=== | ||
In R gibt es die Funktion eine „Markdown-Datei“ zu erstellen. Diese ermöglicht es, Codes, Grafiken usw. in einem Dokument miteinander zu vereinen. Man kann sie auch als „Cheat-Sheet“ betrachten. Wenn du auf „R Markdown…“ klickst, kannst du dem Dokument und dem Autoren/der Autorin einen Namen geben. Zudem wird das Erstelldatum gespeichert. | In R gibt es die Funktion eine „Markdown-Datei“ zu erstellen. Diese ermöglicht es, Codes, Grafiken usw. in einem Dokument miteinander zu vereinen. Man kann sie auch als „Cheat-Sheet“ betrachten. Wenn du auf „R Markdown…“ klickst, kannst du dem Dokument und dem Autoren/der Autorin einen Namen geben. Zudem wird das Erstelldatum gespeichert. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Eine neue Datei (.rmd) öffnet sich und darin arbeitest du am besten, v.a. wenn es um komplexere Datensätze geht. In der Übersicht wird dir die Markdown kurz erklärt und wozu sie genutzt wird. Das ist deine Übersicht in R: | Eine neue Datei (.rmd) öffnet sich und darin arbeitest du am besten, v.a. wenn es um komplexere Datensätze geht. In der Übersicht wird dir die Markdown kurz erklärt und wozu sie genutzt wird. Das ist deine Übersicht in R: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
===3.3 Datensätze in R laden=== | ===3.3 Datensätze in R laden=== | ||
Zeile 174: | Zeile 178: | ||
Mit welchem Datensatz du arbeitest, entscheidest du natürlich selbst (oder im Seminar), je nach Interesse. Dann wählst du unter den vier Möglichkeiten „ESS11- integrated file, edition 2.0 aus“. (Wichtig!: Damit du die Daten auch aufrufen/ | Mit welchem Datensatz du arbeitest, entscheidest du natürlich selbst (oder im Seminar), je nach Interesse. Dann wählst du unter den vier Möglichkeiten „ESS11- integrated file, edition 2.0 aus“. (Wichtig!: Damit du die Daten auch aufrufen/ | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Dann hast du die Option, zwischen mehreren Programmen zu wählen, mit denen du den Datensatz runterlädst. Am einfachsten ist das SPSS (.sav) Format oder auch das Stata (.dta) Format. Aber auch das (.CSV) Format funktioniert, | Dann hast du die Option, zwischen mehreren Programmen zu wählen, mit denen du den Datensatz runterlädst. Am einfachsten ist das SPSS (.sav) Format oder auch das Stata (.dta) Format. Aber auch das (.CSV) Format funktioniert, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Jetzt willst du natürlich den Datensatz in R laden, damit du auch damit arbeiten kannst. Dafür musst du beachten, wo du deinen geladenen Datensatz im Computer abspeicherst, | Jetzt willst du natürlich den Datensatz in R laden, damit du auch damit arbeiten kannst. Dafür musst du beachten, wo du deinen geladenen Datensatz im Computer abspeicherst, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
**Tipp**: Falls du es nicht weißt: Um den „Pfad“ zu finden, kannst du oben in der Leiste über die „Session“ die „Working Directory“ auswählen. Dann bekommst du Auskunft über den Pfad deiner Datei. | **Tipp**: Falls du es nicht weißt: Um den „Pfad“ zu finden, kannst du oben in der Leiste über die „Session“ die „Working Directory“ auswählen. Dann bekommst du Auskunft über den Pfad deiner Datei. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
In der „Console“ wird dir dann der „Aufenthaltsort“ der Datei beschrieben. | In der „Console“ wird dir dann der „Aufenthaltsort“ der Datei beschrieben. | ||
Spätestens jetzt ist alles bereit, dass du den Datensatz in R laden kannst. Zuerst überlegst du dir einen Namen, der den Datensatz definiert, z.B. „ESSdatensatz“. Das machst du mit dem Pfeil, wie du vorhin beim Definieren von verschiedenen Variablen gelernt hast. Dann soll die Datei „gelesen“ werden, die du auf deinem Laptop abgespeichert hast und die du ja wie beschrieben mit dem Pfad findest. | Spätestens jetzt ist alles bereit, dass du den Datensatz in R laden kannst. Zuerst überlegst du dir einen Namen, der den Datensatz definiert, z.B. „ESSdatensatz“. Das machst du mit dem Pfeil, wie du vorhin beim Definieren von verschiedenen Variablen gelernt hast. Dann soll die Datei „gelesen“ werden, die du auf deinem Laptop abgespeichert hast und die du ja wie beschrieben mit dem Pfad findest. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wenn du auf den grünen Pfeil rechts klickst, durchläuft R immer den ganzen Chunk (das sind die einzelnen grauen „Bereiche“). Das kannst du aber auch ganz einfach mit einem Shortcut durchlaufen lassen, wie ich euch im Kapitel zu Shortcuts zeigen werde. | Wenn du auf den grünen Pfeil rechts klickst, durchläuft R immer den ganzen Chunk (das sind die einzelnen grauen „Bereiche“). Das kannst du aber auch ganz einfach mit einem Shortcut durchlaufen lassen, wie ich euch im Kapitel zu Shortcuts zeigen werde. | ||
Wenn der Chunk durchlaufen wurde, erscheint im „Environment“ eine neue " | Wenn der Chunk durchlaufen wurde, erscheint im „Environment“ eine neue " | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wenn du auf diese klickst, öffnet sich ein Tab mit den ganzen Angaben (also vom ganzen Datensatz, den du runtergeladen hast). Das kannst du aber auch einfach wieder zuklappen, diese Angaben dienen nur zur genaueren Information und du brauchst sie in der Regel nicht dauerhaft. Das sieht dann ungefähr so aus: | Wenn du auf diese klickst, öffnet sich ein Tab mit den ganzen Angaben (also vom ganzen Datensatz, den du runtergeladen hast). Das kannst du aber auch einfach wieder zuklappen, diese Angaben dienen nur zur genaueren Information und du brauchst sie in der Regel nicht dauerhaft. Das sieht dann ungefähr so aus: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
===3.4 Mit Datensätzen arbeiten=== | ===3.4 Mit Datensätzen arbeiten=== | ||
Zeile 206: | Zeile 210: | ||
Nehmen wir mal an, du willst die Daten aus Deutschland analysieren. Dafür kannst du einen Code benutzen, der aus den Datensätzen nur die Daten aus Deutschland anzeigt. Anschließend kannst du dann damit weiter analysieren. | Nehmen wir mal an, du willst die Daten aus Deutschland analysieren. Dafür kannst du einen Code benutzen, der aus den Datensätzen nur die Daten aus Deutschland anzeigt. Anschließend kannst du dann damit weiter analysieren. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Im „Environment“ kannst du dann die Variablen dazu einsehen und wenn du darauf klickst, öffnet sich ein neuer Tab, in dem du die ganze Tabelle im Überblick hast. So sieht das dann aus (das ist natürlich nur ein Ausschnitt, also 26 von 2.460): | Im „Environment“ kannst du dann die Variablen dazu einsehen und wenn du darauf klickst, öffnet sich ein neuer Tab, in dem du die ganze Tabelle im Überblick hast. So sieht das dann aus (das ist natürlich nur ein Ausschnitt, also 26 von 2.460): | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Ein nerviges Problem, das beim Analysieren deine Werte manipulieren kann, (indem besonders abweichende und unrealistische Werte z.B. bei der Schiefe oder Kurtosis rauskommen) sind ungültige Werte. Diese entstehen wenn bei der Umfrage (z.B. Fragen mit Antwort, bei der man eine Skala bis 10 hat) nichts oder falsche Antworten angegeben wurden. In dem Fall werden die Antworten oft mit „77“, „99“ (meistens aber mit " | Ein nerviges Problem, das beim Analysieren deine Werte manipulieren kann, (indem besonders abweichende und unrealistische Werte z.B. bei der Schiefe oder Kurtosis rauskommen) sind ungültige Werte. Diese entstehen wenn bei der Umfrage (z.B. Fragen mit Antwort, bei der man eine Skala bis 10 hat) nichts oder falsche Antworten angegeben wurden. In dem Fall werden die Antworten oft mit „77“, „99“ (meistens aber mit " | ||
Zeile 216: | Zeile 220: | ||
" | " | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Dann schreibst du R vor, alle Werte, die größer als 10 sind (>10) durch N.A. zu ersetzen. Du kannst auch einen anderen Code nehmen, z.B. „Trst[Trst == 77 | Trst == 88 | Trst==99] <- NA. Das ist dir selbst überlassen, | Dann schreibst du R vor, alle Werte, die größer als 10 sind (>10) durch N.A. zu ersetzen. Du kannst auch einen anderen Code nehmen, z.B. „Trst[Trst == 77 | Trst == 88 | Trst==99] <- NA. Das ist dir selbst überlassen, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wenn du nun die Tabelle öffnest, kannst du sehen, dass einige N.A.-Werte im Datensatz vorhanden sind: | Wenn du nun die Tabelle öffnest, kannst du sehen, dass einige N.A.-Werte im Datensatz vorhanden sind: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Bei so einer großen Tabelle kann es natürlich vorkommen, dass du den Überblick verlierst. Damit du einen Überblick erhältst, ob NA Werte vorhanden sind, kannst du einen weiteren Code aufrufen: | Bei so einer großen Tabelle kann es natürlich vorkommen, dass du den Überblick verlierst. Damit du einen Überblick erhältst, ob NA Werte vorhanden sind, kannst du einen weiteren Code aufrufen: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wahrscheinlich wirst du bei der Analyse Stichproben ziehen, mit der Grundgesamtheit arbeiten ist oft für Seminarkontexte zu viel und generell nicht besonders sinnvoll. Um zu vermeiden, dass du Stichproben ziehst, die NA Werte haben, kannst du eine Variable erstellen, die von solchen Werten befreit ist. Am besten gibst du ihr einen Namen, an dem du erkennen kannst, dass sich die " | Wahrscheinlich wirst du bei der Analyse Stichproben ziehen, mit der Grundgesamtheit arbeiten ist oft für Seminarkontexte zu viel und generell nicht besonders sinnvoll. Um zu vermeiden, dass du Stichproben ziehst, die NA Werte haben, kannst du eine Variable erstellen, die von solchen Werten befreit ist. Am besten gibst du ihr einen Namen, an dem du erkennen kannst, dass sich die " | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Die Tabelle mit den sauberen Werten kannst du dann auch immer wieder im „Environment“-Bereich öffnen und einsehen. | Die Tabelle mit den sauberen Werten kannst du dann auch immer wieder im „Environment“-Bereich öffnen und einsehen. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
===3.5 Stichproben ziehen=== | ===3.5 Stichproben ziehen=== | ||
Zeile 242: | Zeile 246: | ||
Du definierst deine Stichprobe, ich habe sie jetzt „Stichprobe100“ genannt und du brauchst dafür natürlich deinen gesäuberten Datensatz, damit keine abweichenden Werte rauskommen. Deswegen habe ich den Datensatz „Trst_clean“ genommen und nicht „Trst“. Dieser Code wählt dann zufällig 100 Zeilen-frames aus dem Datensatz „Trst_clean“ aus, erstellt also eine 100er Stichprobe. | Du definierst deine Stichprobe, ich habe sie jetzt „Stichprobe100“ genannt und du brauchst dafür natürlich deinen gesäuberten Datensatz, damit keine abweichenden Werte rauskommen. Deswegen habe ich den Datensatz „Trst_clean“ genommen und nicht „Trst“. Dieser Code wählt dann zufällig 100 Zeilen-frames aus dem Datensatz „Trst_clean“ aus, erstellt also eine 100er Stichprobe. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wenn du den Code ausführst, kommt im „Environment“ eine Variable dazu: „Stichprobe100“. Auch hier kannst du drauf klicken, dann öffnet sich ein Tab, der die Tabelle mit euren 100 Stichproben anzeigt: | Wenn du den Code ausführst, kommt im „Environment“ eine Variable dazu: „Stichprobe100“. Auch hier kannst du drauf klicken, dann öffnet sich ein Tab, der die Tabelle mit euren 100 Stichproben anzeigt: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Wichtig: Wenn du den Code wie oben angezeigt ausführst, entstehen jedes Mal andere Stichproben! | Wichtig: Wenn du den Code wie oben angezeigt ausführst, entstehen jedes Mal andere Stichproben! | ||
Das ist ungünstig, wenn du über längere Zeit damit arbeitest. Jedes Mal wenn du R öffnest, musst du den Code nämlich nochmal durchlaufen lassen. Es entstehen dann jedes Mal neue 100er Stichproben, | Das ist ungünstig, wenn du über längere Zeit damit arbeitest. Jedes Mal wenn du R öffnest, musst du den Code nämlich nochmal durchlaufen lassen. Es entstehen dann jedes Mal neue 100er Stichproben, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
**Tipp**: Du kannst auch mehrere Stichproben gleichzeitig ziehen, du musst nicht alle Stichproben in einzelnen Schritten ziehen. Klickst du einmal auf den grünen Pfeil, entstehen gleich drei Stichproben. | **Tipp**: Du kannst auch mehrere Stichproben gleichzeitig ziehen, du musst nicht alle Stichproben in einzelnen Schritten ziehen. Klickst du einmal auf den grünen Pfeil, entstehen gleich drei Stichproben. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
====4. R und seine unterschiedlichen Logiken==== | ====4. R und seine unterschiedlichen Logiken==== | ||
Zeile 265: | Zeile 269: | ||
Die Berechnung dieser Verfahren verläuft recht einfach mit den Basisfunktionen von R. Für die Berechnung von Mittelwert, Median und Standardabweichung sind also keine Pakete notwendig. Dahingegen kannst du aber auch ein Paket anwenden, das dir diese Verfahren berechnet. So kannst du beispielsweise alternativ das „dplyr“-Paket anwenden: | Die Berechnung dieser Verfahren verläuft recht einfach mit den Basisfunktionen von R. Für die Berechnung von Mittelwert, Median und Standardabweichung sind also keine Pakete notwendig. Dahingegen kannst du aber auch ein Paket anwenden, das dir diese Verfahren berechnet. So kannst du beispielsweise alternativ das „dplyr“-Paket anwenden: | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Der Unterschied besteht nur daraus, dass dir bei der Variante ohne Paket mit dem Befehl „summary“ weitere Daten angegeben werden, wie z.B. das 1. Und 3. Quartil, zudem das Minimum und das Maximum. Wenn du die rausfinden willst, musst du das bei der Variante mit Paket explizit angeben. In diesem Fall brauchst du jetzt nicht unbedingt ein zusätzliches Paket, aber hier geht es auch um einfache Berechnungen. | Der Unterschied besteht nur daraus, dass dir bei der Variante ohne Paket mit dem Befehl „summary“ weitere Daten angegeben werden, wie z.B. das 1. Und 3. Quartil, zudem das Minimum und das Maximum. Wenn du die rausfinden willst, musst du das bei der Variante mit Paket explizit angeben. In diesem Fall brauchst du jetzt nicht unbedingt ein zusätzliches Paket, aber hier geht es auch um einfache Berechnungen. | ||
Zeile 272: | Zeile 276: | ||
Auch eine lineare Regression kannst du mit unterschiedlichen Codes berechnen. | Auch eine lineare Regression kannst du mit unterschiedlichen Codes berechnen. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Die beiden Varianten unterscheiden sich in der Datenstruktur. Bei der Anwendung ohne Paket werden x und y als numerische Vektoren definiert und bei der Anwendung mit einem Paket wird ein Datenrahmen „Daten“ erstellt. Das lineare Modell wird mit der Formel „y ~ x“ und mit „Daten“ spezifiziert. Diese Methode ist allerdings eher sinnvoller für Datensätze, | Die beiden Varianten unterscheiden sich in der Datenstruktur. Bei der Anwendung ohne Paket werden x und y als numerische Vektoren definiert und bei der Anwendung mit einem Paket wird ein Datenrahmen „Daten“ erstellt. Das lineare Modell wird mit der Formel „y ~ x“ und mit „Daten“ spezifiziert. Diese Methode ist allerdings eher sinnvoller für Datensätze, | ||
Zeile 279: | Zeile 283: | ||
Einen T-Test kannst du auch mit verschiedener Syntax durchführen, | Einen T-Test kannst du auch mit verschiedener Syntax durchführen, | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Die erste Variante führt einen T-Test durch, indem die zwei Gruppen als separate Vektoren definiert werden. Dabei trifft die Option „var.equal = True“ die Annahmen gleicher Varianzen. Bei der zweiten Variante werden die Werte von beiden Gruppen im Datenframe „ttestdaten“ zusammengefasst. Spalte „Gruppe“ markiert die Zugehörigkeit zu „Gruppe1“ und „Gruppe2“. Der T-Test wird mit der Formel Werte ~ Gruppe durchgeführt, | Die erste Variante führt einen T-Test durch, indem die zwei Gruppen als separate Vektoren definiert werden. Dabei trifft die Option „var.equal = True“ die Annahmen gleicher Varianzen. Bei der zweiten Variante werden die Werte von beiden Gruppen im Datenframe „ttestdaten“ zusammengefasst. Spalte „Gruppe“ markiert die Zugehörigkeit zu „Gruppe1“ und „Gruppe2“. Der T-Test wird mit der Formel Werte ~ Gruppe durchgeführt, | ||
Zeile 310: | Zeile 314: | ||
**#** hinter dem Code bedeutet, dass alles dahinter nicht miteinberechnet wird. Das ist besonders am Anfang eine praktische Hilfe, weil du hinter jedem Code beschreiben kannst, was da passiert, ohne dass R bei der Berechnung verwirrt wird und eine Fehlermeldung ausgibt. | **#** hinter dem Code bedeutet, dass alles dahinter nicht miteinberechnet wird. Das ist besonders am Anfang eine praktische Hilfe, weil du hinter jedem Code beschreiben kannst, was da passiert, ohne dass R bei der Berechnung verwirrt wird und eine Fehlermeldung ausgibt. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Das **„$“** bedeutet, dass du auf eine bestimmte Spalte zugreifen kannst, ohne die anderen Variablen im Code zu beachten. | Das **„$“** bedeutet, dass du auf eine bestimmte Spalte zugreifen kannst, ohne die anderen Variablen im Code zu beachten. | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
Ein **Code**, den du auf **jeden Fall** kennen sollst, ist ein Code, der statistische Analysen anhand einer Schleife durchführt. Dafür erstellst du zuerst eine Liste (hier namens " | Ein **Code**, den du auf **jeden Fall** kennen sollst, ist ein Code, der statistische Analysen anhand einer Schleife durchführt. Dafür erstellst du zuerst eine Liste (hier namens " | ||
Zeile 321: | Zeile 325: | ||
Das **" | Das **" | ||
- | {{: | + | {{:lv-wikis-oeffentlich:boot2024: |
<note tip> | <note tip> |