Statistisches

Cook Abstand

Eine Möglichkeit Ausreißer zu finden ist der Cook Abstand (eng.: Cook’s distance). Die Idee ist es zu messen welchen Einfluss ein Wert auf das Modell hat. Dazu schaut mich sich das Modell einmal mit und einmal ohne den Wert an und vergleicht diese Ergebnisse.

Ein kleines Beispiel zum Rangkorrelationskoeffizienten

Bei der Rangkorrelation werden statt der Werte die Ränge der Werte zur Berechnung herangezogen. Beispiel: Es seien die folgenden Datenpunkte gegeben: x 0.15 2.

Eine typische Frage von Studierenden

Vor kurzem fand ich mal wieder eine Anfrage einer Studierenden in meinem Email Postfach. Die Frage lautete in etwa wie folgt: Guten Tag Herr Markgraf, ich würde gerne die Hypothese untersuchen: Die reduzierte Abhängigkeit des Iphones tagsüber liegt am schönen Wetter.

Moderator und Mediation - Formen der Interaktion bei Analyse von Zusammenhängen

Bei der Analyse von Zusammenhängen tauchen sowohl Moderation als auch Mediation auf. Es geht um Zusammenhänge zwischen drei Variablen \(X\), \(Y\) und \(M\). Untersucht wird der Effekt einer unabhägigen Variable \(X\) (Prädiktor, UV) auf ein abhängige Variable \(Y\) (AV).

Die ersten Schritte zur Prognose mitteles linearer Regression

An hand der **tipping**-Daten werden die ersten Schritte zur Prognose von Daten gezeigt.

SBI - Simulation Based Inference

Wenn meine Tochter SBI hört, denkt sie an Sally Bollywood Investigation. – Und ich oft auch. – Mit SBI ist hier aber nicht der Trickfilm für Kinder, sondern Simulation Based Inference, gemeint.

Ein wenig schneller zur simulierten Nullverteilung

Ein Nullhypothesentest ist schnell geschrieben. Will man den approximativen Weg gehen, so hilft R einem mit entsprechenden Tests mit einfachen Befehlen. Nimmt man MOSAIC dazu, so bekommt man u.

Nur ein wenig lineare Regression

Der tipping Datensatz wird oft analysiert. Das Verhältnis von Trinkgeld (tip) und Rechnungsbetrag (total_bill) steht dabei im Vordergrund einer lineare Regressionsanalyse. So auch hier. Wir wollen die einzelnen Angaben von R dabei in den Fokus rücken und einmal Hinterfragen, was wir bei der Ausgabe von R eigentlich genau sehen, woher es kommt und wie man es interpretieren kann.

Prognose-, Konfidenz- und Fiduzialintervalle

*WORK IN PROGRESS Dieser Eintrag ist noch nicht fertig und wird in der Zukunft erweitert! Konfidenzintervalle Definition von Konfidenzintervallen1 Für unabhängig identisch verteilte Zufallsvariablen \(X_1,\dotsc, X_n\) mit unbekanntem reellen Verteilungsparameter \(\vartheta\) kann unter bestimmten Umständen zwei Stichprobenfunktionen \(U\) und \(V\) angeben, so dass

Konfidenzintervalle

Stub!