%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \chapter{\tr{Bootstrap Methods}{Bootstrap Methoden}} Beim Bootstrap erzeugt man sich die Verteilung von Statistiken durch Resampling aus der Stichprobe. Das hat mehrere Vorteile: \begin{itemize} \item Weniger Annahmen (z.B. muss eine Stichprobe nicht Normalverteilt sein). \item H\"ohere Genauigkeit als klassische Methoden. \item Allgemeing\"ultigkeit: Bootstrap Methoden sind sich sehr \"ahnlich f\"ur viele verschiedene Statistiken und ben\"otigen nicht f\"ur jede Statistik eine andere Formel. \end{itemize} \begin{figure}[t] \includegraphics[width=0.8\textwidth]{2012-10-29_16-26-05_771}\\[2ex] \includegraphics[width=0.8\textwidth]{2012-10-29_16-41-39_523}\\[2ex] \includegraphics[width=0.8\textwidth]{2012-10-29_16-29-35_312} \caption{\tr{Why can we only measure a sample of the population?}{Warum k\"onnen wir nur eine Stichprobe der Grundgesamtheit messen?}} \end{figure} \begin{figure}[t] \includegraphics[height=0.2\textheight]{srs1}\\[2ex] \includegraphics[height=0.2\textheight]{srs2}\\[2ex] \includegraphics[height=0.2\textheight]{srs3} \caption{Bootstrap der Stichprobenvertielung (a) Von der Grundgesamtheit (population) mit unbekanntem Parameter (z.B. Mittelwert $\mu$) zieht man Stichproben (SRS: simple random samples). Die Statistik (hier Bestimmung von $\bar x$) kann f\"ur jede Stichprobe berechnet werden. Die erhaltenen Werte entstammen der Stichprobenverteilung. Meisten wird aber nur eine Stichprobe gezogen! (b) Mit bestimmten Annahmen und Theorien kann man auf die Stichprobenverteilung schlie{\ss}en ohne sie gemessen zu haben. (c) Alternativ k\"onnen aus der einen Stichprobe viele Bootstrap-Stichproben generiert werden (resampling) und so Eigenschaften der Stichprobenverteilung empirisch bestimmt werden. Aus Hesterberg et al. 2003, Bootstrap Methods and Permuation Tests} \end{figure} \section{Bootstrap des Standardfehlers} Beim Bootstrap erzeugen wir durch Resampling neue Stichproben und benutzen diese um die Stichprobenverteilung einer Statistik zu berechnen. Die Bootstrap Stichproben haben jeweils den gleichen Umfang wie die urspr\"unglich gemessene Stichprobe und werden durch Ziehen mit Zur\"ucklegen gewonnen. Jeder Wert der urspr\"unglichen Stichprobe kann also einmal, mehrmals oder gar nicht in einer Bootstrap Stichprobe vorkommen. \begin{exercise}[bootstrapsem.m] Ziehe 1000 normalverteilte Zufallszahlen und berechne deren Mittelwert, Standardabweichung und Standardfehler ($\sigma/\sqrt{n}$). Resample die Daten 1000 mal (Ziehen mit Zur\"ucklegen) und berechne jeweils den Mittelwert. Plotte ein Histogramm dieser Mittelwerte, sowie deren Mittelwert und die Standardabweichung. Was hat das mit dem Standardfehler zu tun? \end{exercise}