65 lines
2.9 KiB
TeX
65 lines
2.9 KiB
TeX
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\chapter{\tr{Bootstrap Methods}{Bootstrap Methoden}}
|
|
|
|
Beim Bootstrap erzeugt man sich die Verteilung von Statistiken durch Resampling
|
|
aus der Stichprobe. Das hat mehrere Vorteile:
|
|
\begin{itemize}
|
|
\item Weniger Annahmen (z.B. muss eine Stichprobe nicht Normalverteilt sein).
|
|
\item H\"ohere Genauigkeit als klassische Methoden.
|
|
\item Allgemeing\"ultigkeit: Bootstrap Methoden sind sich sehr
|
|
\"ahnlich f\"ur viele verschiedene Statistiken und ben\"otigen nicht
|
|
f\"ur jede Statistik eine andere Formel.
|
|
\end{itemize}
|
|
|
|
\begin{figure}[t]
|
|
\includegraphics[width=0.8\textwidth]{2012-10-29_16-26-05_771}\\[2ex]
|
|
\includegraphics[width=0.8\textwidth]{2012-10-29_16-41-39_523}\\[2ex]
|
|
\includegraphics[width=0.8\textwidth]{2012-10-29_16-29-35_312}
|
|
\caption{\tr{Why can we only measure a sample of the
|
|
population?}{Warum k\"onnen wir nur eine Stichprobe der
|
|
Grundgesamtheit messen?}}
|
|
\end{figure}
|
|
|
|
\begin{figure}[t]
|
|
\includegraphics[height=0.2\textheight]{srs1}\\[2ex]
|
|
\includegraphics[height=0.2\textheight]{srs2}\\[2ex]
|
|
\includegraphics[height=0.2\textheight]{srs3}
|
|
\caption{Bootstrap der Stichprobenvertielung (a) Von der
|
|
Grundgesamtheit (population) mit unbekanntem Parameter
|
|
(z.B. Mittelwert $\mu$) zieht man Stichproben (SRS: simple random
|
|
samples). Die Statistik (hier Bestimmung von $\bar x$) kann f\"ur
|
|
jede Stichprobe berechnet werden. Die erhaltenen Werte entstammen
|
|
der Stichprobenverteilung. Meisten wird aber nur eine Stichprobe
|
|
gezogen! (b) Mit bestimmten Annahmen und Theorien kann man auf
|
|
die Stichprobenverteilung schlie{\ss}en ohne sie gemessen zu
|
|
haben. (c) Alternativ k\"onnen aus der einen Stichprobe viele
|
|
Bootstrap-Stichproben generiert werden (resampling) und so
|
|
Eigenschaften der Stichprobenverteilung empirisch bestimmt
|
|
werden. Aus Hesterberg et al. 2003, Bootstrap Methods and
|
|
Permuation Tests}
|
|
\end{figure}
|
|
|
|
\section{Bootstrap des Standardfehlers}
|
|
|
|
Beim Bootstrap erzeugen wir durch Resampling neue Stichproben und
|
|
benutzen diese um die Stichprobenverteilung einer Statistik zu
|
|
berechnen. Die Bootstrap Stichproben haben jeweils den gleichen Umfang
|
|
wie die urspr\"unglich gemessene Stichprobe und werden durch Ziehen
|
|
mit Zur\"ucklegen gewonnen. Jeder Wert der urspr\"unglichen Stichprobe
|
|
kann also einmal, mehrmals oder gar nicht in einer Bootstrap
|
|
Stichprobe vorkommen.
|
|
|
|
\begin{exercise}[bootstrapsem.m]
|
|
Ziehe 1000 normalverteilte Zufallszahlen und berechne deren Mittelwert,
|
|
Standardabweichung und Standardfehler ($\sigma/\sqrt{n}$).
|
|
|
|
Resample die Daten 1000 mal (Ziehen mit Zur\"ucklegen) und berechne jeweils
|
|
den Mittelwert.
|
|
|
|
Plotte ein Histogramm dieser Mittelwerte, sowie deren Mittelwert und
|
|
die Standardabweichung.
|
|
|
|
Was hat das mit dem Standardfehler zu tun?
|
|
\end{exercise}
|