scientificComputing/bootstrap/lecture/bootstrap.tex

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\chapter{\tr{Bootstrap Methods}{Bootstrap Methoden}}

Beim Bootstrap erzeugt man sich die Verteilung von Statistiken durch Resampling
aus der Stichprobe. Das hat mehrere Vorteile:
\begin{itemize}
\item Weniger Annahmen (z.B. muss eine Stichprobe nicht Normalverteilt sein).
\item H\"ohere Genauigkeit als klassische Methoden.
\item Allgemeing\"ultigkeit: Bootstrap Methoden sind sich sehr
  \"ahnlich f\"ur viele verschiedene Statistiken und ben\"otigen nicht
  f\"ur jede Statistik eine andere Formel.
\end{itemize}

\begin{figure}[t]
  \includegraphics[width=0.8\textwidth]{2012-10-29_16-26-05_771}\\[2ex]
  \includegraphics[width=0.8\textwidth]{2012-10-29_16-41-39_523}\\[2ex]
  \includegraphics[width=0.8\textwidth]{2012-10-29_16-29-35_312}
  \caption{\tr{Why can we only measure a sample of the
      population?}{Warum k\"onnen wir nur eine Stichprobe der
      Grundgesamtheit messen?}}
\end{figure}

\begin{figure}[t]
  \includegraphics[height=0.2\textheight]{srs1}\\[2ex]
  \includegraphics[height=0.2\textheight]{srs2}\\[2ex]
  \includegraphics[height=0.2\textheight]{srs3}
  \caption{Bootstrap der Stichprobenvertielung (a) Von der
    Grundgesamtheit (population) mit unbekanntem Parameter
    (z.B. Mittelwert $\mu$) zieht man Stichproben (SRS: simple random
    samples).  Die Statistik (hier Bestimmung von $\bar x$) kann f\"ur
    jede Stichprobe berechnet werden. Die erhaltenen Werte entstammen
    der Stichprobenverteilung. Meisten wird aber nur eine Stichprobe
    gezogen!  (b) Mit bestimmten Annahmen und Theorien kann man auf
    die Stichprobenverteilung schlie{\ss}en ohne sie gemessen zu
    haben.  (c) Alternativ k\"onnen aus der einen Stichprobe viele
    Bootstrap-Stichproben generiert werden (resampling) und so
    Eigenschaften der Stichprobenverteilung empirisch bestimmt
    werden. Aus Hesterberg et al. 2003, Bootstrap Methods and
    Permuation Tests}
\end{figure}

\section{Bootstrap des Standardfehlers}

Beim Bootstrap erzeugen wir durch Resampling neue Stichproben und
benutzen diese um die Stichprobenverteilung einer Statistik zu
berechnen. Die Bootstrap Stichproben haben jeweils den gleichen Umfang
wie die urspr\"unglich gemessene Stichprobe und werden durch Ziehen
mit Zur\"ucklegen gewonnen. Jeder Wert der urspr\"unglichen Stichprobe
kann also einmal, mehrmals oder gar nicht in einer Bootstrap
Stichprobe vorkommen.

\begin{exercise}[bootstrapsem.m]
  Ziehe 1000 normalverteilte Zufallszahlen und berechne deren Mittelwert,
  Standardabweichung und Standardfehler ($\sigma/\sqrt{n}$).

  Resample die Daten 1000 mal (Ziehen mit Zur\"ucklegen) und berechne jeweils
  den Mittelwert.

  Plotte ein Histogramm dieser Mittelwerte, sowie deren Mittelwert und
  die Standardabweichung.

  Was hat das mit dem Standardfehler zu tun?
\end{exercise}