173 lines
6.0 KiB
TeX
173 lines
6.0 KiB
TeX
\documentclass[12pt,a4paper,pdftex]{exam}
|
|
|
|
\usepackage[german]{babel}
|
|
\usepackage{pslatex}
|
|
\usepackage[mediumspace,mediumqspace,Gray]{SIunits} % \ohm, \micro
|
|
\usepackage{xcolor}
|
|
\usepackage{graphicx}
|
|
\usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref}
|
|
|
|
%%%%% layout %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry}
|
|
\pagestyle{headandfoot}
|
|
\ifprintanswers
|
|
\newcommand{\stitle}{: L\"osungen}
|
|
\else
|
|
\newcommand{\stitle}{}
|
|
\fi
|
|
\header{{\bfseries\large \"Ubung\stitle}}{{\bfseries\large Bootstrap}}{{\bfseries\large 17. Januar, 2017}}
|
|
\firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email:
|
|
jan.benda@uni-tuebingen.de}
|
|
\runningfooter{}{\thepage}{}
|
|
|
|
\setlength{\baselineskip}{15pt}
|
|
\setlength{\parindent}{0.0cm}
|
|
\setlength{\parskip}{0.3cm}
|
|
\renewcommand{\baselinestretch}{1.15}
|
|
|
|
%%%%% listings %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\usepackage{listings}
|
|
\lstset{
|
|
language=Matlab,
|
|
basicstyle=\ttfamily\footnotesize,
|
|
numbers=left,
|
|
numberstyle=\tiny,
|
|
title=\lstname,
|
|
showstringspaces=false,
|
|
commentstyle=\itshape\color{darkgray},
|
|
breaklines=true,
|
|
breakautoindent=true,
|
|
columns=flexible,
|
|
frame=single,
|
|
xleftmargin=1em,
|
|
xrightmargin=1em,
|
|
aboveskip=10pt
|
|
}
|
|
|
|
%%%%% math stuff: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\usepackage{amsmath}
|
|
\usepackage{amssymb}
|
|
\usepackage{bm}
|
|
\usepackage{dsfont}
|
|
\newcommand{\naZ}{\mathds{N}}
|
|
\newcommand{\gaZ}{\mathds{Z}}
|
|
\newcommand{\raZ}{\mathds{Q}}
|
|
\newcommand{\reZ}{\mathds{R}}
|
|
\newcommand{\reZp}{\mathds{R^+}}
|
|
\newcommand{\reZpN}{\mathds{R^+_0}}
|
|
\newcommand{\koZ}{\mathds{C}}
|
|
|
|
%%%%% page breaks %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\newcommand{\continue}{\ifprintanswers%
|
|
\else
|
|
\vfill\hspace*{\fill}$\rightarrow$\newpage%
|
|
\fi}
|
|
\newcommand{\continuepage}{\ifprintanswers%
|
|
\newpage
|
|
\else
|
|
\vfill\hspace*{\fill}$\rightarrow$\newpage%
|
|
\fi}
|
|
\newcommand{\newsolutionpage}{\ifprintanswers%
|
|
\newpage%
|
|
\else
|
|
\fi}
|
|
|
|
%%%%% new commands %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\newcommand{\qt}[1]{\textbf{#1}\\}
|
|
\newcommand{\pref}[1]{(\ref{#1})}
|
|
\newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}}
|
|
\newcommand{\code}[1]{\texttt{#1}}
|
|
|
|
|
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\begin{document}
|
|
|
|
\input{instructions}
|
|
|
|
\begin{questions}
|
|
|
|
\question \qt{Bootstrap des Standardfehlers}
|
|
Wir wollen den Standardfehler, die Standardabweichung des Mittelwerts,
|
|
eines Datensatze mit Hilfe der Bootstrapmethode berechnen und mit der
|
|
Formel ``Standardabweichung geteilt durch Wurzel aus $n$''
|
|
vergleichen.
|
|
\begin{parts}
|
|
\part Lade von Ilias die Datei \code{thymusglandweights.dat} herunter.
|
|
Darin befindet sich ein Datensatz vom Gewicht der Thymus Dr\"use in 14-Tage alten
|
|
H\"uhnerembryos in mg.
|
|
\part Lade diese Daten in Matlab (\code{load} Funktion).
|
|
\part Bestimme Histogramm, Mittelwert und Standardfehler aus den ersten 80 Datenpunkten.
|
|
\part Bestimme den Standardfehler aus den ersten 80 Datenpunkten durch 500-mal Bootstrappen.
|
|
\part Bestimme das 95\,\% Konfidenzintervall f\"ur den Mittelwert
|
|
aus der Bootstrap Verteilung (\code{quantile()} Funktion) --- also
|
|
das Interval innerhalb dessen mit 95\,\% Wahrscheinlichkeit der
|
|
wahre Mittelwert liegen wird.
|
|
\part Benutze den ganzen Datensatz und die Bootstrapping Technik, um die Abh\"angigkeit
|
|
des Standardfehlers von der Stichprobengr\"o{\ss}e zu bestimmen.
|
|
\part Vergleiche mit der bekannten Formel f\"ur den Standardfehler $\sigma/\sqrt{n}$.
|
|
\end{parts}
|
|
\begin{solution}
|
|
\lstinputlisting{bootstrapmean.m}
|
|
\lstinputlisting{bootstraptymus.m}
|
|
\includegraphics[width=0.5\textwidth]{bootstraptymus-datahist}
|
|
\includegraphics[width=0.5\textwidth]{bootstraptymus-meanhist}
|
|
\includegraphics[width=0.5\textwidth]{bootstraptymus-samples}
|
|
\end{solution}
|
|
|
|
|
|
\question \qt{Student t-Verteilung}
|
|
Durch Standardabweichungen normierte Mittelwerte sind nicht Gaussverteilt,
|
|
wenn beide aus Normalverteilten Daten abgesch\"atzt werden.
|
|
Die Verteilung von $t=\bar x/(\sigma_x/\sqrt{m})$ folgt vielmehr
|
|
der Student t-Verteilung.
|
|
\begin{parts}
|
|
\part Erzeuge 100000 normalverteilte Zufallszahlen.
|
|
\part Ziehe daraus 1000 Stichproben vom Umfang $m=3$, 5, 10, oder 50.
|
|
\part Berechne den Mittelwert $\bar x$ der Stichproben und plotte die Wahrscheinlichkeitsdichte
|
|
dieser Mittelwerte.
|
|
\part Vergleiche diese Wahrscheinlichkeitsdichte mit der Gausskurve.
|
|
\part Berechne ausserdem die Gr\"o{\ss}e $t=\bar x/(\sigma_x/\sqrt{m})$
|
|
(Standardabweichung $\sigma_x$) und vergleiche diese mit der Normalverteilung mit Standardabweichung Eins. Ist $t$ normalverteilt, bzw. unter welchen Bedingungen ist $t$ normalverteilt?
|
|
\end{parts}
|
|
\newsolutionpage
|
|
\begin{solution}
|
|
\lstinputlisting{tdistribution.m}
|
|
\includegraphics[width=1\textwidth]{tdistribution-n03}\\
|
|
\includegraphics[width=1\textwidth]{tdistribution-n05}\\
|
|
\includegraphics[width=1\textwidth]{tdistribution-n10}\\
|
|
\includegraphics[width=1\textwidth]{tdistribution-n50}
|
|
\end{solution}
|
|
|
|
|
|
\continue
|
|
\question \qt{Permutationstest}
|
|
Wir wollen die Signifikanz einer Korrelation durch einen
|
|
Permutationstest bestimmen.
|
|
\begin{parts}
|
|
\part Erzeuge 1000 korrelierte Zufallszahlen $x$, $y$ durch
|
|
\begin{verbatim}
|
|
n = 1000
|
|
a = 0.2;
|
|
x = randn(n, 1);
|
|
y = randn(n, 1) + a*x;
|
|
\end{verbatim}
|
|
\part Erstelle einen Scatterplot der beiden Variablen.
|
|
\part Warum ist $y$ mit $x$ korreliert?
|
|
\part Berechne den Korrelationskoeffizienten zwischen $x$ und $y$.
|
|
\part Was m\"usste man tun, um die Korrelationen zwischen den $x$-$y$
|
|
Paaren zu zerst\"oren?
|
|
\part Mach genau dies 1000 mal und berechne jedes Mal den Korrelationskoeffizienten.
|
|
\part Bestimme die Wahrscheinlichkeitsdichte dieser Korrelationskoeffizienten.
|
|
\part Ist die Korrelation der urspr\"unglichen Daten signifikant?
|
|
\part Variiere die Stichprobengr\"o{\ss}e \code{n} und \"uberpr\"ufe
|
|
auf gleiche Weise die Signifikanz.
|
|
\end{parts}
|
|
\begin{solution}
|
|
\lstinputlisting{correlationsignificance.m}
|
|
\includegraphics[width=1\textwidth]{correlationsignificance}
|
|
\end{solution}
|
|
|
|
|
|
\end{questions}
|
|
|
|
\end{document} |