\documentclass[12pt,a4paper,pdftex]{exam} \usepackage[german]{babel} \usepackage{pslatex} \usepackage[mediumspace,mediumqspace,Gray]{SIunits} % \ohm, \micro \usepackage{xcolor} \usepackage{graphicx} \usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref} %%%%% layout %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry} \pagestyle{headandfoot} \ifprintanswers \newcommand{\stitle}{: L\"osungen} \else \newcommand{\stitle}{} \fi \header{{\bfseries\large \"Ubung\stitle}}{{\bfseries\large Bootstrap}}{{\bfseries\large 17. Januar, 2017}} \firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email: jan.benda@uni-tuebingen.de} \runningfooter{}{\thepage}{} \setlength{\baselineskip}{15pt} \setlength{\parindent}{0.0cm} \setlength{\parskip}{0.3cm} \renewcommand{\baselinestretch}{1.15} %%%%% listings %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \usepackage{listings} \lstset{ language=Matlab, basicstyle=\ttfamily\footnotesize, numbers=left, numberstyle=\tiny, title=\lstname, showstringspaces=false, commentstyle=\itshape\color{darkgray}, breaklines=true, breakautoindent=true, columns=flexible, frame=single, xleftmargin=1em, xrightmargin=1em, aboveskip=10pt } %%%%% math stuff: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \usepackage{amsmath} \usepackage{amssymb} \usepackage{bm} \usepackage{dsfont} \newcommand{\naZ}{\mathds{N}} \newcommand{\gaZ}{\mathds{Z}} \newcommand{\raZ}{\mathds{Q}} \newcommand{\reZ}{\mathds{R}} \newcommand{\reZp}{\mathds{R^+}} \newcommand{\reZpN}{\mathds{R^+_0}} \newcommand{\koZ}{\mathds{C}} %%%%% page breaks %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \newcommand{\continue}{\ifprintanswers% \else \vfill\hspace*{\fill}$\rightarrow$\newpage% \fi} \newcommand{\continuepage}{\ifprintanswers% \newpage \else \vfill\hspace*{\fill}$\rightarrow$\newpage% \fi} \newcommand{\newsolutionpage}{\ifprintanswers% \newpage% \else \fi} %%%%% new commands %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \newcommand{\qt}[1]{\textbf{#1}\\} \newcommand{\pref}[1]{(\ref{#1})} \newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}} \newcommand{\code}[1]{\texttt{#1}} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \begin{document} \input{instructions} \begin{questions} \question \qt{Bootstrap des Standardfehlers} Wir wollen den Standardfehler, die Standardabweichung des Mittelwerts, eines Datensatze mit Hilfe der Bootstrapmethode berechnen und mit der Formel ``Standardabweichung geteilt durch Wurzel aus $n$'' vergleichen. \begin{parts} \part Lade von Ilias die Datei \code{thymusglandweights.dat} herunter. Darin befindet sich ein Datensatz vom Gewicht der Thymus Dr\"use in 14-Tage alten H\"uhnerembryos in mg. \part Lade diese Daten in Matlab (\code{load} Funktion). \part Bestimme Histogramm, Mittelwert und Standardfehler aus den ersten 80 Datenpunkten. \part Bestimme den Standardfehler aus den ersten 80 Datenpunkten durch 500-mal Bootstrappen. \part Bestimme das 95\,\% Konfidenzintervall f\"ur den Mittelwert aus der Bootstrap Verteilung (\code{quantile()} Funktion) --- also das Interval innerhalb dessen mit 95\,\% Wahrscheinlichkeit der wahre Mittelwert liegen wird. \part Benutze den ganzen Datensatz und die Bootstrapping Technik, um die Abh\"angigkeit des Standardfehlers von der Stichprobengr\"o{\ss}e zu bestimmen. \part Vergleiche mit der bekannten Formel f\"ur den Standardfehler $\sigma/\sqrt{n}$. \end{parts} \begin{solution} \lstinputlisting{bootstrapmean.m} \lstinputlisting{bootstraptymus.m} \includegraphics[width=0.5\textwidth]{bootstraptymus-datahist} \includegraphics[width=0.5\textwidth]{bootstraptymus-meanhist} \includegraphics[width=0.5\textwidth]{bootstraptymus-samples} \end{solution} \question \qt{Student t-Verteilung} Durch Standardabweichungen normierte Mittelwerte sind nicht Gaussverteilt, wenn beide aus Normalverteilten Daten abgesch\"atzt werden. Die Verteilung von $t=\bar x/(\sigma_x/\sqrt{m})$ folgt vielmehr der Student t-Verteilung. \begin{parts} \part Erzeuge 100000 normalverteilte Zufallszahlen. \part Ziehe daraus 1000 Stichproben vom Umfang $m=3$, 5, 10, oder 50. \part Berechne den Mittelwert $\bar x$ der Stichproben und plotte die Wahrscheinlichkeitsdichte dieser Mittelwerte. \part Vergleiche diese Wahrscheinlichkeitsdichte mit der Gausskurve. \part Berechne ausserdem die Gr\"o{\ss}e $t=\bar x/(\sigma_x/\sqrt{m})$ (Standardabweichung $\sigma_x$) und vergleiche diese mit der Normalverteilung mit Standardabweichung Eins. Ist $t$ normalverteilt, bzw. unter welchen Bedingungen ist $t$ normalverteilt? \end{parts} \newsolutionpage \begin{solution} \lstinputlisting{tdistribution.m} \includegraphics[width=1\textwidth]{tdistribution-n03}\\ \includegraphics[width=1\textwidth]{tdistribution-n05}\\ \includegraphics[width=1\textwidth]{tdistribution-n10}\\ \includegraphics[width=1\textwidth]{tdistribution-n50} \end{solution} \continue \question \qt{Permutationstest} Wir wollen die Signifikanz einer Korrelation durch einen Permutationstest bestimmen. \begin{parts} \part Erzeuge 1000 korrelierte Zufallszahlen $x$, $y$ durch \begin{verbatim} n = 1000 a = 0.2; x = randn(n, 1); y = randn(n, 1) + a*x; \end{verbatim} \part Erstelle einen Scatterplot der beiden Variablen. \part Warum ist $y$ mit $x$ korreliert? \part Berechne den Korrelationskoeffizienten zwischen $x$ und $y$. \part Was m\"usste man tun, um die Korrelationen zwischen den $x$-$y$ Paaren zu zerst\"oren? \part Mach genau dies 1000 mal und berechne jedes Mal den Korrelationskoeffizienten. \part Bestimme die Wahrscheinlichkeitsdichte dieser Korrelationskoeffizienten. \part Ist die Korrelation der urspr\"unglichen Daten signifikant? \part Variiere die Stichprobengr\"o{\ss}e \code{n} und \"uberpr\"ufe auf gleiche Weise die Signifikanz. \end{parts} \begin{solution} \lstinputlisting{correlationsignificance.m} \includegraphics[width=1\textwidth]{correlationsignificance} \end{solution} \end{questions} \end{document}