132 lines
5.0 KiB
TeX
132 lines
5.0 KiB
TeX
\documentclass[12pt,a4paper,pdftex]{exam}
|
|
|
|
\usepackage[german]{babel}
|
|
\usepackage{natbib}
|
|
\usepackage{graphicx}
|
|
\usepackage[small]{caption}
|
|
\usepackage{sidecap}
|
|
\usepackage{pslatex}
|
|
\usepackage{amsmath}
|
|
\usepackage{amssymb}
|
|
\setlength{\marginparwidth}{2cm}
|
|
\usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref}
|
|
|
|
%%%%% text size %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry}
|
|
\pagestyle{headandfoot}
|
|
\header{{\bfseries\large \"Ubung 1}}{{\bfseries\large Bootstrap}}{{\bfseries\large 21. Oktober, 2015}}
|
|
\firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email:
|
|
jan.benda@uni-tuebingen.de}
|
|
\runningfooter{}{\thepage}{}
|
|
|
|
\setlength{\baselineskip}{15pt}
|
|
\setlength{\parindent}{0.0cm}
|
|
\setlength{\parskip}{0.3cm}
|
|
\renewcommand{\baselinestretch}{1.15}
|
|
|
|
\newcommand{\qt}[1]{\textbf{#1}\\}
|
|
\newcommand{\pref}[1]{(\ref{#1})}
|
|
\newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}}
|
|
\newcommand{\code}[1]{\texttt{#1}}
|
|
|
|
\newcommand{\continue}{\ifprintanswers%
|
|
\else
|
|
\vfill\hspace*{\fill}$\rightarrow$\newpage%
|
|
\fi}
|
|
\newcommand{\continuepage}{\ifprintanswers%
|
|
\newpage
|
|
\else
|
|
\vfill\hspace*{\fill}$\rightarrow$\newpage%
|
|
\fi}
|
|
\newcommand{\newsolutionpage}{\ifprintanswers%
|
|
\newpage%
|
|
\else
|
|
\fi}
|
|
|
|
|
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
|
\begin{document}
|
|
|
|
\vspace*{-6.5ex}
|
|
\begin{center}
|
|
\textbf{\Large Einf\"uhrung in die wissenschaftliche Datenverarbeitung}\\[1ex]
|
|
{\large Jan Grewe, Jan Benda}\\[-3ex]
|
|
Abteilung Neuroethologie \hfill --- \hfill Institut f\"ur Neurobiologie \hfill --- \hfill \includegraphics[width=0.28\textwidth]{UT_WBMW_Black_RGB} \\
|
|
\end{center}
|
|
|
|
\begin{itemize}
|
|
\item \"Uberzeuge dich von jeder einzelnen Zeile deines Codes, dass sie
|
|
auch wirklich das macht, was sie machen soll! Teste dies mit kleinen
|
|
Beispielen direkt in der Kommandozeile.
|
|
\item Versuche die L\"osungen der folgenden Aufgaben m\"oglichst in
|
|
sinnvolle kleine Funktionen herunterzubrechen.
|
|
\item Sobald etwas \"ahnliches mehr als einmal berechnet werden soll,
|
|
lohnt es sich eine Funktion daraus zu schreiben!
|
|
\item Teste rechenintensive \code{for} Schleifen zuerst mit einer kleinen
|
|
Anzahl von Wiederholungen, und benutze erst am Ende, wenn alles
|
|
stimmt, eine gro{\ss}e Anzahl von Wiederholungen, um eine gute
|
|
Statistik zu bekommen.
|
|
\item Benutze die Hilfsfunktion von matlab und das Internet, um
|
|
herauszufinden wie bestimmte \code{matlab} Funktionen zu verwenden
|
|
sind und was f\"ur M\"oglichkeiten sie bieten.
|
|
\item Auch zu inhaltlichen Konzepten bietet das Internet oft viele Antworten!
|
|
\end{itemize}
|
|
|
|
|
|
\begin{questions}
|
|
|
|
\question \qt{Bootstrap des Standardfehlers}
|
|
\begin{parts}
|
|
\part Lade von Ilias die Datei \code{thymusglandweights.dat} herunter.
|
|
Darin befindet sich ein Datensatz vom Gewicht der Thymus Dr\"use in 14-Tage alten
|
|
H\"uhnerembryos in mg.
|
|
\part Lade diese Daten in Matlab (\code{load} Funktion).
|
|
\part Bestimme Histogramm, Mittelwert und Standardfehler aus den ersten 80 Datenpunkten.
|
|
\part Bestimme den Standardfehler aus den ersten 80 Datenpunkten durch 500 Mal Bootstrappen.
|
|
\part Bestimme das 95\,\% Konfidenzintervall f\"ur den Mittelwert
|
|
aus der Bootstrap Verteilung (\code{quantile()} Funktion) --- also
|
|
das Interval innerhalb dessen mit 95\,\% Wahrscheinlichkeit der
|
|
wahre Mittelwert liegen wird.
|
|
\part Benutze den ganzen Datensatz und die Bootstrapping Technik, um die Abh\"angigkeit
|
|
des Standardfehlers von der Stichprobengr\"o{\ss}e zu bestimmen.
|
|
\part Vergleiche mit der bekannten Formel f\"ur den Standardfehler $\sigma/\sqrt{n}$.
|
|
\end{parts}
|
|
|
|
|
|
\continue
|
|
\question \qt{Student t-Verteilung}
|
|
\begin{parts}
|
|
\part Erzeuge 100000 normalverteilte Zufallszahlen.
|
|
\part Ziehe daraus 1000 Stichproben vom Umfang $m$ (3, 5, 10, 50).
|
|
\part Berechne den Mittelwert $\bar x$ der Stichproben und plotte die Wahrscheinlichkeitsdichte
|
|
dieser Mittelwerte.
|
|
\part Vergleiche diese Wahrscheinlichkeitsdichte mit der Gausskurve.
|
|
\part Berechne ausserdem die Gr\"o{\ss}e $t=\bar x/(\sigma_x/\sqrt{m}$
|
|
(Standardabweichung $\sigma_x$) und vergleiche diese mit der Normalverteilung mit Standardabweichung Eins. Ist $t$ normalverteilt, bzw. unter welchen Bedingungen ist $t$ Normalverteilt?
|
|
\end{parts}
|
|
|
|
|
|
\question \qt{Korrelationen}
|
|
\begin{parts}
|
|
\part Erzeuge 1000 korrelierte Zufallszahlen $x$, $y$ durch
|
|
\begin{verbatim}
|
|
n = 1000
|
|
a = 0.2;
|
|
x = randn(n, 1);
|
|
y = randn(n, 1) + a*x;
|
|
\end{verbatim}
|
|
\part Erstelle einen Scatterplot der beiden Variablen.
|
|
\part Warum ist $y$ mit $x$ korreliert?
|
|
\part Berechne den Korrelationskoeffizienten zwischen $x$ und $y$.
|
|
\part Was m\"usste man tun, um die Korrelationen zwischen den $x$-$y$
|
|
Paaren zu zerst\"oren?
|
|
\part Mach genau dies 1000 mal und berechne jedes Mal den Korrelationskoeffizienten.
|
|
\part Bestimme die Wahrscheinlichkeitsdichte dieser Korrelationskoeffizienten.
|
|
\part Ist die Korrelation der urspr\"unglichen Daten signifikant?
|
|
\part Variiere den Parameter $a$ und \"uberpr\"ufe auf gleiche Weise die Signifikanz.
|
|
\end{parts}
|
|
|
|
|
|
\end{questions}
|
|
|
|
\end{document} |