\documentclass[12pt,a4paper,pdftex]{exam} \usepackage[german]{babel} \usepackage{pslatex} \usepackage[mediumspace,mediumqspace,Gray]{SIunits} % \ohm, \micro \usepackage{xcolor} \usepackage{graphicx} \usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref} %%%%% layout %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry} \pagestyle{headandfoot} \ifprintanswers \newcommand{\stitle}{: L\"osungen} \else \newcommand{\stitle}{} \fi \header{{\bfseries\large \"Ubung 6X\stitle}}{{\bfseries\large Statistik}}{{\bfseries\large 22. November, 2016}} \firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email: jan.benda@uni-tuebingen.de} \runningfooter{}{\thepage}{} \setlength{\baselineskip}{15pt} \setlength{\parindent}{0.0cm} \setlength{\parskip}{0.3cm} \renewcommand{\baselinestretch}{1.15} %%%%% listings %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \usepackage{listings} \lstset{ language=Matlab, basicstyle=\ttfamily\footnotesize, numbers=left, numberstyle=\tiny, title=\lstname, showstringspaces=false, commentstyle=\itshape\color{darkgray}, breaklines=true, breakautoindent=true, columns=flexible, frame=single, xleftmargin=1em, xrightmargin=1em, aboveskip=10pt } %%%%% math stuff: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \usepackage{amsmath} \usepackage{amssymb} \usepackage{bm} \usepackage{dsfont} \newcommand{\naZ}{\mathds{N}} \newcommand{\gaZ}{\mathds{Z}} \newcommand{\raZ}{\mathds{Q}} \newcommand{\reZ}{\mathds{R}} \newcommand{\reZp}{\mathds{R^+}} \newcommand{\reZpN}{\mathds{R^+_0}} \newcommand{\koZ}{\mathds{C}} %%%%% page breaks %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \newcommand{\continue}{\ifprintanswers% \else \vfill\hspace*{\fill}$\rightarrow$\newpage% \fi} \newcommand{\continuepage}{\ifprintanswers% \newpage \else \vfill\hspace*{\fill}$\rightarrow$\newpage% \fi} \newcommand{\newsolutionpage}{\ifprintanswers% \newpage% \else \fi} %%%%% new commands %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \newcommand{\qt}[1]{\textbf{#1}\\} \newcommand{\pref}[1]{(\ref{#1})} \newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}} \newcommand{\code}[1]{\texttt{#1}} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \begin{document} \input{instructions} \begin{questions} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \question \qt{Wahrscheinlichkeiten der Normalverteilung} Mit den folgenden Aufgaben wollen wir bestimmen, welcher Anteil eines normalverteilten Datensatzes in bestimmten Grenzen symmetrisch um den Mittelwert enthalten ist. \begin{parts} \part Erzeuge einen Datensatz $X = (x_1, x_2, ... x_n)$ aus $n=10000$ normalverteilten Zufallszahlen mit Mittelwert $\mu=0$ und Standardabweichung $\sigma=1$ (\code{randn() Funktion}). \part Bestimme und plotte die Wahrscheinlichkeitsdichte dieser Zufallszahlen (normiertes Histogramm). \part Plotte zum Vergleich in den gleichen Plot die Normalverteilung \[ p_g(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \; . \] \part \label{onesigma} Wieviele dieser Daten sind maximal eine Standardabweichung vom Mittelwert entfernt?\\ D.h. wieviele Datenwerte $x_i$ haben den Wert $-\sigma < x_i < +\sigma$?\\ Wie gro{\ss} ist also die Wahrscheinlichkeit $P_{\pm\sigma}$ einen Wert in diesem Interval zu erhalten? \part \label{probintegral} Berechne numerisch diese Wahrscheinlichkeit aus dem entsprechenden Integral \[ P_{\pm\sigma}=\int_{x=\mu-\sigma}^{x=\mu+\sigma} p_g(x) \, dx \] \"uber die Normalverteilung. \"Uberpr\"ufe zuerst, ob tats\"achlich \[ \int_{-\infty}^{+\infty} p_g(x) \, dx = 1 \; . \] Warum muss das so sein? \part Welcher Anteil der Daten ist in den Intervallen $\pm2\sigma$ sowie $\pm3\sigma$ enthalten? \part \label{givenfraction} Finde heraus in welchem Interval symmetrisch um den Mittelwert 50\,\%, 90\,\%, 95\,\% bzw. 99\,\% der Daten enhalten sind. \part \extra Modifiziere den Code der Teilaufgaben \pref{onesigma} -- \pref{givenfraction} so, dass er f\"ur Datens\"atze mit beliebigen Mittelwerten und Standardabweichungen funktioniert.\\ Teste den Code mit entsprechenden Zufallszahlen.\\ Wie bekommt man mit \code{randn()} Zufallszahlen mit beliebiger Standardabweichung und Mittelwerten? \end{parts} \begin{solution} \lstinputlisting{normprobs.m} \end{solution} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \question \qt{Zentraler Grenzwertsatz} Der Zentrale Grenzwertsatz besagt, dass die Summe von unabh\"angigen und identisch verteilten (i.i.d. = independent and identically distributed) Zufallsvariablen gegen die Normalverteilung konvergiert. Den Zentralen Grenzwertsatz wollen wir uns im Folgenden veranschaulichen. \begin{parts} \part Versuche dir klar zu machen, was der Zentrale Grenzwertsatz bedeutet, und wie du vorgehen k\"onntest ein Programm zu schreiben, das den Grenzwertsatz illustriert. \part Erzeuge 10000 zwischen 0 und 1 gleichverteilte Zufallszahlen (Funktion \code{rand}). \part Plotte deren Wahrscheinlichkeitsdichte (normiertes Histogram). \part Erzeuge weitere 10000 gleichverteilte Zufallszahlen und addiere diese zu den bereits vorhandenen auf. \part Plotte die Wahrscheinlichkeitsdichte der aufsummierten Zufallszahlen. \part Wiederhole Schritt (d) und (e) viele Male. \part Vergleiche in einer Grafik die Wahrscheinlichkeitsdichte der aufsummierten Zufallszahlen mit der Gaussfunktion \[ p_g(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}\] mit dem Mittelwert $\mu$ und der Standardabweichung $\sigma$ der aufsummierten Zufallszahlen. \part Wie \"andert sich der Mittelwert und die Standardabweichung/Varianz der aufsummierten Zufallszahlen?\\ Wie h\"angen diese mit den Werten der urspr\"unglichen Verteilung zusammen? \part \extra \"Uberpr\"ufe den Grenzwertsatz in gleicher Weise mit exponentiell verteilten Zufallszahlen (Funktion \code{rande}). \end{parts} \begin{solution} \lstinputlisting{centrallimit.m} \includegraphics[width=0.5\textwidth]{centrallimit-hist01} \includegraphics[width=0.5\textwidth]{centrallimit-hist02} \includegraphics[width=0.5\textwidth]{centrallimit-hist03} \includegraphics[width=0.5\textwidth]{centrallimit-hist05} \includegraphics[width=0.5\textwidth]{centrallimit-samples} \end{solution} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \question \qt{Random Walk} Im folgenden wollen wir einige Eigenschaften des Random Walks bestimmen. \begin{parts} \part Schreibe eine Funktion, die einen einzelnen Random Walk mit Startwert 0 f\"ur $n$ Schritte und Wahrscheinlichkeit $p$ f\"ur einen positiven Schritt als Vektor zur\"uckgibt. \part Visualisiere jeweils 10 Random Walks mit $p=0.5$ zusammen in einem Plot f\"ur $n=100$, $n=1000$ und $n=10000$ (drei Plots).\\ Sch\"atze aus den Abbildungen ab, wie sich der Mittelwert und die Standardabweichung des Random Walks mit der Zeit (Schritte) sich entwickelt. \part \"Uberpr\"uefe deine Hypothese zum Mittelwert und zur Standardabweichung, indem du von $m$ Random Walks ($m \ge 10$) f\"ur jeden z.B. zehnten Schritt den Mittelwert und die Standardabweichung \"uber die Positionen der $m$ Random Walks berechnest.\\ Wie h\"angt also die Standardabweichung von der Anzahl der Schritte ab? Wie entwickelt sich die Standardabweichung f\"ur eine sehr gro{\ss}e Anzahl von Schritten? \part \extra Erstelle eine Grafik, die die Verteilung der Position eines Random Walkers zu drei verschiedenen Zeitpunkten zeigt. \end{parts} \begin{solution} \lstinputlisting{randomwalk.m} \lstinputlisting{randomwalkstatistics.m} \includegraphics[width=0.8\textwidth]{randomwalk-traces}\\ \includegraphics[width=0.5\textwidth]{randomwalk-stdev} \includegraphics[width=0.5\textwidth]{randomwalk-hists} \end{solution} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \question \qt{\extra 2D Random Walk} Bisher hat sich unser Random Walker nur in einer Dimension bewegt (nur vorw\"arts oder r\"uckw\"arts). Er kann aber auch in mehreren Dimensionen laufen!\\ In zwei Dimensionen wird dazu in jedem Schritt eine weitere Zufallszahl gezogen, die bestimmt ob er einen Schritt nach links oder rechts gemacht hat. Die Bewegung nach vorne/hinten bzw. links/rechts sind unabh\"angig voneinander. \begin{parts} \part Wie kann unter Verwendung unserer Funktion f\"ur den eindimensionalen Random Walk ein zweidimensionaler Random Walk simuliert werden? \part Erstelle h\"ubsche Bilder, die zweidimensionalen Random Walks verschiedener L\"ange (bis zu mindestens $n=1000000$) illustrieren. \part Animationen sind auch sch\"on! z.B. mit dem \code{pause} Befehl. \part Anstatt einfach den Weg des Random Walks zu zeichnen, kann man sich auch merken, wie oft er an jeder Stelle vorbeigekommen ist und mit einem Farbcode plotten. \end{parts} \end{questions} \end{document}