\documentclass[12pt,a4paper,pdftex]{exam} \usepackage[german]{babel} \usepackage{natbib} \usepackage{graphicx} \usepackage[small]{caption} \usepackage{sidecap} \usepackage{pslatex} \usepackage{amsmath} \usepackage{amssymb} \setlength{\marginparwidth}{2cm} \usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref} %%%%% text size %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry} \pagestyle{headandfoot} \header{{\bfseries\large \"Ubung 1}}{{\bfseries\large Deskriptive Statistik}}{{\bfseries\large 19. Oktober, 2015}} \firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email: jan.grewe@uni-tuebingen.de} \runningfooter{}{\thepage}{} \setlength{\baselineskip}{15pt} \setlength{\parindent}{0.0cm} \setlength{\parskip}{0.3cm} \renewcommand{\baselinestretch}{1.15} \newcommand{\qt}[1]{\textbf{#1}\\} \newcommand{\pref}[1]{(\ref{#1})} \newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}} \newcommand{\code}[1]{\texttt{#1}} \newcommand{\continue}{\ifprintanswers% \else \vfill\hspace*{\fill}$\rightarrow$\newpage% \fi} \newcommand{\continuepage}{\ifprintanswers% \newpage \else \vfill\hspace*{\fill}$\rightarrow$\newpage% \fi} \newcommand{\newsolutionpage}{\ifprintanswers% \newpage% \else \fi} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \begin{document} \vspace*{-6.5ex} \begin{center} \textbf{\Large Einf\"uhrung in die wissenschaftliche Datenverarbeitung}\\[1ex] {\large Jan Grewe, Jan Benda}\\[-3ex] Abteilung Neuroethologie \hfill --- \hfill Institut f\"ur Neurobiologie \hfill --- \hfill \includegraphics[width=0.28\textwidth]{UT_WBMW_Black_RGB} \\ \end{center} % Die folgenden Aufgaben dienen der Wiederholung, \"Ubung und % Selbstkontrolle und sollten eigenst\"andig bearbeitet und gel\"ost % werden. Die L\"osung soll in Form eines einzelnen Skriptes (m-files) % im ILIAS hochgeladen werden. Jede Aufgabe sollte in einer eigenen % ``Zelle'' gel\"ost sein. Die Zellen \textbf{m\"ussen} unabh\"angig % voneinander ausf\"uhrbar sein. Das Skript sollte nach dem Muster: % ``variablen\_datentypen\_\{nachname\}.m'' benannt werden % (z.B. variablen\_datentypen\_mueller.m). \begin{itemize} \item \"Uberzeuge dich von jeder einzelnen Zeile deines Codes, dass sie auch wirklich das macht, was sie machen soll! Teste dies mit kleinen Beispielen direkt in der Kommandozeile. \item Versuche die L\"osungen der folgenden Aufgaben m\"oglichst in sinnvolle kleine Funktionen herunterzubrechen. \item Sobald etwas \"ahnliches mehr als einmal berechnet werden soll, lohnt es sich eine Funktion daraus zu schreiben! \item Teste rechenintensive \code{for} Schleifen zuerst mit einer kleinen Anzahl von Wiederholungen, und benutze erst am Ende, wenn alles stimmt, eine gro{\ss}e Anzahl von Wiederholungen, um eine gute Statistik zu bekommen. \item Benutze die Hilfsfunktion von matlab und das Internet, um herauszufinden wie bestimmte \code{matlab} Funktionen zu verwenden sind und was f\"ur M\"oglichkeiten sie bieten. \item Auch zu inhaltlichen Konzepten bietet das Internet oft viele Antworten! \end{itemize} \begin{questions} \question \qt{Wahrscheinlichkeiten eines W\"urfels I} Der Computer kann auch als W\"urfel verwendet werden! \begin{parts} \part Simuliere 10000 W\"urfe mit dem W\"urfel durch Erzeugung von ganzzahligen Zufallszahlen mit den Augenzahlen $x_i = 1, 2, \ldots 6$ . \part Berechne die Wahrscheinlichkeit $P(3)$ des Auftretens der Augenzahl drei durch Bestimmung der Anzahl der Dreien im Datensatz.\\ Entspricht das Ergebnis deiner Erwartung?\\ \"Uberpr\"ufe auch die Wahrscheinlichkeit $P(x_i)$ der anderen Zahlen.\\ Ist das ein fairer W\"urfel? \part Speicher die berechneten Wahrscheinlichkeiten $P(x_i)$ f\"ur das Auftreten der gew\"urfelten Zahlen in einem Vektor und benutze die \code{bar} Funktion, um diese Wahrscheinlichkeiten als Funktion der Augenzahl zu plotten. \part Erstelle in einem weiterem Plot ein entsprechendes normiertes Histogramm mit der \code{hist} Funktion. \part \extra Wie k\"onnte man einen gezinkten W\"urfel simulieren, bei dem die sechs dreimal so h\"aufig wie die anderen Zahlen gew\"urfelt wird?\\ Fertige von diesem W\"urfel ein Histogram aus 10000 W\"urfen an. \end{parts} \continue \question \qt{Wahrscheinlichkeiten eines W\"urfels II} Wir werten nun das Verhalten mehrerer W\"urfel aus. \begin{parts} \part Simuliere 20 W\"urfel, von denen jeder 100 mal geworfen wird (jeder W\"urfel wird mit dem gleichen Zufallsgenerator simuliert). \part Berechne aus diesem Datensatz f\"ur jeden W\"urfel ein normiertes Histogramm. \part Bestimme den Mittelwert und die Standardabweichung f\"ur jede Augenzahl gemittelt \"uber die W\"urfel. \part Stelle das Ergebnis mit einem S\"aulenplot mit Fehlerbalken dar (\code{bar} mit \code{errorbar} Funktionen). \end{parts} \question \qt{Wahrscheinlichkeiten der Normalverteilung} Mit den folgenden Aufgaben wollen wir bestimmen, welcher Anteil eines normalverteilten Datensatzes in bestimmten Grenzen symmetrisch um den Mittelwert enthalten ist. \begin{parts} \part Erzeuge einen Datensatz $X = (x_1, x_2, ... x_n)$ aus $n=10000$ normalverteilten Zufallszahlen mit Mittelwert $\mu=0$ und Standardabweichung $\sigma=1$. \part \label{onesigma} Wieviele dieser Daten sind maximal eine Standardabweichung vom Mittelwert entfernt?\\ D.h. wieviele Datenwerte $x_i$ haben den Wert $-\sigma < x_i < +\sigma$?\\ Wie gro{\ss} ist also die Wahrscheinlichkeit $P_{\pm\sigma}$ einen Wert in diesem Interval zu erhalten? \part \label{probintegral} Berechne numerisch diese Wahrscheinlichkeit aus dem entsprechenden Integral \[ P_{\pm\sigma}=\int_{x=\mu-\sigma}^{x=\mu+\sigma} p_g(x) \, dx \] \"uber die Normalverteilung \[ p_g(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \; . \] \"Uberpr\"ufe zuerst, ob tats\"achlich \[ \int_{-\infty}^{+\infty} p_g(x) \, dx = 1 \; . \] Warum muss das so sein? \part Welcher Anteil der Daten ist in den Intervallen $\pm2\sigma$ sowie $\pm3\sigma$ enthalten? \part \label{givenfraction} Finde heraus in welchem Interval symmetrisch um den Mittelwert 50\,\%, 90\,\%, 95\,\% bzw. 99\,\% der Daten enhalten sind. \part Was passiert mit der Wahrscheinlichkeit eine Zahl in einem bestimmten Interval zu ziehen, wenn dieses Intervall immer kleiner wird?\\ Schreibe ein Programm, das dies illustriert.\\ Wie gro{\ss} ist die Wahrscheinlichkeit $P(x_i=0.1234)$? \part \extra Modifiziere den Code der Teilaufgaben \pref{onesigma} -- \pref{givenfraction} so, dass er f\"ur Datens\"atze mit beliebigen Mittelwerten und Standardabweichungen funktioniert.\\ Teste den Code mit entsprechenden Zufallszahlen.\\ Wie bekommt man mit \code{randn} Zufallszahlen mit beliebiger Standardabweichung und Mittelwerten? \end{parts} \end{questions} \end{document}