diff --git a/statistics/exercises/statistics01.tex b/statistics/exercises/statistics01.tex new file mode 100644 index 0000000..d78a0b3 --- /dev/null +++ b/statistics/exercises/statistics01.tex @@ -0,0 +1,181 @@ +\documentclass[12pt,a4paper,pdftex]{exam} + +\usepackage[german]{babel} +\usepackage{pslatex} +\usepackage[mediumspace,mediumqspace,Gray]{SIunits} % \ohm, \micro +\usepackage{xcolor} +\usepackage{graphicx} +\usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref} + +%%%%% layout %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry} +\pagestyle{headandfoot} +\ifprintanswers +\newcommand{\stitle}{: L\"osungen} +\else +\newcommand{\stitle}{} +\fi +\header{{\bfseries\large \"Ubung 1\stitle}}{{\bfseries\large Statistik}}{{\bfseries\large 19. Oktober, 2015}} +\firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email: +jan.benda@uni-tuebingen.de} +\runningfooter{}{\thepage}{} + +\setlength{\baselineskip}{15pt} +\setlength{\parindent}{0.0cm} +\setlength{\parskip}{0.3cm} +\renewcommand{\baselinestretch}{1.15} + +%%%%% listings %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage{listings} +\lstset{ + language=Matlab, + basicstyle=\ttfamily\footnotesize, + numbers=left, + numberstyle=\tiny, + title=\lstname, + showstringspaces=false, + commentstyle=\itshape\color{darkgray}, + breaklines=true, + breakautoindent=true, + columns=flexible, + frame=single, + xleftmargin=1em, + xrightmargin=1em, + aboveskip=10pt +} + +%%%%% math stuff: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage{amsmath} +\usepackage{amssymb} +\usepackage{bm} +\usepackage{dsfont} +\newcommand{\naZ}{\mathds{N}} +\newcommand{\gaZ}{\mathds{Z}} +\newcommand{\raZ}{\mathds{Q}} +\newcommand{\reZ}{\mathds{R}} +\newcommand{\reZp}{\mathds{R^+}} +\newcommand{\reZpN}{\mathds{R^+_0}} +\newcommand{\koZ}{\mathds{C}} + +%%%%% page breaks %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\newcommand{\continue}{\ifprintanswers% +\else +\vfill\hspace*{\fill}$\rightarrow$\newpage% +\fi} +\newcommand{\continuepage}{\ifprintanswers% +\newpage +\else +\vfill\hspace*{\fill}$\rightarrow$\newpage% +\fi} +\newcommand{\newsolutionpage}{\ifprintanswers% +\newpage% +\else +\fi} + +%%%%% new commands %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\newcommand{\qt}[1]{\textbf{#1}\\} +\newcommand{\pref}[1]{(\ref{#1})} +\newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}} +\newcommand{\code}[1]{\texttt{#1}} + + +%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\begin{document} + +\input{instructions} + + +\begin{questions} + +\question \qt{Wahrscheinlichkeiten eines W\"urfels I} + +Der Computer kann auch als W\"urfel verwendet werden! +\begin{parts} + \part Simuliere 10000 W\"urfe mit dem W\"urfel durch Erzeugung von + ganzzahligen Zufallszahlen mit den Augenzahlen $x_i = 1, 2, \ldots 6$ . + + \part Berechne die Wahrscheinlichkeit $P(3)$ + des Auftretens der Augenzahl drei durch Bestimmung der Anzahl der Dreien im Datensatz.\\ + Entspricht das Ergebnis deiner Erwartung?\\ + \"Uberpr\"ufe auch die Wahrscheinlichkeit $P(x_i)$ der anderen Zahlen.\\ + Ist das ein fairer W\"urfel? + + \part Speicher die berechneten Wahrscheinlichkeiten $P(x_i)$ f\"ur das Auftreten der + gew\"urfelten Zahlen in einem Vektor und benutze die \code{bar} Funktion, + um diese Wahrscheinlichkeiten als Funktion der Augenzahl zu plotten. + + \part Erstelle in einem weiterem Plot ein entsprechendes normiertes Histogramm + mit der \code{hist} Funktion. + + \part \extra Wie k\"onnte man einen gezinkten W\"urfel simulieren, bei dem die sechs + dreimal so h\"aufig wie die anderen Zahlen gew\"urfelt wird?\\ + Fertige von diesem W\"urfel ein Histogram aus 10000 W\"urfen an. +\end{parts} +\begin{solution} + \lstinputlisting{rollthedie.m} + \lstinputlisting{diehist.m} + \lstinputlisting{die1.m} +\end{solution} + + +\continue +\question \qt{Wahrscheinlichkeiten eines W\"urfels II} +Wir werten nun das Verhalten mehrerer W\"urfel aus. +\begin{parts} + \part Simuliere 20 W\"urfel, von denen jeder 100 mal geworfen wird + (jeder W\"urfel wird mit dem gleichen Zufallsgenerator simuliert). + \part Berechne aus diesem Datensatz f\"ur jeden W\"urfel ein normiertes Histogramm. + \part Bestimme den Mittelwert und die Standardabweichung f\"ur jede + Augenzahl gemittelt \"uber die W\"urfel. + \part Stelle das Ergebnis mit einem S\"aulenplot mit Fehlerbalken dar + (\code{bar} mit \code{errorbar} Funktionen). +\end{parts} +\begin{solution} + \lstinputlisting{die2.m} +\end{solution} + + +\question \qt{Wahrscheinlichkeiten der Normalverteilung} +Mit den folgenden Aufgaben wollen wir bestimmen, welcher Anteil eines +normalverteilten Datensatzes in bestimmten Grenzen symmetrisch um den +Mittelwert enthalten ist. +\begin{parts} + \part Erzeuge einen Datensatz $X = (x_1, x_2, ... x_n)$ aus + $n=10000$ normalverteilten Zufallszahlen mit Mittelwert $\mu=0$ und + Standardabweichung $\sigma=1$. + \part \label{onesigma} Wieviele dieser Daten sind maximal eine Standardabweichung vom Mittelwert entfernt?\\ + D.h. wieviele Datenwerte $x_i$ haben den Wert $-\sigma < x_i < +\sigma$?\\ + Wie gro{\ss} ist also die Wahrscheinlichkeit $P_{\pm\sigma}$ einen + Wert in diesem Interval zu erhalten? + \part \label{probintegral} Berechne numerisch diese + Wahrscheinlichkeit aus dem entsprechenden Integral + \[ P_{\pm\sigma}=\int_{x=\mu-\sigma}^{x=\mu+\sigma} p_g(x) \, dx \] + \"uber die Normalverteilung + \[ p_g(x) = + \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \; . \] + \"Uberpr\"ufe zuerst, ob tats\"achlich + \[ \int_{-\infty}^{+\infty} p_g(x) \, dx = 1 \; . \] + Warum muss das so sein? + \part Welcher Anteil der Daten ist in den Intervallen $\pm2\sigma$ sowie $\pm3\sigma$ + enthalten? + \part \label{givenfraction} Finde heraus in welchem Interval symmetrisch um den Mittelwert + 50\,\%, 90\,\%, 95\,\% bzw. 99\,\% der Daten enhalten sind. + \part Was passiert mit der Wahrscheinlichkeit eine Zahl in einem bestimmten Interval + zu ziehen, wenn dieses Intervall immer kleiner wird?\\ + Schreibe ein Programm, das dies illustriert.\\ + Wie gro{\ss} ist die Wahrscheinlichkeit $P(x_i=0.1234)$? + \part \extra Modifiziere den Code der Teilaufgaben \pref{onesigma} + -- \pref{givenfraction} so, dass er f\"ur Datens\"atze mit + beliebigen Mittelwerten und Standardabweichungen funktioniert.\\ + Teste den Code mit entsprechenden Zufallszahlen.\\ + Wie bekommt man mit \code{randn} Zufallszahlen mit beliebiger + Standardabweichung und Mittelwerten? +\end{parts} +\begin{solution} + \lstinputlisting{normprobs.m} +\end{solution} + + +\end{questions} + +\end{document} \ No newline at end of file diff --git a/statistics/exercises/statistics02.tex b/statistics/exercises/statistics02.tex new file mode 100644 index 0000000..36216be --- /dev/null +++ b/statistics/exercises/statistics02.tex @@ -0,0 +1,174 @@ +\documentclass[12pt,a4paper,pdftex]{exam} + +\usepackage[german]{babel} +\usepackage{pslatex} +\usepackage[mediumspace,mediumqspace,Gray]{SIunits} % \ohm, \micro +\usepackage{xcolor} +\usepackage{graphicx} +\usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref} + +%%%%% layout %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry} +\pagestyle{headandfoot} +\ifprintanswers +\newcommand{\stitle}{: L\"osungen} +\else +\newcommand{\stitle}{} +\fi +\header{{\bfseries\large \"Ubung 2\stitle}}{{\bfseries\large Statistik}}{{\bfseries\large 20. Oktober, 2015}} +\firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email: +jan.benda@uni-tuebingen.de} +\runningfooter{}{\thepage}{} + +\setlength{\baselineskip}{15pt} +\setlength{\parindent}{0.0cm} +\setlength{\parskip}{0.3cm} +\renewcommand{\baselinestretch}{1.15} + +%%%%% listings %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage{listings} +\lstset{ + language=Matlab, + basicstyle=\ttfamily\footnotesize, + numbers=left, + numberstyle=\tiny, + title=\lstname, + showstringspaces=false, + commentstyle=\itshape\color{darkgray}, + breaklines=true, + breakautoindent=true, + columns=flexible, + frame=single, + xleftmargin=1em, + xrightmargin=1em, + aboveskip=10pt +} + +%%%%% math stuff: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage{amsmath} +\usepackage{amssymb} +\usepackage{bm} +\usepackage{dsfont} +\newcommand{\naZ}{\mathds{N}} +\newcommand{\gaZ}{\mathds{Z}} +\newcommand{\raZ}{\mathds{Q}} +\newcommand{\reZ}{\mathds{R}} +\newcommand{\reZp}{\mathds{R^+}} +\newcommand{\reZpN}{\mathds{R^+_0}} +\newcommand{\koZ}{\mathds{C}} + +%%%%% page breaks %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\newcommand{\continue}{\ifprintanswers% +\else +\vfill\hspace*{\fill}$\rightarrow$\newpage% +\fi} +\newcommand{\continuepage}{\ifprintanswers% +\newpage +\else +\vfill\hspace*{\fill}$\rightarrow$\newpage% +\fi} +\newcommand{\newsolutionpage}{\ifprintanswers% +\newpage% +\else +\fi} + +%%%%% new commands %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\newcommand{\qt}[1]{\textbf{#1}\\} +\newcommand{\pref}[1]{(\ref{#1})} +\newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}} +\newcommand{\code}[1]{\texttt{#1}} + + +%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\begin{document} + +\input{instructions} + + +\begin{questions} + +\question \qt{Zentraler Grenzwertsatz} +Der Zentrale Grenzwertsatz besagt, dass die Summe von unabh\"angigen +und identisch verteilten (i.i.d. = independent and identically +distributed) Zufallsvariablen gegen die Normalverteilung konvergiert. + +Den Zentralen Grenzwertsatz wollen wir uns im Folgenden veranschaulichen. +\begin{parts} + \part Versuche dir klar zu machen, was der Zentrale Grenzwertsatz + bedeutet, und wie du vorgehen k\"onntest ein Programm zu + schreiben, das den Grenzwertsatz illustriert. + \part Erzeuge 10000 zwischen 0 und 1 gleichverteilte Zufallszahlen + (Funktion \code{rand}). + \part Plotte deren Wahrscheinlichkeitsdichte (normiertes Histogram). + \part Erzeuge weitere 10000 gleichverteilte Zufallszahlen und + addiere diese zu den bereits vorhandenen auf. + \part Plotte die Wahrscheinlichkeitsdichte der aufsummierten + Zufallszahlen. + \part Wiederhole Schritt (d) und (e) viele Male. + \part Vergleiche in einer Grafik die Wahrscheinlichkeitsdichte der + aufsummierten Zufallszahlen mit der Gaussfunktion + \[ p_g(x) = + \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}\] + mit dem Mittelwert $\mu$ und der Standardabweichung $\sigma$ der + aufsummierten Zufallszahlen. + \part Wie \"andert sich der Mittelwert und die + Standardabweichung/Varianz + der aufsummierten Zufallszahlen?\\ + Wie h\"angen diese mit den Werten der urspr\"unglichen Verteilung + zusammen? + \part \extra \"Uberpr\"ufe den Grenzwertsatz in gleicher Weise mit exponentiell + verteilten Zufallszahlen (Funktion \code{rande}). +\end{parts} +\begin{solution} + \lstinputlisting{centrallimit.m} +\end{solution} + + +\question \qt{Random Walk} +Im folgenden wollen wir einige Eigenschaften des Random Walks bestimmen. +\begin{parts} + \part Schreibe eine Funktion, die einen einzelnen Random Walk mit + Startwert 0 f\"ur $n$ Schritte und Wahrscheinlichkeit $p$ f\"ur + einen positiven Schritt als Vektor zur\"uckgibt. + \part Visualisiere jeweils 10 Random Walks mit $p=0.5$ zusammen in einem Plot + f\"ur $n=100$, $n=1000$ und $n=10000$ (drei Plots).\\ + Sch\"atze aus den Abbildungen ab, wie sich der Mittelwert und die Standardabweichung + des Random Walks mit der Zeit (Schritte) sich entwickelt. + \part \"Uberpr\"uefe deine Hypothese zum Mittelwert und zur + Standardabweichung, indem du von $m$ Random Walks ($m \ge 10$) f\"ur + jeden z.B. zehnten Schritt den Mittelwert und die Standardabweichung + \"uber die Positionen der $m$ Random Walks berechnest.\\ + Wie h\"angt also die Standardabweichung von der Anzahl der Schritte + ab? Wie entwickelt sich die Standardabweichung f\"ur eine sehr + gro{\ss}e Anzahl von Schritten? + \part \extra Erstelle eine Grafik, die die Verteilung der Position eines Random Walkers + zu drei verschiedenen Zeitpunkten zeigt. +\end{parts} +\begin{solution} + \lstinputlisting{randomwalk.m} + \lstinputlisting{randomwalkstatistics.m} +\end{solution} + + +\question \qt{\extra 2D Random Walk} +Bisher hat sich unser Random Walker nur in einer Dimension bewegt +(nur vorw\"arts oder r\"uckw\"arts). Er kann aber auch in mehreren Dimensionen laufen!\\ +In zwei Dimensionen wird dazu in jedem Schritt eine weitere +Zufallszahl gezogen, die bestimmt ob er einen Schritt nach links oder +rechts gemacht hat. Die Bewegung nach vorne/hinten bzw. links/rechts +sind unabh\"angig voneinander. +\begin{parts} + \part Wie kann unter Verwendung unserer Funktion f\"ur den + eindimensionalen Random Walk ein zweidimensionaler Random Walk + simuliert werden? + \part Erstelle h\"ubsche Bilder, die zweidimensionalen Random + Walks verschiedener L\"ange (bis zu mindestens $n=1000000$) illustrieren. + \part Animationen sind auch sch\"on! z.B. mit dem \code{pause} Befehl. + \part Anstatt einfach den Weg des Random Walks zu zeichnen, kann man + sich auch merken, wie oft er an jeder Stelle vorbeigekommen ist und + mit einem Farbcode plotten. +\end{parts} + +\end{questions} + +\end{document} \ No newline at end of file diff --git a/statistics/exercises/statistics03.tex b/statistics/exercises/statistics03.tex new file mode 100644 index 0000000..6ae5189 --- /dev/null +++ b/statistics/exercises/statistics03.tex @@ -0,0 +1,144 @@ +\documentclass[12pt,a4paper,pdftex]{exam} + +\usepackage[german]{babel} +\usepackage{pslatex} +\usepackage[mediumspace,mediumqspace,Gray]{SIunits} % \ohm, \micro +\usepackage{xcolor} +\usepackage{graphicx} +\usepackage[breaklinks=true,bookmarks=true,bookmarksopen=true,pdfpagemode=UseNone,pdfstartview=FitH,colorlinks=true,citecolor=blue]{hyperref} + +%%%%% layout %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage[left=20mm,right=20mm,top=25mm,bottom=25mm]{geometry} +\pagestyle{headandfoot} +\ifprintanswers +\newcommand{\stitle}{: L\"osungen} +\else +\newcommand{\stitle}{} +\fi +\header{{\bfseries\large \"Ubung 3\stitle}}{{\bfseries\large Statistik}}{{\bfseries\large 21. Oktober, 2015}} +\firstpagefooter{Prof. Dr. Jan Benda}{Phone: 29 74573}{Email: +jan.benda@uni-tuebingen.de} +\runningfooter{}{\thepage}{} + +\setlength{\baselineskip}{15pt} +\setlength{\parindent}{0.0cm} +\setlength{\parskip}{0.3cm} +\renewcommand{\baselinestretch}{1.15} + +%%%%% listings %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage{listings} +\lstset{ + language=Matlab, + basicstyle=\ttfamily\footnotesize, + numbers=left, + numberstyle=\tiny, + title=\lstname, + showstringspaces=false, + commentstyle=\itshape\color{darkgray}, + breaklines=true, + breakautoindent=true, + columns=flexible, + frame=single, + xleftmargin=1em, + xrightmargin=1em, + aboveskip=10pt +} + +%%%%% math stuff: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\usepackage{amsmath} +\usepackage{amssymb} +\usepackage{bm} +\usepackage{dsfont} +\newcommand{\naZ}{\mathds{N}} +\newcommand{\gaZ}{\mathds{Z}} +\newcommand{\raZ}{\mathds{Q}} +\newcommand{\reZ}{\mathds{R}} +\newcommand{\reZp}{\mathds{R^+}} +\newcommand{\reZpN}{\mathds{R^+_0}} +\newcommand{\koZ}{\mathds{C}} + +%%%%% page breaks %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\newcommand{\continue}{\ifprintanswers% +\else +\vfill\hspace*{\fill}$\rightarrow$\newpage% +\fi} +\newcommand{\continuepage}{\ifprintanswers% +\newpage +\else +\vfill\hspace*{\fill}$\rightarrow$\newpage% +\fi} +\newcommand{\newsolutionpage}{\ifprintanswers% +\newpage% +\else +\fi} + +%%%%% new commands %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\newcommand{\qt}[1]{\textbf{#1}\\} +\newcommand{\pref}[1]{(\ref{#1})} +\newcommand{\extra}{--- Zusatzaufgabe ---\ \mbox{}} +\newcommand{\code}[1]{\texttt{#1}} + + +%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\begin{document} + +\input{instructions} + + +\begin{questions} + +\question \qt{Bootstrap des Standardfehlers} +\begin{parts} + \part Lade von Ilias die Datei \code{thymusglandweights.dat} herunter. + Darin befindet sich ein Datensatz vom Gewicht der Thymus Dr\"use in 14-Tage alten + H\"uhnerembryos in mg. + \part Lade diese Daten in Matlab (\code{load} Funktion). + \part Bestimme Histogramm, Mittelwert und Standardfehler aus den ersten 80 Datenpunkten. + \part Bestimme den Standardfehler aus den ersten 80 Datenpunkten durch 500-mal Bootstrappen. + \part Bestimme das 95\,\% Konfidenzintervall f\"ur den Mittelwert + aus der Bootstrap Verteilung (\code{quantile()} Funktion) --- also + das Interval innerhalb dessen mit 95\,\% Wahrscheinlichkeit der + wahre Mittelwert liegen wird. + \part Benutze den ganzen Datensatz und die Bootstrapping Technik, um die Abh\"angigkeit + des Standardfehlers von der Stichprobengr\"o{\ss}e zu bestimmen. + \part Vergleiche mit der bekannten Formel f\"ur den Standardfehler $\sigma/\sqrt{n}$. +\end{parts} + + +\continue +\question \qt{Student t-Verteilung} +\begin{parts} +\part Erzeuge 100000 normalverteilte Zufallszahlen. +\part Ziehe daraus 1000 Stichproben vom Umfang $m$ (3, 5, 10, 50). +\part Berechne den Mittelwert $\bar x$ der Stichproben und plotte die Wahrscheinlichkeitsdichte +dieser Mittelwerte. +\part Vergleiche diese Wahrscheinlichkeitsdichte mit der Gausskurve. +\part Berechne ausserdem die Gr\"o{\ss}e $t=\bar x/(\sigma_x/\sqrt{m}$ +(Standardabweichung $\sigma_x$) und vergleiche diese mit der Normalverteilung mit Standardabweichung Eins. Ist $t$ normalverteilt, bzw. unter welchen Bedingungen ist $t$ normalverteilt? +\end{parts} + + +\question \qt{Korrelationen} +\begin{parts} +\part Erzeuge 1000 korrelierte Zufallszahlen $x$, $y$ durch +\begin{verbatim} +n = 1000 +a = 0.2; +x = randn(n, 1); +y = randn(n, 1) + a*x; +\end{verbatim} +\part Erstelle einen Scatterplot der beiden Variablen. +\part Warum ist $y$ mit $x$ korreliert? +\part Berechne den Korrelationskoeffizienten zwischen $x$ und $y$. +\part Was m\"usste man tun, um die Korrelationen zwischen den $x$-$y$ +Paaren zu zerst\"oren? +\part Mach genau dies 1000 mal und berechne jedes Mal den Korrelationskoeffizienten. +\part Bestimme die Wahrscheinlichkeitsdichte dieser Korrelationskoeffizienten. +\part Ist die Korrelation der urspr\"unglichen Daten signifikant? +\part Variiere den Parameter $a$ und \"uberpr\"ufe auf gleiche Weise die Signifikanz. +\end{parts} + + +\end{questions} + +\end{document} \ No newline at end of file