From de8ff5574034ee0052b9c59cb786c8a1793aa7a5 Mon Sep 17 00:00:00 2001 From: Fabian Sinz Date: Mon, 6 Oct 2014 12:46:36 +0200 Subject: [PATCH] statistics datat types done --- latex/environments.tex | 6 + statistics/lecture_statistics.tex | 179 +++++++++++++++++++++++++++++- 2 files changed, 183 insertions(+), 2 deletions(-) diff --git a/latex/environments.tex b/latex/environments.tex index 875f98c..ddab47d 100644 --- a/latex/environments.tex +++ b/latex/environments.tex @@ -25,6 +25,12 @@ \definecolor{sec22}{RGB}{210,150,0} \definecolor{sec23}{RGB}{145,105,70} +\newcommand{\source}[1]{ + \begin{flushright} + \color{gray}\scriptsize \url{#1} + \end{flushright} +} + \newenvironment<>{emphasize}[1]{% \begin{actionenv}#2% \def\insertblocktitle{#1}% diff --git a/statistics/lecture_statistics.tex b/statistics/lecture_statistics.tex index 353ca53..2af3343 100755 --- a/statistics/lecture_statistics.tex +++ b/statistics/lecture_statistics.tex @@ -18,7 +18,7 @@ \setbeamercovered{opaque} \usecolortheme{tuebingen} \setbeamertemplate{navigation symbols}{} - \usefonttheme{professionalfonts} + \usefonttheme{default} \useoutertheme{infolines} % \useoutertheme{miniframes} } @@ -177,9 +177,24 @@ Bernstein Center T\"ubingen} \subsection{Arten von Daten} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% + +\begin{frame} + \frametitle{Datenskalen} + \framesubtitle{Welche Datentypen gibt es in der Statistik?} + \Large + {\bf Warum sind Datentypen wichtig?} + \pause + \begin{itemize} + \item Auswahl passender Statistiken + \item Auswahl angemessener Plots + \item Auswahl von korrekten Tests + \end{itemize} +\end{frame} +%------------------------------------------------------------- + \begin{frame} \frametitle{Datenskalen} - \framesubtitle{Nominalskala (engl. "categorial")} + \framesubtitle{Nominalskala (engl. ,,categorial'')} \begin{itemize} \item Eigenschaften wie Zelltyp, Versuchsgruppe \item jede Beobachtung wird eine bestimmten Klasse (Kategorie) @@ -188,6 +203,166 @@ Bernstein Center T\"ubingen} \item Beispiel: [Zapfen, Stäbchen] vs. [Stäbchen, Zapfen] \end{itemize} \end{frame} +%------------------------------------------------------------- + +\begin{frame} + \frametitle{Datenskalen} + \framesubtitle{Ordinalskala (engl. ,,ordinal'')} + \begin{itemize} + \item Wie Nominalskala, nur ist sinnvolles Ordnen m\"oglich + \item {\bf aber:} Unterschiede zwischen den Werten bzw. Klassen + nicht vergleichbar (keine Abst\"ande) + \item Beispiel: Platzierungen, G\"uteklassen, Ratingskalen + \end{itemize} +\end{frame} +%------------------------------------------------------------- + +\begin{frame} + \frametitle{Datenskalen} + \framesubtitle{Intervallskala (engl. ,,interval'')} + \begin{itemize} + \item quantitative/metrische Werte + \item Abst\"ande zwischen Werten sind sinnvoll, aber es gibt keine + absoluten Nullpunkt + \item Beispiel: physikalische Gr\"o{\ss}en wie Temperatur in Grad Celsius + \end{itemize} +\end{frame} +%------------------------------------------------------------- + +\begin{frame} + \frametitle{Datenskalen} + \framesubtitle{Absolut- oder Verh\"altnisskala (engl. ,,ratio)} + \begin{itemize} + \item wie Intervallskala, aber mit absolutem Nullpunkt + \item Beispiel: Temperatur in Kelvin, Einkommen + \end{itemize} + \pause + \begin{emphasize}{Verh\"altnis der Skalen} + \begin{itemize} + \item Skalen besitzen aufsteigenden Informationsgehalt von + Nominal- zu Absolutskala + \item Konvertierung ,,abw\"arts'' immer m\"oglich + \end{itemize} + \end{emphasize} +\end{frame} + +%------------------------------------------------------------- +\begin{frame} + \frametitle{Beispiele aus Neuro-/Kognitionswissenschaften} + \begin{itemize} + \item {\bf Nominalskala:}\pause + \begin{itemize} + \item Versuchsgruppenzugeh\"origkeit + \item Stimulusklasse + \item Zelltyp + \end{itemize} + + \item {\bf Ordinalskala:} \pause + \begin{itemize} + \item Ratings + \item Krankheitsstadien + \item Zust\"ande eines Ionenkanals + \end{itemize} + \item {\bf Absolut-/Ratioskala:}\pause + \begin{itemize} + \item Feuerrate + \item Membranpotential + \item Ionenkonzentration + \end{itemize} + \end{itemize} +\end{frame} +%------------------------------------------------------------- +%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +\subsection{Statistiken} +%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% +%------------------------------------------------------------- +\begin{frame} + \frametitle{Was ist eine (Test)-Statistik} + \begin{definition}{Teststatistik, Pr\"ufwert} + \begin{itemize} + \item Als {\em Teststatistik} bezeichnet man in der mathematischen + Statistik eine Stichprobenfunktion die einer Stichprobe einen + Wert zuordnet (z.B. Mittelwert, Median, Standardabweichung, + ...). + + \item Als {\em Pr\"ufwert} wird die Realisation einer Teststatistik + anhand einer Stichprobe bezeichnet. + + \source{http://de.wikipedia.org/wiki/Teststatistik} + \end{itemize} + \end{definition} +\end{frame} + +%------------------------------------------------------------- +\begin{frame} + \frametitle{Beispiele f\"ur Teststatistiken} + \begin{itemize} + \item {\bf Nominalskala:}\pause + \begin{itemize} + \item Anzahl + \item relative H\"aufigkeit + \end{itemize} + + \item {\bf Ordinalskala:} \pause + \begin{itemize} + \item Median + \item Perzentilen + \item Rangkorrelationskoeffizient + \end{itemize} + \item {\bf Absolut-/Ratioskala:}\pause + \begin{itemize} + \item Mittelwert + \item Varianz/ Standardabweichung + \item Pearson Korrelationskoeffizient + \end{itemize} + \end{itemize} +\end{frame} + +%------------------------------------------------------------- +\begin{frame} + \frametitle{\"Ubung} + \begin{task}{Spearman Rangkorrelationskoeffizient} + \begin{enumerate} + \item Benutze {\tt randi} um zwei 100-dimensionale Vektoren {\tt x,y} mit + Zufalls-Integern zwischen $0$ und $10$ zu berechnen. + \item Finde heraus wie man in Matlab den Spearman + Rangkorrelationskoeffizient $$\rho = 1- {\frac {6 \sum + d_i^2}{n(n^2 - 1)}}$$ berechnet. $d_i = x_i - y_i$ ist die + Differenz im Rang der Datenpunkte. + \item Berechne $\rho$ zwischen $x$ und $y$, zwischen $x$ und + $y^2$, zwischen $\log(x+1)$ und $y^2$. Berechne auch den + \"ublichen (Pearson) Korrelationskoeffizient zwischen diesen + Werten. Was kann man beobachten und warum macht das Sinn? + \end{enumerate} + \end{task} +\end{frame} + +%------------------------------------------------------------- +\begin{frame}[fragile] + \frametitle{\"Ubung - L\"osung} + \begin{solution}{Spearman Rangkorrelationskoeffizient} +\scriptsize +\begin{lstlisting} +>>> x = randi(10, 100, 1); +>>> y = randi(10, 100, 1); +>>> corr(x,y,'type','Spearman') +ans = + 0.1220 +>>> corr(x,y.^2,'type','Spearman') +ans = + 0.1220 +>>> corr(x,y,'type','Pearson') +ans = + 0.1074 +>>> corr(x,y.^2,'type','Pearson') +ans = + 0.0551 +\end{lstlisting} +Der Rangkorrelationskoeffizient \"andert sich nicht bei monotoner +Transformation der Daten. Daher ist er f\"ur ordinale Daten +geeignet. Der Pearson Korrelationskoeffizient ist es nicht. + \end{solution} +\end{frame} \end{document}