statistics datat types done

2014-10-06 12:46:36 +02:00
parent b766f61ef0
commit de8ff55740
2 changed files with 183 additions and 2 deletions
--- a/latex/environments.tex
+++ b/latex/environments.tex
@@ -25,6 +25,12 @@
 \definecolor{sec22}{RGB}{210,150,0} 
 \definecolor{sec23}{RGB}{145,105,70} 
 \newcommand{\source}[1]{    
  \begin{flushright}
    \color{gray}\scriptsize \url{#1}
  \end{flushright}
 }
 \newenvironment<>{emphasize}[1]{%
  \begin{actionenv}#2%
      \def\insertblocktitle{#1}%
--- a/statistics/lecture_statistics.tex
+++ b/statistics/lecture_statistics.tex
@@ -18,7 +18,7 @@
  \setbeamercovered{opaque}
  \usecolortheme{tuebingen}
  \setbeamertemplate{navigation symbols}{}
-  \usefonttheme{professionalfonts}
+  \usefonttheme{default}
  \useoutertheme{infolines}
  % \useoutertheme{miniframes}
 }
@@ -177,9 +177,24 @@ Bernstein Center T\"ubingen}
 \subsection{Arten von Daten}
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 \begin{frame}
  \frametitle{Datenskalen}
-  \framesubtitle{Nominalskala (engl. "categorial")}
+  \framesubtitle{Welche Datentypen gibt es in der Statistik?}
  \Large
  {\bf Warum sind Datentypen wichtig?}
  \pause
  \begin{itemize}
  \item Auswahl passender Statistiken
  \item Auswahl angemessener Plots
  \item Auswahl von korrekten Tests
  \end{itemize}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{Datenskalen}
  \framesubtitle{Nominalskala (engl. ,,categorial'')}
  \begin{itemize}
  \item Eigenschaften wie Zelltyp, Versuchsgruppe
  \item jede Beobachtung wird eine bestimmten Klasse (Kategorie)
@@ -188,6 +203,166 @@ Bernstein Center T\"ubingen}
  \item  Beispiel: [Zapfen, Stäbchen] vs. [Stäbchen, Zapfen]
  \end{itemize}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{Datenskalen}
  \framesubtitle{Ordinalskala (engl. ,,ordinal'')}
  \begin{itemize}
  \item Wie Nominalskala, nur ist sinnvolles Ordnen m\"oglich
  \item {\bf aber:} Unterschiede zwischen den Werten bzw. Klassen
    nicht vergleichbar (keine Abst\"ande)
  \item Beispiel: Platzierungen, G\"uteklassen, Ratingskalen
  \end{itemize}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{Datenskalen}
  \framesubtitle{Intervallskala (engl. ,,interval'')}
  \begin{itemize}
  \item quantitative/metrische Werte
  \item Abst\"ande zwischen Werten sind sinnvoll, aber es gibt keine
    absoluten Nullpunkt
  \item Beispiel: physikalische Gr\"o{\ss}en wie Temperatur in Grad Celsius
  \end{itemize}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{Datenskalen}
  \framesubtitle{Absolut- oder Verh\"altnisskala (engl. ,,ratio)}
  \begin{itemize}
  \item wie Intervallskala, aber mit absolutem Nullpunkt
  \item Beispiel: Temperatur in Kelvin, Einkommen
  \end{itemize}
  \pause
  \begin{emphasize}{Verh\"altnis der Skalen}
    \begin{itemize}
    \item Skalen besitzen aufsteigenden Informationsgehalt von
      Nominal- zu Absolutskala
    \item Konvertierung ,,abw\"arts'' immer m\"oglich
    \end{itemize}
  \end{emphasize}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{Beispiele aus Neuro-/Kognitionswissenschaften}
  \begin{itemize}
  \item {\bf Nominalskala:}\pause 
    \begin{itemize}
    \item Versuchsgruppenzugeh\"origkeit
    \item Stimulusklasse
    \item Zelltyp
    \end{itemize}
  \item {\bf Ordinalskala:} \pause 
    \begin{itemize}
    \item Ratings
    \item Krankheitsstadien
    \item Zust\"ande eines Ionenkanals
    \end{itemize}
  \item {\bf Absolut-/Ratioskala:}\pause
    \begin{itemize}
    \item Feuerrate 
    \item Membranpotential
    \item Ionenkonzentration
    \end{itemize}
  \end{itemize}
 \end{frame}
 %-------------------------------------------------------------
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 \subsection{Statistiken}
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{Was ist eine (Test)-Statistik}
  \begin{definition}{Teststatistik, Pr\"ufwert}
    \begin{itemize}
    \item Als {\em Teststatistik} bezeichnet man in der mathematischen
      Statistik eine Stichprobenfunktion die einer Stichprobe einen
      Wert zuordnet (z.B. Mittelwert, Median, Standardabweichung,
      ...).
      \item Als {\em Pr\"ufwert} wird die Realisation einer Teststatistik
      anhand einer Stichprobe bezeichnet.
      \source{http://de.wikipedia.org/wiki/Teststatistik}
    \end{itemize}
  \end{definition}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{Beispiele f\"ur Teststatistiken}
  \begin{itemize}
  \item {\bf Nominalskala:}\pause 
    \begin{itemize}
    \item Anzahl
    \item relative H\"aufigkeit
    \end{itemize}
  \item {\bf Ordinalskala:} \pause 
    \begin{itemize}
    \item Median
    \item Perzentilen
    \item Rangkorrelationskoeffizient
    \end{itemize}
  \item {\bf Absolut-/Ratioskala:}\pause
    \begin{itemize}
    \item Mittelwert
    \item Varianz/ Standardabweichung
    \item Pearson Korrelationskoeffizient
    \end{itemize}
  \end{itemize}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}
  \frametitle{\"Ubung}
  \begin{task}{Spearman Rangkorrelationskoeffizient}
    \begin{enumerate}
    \item Benutze {\tt randi} um zwei 100-dimensionale Vektoren {\tt x,y} mit
      Zufalls-Integern zwischen $0$ und $10$ zu berechnen. 
    \item Finde heraus wie man in Matlab den Spearman
      Rangkorrelationskoeffizient $$\rho = 1- {\frac {6 \sum
          d_i^2}{n(n^2 - 1)}}$$ berechnet. $d_i = x_i - y_i$ ist die
      Differenz im Rang der Datenpunkte. 
    \item Berechne $\rho$ zwischen $x$ und $y$, zwischen $x$ und
      $y^2$, zwischen $\log(x+1)$ und $y^2$. Berechne auch den
      \"ublichen (Pearson) Korrelationskoeffizient zwischen diesen
      Werten. Was kann man beobachten und warum macht das Sinn?
    \end{enumerate}
  \end{task}
 \end{frame}
 %-------------------------------------------------------------
 \begin{frame}[fragile]
  \frametitle{\"Ubung - L\"osung}
  \begin{solution}{Spearman Rangkorrelationskoeffizient}
 \scriptsize
 \begin{lstlisting}
 >>> x = randi(10, 100, 1);
 >>> y = randi(10, 100, 1);
 >>> corr(x,y,'type','Spearman')
 ans =
    0.1220
 >>> corr(x,y.^2,'type','Spearman')
 ans =
    0.1220
 >>> corr(x,y,'type','Pearson')
 ans =
    0.1074
 >>> corr(x,y.^2,'type','Pearson')
 ans =
    0.0551
 \end{lstlisting}
 Der Rangkorrelationskoeffizient \"andert sich nicht bei monotoner
 Transformation der Daten. Daher ist er f\"ur ordinale Daten
 geeignet. Der Pearson Korrelationskoeffizient ist es nicht. 
  \end{solution}
 \end{frame}
 \end{document}