statistics datat types done
This commit is contained in:
parent
b766f61ef0
commit
de8ff55740
@ -25,6 +25,12 @@
|
|||||||
\definecolor{sec22}{RGB}{210,150,0}
|
\definecolor{sec22}{RGB}{210,150,0}
|
||||||
\definecolor{sec23}{RGB}{145,105,70}
|
\definecolor{sec23}{RGB}{145,105,70}
|
||||||
|
|
||||||
|
\newcommand{\source}[1]{
|
||||||
|
\begin{flushright}
|
||||||
|
\color{gray}\scriptsize \url{#1}
|
||||||
|
\end{flushright}
|
||||||
|
}
|
||||||
|
|
||||||
\newenvironment<>{emphasize}[1]{%
|
\newenvironment<>{emphasize}[1]{%
|
||||||
\begin{actionenv}#2%
|
\begin{actionenv}#2%
|
||||||
\def\insertblocktitle{#1}%
|
\def\insertblocktitle{#1}%
|
||||||
|
@ -18,7 +18,7 @@
|
|||||||
\setbeamercovered{opaque}
|
\setbeamercovered{opaque}
|
||||||
\usecolortheme{tuebingen}
|
\usecolortheme{tuebingen}
|
||||||
\setbeamertemplate{navigation symbols}{}
|
\setbeamertemplate{navigation symbols}{}
|
||||||
\usefonttheme{professionalfonts}
|
\usefonttheme{default}
|
||||||
\useoutertheme{infolines}
|
\useoutertheme{infolines}
|
||||||
% \useoutertheme{miniframes}
|
% \useoutertheme{miniframes}
|
||||||
}
|
}
|
||||||
@ -177,9 +177,24 @@ Bernstein Center T\"ubingen}
|
|||||||
\subsection{Arten von Daten}
|
\subsection{Arten von Daten}
|
||||||
|
|
||||||
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
|
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{Datenskalen}
|
||||||
|
\framesubtitle{Welche Datentypen gibt es in der Statistik?}
|
||||||
|
\Large
|
||||||
|
{\bf Warum sind Datentypen wichtig?}
|
||||||
|
\pause
|
||||||
|
\begin{itemize}
|
||||||
|
\item Auswahl passender Statistiken
|
||||||
|
\item Auswahl angemessener Plots
|
||||||
|
\item Auswahl von korrekten Tests
|
||||||
|
\end{itemize}
|
||||||
|
\end{frame}
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
|
||||||
\begin{frame}
|
\begin{frame}
|
||||||
\frametitle{Datenskalen}
|
\frametitle{Datenskalen}
|
||||||
\framesubtitle{Nominalskala (engl. "categorial")}
|
\framesubtitle{Nominalskala (engl. ,,categorial'')}
|
||||||
\begin{itemize}
|
\begin{itemize}
|
||||||
\item Eigenschaften wie Zelltyp, Versuchsgruppe
|
\item Eigenschaften wie Zelltyp, Versuchsgruppe
|
||||||
\item jede Beobachtung wird eine bestimmten Klasse (Kategorie)
|
\item jede Beobachtung wird eine bestimmten Klasse (Kategorie)
|
||||||
@ -188,6 +203,166 @@ Bernstein Center T\"ubingen}
|
|||||||
\item Beispiel: [Zapfen, Stäbchen] vs. [Stäbchen, Zapfen]
|
\item Beispiel: [Zapfen, Stäbchen] vs. [Stäbchen, Zapfen]
|
||||||
\end{itemize}
|
\end{itemize}
|
||||||
\end{frame}
|
\end{frame}
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{Datenskalen}
|
||||||
|
\framesubtitle{Ordinalskala (engl. ,,ordinal'')}
|
||||||
|
\begin{itemize}
|
||||||
|
\item Wie Nominalskala, nur ist sinnvolles Ordnen m\"oglich
|
||||||
|
\item {\bf aber:} Unterschiede zwischen den Werten bzw. Klassen
|
||||||
|
nicht vergleichbar (keine Abst\"ande)
|
||||||
|
\item Beispiel: Platzierungen, G\"uteklassen, Ratingskalen
|
||||||
|
\end{itemize}
|
||||||
|
\end{frame}
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{Datenskalen}
|
||||||
|
\framesubtitle{Intervallskala (engl. ,,interval'')}
|
||||||
|
\begin{itemize}
|
||||||
|
\item quantitative/metrische Werte
|
||||||
|
\item Abst\"ande zwischen Werten sind sinnvoll, aber es gibt keine
|
||||||
|
absoluten Nullpunkt
|
||||||
|
\item Beispiel: physikalische Gr\"o{\ss}en wie Temperatur in Grad Celsius
|
||||||
|
\end{itemize}
|
||||||
|
\end{frame}
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{Datenskalen}
|
||||||
|
\framesubtitle{Absolut- oder Verh\"altnisskala (engl. ,,ratio)}
|
||||||
|
\begin{itemize}
|
||||||
|
\item wie Intervallskala, aber mit absolutem Nullpunkt
|
||||||
|
\item Beispiel: Temperatur in Kelvin, Einkommen
|
||||||
|
\end{itemize}
|
||||||
|
\pause
|
||||||
|
\begin{emphasize}{Verh\"altnis der Skalen}
|
||||||
|
\begin{itemize}
|
||||||
|
\item Skalen besitzen aufsteigenden Informationsgehalt von
|
||||||
|
Nominal- zu Absolutskala
|
||||||
|
\item Konvertierung ,,abw\"arts'' immer m\"oglich
|
||||||
|
\end{itemize}
|
||||||
|
\end{emphasize}
|
||||||
|
\end{frame}
|
||||||
|
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{Beispiele aus Neuro-/Kognitionswissenschaften}
|
||||||
|
\begin{itemize}
|
||||||
|
\item {\bf Nominalskala:}\pause
|
||||||
|
\begin{itemize}
|
||||||
|
\item Versuchsgruppenzugeh\"origkeit
|
||||||
|
\item Stimulusklasse
|
||||||
|
\item Zelltyp
|
||||||
|
\end{itemize}
|
||||||
|
|
||||||
|
\item {\bf Ordinalskala:} \pause
|
||||||
|
\begin{itemize}
|
||||||
|
\item Ratings
|
||||||
|
\item Krankheitsstadien
|
||||||
|
\item Zust\"ande eines Ionenkanals
|
||||||
|
\end{itemize}
|
||||||
|
\item {\bf Absolut-/Ratioskala:}\pause
|
||||||
|
\begin{itemize}
|
||||||
|
\item Feuerrate
|
||||||
|
\item Membranpotential
|
||||||
|
\item Ionenkonzentration
|
||||||
|
\end{itemize}
|
||||||
|
\end{itemize}
|
||||||
|
\end{frame}
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
|
\subsection{Statistiken}
|
||||||
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{Was ist eine (Test)-Statistik}
|
||||||
|
\begin{definition}{Teststatistik, Pr\"ufwert}
|
||||||
|
\begin{itemize}
|
||||||
|
\item Als {\em Teststatistik} bezeichnet man in der mathematischen
|
||||||
|
Statistik eine Stichprobenfunktion die einer Stichprobe einen
|
||||||
|
Wert zuordnet (z.B. Mittelwert, Median, Standardabweichung,
|
||||||
|
...).
|
||||||
|
|
||||||
|
\item Als {\em Pr\"ufwert} wird die Realisation einer Teststatistik
|
||||||
|
anhand einer Stichprobe bezeichnet.
|
||||||
|
|
||||||
|
\source{http://de.wikipedia.org/wiki/Teststatistik}
|
||||||
|
\end{itemize}
|
||||||
|
\end{definition}
|
||||||
|
\end{frame}
|
||||||
|
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{Beispiele f\"ur Teststatistiken}
|
||||||
|
\begin{itemize}
|
||||||
|
\item {\bf Nominalskala:}\pause
|
||||||
|
\begin{itemize}
|
||||||
|
\item Anzahl
|
||||||
|
\item relative H\"aufigkeit
|
||||||
|
\end{itemize}
|
||||||
|
|
||||||
|
\item {\bf Ordinalskala:} \pause
|
||||||
|
\begin{itemize}
|
||||||
|
\item Median
|
||||||
|
\item Perzentilen
|
||||||
|
\item Rangkorrelationskoeffizient
|
||||||
|
\end{itemize}
|
||||||
|
\item {\bf Absolut-/Ratioskala:}\pause
|
||||||
|
\begin{itemize}
|
||||||
|
\item Mittelwert
|
||||||
|
\item Varianz/ Standardabweichung
|
||||||
|
\item Pearson Korrelationskoeffizient
|
||||||
|
\end{itemize}
|
||||||
|
\end{itemize}
|
||||||
|
\end{frame}
|
||||||
|
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
\begin{frame}
|
||||||
|
\frametitle{\"Ubung}
|
||||||
|
\begin{task}{Spearman Rangkorrelationskoeffizient}
|
||||||
|
\begin{enumerate}
|
||||||
|
\item Benutze {\tt randi} um zwei 100-dimensionale Vektoren {\tt x,y} mit
|
||||||
|
Zufalls-Integern zwischen $0$ und $10$ zu berechnen.
|
||||||
|
\item Finde heraus wie man in Matlab den Spearman
|
||||||
|
Rangkorrelationskoeffizient $$\rho = 1- {\frac {6 \sum
|
||||||
|
d_i^2}{n(n^2 - 1)}}$$ berechnet. $d_i = x_i - y_i$ ist die
|
||||||
|
Differenz im Rang der Datenpunkte.
|
||||||
|
\item Berechne $\rho$ zwischen $x$ und $y$, zwischen $x$ und
|
||||||
|
$y^2$, zwischen $\log(x+1)$ und $y^2$. Berechne auch den
|
||||||
|
\"ublichen (Pearson) Korrelationskoeffizient zwischen diesen
|
||||||
|
Werten. Was kann man beobachten und warum macht das Sinn?
|
||||||
|
\end{enumerate}
|
||||||
|
\end{task}
|
||||||
|
\end{frame}
|
||||||
|
|
||||||
|
%-------------------------------------------------------------
|
||||||
|
\begin{frame}[fragile]
|
||||||
|
\frametitle{\"Ubung - L\"osung}
|
||||||
|
\begin{solution}{Spearman Rangkorrelationskoeffizient}
|
||||||
|
\scriptsize
|
||||||
|
\begin{lstlisting}
|
||||||
|
>>> x = randi(10, 100, 1);
|
||||||
|
>>> y = randi(10, 100, 1);
|
||||||
|
>>> corr(x,y,'type','Spearman')
|
||||||
|
ans =
|
||||||
|
0.1220
|
||||||
|
>>> corr(x,y.^2,'type','Spearman')
|
||||||
|
ans =
|
||||||
|
0.1220
|
||||||
|
>>> corr(x,y,'type','Pearson')
|
||||||
|
ans =
|
||||||
|
0.1074
|
||||||
|
>>> corr(x,y.^2,'type','Pearson')
|
||||||
|
ans =
|
||||||
|
0.0551
|
||||||
|
\end{lstlisting}
|
||||||
|
Der Rangkorrelationskoeffizient \"andert sich nicht bei monotoner
|
||||||
|
Transformation der Daten. Daher ist er f\"ur ordinale Daten
|
||||||
|
geeignet. Der Pearson Korrelationskoeffizient ist es nicht.
|
||||||
|
\end{solution}
|
||||||
|
\end{frame}
|
||||||
|
|
||||||
|
|
||||||
\end{document}
|
\end{document}
|
||||||
|
Reference in New Issue
Block a user