fixes and some todos

This commit is contained in:
Jan Grewe 2015-11-11 22:35:50 +01:00
parent a0e4d306f1
commit 17eb14f7f8

View File

@ -1,11 +1,11 @@
\chapter{\tr{Data plotting}{Graphische Darstellung von Daten}}
\section{Does and Don'ts bei der Graphische Darstellung von Daten}
\section{Dos and Don'ts bei der graphische Darstellung von Daten}
Die ad\"aquate Darstellung wissenschaftlicher Daten darf man durchaus
zu den notwendigen Kernkompetenzen z\"ahlen. Wir brauchen sie um
unsere Daten optimal darstellen zu k\"onnen und unsere Aussagen zu
unterstreichen.
Die Fähigkeit zur ad\"aquaten Darstellung wissenschaftlicher Daten
darf man durchaus zu den notwendigen Kernkompetenzen z\"ahlen. Wir
brauchen sie um unsere Daten und Ergebnisse \"uberzeugend darzustellen
und das Verst\"andnis zu vereinfachen
\begin{figure}[hb!]
\includegraphics[width=0.9\columnwidth]{convincing}
@ -17,50 +17,53 @@ unterstreichen.
Graphen sollen dem geneigten Leser wissenschaftlicher Arbeiten
erm\"oglichen die Daten zu erfassen und die beschriebenen Effekte zu
begutachen, zu hinterfragen und zu validieren. Eine der obersten
Regeln ist die vollst\"andige Annotation von Plots
(Abbildung \ref{xkcdplotting}). Eine weiteres Prinzip, an das man sich halten
sollte ist die \textbf{ink minimization}. Es besagt, dass das
Verh\"altnis aus Tinte, die f\"ur die Darstellung der Daten gebraucht
wird und der Menge Tinte, die f\"ur die Graphik ben\"otigt wird sollte
m\"oglichst gro{\ss} sein. Mit anderen Worten \"uberfl\"ussiger
Ausschm\"uckungen sollten sich in Datenplots nur selten finden
lassen. Eine Ausnahme kann vielleicht gemacht werden, wenn der Plot z.B
bei einer Pr\"asentation genutzt wird.
Regeln ist die vollst\"andige Annotation von Plots (Abbildung
\ref{xkcdplotting}). Eine weiteres Prinzip, an das man sich halten
sollte ist die \textbf{ink minimization}. Dieses Prinzip fordert, dass
das Verh\"altnis aus Tinte, die f\"ur die Darstellung der Daten
gebraucht wird und der Menge Tinte, die f\"ur sonstige Elemente der
Graphik aufgewendet m\"oglichst gro{\ss} ist. Mit anderen Worten
\"uberfl\"ussiger Ausschm\"uckungen sollten sich in Datenplots nur
selten finden lassen. Eine Ausnahme kann vielleicht gemacht werden,
wenn der Plot z.B in einer Pr\"asentation oder zu didaktischen
Zwecken genutzt wird.
\subsection{Dinge, die vermieden werden sollten.}
Bei der Darstellung wissenschaftlicher Daten sollte drauf geachtet
werden suggestive oder gar fehlleitende Darstellung zu vermeiden.
Ablenkung durch \"uberm\"a{\ss}ige Effekte lassen eine Plot unruhig
werden suggestive oder fehlleitende Darstellungen zu vermeiden.
Ablenkung durch \"uberm\"a{\ss}ige Effekte lassen einen Plot unruhig
und unseri\"os wirken. Comicartige Effekte wie z.B. in Abbildung
\ref{comicexamplefig} sind in der Regel nicht zul\"assig. Ausnahme ist
hier allerdings der Einsatz im didaktischen Kontext wo es um die
Illustration (z.B. einer Methode) geht und keinen Anspruch auf
hier allerdings der Einsatz im didaktischen Kontext, wo es um die
Illustration (z.B. einer Methode) geht und kein Anspruch auf
Korrektheit besteht.
\begin{figure}
\includegraphics[width=0.35\columnwidth]{images/one_d_problem_c}
\titlecaption{Comicartige Darstellung.}{Ist f\"ur die Darstellung
\titlecaption{Comicartige Darstellungen}{ sind f\"ur die Darstellung
wissenschaftlicher Daten nicht geeignet.}\label{comicexamplefig}
\end{figure}
\subsection{Beispiele suggestiver oder fehlleitender Darstellungen}
Im folgenden werden einige Beispiele fehlleitender oder suggestiver
Darstellungen angesprochen. Einiger dieser Effekte sind deutlich
\"uberzeichnet die beschiebenen Tricks werden, etwas dezenter,
allerdings mit voller Absicht eingesetzt um die Wahrnehmung in die
gewollte Richtung zu beeinflussen. Auf Wikipedia gibt es weitere
Beispiele (\url{https://en.wikipedia.org/wiki/Misleading_graph}).
\paragraph{Fehlleitende Darstellung}
Man kann durch graphische Tricks wie Perspektive (Abbildung
\ref{misleadingpiefig}) oder auch gezielte Achsenskalierungen
(Abbildung \ref{misleadingscalingfig}) den Eindruck des Betrachters
steuern. Insbesondere wenn die Gr\"o{\ss}e von Symbolen zur
Darstellung einer Quantit\"at eingesetzt werden, muss man mit Vorsicht
vorgehen um Unterschiede nicht zu \"uberproportional zu verzerren
(Abbildung \ref{misleadingsymbolsfig}).
Darstellungen gezeigt. Einiger dieser Effekte sind deutlich
\"uberzeichnet, die beschriebenen ``Tricks'' werden allerdings, etwas
dezenter nat\"urlich, mitunter mit voller Absicht eingesetzt um die
Wahrnehmung in die gewollte Richtung zu beeinflussen. Auf Wikipedia
gibt es weitere Beispiele
(\url{https://en.wikipedia.org/wiki/Misleading_graph}).
Durch perspektivische Effekte k\"onnen Gr\"o{\ss}enverh\"altnisse
verzerrt dargestellt werden (z.B. Abbildung
\ref{misleadingpiefig}). Ver\"anderung der Achsenskalierungen kann die
Wahrnehmung des Betrachters in die ein oder andere Richtung
lenken. Ein Zusammenhang kann so verschleiert oder \"ubertrieben
werden (Abbildung \ref{misleadingscalingfig}). Insbesondere wenn die
Gr\"o{\ss}e von Symbolen zur Darstellung einer Quantit\"at eingesetzt
werden, muss man mit Vorsicht vorgehen um Unterschiede nicht
\"uberproportional darzustellen (Abbildung
\ref{misleadingsymbolsfig}).
\begin{figure}
\begin{minipage}[t]{0.4\textwidth}
@ -69,10 +72,10 @@ vorgehen um Unterschiede nicht zu \"uberproportional zu verzerren
\begin{minipage}[t]{0.4\textwidth}
\includegraphics[width=\textwidth]{images/sample_pie}
\end{minipage}
\titlecaption{Perspektivische Verzerrungen beeinlfu{\ss}t die
Gr\"o{\ss}enwahrnehmung.}{Durch die geeignete Wahl der
Perspektive erscheint das hervorgehobene Segment (C) des
Tortendiagramms als mindestens gleichwertig zum Segment A. Die
\titlecaption{Perspektivische Verzerrung beeinflusst die
Gr\"o{\ss}enwahrnehmung.}{Durch die Wahl der perspektivischen
Darstellung erscheint das hervorgehobene Segment C des
Tortendiagramms als mindestens gleichwertig zu Segment A. Die
2-dimensionale Darstellung rechts macht deutlich, dass die
scheinbare Gleichwertigkeit der Segmente A und C eine reine
Illusion ist. Quelle:
@ -81,19 +84,19 @@ vorgehen um Unterschiede nicht zu \"uberproportional zu verzerren
\begin{figure}
\begin{minipage}[t]{0.3\textwidth}
\includegraphics[width=\textwidth]{images/line_graph1}
\includegraphics[width=0.9\textwidth]{images/line_graph1}
\end{minipage}
\begin{minipage}[t]{0.3\textwidth}
\includegraphics[width=\textwidth]{images/line_graph1_3}
\includegraphics[width=0.9\textwidth]{images/line_graph1_3}
\end{minipage}
\begin{minipage}[t]{0.3\textwidth}
\includegraphics[width=\textwidth]{images/line_graph1_4}
\includegraphics[width=0.9\textwidth]{images/line_graph1_4}
\end{minipage}
\titlecaption{Wahl der Zeichenfl\"ache kann den visuellen
Eindruck beeinflu{\ss}en.}{Alle drei Plots zeigen die gleichen
Daten allein die Skalierung der Zeichenfl\"ache unterscheidet sich
und beeinflusst, wie stark der Zusammenhang zwischen den
Gr\"o{\ss}en auf der x- und y-Achse wahrgenommen wird. Quelle:
\titlecaption{Die Wahl der Zeichenfl\"ache beeinflusst den visuellen
Eindruck.}{Alle drei Plots zeigen die gleichen Daten. Allein die
Skalierung der Zeichenfl\"ache unterscheidet sich und beeinflusst,
wie stark der Zusammenhang zwischen den Gr\"o{\ss}en auf der x-
und y-Achse wahrgenommen wird. Quelle:
\url{https://en.wikipedia.org/wiki/Misleading_graph}}\label{misleadingscalingfig}
\end{figure}
@ -105,57 +108,80 @@ vorgehen um Unterschiede nicht zu \"uberproportional zu verzerren
\includegraphics[width=0.8\textwidth]{images/comparison_properly_improperly_graph}
\end{minipage}
\begin{minipage}[t]{0.3\textwidth}
\includegraphics[width=0.8\textwidth]{images/properly_scaled_graph}
\includegraphics[width=0.7\textwidth]{images/properly_scaled_graph}
\end{minipage}
\titlecaption{Die Skalierung von Symbolen kann problematisch
sein.} {In diesen Graphen werden Symbole eingesetzt um zwei
Kategorien zu vergleichen. Im linken Fall wird das einzelne Symbol
proportionsgerecht skaliert. Dies scheint auf den ersten Blick
richtig f\"uhrt aber dazu, dass das Symbol der Kategorie B nicht
dreifach sondern neunfach gr\"o{\ss}er geworden ist. Der Plot
rechts zeigt die Korrekte Verwendung von Symbolen. Quelle:
\titlecaption{Die Skalierung von Symbolen kann problematisch sein.}
{In diesen Graphen werden Symbole eingesetzt um Messgr\"o{\ss}en in
zwei Kategorien zu vergleichen. Die Messgr\"o{\ss}e in Kategorie B
ist dabei 3-fach so gro{\ss}. Im linken Fall wird das einzelne
Symbol f\"ur Kategorie B proportional auf die 3-fache H\"ohe
skaliert (die Seitenverh\"altnisse bleiben erhalten). Dies scheint
auf den ersten Blick korrekt, f\"uhrt aber dazu, dass das Symbol
der Kategorie B nicht nur dreifach gewachsen ist sondern nun die
neunfache Fl\"ache besitzt. Der Plot rechts zeigt die korrekte
Verwendung von Symbolen. Quelle:
\url{https://en.wikipedia.org/wiki/Misleading_graph}} \label{misleadingsymbolsfig}
\end{figure}
\newpage
\section{Plottingsystem in \matlab{}}
\section{Das Plottingsystem von \matlab{}}
Plotten in \matlab{} ist zun\"achst einmal einfach. Durch den Aufruf
von \code{plot(x, y)} wird ein einfacher, schlichter Linienplot
erstellt. Zun\"achst fehlem diesem Plot jegliche Annotationen wie
Achsbeschriftungen Legenden, etc. Um diese hizuzuf\"ugen kann man zwei
Wege gehen: Das Graphische User Interface oder die
Kommandozheile. Beide haben ihre Berechtigung und Vor- und
Nachteile. W\"ahrend es bequem ist die Abbildung mit der GUI
erstellt. Zun\"achst fehlen diesem Plot jegliche Annotationen wie
Achsbeschriftungen, Legenden, etc. Um diese hizuzuf\"ugen kann man
zwei Wege gehen: Das Graphische User Interface oder die
Kommandozeile. Beide haben ihre Berechtigung sowie Vor- und
Nachteile. W\"ahrend es bequem ist, die Abbildung mit der GUI
(Abbildung \ref{ploteditorfig}) zu bearbeiten sind die erhaltenen
Ergebnisse nicht unbedingt reproduzierbar. Auch wenn eine Abbildung
korrigiert werden mus{\ss}, wird es schwierig und zeitaufwendig. Die
Nachtr\"agliche Bearbeitung der Abbildungen mit dem Graphikprogramm
seiner Wahl birgt seine eigenen Risiken. Das Bestreben sollte sein,
aus \matlab{} heraus publikationsreife Abbildungen zu erzeugen.
Ergebnisse nicht einfach reproduzierbar. Wenn eine Abbildung
korrigiert werden musss, wird es schwierig und zeitaufwendig. Die
nachtr\"agliche Bearbeitung der Abbildungen mit einem beliebigen
Graphikprogramm erscheitn bequem, birgt seine eigenen Risiken und ist
auf lange Sicht sehr aufwendig. Das Bestreben sollte sein, aus
\matlab{} heraus publikationsreife Abbildungen zu erzeugen.
TODOS\\
Elemente eines Plots:
\begin{enumerate}
\item Figure
\item Axes
\item Lines
\item Annotationen
\item Legende
\end{enumerate}
\subsection{Einfaches Plotten}
TODO
\subsection{Ver\"andern von Eigenschaften von Linen}
\begin{figure}
\begin{minipage}[t]{0.45\columnwidth}
\begin{minipage}[t]{0.6\columnwidth}
\includegraphics[width=0.9\textwidth]{plot_editor}
\end{minipage}
\begin{minipage}[t]{0.225\columnwidth}
\begin{minipage}[t]{0.3\columnwidth}
\includegraphics[width=0.9\textwidth]{property_editor}
\end{minipage}
\caption{\textbf{Grahischer Plot Editor.} Editor f\"ur plots. Je
nachdem welches Element des Plots ausgew\"ahlt wurde ver\"andern
sich Einstellungsm\"oglichkeiten. Weitere Eigenschaften k\"onnen
\"uber den ``Property Editor'', rechts, eingestellt werden. Der
Property Editor ist \"uber die Schaltfl\"ache ``More Properties''
\caption{\textbf{Graphischer Plot Editor.} \"Uber das Menu
``Tools->Edit Plot'' erreicht man den Plot Editor. Je nachdem
welches Element des Plots ausgew\"ahlt wurde ver\"andern sich
Einstellungsm\"oglichkeiten. Weitere Eigenschaften und
Einstellungen k\"onnen \"uber den ``Property Editor'', rechts,
eingesehen und ver\"andert werden. Der ``Property Editor'' ist
\"uber die Schaltfl\"ache ``More Properties''
erreichbar.}\label{ploteditorfig}
\end{figure}
Alle Einstellungen, die man \"uber das graphische Interface machen
kann sind auch \"uber Befehle auf der Kommandozeile m\"oglich. Das
heisst, dass die Einstellungen problemlos in eine Skript, eine
hei{\ss}t, dass die Einstellungen problemlos in ein Skript oder eine
Funktion eingebaut werden k\"onnen. Dieser Ansatz hat den Vorteil,
dass man sich die M\"uhe nur ein mal machen muss. Unter den
h\"aufigsten Einstellungen sind:
dass man sich die M\"uhe nur einmal machen muss. Zu den h\"aufigsten
Einstellungen geh\"oren:
\begin{enumerate}
\item Einstellungen der Linienplots:
\begin{itemize}
@ -182,14 +208,18 @@ h\"aufigsten Einstellungen sind:
\end{itemize}
\end{enumerate}
\subsection{Globale Einstellungen}
\TODO
Das folgende Listing \ref{niceplotlisting} zeigt das Skript, das die
Abbildung \ref{spikedetectionfig} erstellt und speichert. Abh\"angig
davon, ob man Eigenschaften der Abbildung oder der Achsen setzen will
benutzt man die \code{set} Funktion und \"ubergibt ihr ein sogenanntes
Handle der Achse oder der Abbildung und sowohl den Namen als auch den
gew\"unschten Wert der der Eigenschaft: \code{set(gcf, 'PaperUnits',
gew\"unschten Wert der Eigenschaft: \code{set(gcf, 'PaperUnits',
'centimeters')} setzt die Eigenschaft ``PaperUnits'' der Abbildung
auf ``centimeters'', Standard ist, nat\"urlich, ``inches''.
auf ``centimeters''. (Standard Einheit ist, nat\"urlich, ``inches''.)
\code{gcf} steht f\"ur ``get current figure'' und stellt ein Handle
der aktuellen Abbildung zur Verf\"ugung. Um Eigenschaften der Achse zu
setzten benutzt man: \code{set(gca, 'linewidth', 1.5)} wobei
@ -236,7 +266,7 @@ n\"uchtern dar. Verzerrungen durch perspektivische Darstellungen,
Achs- oder Symbolskalierungen sollten vermieden werden. Wenn man
verschiedene Linienplots in einen Graphen plottet, sollte man neben
der Farbe auch den Linienstil (durchgezogen, gepunktet, gestrichelt,
etc.) variieren um auch im Schwarzweissdruck eine Unterscheidung zu
etc.) variieren um auch im Schwarz-Wei{\ss}-Druck eine Unterscheidung zu
erm\"oglichen. Bei der Farbwahl sollte man auf Kombinationen aus Rot
und Gr\"un verzichten, da sie f\"ur einen nicht unwesentlichen Teil
der m\"annlichen Bev\"olkerung nicht unterscheidbar sind. Man achte