diff --git a/header.tex b/header.tex
index 8a6ec5a..4423fdc 100644
--- a/header.tex
+++ b/header.tex
@@ -233,7 +233,7 @@
 % The cooler programming language.
 \usepackage[within=chapter]{newfloat}
 \DeclareFloatingEnvironment[
-  fileextension=lob,
+  fileext=lob,
   listname={\tr{Info Boxes}{Infoboxen}},
   name={Info Box},
   placement=t
diff --git a/likelihood/lecture/likelihood.tex b/likelihood/lecture/likelihood.tex
index 4620e20..bdeb82d 100644
--- a/likelihood/lecture/likelihood.tex
+++ b/likelihood/lecture/likelihood.tex
@@ -264,17 +264,17 @@ als Funktion eines Stimulusparameters ist dann die ``Tuning-curve''
 
 \begin{figure}[tp]
   \includegraphics[width=1\textwidth]{mlecoding}
-  \titlecaption{\label{mlecodingfig} Maximum Likelihood Sch\"atzung eines
-    Stimulusparameters aus der Aktivit\"at einer Population von
-    Neuronen.}{Oben: Die Tuning-Kurve eines einzelnen Neurons in
-    Abh\"angigkeit von der Orientierung eines Balkens. Der Stimulus
-    der die st\"akste Aktivit\"at in diesem Neuron hervorruft ist ein
-    senkrechter Balken (Pfeil, $\phi_i=90$\,\degree. Die rote Fl\"ache
-    deutet die Variabilit\"at $p(r)$ der Aktivit\"at $r$ um die
-    Tuning-Kurve herum an. Mitte: Jedes Neuron in der Population hat
-    eine andere bevorzugte Orientierung des Stimulus (farbige Linien).
-    Ein Stimulus einer bestimmten Orientierung aktiviert die Neurone
-    in spezifischer Weise (Punkte). Unten: Die Log-Likelihood dieser
+  \titlecaption{\label{mlecodingfig} Maximum Likelihood Sch\"atzung
+    eines Stimulusparameters aus neuronaler Aktivit\"at.}{Oben:
+    Die Tuning-Kurve eines einzelnen Neurons in Abh\"angigkeit von der
+    Orientierung eines Balkens. Der Stimulus der die st\"akste
+    Aktivit\"at in diesem Neuron hervorruft ist ein senkrechter Balken
+    (Pfeil, $\phi_i=90$\,\degree. Die rote Fl\"ache deutet die
+    Variabilit\"at $p(r)$ der Aktivit\"at $r$ um die Tuning-Kurve
+    herum an. Mitte: Jedes Neuron in der Population hat eine andere
+    bevorzugte Orientierung des Stimulus (farbige Linien).  Ein
+    Stimulus einer bestimmten Orientierung aktiviert die Neurone in
+    spezifischer Weise (Punkte). Unten: Die Log-Likelihood dieser
     Aktivit\"aten wir maximal in der N\"ahe der wahren Orientierung
     des Stimulus.}
 \end{figure}
diff --git a/plotting/lecture/Makefile b/plotting/lecture/Makefile
index 9c5c90f..4626417 100644
--- a/plotting/lecture/Makefile
+++ b/plotting/lecture/Makefile
@@ -11,7 +11,7 @@ all: pdf slides thumbs
 
 # script:
 pdf : $(BASENAME)-chapter.pdf
-$(BASENAME)-chapter.pdf : $(BASENAME)-chapter.tex $(BASENAME).tex $(GPTTEXFILES) $(PYPDFFILES)
+$(BASENAME)-chapter.pdf : $(BASENAME)-chapter.tex $(BASENAME).tex $(GPTTEXFILES) $(PYPDFFILES) ../../header.tex
 	pdflatex -interaction=scrollmode $< | tee /dev/stderr | fgrep -q "Rerun to get cross-references right" && pdflatex -interaction=scrollmode $< || true
 
 
diff --git a/plotting/lecture/plotting.tex b/plotting/lecture/plotting.tex
index d4bd207..74f9195 100644
--- a/plotting/lecture/plotting.tex
+++ b/plotting/lecture/plotting.tex
@@ -62,7 +62,7 @@ nicht auf die genaue Lage der Datenpunkte ankommt.
 
 \begin{figure}[t]
   \includegraphics[width=0.7\columnwidth]{outlier}\vspace{-3ex}
-  \titlecaption{Comicartige Darstellungen}{ sind f\"ur die Darstellung
+  \titlecaption{Comicartige Darstellungen.}{Sie sind f\"ur die Darstellung
     wissenschaftlicher Daten nicht geeignet. F\"ur illustrative Beispiele
     k\"onnen sie aber helfen, die wesentlichen Aspekte zu betonen.}\label{comicexamplefig}
 \end{figure}
@@ -177,7 +177,7 @@ Einstellungsm\"oglichkeiten. Wie schon erw\"ahnt, k\"onnen diese
   \begin{minipage}[t]{0.3\columnwidth}
     \includegraphics[width=0.9\textwidth]{property_editor}
   \end{minipage}
-  \caption{\textbf{Graphisches Interface ``Plot Editor''.} \"Uber das Menu
+  \titlecaption{Graphisches Interface ``Plot Editor''.}{\"Uber das Menu
     ``Tools $\rightarrow$ Edit Plot'' erreicht man den Plot Editor. Je nachdem
     welches Element des Plots ausgew\"ahlt wurde, ver\"andern sich
     die Einstellungsm\"oglichkeiten. Weitere Eigenschaften und
@@ -244,7 +244,7 @@ die Farbe und die verschiedenen Marker.
    \titlecaption{Vordefinierte Linienstile (links), Farben (Mitte) und Markersymbole (rechts).}{}\label{plotlinestyles}
    \begin{minipage}[t]{0.3\textwidth}
      \vspace{0pt}
-     \begin{tabular}{c|l}
+     \begin{tabular}{lc} \hline
        \textbf{Linienstil} & \textbf{K\"urzel} \\\hline
        durchgezogen  & '\verb|-|' \\
        gestrichelt   & '\verb|--|' \\
@@ -256,7 +256,7 @@ die Farbe und die verschiedenen Marker.
    \begin{minipage}[t]{.3\textwidth}
      \vspace{0pt}
      \hspace{0.05\textwidth}
-     \begin{tabular}{lc}
+     \begin{tabular}{lc} \hline
        \textbf{Farbe} & \textbf{K\"urzel} \\ \hline
        Rot & 'r'\\
        Gr\"un  & 'g' \\
@@ -270,7 +270,7 @@ die Farbe und die verschiedenen Marker.
    \vspace{0pt}
    \begin{minipage}[t]{0.3\textwidth}
      \vspace{0pt}
-     \begin{tabular}{lc}
+     \begin{tabular}{lc} \hline
        \textbf{Markersymbol} & \textbf{K\"urzel} \\ \hline
        Kreis & 'o'\\
        Stern  & '*' \\
@@ -296,7 +296,7 @@ einen roten Linienplot mit gepunkteter Linie der St\"arke 1.5 und
 Sternmarkern an den Positionen der Datenpunkte. Zus\"atzlich wird noch
 die Eigenschaft \codeterm{displayname} gesetzt, um dem Linienplot
 einen Namen zu geben, der in einer Legende verwendet werden kann.
-\begin{lstlisting}
+\begin{lstlisting}[caption={Ein enfache Plot.}]
   x = 0:0.1:2*pi;
   y = sin(x);
   plot( x, y, 'color', 'r', 'linestyle', ':', 'marker', '*',  'linewidth', 1.5, 'displayname', 'plot 1')
@@ -360,11 +360,11 @@ gerade aktiven Achse.
     \codeterm{PaperSize} & Gr\"o{\ss}e der des Papiers. & 2-elementiger Vektor mit der Papiergr\"o{\ss}e.\\
     \codeterm{PaperUnits} & Einheit, in der die Papiergr\"o{\ss}e bestimmt wird. &  $\{'inches' | 'centimeters' | 'normalized' | 'points'\}$\\
     \codeterm{Visible} & Hilfreich, wenn ein Plot aus Performanzgr\"unden nicht auf dem Bildschirm gezeigt, sondern direkt gespeichert werden soll. & $\{'on' | 'off'\}$\\ \hline
-  \end{tabular}
+  \end{tabular*}
 \end{table}
 
 Wie die Achse, hat auch das \codeterm{Figure} Element eine Reihe von
-Eigenschaften, die nach Bedarf mit der \cide{set} - Funktion gesetzt
+Eigenschaften, die nach Bedarf mit der \code{set} - Funktion gesetzt
 werden k\"onnen (Tabelle \ref{plotfigureprops} listet die
 meistverwendeten). Das erste Argument f\"ur \code{set()} ist jetzt
 aber eine Handle f\"ur die Abbildung, nicht das
@@ -383,7 +383,7 @@ erstes Argument wieder ein Handle auf die Figure erwartet. Das zweite
 Argument ist der Dateiname, und zuletzt muss das gew\"unschte Format
 (Box \ref{graphicsformatbox}) angegeben werden.
 
-\begin{lstlisting}[caption={Skript zur Erstellung des Plots in Abbildung \ref{spikedetectionfig}.}, label=niceplotlisting]
+\begin{lstlisting}[caption={Skript zur Erstellung des Plots in \figref{spikedetectionfig}.}, label=niceplotlisting]
 figure()
 set(gcf, 'PaperUnits', 'centimeters', 'PaperSize', [11.7 9.0]);
 set(gcf, 'PaperPosition',[0.0 0.0 11.7 9.0], 'Color', 'white')
@@ -402,9 +402,9 @@ set(gca, 'TickDir','out', 'linewidth', 1.5, 'fontname', 'MyriadPro-Regular')
 saveas(gcf, 'spike_detection.pdf', 'pdf')
 \end{lstlisting}
 
-\begin{figure}
-  \includegraphics[width=0.5\columnwidth]{spike_detection}
-  \caption{\textbf{Annehmbarer Plot.} Dieser Plot wurde vollst\"andig
+\begin{figure}[t]
+  \includegraphics[width=0.4\columnwidth]{spike_detection}
+  \titlecaption{Annehmbarer Plot.}{Dieser Plot wurde vollst\"andig
     mit dem Skript in Listing \ref{niceplotlisting} erstellt und
     gespeichert.}\label{spikedetectionfig}
 \end{figure}
diff --git a/regression/lecture/regression.tex b/regression/lecture/regression.tex
index 061f979..b6a6041 100644
--- a/regression/lecture/regression.tex
+++ b/regression/lecture/regression.tex
@@ -11,11 +11,11 @@ ein Optimierungsproblem, der als Kurvenfit bekannt ist
 
 \begin{figure}[t]
   \includegraphics[width=1\textwidth]{lin_regress}\hfill
-  \titlecaption{.}{F\"ur eine Reihe von Eingangswerten $x$,
-    z.B. Stimulusintensit\"aten, wurden die Antworten $y$ eines
-    Systems gemessen (links). Der postulierte lineare Zusammenhang hat
-    als freie Parameter die Steigung (mitte) und den
-    $y$-Achsenabschnitt (rechts).}\label{linregressiondatafig}
+  \titlecaption{Beispieldatensatz f\"ur den Geradenfit.}{F\"ur eine
+    Reihe von Eingangswerten $x$, z.B. Stimulusintensit\"aten, wurden
+    die Antworten $y$ eines Systems gemessen (links). Der postulierte
+    lineare Zusammenhang hat als freie Parameter die Steigung (mitte)
+    und den $y$-Achsenabschnitt (rechts).}\label{linregressiondatafig}
 \end{figure}
 
 Die Punktewolke in \figref{linregressiondatafig} legt
@@ -169,7 +169,7 @@ beiden Parameter und auf der $z$-Achse der Fehlerwert aufgetragen
 
 \begin{figure}[t]
   \includegraphics[width=0.75\columnwidth]{error_surface.pdf}
-  \caption{\textbf{Fehlerfl\"ache.} Die beiden freien Parameter
+  \titlecaption{Fehlerfl\"ache.}{Die beiden freien Parameter
     unseres Modells $m$ und $b$ spannen die Grundfl\"ache des Plots
     auf. F\"ur jede Kombination von Steigung $m$ und
     $y$-Achsenabschnitt $b$ wird die errechnete Vorhersage des Modells
@@ -358,7 +358,7 @@ Punkte in Abbildung \ref{gradientdescentfig} gro{\ss}.
 
 \begin{figure}[t]
   \includegraphics[width=0.6\columnwidth]{gradient_descent}
-  \caption{\textbf{Gradientenabstieg.} Es wird von einer beliebigen
+  \titlecaption{Gradientenabstieg.}{Es wird von einer beliebigen
     Position aus gestartet und der Gradient berechnet und die Position
     ver\"andert. Jeder Punkt zeigt die Position nach jedem
     Optimierungsschritt an.} \label{gradientdescentfig}
diff --git a/statistics/lecture/statistics.tex b/statistics/lecture/statistics.tex
index 3929389..4667e03 100644
--- a/statistics/lecture/statistics.tex
+++ b/statistics/lecture/statistics.tex
@@ -217,14 +217,13 @@ Standardabweichung $\sigma$.
 
 \begin{figure}[t]
   \includegraphics[width=1\textwidth]{pdfhistogram}
-  \titlecaption{\label{pdfhistogramfig} Histogramme mit
-      verschiednenen Klassenbreiten eines Datensatzes von
-      normalverteilten Messwerten.}{Links: Die H\"ohe des absoluten
-      Histogramms h\"angt von der Klassenbreite ab. Rechts: Bei auf
-      das Integral normierten Histogrammen werden auch
-      unterschiedliche Klassenbreiten untereinander vergleichbar und
-      auch mit der theoretischen Wahrschinlichkeitsdichtefunktion
-      (blau).}}
+  \titlecaption{\label{pdfhistogramfig} Histogramme mit verschiednenen
+    Klassenbreiten von normalverteilten Messwerten.}{Links: Die H\"ohe
+    des absoluten Histogramms h\"angt von der Klassenbreite
+    ab. Rechts: Bei auf das Integral normierten Histogrammen werden
+    auch unterschiedliche Klassenbreiten untereinander vergleichbar
+    und auch mit der theoretischen Wahrschinlichkeitsdichtefunktion
+    (blau).}}
 \end{figure}
 
 \begin{exercise}{gaussianbins.m}{}
@@ -261,8 +260,7 @@ $\Delta x$ der Klassen geteilt werden (\figref{pdfhistogramfig}).
 
 \begin{figure}[tp]
   \includegraphics[width=1\textwidth]{correlation}
-  \titlecaption{\label{correlationfig} Korrelationen zwischen zwei
-    Datens\"atzen $x$ und $y$.}{}
+  \titlecaption{\label{correlationfig} Korrelationen zwischen Datenpaaren.}{}
 \end{figure}
 
 Bisher haben wir Eigenschaften einer einzelnen Me{\ss}gr\"o{\ss}e
@@ -285,10 +283,11 @@ nur unzureichend oder \"uberhaupt nicht erfasst (\figref{nonlincorrelationfig}).
 
 \begin{figure}[tp]
   \includegraphics[width=1\textwidth]{nonlincorrelation}
-  \titlecaption{\label{nonlincorrelationfig} Nichtlineare Zusammenh\"ange
-    werden durch den Korrelationskoeffizienten nicht erfasst.}{Sowohl
-    die quadratische Abh\"angigkeit (links) als auch eine
-    Rauschkorrelation (rechts), bei der die Streuung der $y$-Werte von
-    $x$ abh\"angen, ergeben Korrelationskeffizienten nahe Null.
-    $\xi$ sind normalverteilte Zufallszahlen.}
+  \titlecaption{\label{nonlincorrelationfig} Korrelationen von
+    nichtlineare Zusammenh\"angen.}{Der Korrelationskoeffizienten
+    erfasst nur lineare Zusammenh\"ange. Sowohl die quadratische
+    Abh\"angigkeit (links) als auch eine Rauschkorrelation (rechts),
+    bei der die Streuung der $y$-Werte von $x$ abh\"angen, ergeben
+    Korrelationskeffizienten nahe Null. $\xi$ sind normalverteilte
+    Zufallszahlen.}
 \end{figure}