Update on likelihood exercises
This commit is contained in:
parent
d01ae0da1f
commit
573c4ceb07
@ -1,11 +1,11 @@
|
|||||||
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
\chapter{\tr{Maximum likelihood estimation}{Maximum-Likelihood Methode}}
|
\chapter{\tr{Maximum likelihood estimation}{Maximum-Likelihood-Sch\"atzer}}
|
||||||
|
|
||||||
In vielen Situationen wollen wir einen oder mehrere Parameter $\theta$
|
In vielen Situationen wollen wir einen oder mehrere Parameter $\theta$
|
||||||
einer Wahrscheinlichkeitsverteilung sch\"atzen, so dass die Verteilung
|
einer Wahrscheinlichkeitsverteilung sch\"atzen, so dass die Verteilung
|
||||||
die Daten $x_1, x_2, \ldots x_n$ am besten beschreibt. Bei der
|
die Daten $x_1, x_2, \ldots x_n$ am besten beschreibt.
|
||||||
Maximum-Likelihood-Methode w\"ahlen wir die Parameter so, dass die
|
Maximum-Likelihood-Sch\"atzer w\"ahlen wir die Parameter so, dass die
|
||||||
Wahrscheinlichkeit, dass die Daten aus der Verteilung stammen, am
|
Wahrscheinlichkeit, dass die Daten aus der Verteilung stammen, am
|
||||||
gr\"o{\ss}ten ist.
|
gr\"o{\ss}ten ist.
|
||||||
|
|
||||||
@ -89,7 +89,7 @@ nach dem Parameter $\theta$ und setzen diese gleich Null:
|
|||||||
\Leftrightarrow \quad n \theta & = & \sum_{i=1}^n x_i \\
|
\Leftrightarrow \quad n \theta & = & \sum_{i=1}^n x_i \\
|
||||||
\Leftrightarrow \quad \theta & = & \frac{1}{n} \sum_{i=1}^n x_i
|
\Leftrightarrow \quad \theta & = & \frac{1}{n} \sum_{i=1}^n x_i
|
||||||
\end{eqnarray*}
|
\end{eqnarray*}
|
||||||
Der Maximum-Likelihood-Estimator ist das arithmetische Mittel der Daten. D.h.
|
Der Maximum-Likelihood-Sch\"atzer ist das arithmetische Mittel der Daten. D.h.
|
||||||
das arithmetische Mittel maximiert die Wahrscheinlichkeit, dass die Daten aus einer
|
das arithmetische Mittel maximiert die Wahrscheinlichkeit, dass die Daten aus einer
|
||||||
Normalverteilung mit diesem Mittelwert gezogen worden sind.
|
Normalverteilung mit diesem Mittelwert gezogen worden sind.
|
||||||
|
|
||||||
@ -106,7 +106,7 @@ Normalverteilung mit diesem Mittelwert gezogen worden sind.
|
|||||||
|
|
||||||
|
|
||||||
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
\section{Kurvenfit als Maximum Likelihood Estimation}
|
\section{Kurvenfit als Maximum-Likelihood Sch\"atzung}
|
||||||
Beim Kurvenfit soll eine Funktion $f(x;\theta)$ mit den Parametern
|
Beim Kurvenfit soll eine Funktion $f(x;\theta)$ mit den Parametern
|
||||||
$\theta$ an die Datenpaare $(x_i|y_i)$ durch Anpassung der Parameter
|
$\theta$ an die Datenpaare $(x_i|y_i)$ durch Anpassung der Parameter
|
||||||
$\theta$ gefittet werden. Wenn wir annehmen, dass die $y_i$ um die
|
$\theta$ gefittet werden. Wenn wir annehmen, dass die $y_i$ um die
|
||||||
@ -132,18 +132,22 @@ Maximum weggelassen werden.
|
|||||||
Anstatt nach dem Maximum zu suchen, k\"onnen wir auch das Vorzeichen der Log-Likelihood
|
Anstatt nach dem Maximum zu suchen, k\"onnen wir auch das Vorzeichen der Log-Likelihood
|
||||||
umdrehen und nach dem Minimum suchen. Dabei k\"onnen wir auch den Faktor $1/2$ vor der Summe vernachl\"assigen --- auch das \"andert nichts an der Position des Minimums.
|
umdrehen und nach dem Minimum suchen. Dabei k\"onnen wir auch den Faktor $1/2$ vor der Summe vernachl\"assigen --- auch das \"andert nichts an der Position des Minimums.
|
||||||
\begin{equation}
|
\begin{equation}
|
||||||
|
\label{chisqmin}
|
||||||
\theta_{mle} = \text{argmin}_{\theta} \; \sum_{i=1}^n \left( \frac{y_i-f(x_i;\theta)}{\sigma_i} \right)^2 \;\; = \;\; \text{argmin}_{\theta} \; \chi^2
|
\theta_{mle} = \text{argmin}_{\theta} \; \sum_{i=1}^n \left( \frac{y_i-f(x_i;\theta)}{\sigma_i} \right)^2 \;\; = \;\; \text{argmin}_{\theta} \; \chi^2
|
||||||
\end{equation}
|
\end{equation}
|
||||||
Die Summer der quadratischen Abst\"ande normiert auf die jeweiligen
|
Die Summe der quadratischen Abst\"ande normiert auf die jeweiligen
|
||||||
Standardabweichungen wird auch mit $\chi^2$ bezeichnet. Der Wert des
|
Standardabweichungen wird auch mit $\chi^2$ bezeichnet. Der Wert des
|
||||||
Parameters $\theta$ welcher den quadratischen Abstand minimiert ist
|
Parameters $\theta$ welcher den quadratischen Abstand minimiert ist
|
||||||
also identisch mit der Maximierung der Wahrscheinlichkeit, dass die
|
also identisch mit der Maximierung der Wahrscheinlichkeit, dass die
|
||||||
Daten tats\"achlich aus der Funktion stammen k\"onnen. Minimierung des
|
Daten tats\"achlich aus der Funktion stammen k\"onnen. Minimierung des
|
||||||
$\chi^2$ ist also ein Maximum-Likelihood Estimate.
|
$\chi^2$ ist also eine Maximum-Likelihood Sch\"atzung. Aber nur, wenn
|
||||||
|
die Daten normalverteilt um die Funktion streuen! Bei anderen
|
||||||
|
Verteilungen m\"usste man die Log-Likelihood entsprechend
|
||||||
|
\eqnref{loglikelihood} ausrechnen und maximieren.
|
||||||
|
|
||||||
\begin{figure}[t]
|
\begin{figure}[t]
|
||||||
\includegraphics[width=1\textwidth]{mlepropline}
|
\includegraphics[width=1\textwidth]{mlepropline}
|
||||||
\caption{\label{mleproplinefig} Maximum Likelihood Estimation der
|
\caption{\label{mleproplinefig} Maximum-Likelihood Sch\"atzung der
|
||||||
Steigung einer Ursprungsgeraden.}
|
Steigung einer Ursprungsgeraden.}
|
||||||
\end{figure}
|
\end{figure}
|
||||||
|
|
||||||
@ -186,12 +190,13 @@ Abstands an ein Histogram der Daten zu fitten. Das ist aber aus
|
|||||||
folgenden Gr\"unden nicht die Methode der Wahl: (i)
|
folgenden Gr\"unden nicht die Methode der Wahl: (i)
|
||||||
Wahrscheinlichkeitsdichten k\"onnen nur positiv sein. Darum k\"onnen
|
Wahrscheinlichkeitsdichten k\"onnen nur positiv sein. Darum k\"onnen
|
||||||
insbesondere bei kleinen Werten die Daten nicht symmetrisch streuen,
|
insbesondere bei kleinen Werten die Daten nicht symmetrisch streuen,
|
||||||
wie es normalverteilte Daten machen sollten. (ii) Die Datenwerte sind
|
wie es bei normalverteilte Daten der Fall ist. (ii) Die Datenwerte
|
||||||
nicht unabh\"angig, da das normierte Histogram sich zu Eins
|
sind nicht unabh\"angig, da das normierte Histogram sich zu Eins
|
||||||
aufintegriert. Die beiden Annahmen normalverteilte und unabh\"angige Daten
|
aufintegriert. Die beiden Annahmen normalverteilte und unabh\"angige
|
||||||
die die Minimierung des quadratischen Abstands zu einem Maximum
|
Daten, die die Minimierung des quadratischen Abstands
|
||||||
Likelihood Estimator machen sind also verletzt. (iii) Das Histgramm
|
\eqnref{chisqmin} zu einem Maximum-Likelihood Sch\"atzer machen, sind
|
||||||
h\"angt von der Wahl der Klassenbreite ab.
|
also verletzt. (iii) Das Histgramm h\"angt von der Wahl der
|
||||||
|
Klassenbreite ab.
|
||||||
|
|
||||||
Den direkten Weg, eine Wahrscheinlichkeitsdichtefunktion an ein
|
Den direkten Weg, eine Wahrscheinlichkeitsdichtefunktion an ein
|
||||||
Datenset zu fitten, haben wir oben schon bei dem Beispiel zur
|
Datenset zu fitten, haben wir oben schon bei dem Beispiel zur
|
||||||
@ -204,9 +209,11 @@ z.B. dem Gradientenabstieg, gel\"ost wird.
|
|||||||
|
|
||||||
\begin{figure}[t]
|
\begin{figure}[t]
|
||||||
\includegraphics[width=1\textwidth]{mlepdf}
|
\includegraphics[width=1\textwidth]{mlepdf}
|
||||||
\caption{\label{mlepdffig} Maximum Likelihood Estimation einer
|
\caption{\label{mlepdffig} Maximum-Likelihood Sch\"atzung einer
|
||||||
Wahrscheinlichkeitsdichtefunktion. Links: die 100 Datenpunkte, die aus der Gammaverteilung
|
Wahrscheinlichkeitsdichtefunktion. Links: die 100 Datenpunkte, die
|
||||||
2. Ordnung (rot) gezogen worden sind. Der Maximum-Likelihood-Fit ist orange dargestellt.
|
aus der Gammaverteilung 2. Ordnung (rot) gezogen worden sind. Der
|
||||||
Rechts: das normierte Histogramm der Daten zusammen mit der \"uber Minimierung
|
Maximum-Likelihood-Fit ist orange dargestellt. Rechts: das
|
||||||
des quadratischen Abstands zum Histogramm berechneten Fits ist potentiell schlechter.}
|
normierte Histogramm der Daten zusammen mit der \"uber Minimierung
|
||||||
|
des quadratischen Abstands zum Histogramm berechneten Fits ist
|
||||||
|
potentiell schlechter.}
|
||||||
\end{figure}
|
\end{figure}
|
||||||
|
@ -10,11 +10,14 @@
|
|||||||
werden kann. }
|
werden kann. }
|
||||||
\end{figure}
|
\end{figure}
|
||||||
|
|
||||||
Ein zeitlicher Punktprozess ist ein stochastischer Prozess der eine Abfolge von Ereignissen zu den Zeiten $\{t_i\}$, $t_i \in \reZ$ generiert.
|
Ein zeitlicher Punktprozess ist ein stochastischer Prozess, der eine
|
||||||
|
Abfolge von Ereignissen zu den Zeiten $\{t_i\}$, $t_i \in \reZ$,
|
||||||
Jeder Punktprozess wird durch einen sich in der Zeit kontinuierlichen
|
generiert.
|
||||||
entwickelnden Prozess generiert. Wann immer dieser Prozess eine Schwelle \"uberschreitet
|
|
||||||
wird ein Ereigniss des Punktprozesses erzeugt. Zum Beispiel:
|
Jeder Punktprozess wird durch einen sich in der Zeit kontinuierlich
|
||||||
|
entwickelnden Prozess generiert. Wann immer dieser Prozess eine
|
||||||
|
Schwelle \"uberschreitet wird ein Ereigniss des Punktprozesses
|
||||||
|
erzeugt. Zum Beispiel:
|
||||||
\begin{itemize}
|
\begin{itemize}
|
||||||
\item Aktionspotentiale/Herzschlag: wird durch die Dynamik des
|
\item Aktionspotentiale/Herzschlag: wird durch die Dynamik des
|
||||||
Membranpotentials eines Neurons/Herzzelle erzeugt.
|
Membranpotentials eines Neurons/Herzzelle erzeugt.
|
||||||
@ -22,7 +25,7 @@ wird ein Ereigniss des Punktprozesses erzeugt. Zum Beispiel:
|
|||||||
tektonischen Platten auf beiden Seiten einer geologischen Verwerfung
|
tektonischen Platten auf beiden Seiten einer geologischen Verwerfung
|
||||||
erzeugt.
|
erzeugt.
|
||||||
\item Zeitpunkt eines Grillen/Frosch/Vogelgesangs: wird durch die
|
\item Zeitpunkt eines Grillen/Frosch/Vogelgesangs: wird durch die
|
||||||
Dynamic des Nervensystems und des Muskelapparates erzeugt.
|
Dynamik des Nervensystems und des Muskelapparates erzeugt.
|
||||||
\end{itemize}
|
\end{itemize}
|
||||||
|
|
||||||
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
|
@ -1,7 +1,7 @@
|
|||||||
%!PS-Adobe-2.0 EPSF-2.0
|
%!PS-Adobe-2.0 EPSF-2.0
|
||||||
%%Title: pointprocessscetchA.tex
|
%%Title: pointprocessscetchA.tex
|
||||||
%%Creator: gnuplot 4.6 patchlevel 4
|
%%Creator: gnuplot 4.6 patchlevel 4
|
||||||
%%CreationDate: Sun Oct 25 21:47:09 2015
|
%%CreationDate: Mon Oct 26 09:31:15 2015
|
||||||
%%DocumentFonts:
|
%%DocumentFonts:
|
||||||
%%BoundingBox: 50 50 373 135
|
%%BoundingBox: 50 50 373 135
|
||||||
%%EndComments
|
%%EndComments
|
||||||
@ -430,10 +430,10 @@ SDict begin [
|
|||||||
/Title (pointprocessscetchA.tex)
|
/Title (pointprocessscetchA.tex)
|
||||||
/Subject (gnuplot plot)
|
/Subject (gnuplot plot)
|
||||||
/Creator (gnuplot 4.6 patchlevel 4)
|
/Creator (gnuplot 4.6 patchlevel 4)
|
||||||
/Author (jan)
|
/Author (benda)
|
||||||
% /Producer (gnuplot)
|
% /Producer (gnuplot)
|
||||||
% /Keywords ()
|
% /Keywords ()
|
||||||
/CreationDate (Sun Oct 25 21:47:09 2015)
|
/CreationDate (Mon Oct 26 09:31:15 2015)
|
||||||
/DOCINFO pdfmark
|
/DOCINFO pdfmark
|
||||||
end
|
end
|
||||||
} ifelse
|
} ifelse
|
||||||
|
Binary file not shown.
@ -1,7 +1,7 @@
|
|||||||
%!PS-Adobe-2.0 EPSF-2.0
|
%!PS-Adobe-2.0 EPSF-2.0
|
||||||
%%Title: pointprocessscetchB.tex
|
%%Title: pointprocessscetchB.tex
|
||||||
%%Creator: gnuplot 4.6 patchlevel 4
|
%%Creator: gnuplot 4.6 patchlevel 4
|
||||||
%%CreationDate: Sun Oct 25 21:47:09 2015
|
%%CreationDate: Mon Oct 26 09:31:16 2015
|
||||||
%%DocumentFonts:
|
%%DocumentFonts:
|
||||||
%%BoundingBox: 50 50 373 237
|
%%BoundingBox: 50 50 373 237
|
||||||
%%EndComments
|
%%EndComments
|
||||||
@ -430,10 +430,10 @@ SDict begin [
|
|||||||
/Title (pointprocessscetchB.tex)
|
/Title (pointprocessscetchB.tex)
|
||||||
/Subject (gnuplot plot)
|
/Subject (gnuplot plot)
|
||||||
/Creator (gnuplot 4.6 patchlevel 4)
|
/Creator (gnuplot 4.6 patchlevel 4)
|
||||||
/Author (jan)
|
/Author (benda)
|
||||||
% /Producer (gnuplot)
|
% /Producer (gnuplot)
|
||||||
% /Keywords ()
|
% /Keywords ()
|
||||||
/CreationDate (Sun Oct 25 21:47:09 2015)
|
/CreationDate (Mon Oct 26 09:31:16 2015)
|
||||||
/DOCINFO pdfmark
|
/DOCINFO pdfmark
|
||||||
end
|
end
|
||||||
} ifelse
|
} ifelse
|
||||||
|
Binary file not shown.
@ -236,6 +236,6 @@
|
|||||||
|
|
||||||
\renewcommand{\codepath}{pointprocesses/code/}
|
\renewcommand{\codepath}{pointprocesses/code/}
|
||||||
\renewcommand{\texinputpath}{pointprocesses/lecture/}
|
\renewcommand{\texinputpath}{pointprocesses/lecture/}
|
||||||
\include{pointprocesses/lecture/pointprocesses}
|
%\include{pointprocesses/lecture/pointprocesses}
|
||||||
|
|
||||||
\end{document}
|
\end{document}
|
||||||
|
@ -27,4 +27,4 @@ subplot(1, 2, 2);
|
|||||||
plot(psigs, loglm);
|
plot(psigs, loglm);
|
||||||
xlabel('standard deviation')
|
xlabel('standard deviation')
|
||||||
ylabel('log likelihood')
|
ylabel('log likelihood')
|
||||||
savefigpdf(gcf, 'mlestd.pdf', 12, 5);
|
savefigpdf(gcf, 'mlestd.pdf', 15, 5);
|
||||||
|
Binary file not shown.
@ -113,8 +113,10 @@ Absch\"atzung der Standardabweichung verdeutlichen.
|
|||||||
\continue
|
\continue
|
||||||
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
|
||||||
\question \qt{Maximum-Likelihood-Sch\"atzer einer Ursprungsgeraden}
|
\question \qt{Maximum-Likelihood-Sch\"atzer einer Ursprungsgeraden}
|
||||||
In der Vorlesung haben wir eine Gleichung f\"ur die Maximum-Likelihood
|
In der Vorlesung haben wir folgende Formel f\"ur die Maximum-Likelihood
|
||||||
Absch\"atzung der Steigung einer Ursprungsgeraden hergeleitet.
|
Absch\"atzung der Steigung $\theta$ einer Ursprungsgeraden durch $n$ Datenpunkte $(x_i|y_i)$ mit Standardabweichung $\sigma_i$ hergeleitet:
|
||||||
|
\[\theta = \frac{\sum_{i=1}^n \frac{x_iy_i}{\sigma_i^2}}{ \sum_{i=1}^n
|
||||||
|
\frac{x_i^2}{\sigma_i^2}} \]
|
||||||
\begin{parts}
|
\begin{parts}
|
||||||
\part \label{mleslopefunc} Schreibe eine Funktion, die in einem $x$ und einem
|
\part \label{mleslopefunc} Schreibe eine Funktion, die in einem $x$ und einem
|
||||||
$y$ Vektor die Datenpaare \"uberreicht bekommt und die Steigung der
|
$y$ Vektor die Datenpaare \"uberreicht bekommt und die Steigung der
|
||||||
@ -146,13 +148,12 @@ nicht so einfach wie der Mittelwert und die Standardabweichung einer
|
|||||||
Normalverteilung direkt aus den Daten berechnet werden k\"onnen. Solche Parameter
|
Normalverteilung direkt aus den Daten berechnet werden k\"onnen. Solche Parameter
|
||||||
m\"ussen dann aus den Daten mit der Maximum-Likelihood-Methode gefittet werden.
|
m\"ussen dann aus den Daten mit der Maximum-Likelihood-Methode gefittet werden.
|
||||||
|
|
||||||
Um dies zu veranschaulichen ziehen wir uns diesmal Zufallszahlen, die nicht einer
|
Um dies zu veranschaulichen ziehen wir uns diesmal nicht normalverteilte Zufallszahlen, sondern Zufallszahlen aus der Gamma-Verteilung.
|
||||||
Normalverteilung entstammen, sonder aus der Gamma-Verteilung.
|
|
||||||
\begin{parts}
|
\begin{parts}
|
||||||
\part
|
\part
|
||||||
Finde heraus welche Funktion die Wahrscheinlichkeitsdichtefunktion
|
Finde heraus welche \code{matlab} Funktion die
|
||||||
(probability density function) der Gamma-Verteilung in \code{matlab}
|
Wahrscheinlichkeitsdichtefunktion (probability density function) der
|
||||||
berechnet.
|
Gamma-Verteilung berechnet.
|
||||||
|
|
||||||
\part
|
\part
|
||||||
Plotte mit Hilfe dieser Funktion die Wahrscheinlichkeitsdichtefunktion
|
Plotte mit Hilfe dieser Funktion die Wahrscheinlichkeitsdichtefunktion
|
||||||
@ -169,17 +170,17 @@ Normalverteilung entstammen, sonder aus der Gamma-Verteilung.
|
|||||||
|
|
||||||
\part
|
\part
|
||||||
Finde heraus mit welcher \code{matlab}-Funktion eine beliebige
|
Finde heraus mit welcher \code{matlab}-Funktion eine beliebige
|
||||||
Verteilung (``distribution'') und die Gammaverteilung an die
|
Verteilung (``distribution'') an die Zufallszahlen nach der
|
||||||
Zufallszahlen nach der Maximum-Likelihood Methode gefittet werden
|
Maximum-Likelihood Methode gefittet werden kann. Wie wird diese
|
||||||
kann.
|
Funktion benutzt, um die Gammaverteilung an die Daten zu fitten?
|
||||||
|
|
||||||
\part
|
\part
|
||||||
Bestimme mit dieser Funktion die Parameter der
|
Bestimme mit dieser Funktion die Parameter der Gammaverteilung aus
|
||||||
Gammaverteilung aus den Zufallszahlen.
|
den Zufallszahlen.
|
||||||
|
|
||||||
\part
|
\part
|
||||||
Plotte anschlie{\ss}end
|
Plotte anschlie{\ss}end die Gammaverteilung mit den gefitteten
|
||||||
die Gammaverteilung mit den gefitteten Parametern.
|
Parametern.
|
||||||
\end{parts}
|
\end{parts}
|
||||||
\begin{solution}
|
\begin{solution}
|
||||||
\lstinputlisting{mlepdffit.m}
|
\lstinputlisting{mlepdffit.m}
|
||||||
|
Reference in New Issue
Block a user