Mittwoch, 28. November 2012

Höhere Mathematik für Physiker: Graphen stetiger Funktionen sind Nullmengen

Im Folgenden beweisen wir, dass es sich bei Graphen stetiger Funktionen $f\colon U\to \mathbb R$ mit offenem Definitionsbereich $U \subset \mathbb R^n$ um $(n+1)$-dimensionale Nullmengen handelt. Diese Aussage wurde in der Vorlesung ohne Beweis notiert. Tatsächlich werden wir sogar ein wenig mehr zeigen.

Da in puncto Nullmengen verschiedene Sprechweisen und Konventionen kursieren, wiederholen wir unsere
Definition. Sei $n \in \mathbb N$. Dann versteht man unter einer $n$-dimensionalen Nullmenge eine Teilmenge $N \subset \mathbb R^n$, so dass für jede Zahl $\epsilon > 0$ eine Folge $(Q_k)_{k\in\mathbb N}$ $n$-dimensionaler Quader existiert, für die gilt: \[N \subset \bigcup_{k\in\mathbb N}Q_k \qquad \text{und} \qquad \sum_{k=1}^\infty \lambda^n(Q_k) < \epsilon.\] Dabei bezeichnet $\lambda^n$ den $n$-dimensionalen Quaderinhalt.
Die zentrale Idee, wie man Graphen stetiger Funktionen möglichst volumensparend mit (kompakten) Quadern überdeckt, liegt in folgendem
Lemma 1. Sei $n \in \mathbb N_0$, $K \subset \mathbb R^n$ eine kompakte Teilmenge und $f\colon K \to \mathbb R$ eine stetige Funktion. Dann ist \begin{equation}\Gamma := \{(x_0,\dots,x_{n-1},y)\in\mathbb R^{n+1}:f(x_0,\dots,x_{n-1})=y\}\label{e_graph}\end{equation} eine $(n+1)$-dimensionale Nullmenge.
Beweis. Sei $\epsilon > 0$. Als Kompaktum ist $K$ insbesondere eine beschränkte Teilmenge von $\mathbb R^n$, d. h. es existiert eine Zahl $a>0$ dergestalt, dass \[K \subset [-a,a]^n.\] Des Weiteren ist $f$ als stetige Funktion mit kompaktem Definitionsbereich gleichmäßig stetig. Mithin gibt es eine Zahl $\delta>0$, so dass für alle $x,x' \in K$ gilt: \[||x-x'||_\infty<\delta \quad \Rightarrow \quad |f(x)-f(x')|<\epsilon' := \frac\epsilon{2(2a)^n}.\] Nach archimedischem Axiom existiert eine natürliche Zahl $m$ mit der Eigenschaft \[\frac{2a}\delta < m.\] Für alle \[i = (i_0,\dots,i_{n-1}) \in \{0,\dots,m-1\}^n\] setzen wir nun: \[Q'_i := \left((-a,\dots,-a)+\frac{2a}m(i_0,\dots,i_{n-1})\right)+\left[0,\frac{2a}m\right]^n \subset \mathbb R^n.\] Zudem definieren wir \[I := \{i \in \{0,\dots,m-1\}^n : Q'_i \cap K \neq \emptyset\}.\] Damit existiert für alle $i \in I$ ein, und nur ein, $z_i$, das bezüglich der lexikografischen Ordnung auf $\mathbb R^n$ kleinstes Element von $Q'_i \cap K$ ist. Für $i \in I$ definieren wir: \[Q_i := Q'_i \times [f(z_i)-\epsilon',f(z_i)+\epsilon'] \subset \mathbb R^{n+1}.\] Sei nun $(x_0,\dots,x_{n-1},y) \in \Gamma$. Dann ist $x \in K$, also auch $x \in [-a,a]^n$. Demzufolge existiert offensichtlich ein $i \in \{0,\dots,m-1\}^n$, so dass $x \in Q'_i$. Es gilt $i \in I$, da $x \in Q'_i \cap K$. Da \[||x-z_i||_\infty \leq \frac{2a}m < \delta,\] haben wir \[|f(x)-f(z_i)| < \epsilon'.\] Das heißt, \[(x_0,\dots,x_{n-1},y) \in Q_i.\] In der Folge gilt \[\Gamma \subset \bigcup_{i\in I}Q_i.\] Nach Festlegung des Lebesgue'schen Volumens von Quadern haben wir, für alle $i \in I$: \[\lambda^{n+1}(Q_i) = \left(\frac{2a}m\right)^n\cdot 2\epsilon' = \frac1{m^n}\epsilon.\] Das heißt, \[\sum_{i\in I}\lambda^{n+1}(Q_i) = \sum_{i\in I}\frac1{m^n}\epsilon \leq m^n\frac1{m^n}\epsilon = \epsilon,\] was zu beweisen war. $\Box$
Folgerung. Sei $n \in \mathbb N_0$, $A \subset \mathbb R^n$ und $f\colon A \to \mathbb R$ eine stetige Funktion, so dass eine höchstens abzählbare Familie $(K_j)_{j\in J}$ von kompakten Teilmengen $K_j \subset \mathbb R^n$ mit \[A = \bigcup_{j\in J}K_j\] existiert. Dann ist \eqref{e_graph} eine $(n+1)$-dimensionale Nullmenge.
Beweis. Für alle $j\in J$ ist $K_j \subset \mathbb R^n$ kompakt und $f|K_j \colon K_j \to \mathbb R$ eine stetige Funktion. Daher ist \[\Gamma_j := \{(x_0,\dots,x_{n-1},y)\in\mathbb R^{n+1}:(f|K_j)(x_0,\dots,x_{n-1})=y\}\] nach Lemma 1 eine $(n+1)$-dimensionale Nullmenge. Zudem gilt offenbar \[\Gamma = \bigcup_{j\in J}\Gamma_j,\] da $A = \bigcup_{j\in J}K_j$. Somit ist $\Gamma$ eine Nullmenge laut Vorlesung. $\Box$
Lemma 2. Für alle $n \in \mathbb N_0$ und alle offenen Teilmengen $U \subset \mathbb R^n$ existiert eine höchstens abzählbare Menge $\mathfrak Q$ kompakter $n$-dimensionaler Quader, so dass \[U = \bigcup\mathfrak Q.\]
Beweis. Für alle $k\in\mathbb N_0$ und alle $i = (i_0,\dots,i_{n-1}) \in \mathbb Z^n$ setzen wir: \[Q_i^k := \frac1{2^k}\left(i + [0,1]^n\right).\] Wir definieren \[\mathfrak Q := \{Q_i^k:k\in\mathbb N_0, i \in \mathbb Z^n, Q_i^k \subset U\}.\] Die Zuordnung $(k,i) \mapsto Q_i^k$ liefert eine Bijektion zwischen einer Teilmenge von $\mathbb N_0 \times \mathbb Z^n$ und $\mathfrak Q$. Daher ist $\mathfrak Q$ höchstens abzählbar. Ebenfalls evident ist:\[\bigcup\mathfrak Q \subset U.\] Sei jetzt $x\in U$ beliebig. Dann existiert aufgrund der Offenheit von $U$ in $\mathbb R^n$ (und der Äquivalenz sämtlicher Normen auf $\mathbb R^n$) eine Zahl $\epsilon > 0$ derart, dass \[\{y \in \mathbb R^n: ||y-x||_\infty < \epsilon\} \subset U.\] Damit existieren eine natürliche Zahl $k \in \mathbb N_0$, so dass \[\frac1\epsilon < 2^k,\] und des Weiteren ein Element $i \in \mathbb Z^n$, so dass \[x \in Q_i^k.\] Im letzten Schritt kann man dabei $i \in \mathbb Z^n$ als dasjenige Tupel wählen, das entsteht, wenn man auf $2^kx \in \mathbb R^n$ komponentenweise die Gaußklammer anwendet. Da für alle $y \in Q_i^k$ die Beziehung \[||y-x|| \leq \frac1{2^k} < \epsilon\] gilt, haben wir $Q_i^k \subset U$. Demzufolge ist $Q_i^k \in \mathfrak Q$ und $x \in \bigcup \mathfrak Q$. Da $x \in U$ beliebig war, folgt $U \subset \bigcup \mathfrak Q$, was zu beweisen war. $\Box$
Satz. Für alle $n \in \mathbb N_0$ und alle stetigen Funktionen $f\colon U\to \mathbb R$, die auf offenen $U \subset \mathbb R^n$ definiert sind, ist \eqref{e_graph} eine $(n+1)$-dimensionale Nullmenge.
Beweis. Die Behauptung ergibt sich unmittelbar aus Lemma 2 und Folgerung aus Lemma 1. $\Box$

Dienstag, 13. November 2012

Übungen zu Höhere Mathematik für Physiker: Blatt 3, Aufgabe 4

Aufgabe. Zeigen Sie, dass (für alle $x_0,y_0 \in \mathbb R$) das Anfangswertproblem \begin{equation}y' = \sin(xy), \qquad y(x_0)=y_0 \label{e_sinawp}\end{equation} ein eindeutige Lösung auf $\mathbb R$ besitzt.
Zur Lösung der Aufgabe wiederholen wir den folgenden, aus der Vorlesung bekannten
Satz von Picard-Lindelöf (lokale Version, quantitativ). Es seien $n \in \mathbb N$, $a,b,M$ reelle Zahlen $>0$, $t_0 \in \mathbb R$, $x_0 \in \mathbb R^n$ und \[f \colon [t_0-a,t_0+a] \times \{x \in \mathbb R^n:|x-x_0|\leq b\} \to \mathbb R^n\] eine stetige Funktion, die einer globalen Lipschitz-Bedingung in der zweiten Variablen genügt und durch $M$ beschränkt ist. Dann besitzt das Anfangswertproblem \begin{equation} x' = f(t,x), \qquad x(t_0)=x_0, \label{e_awp}\end{equation} genau eine Lösung auf $[t_0-\alpha,t_0+\alpha]$, wobei $\alpha := \min(a,\frac bM)$.
Aus dem zitierten Satz leiten wir her ein einfaches
Korollar. Es seien $n \in \mathbb N$, $M$ eine strikt positive reelle Zahl, $t_0 \in \mathbb R$, $x_0 \in \mathbb R^n$ und \[f \colon \mathbb R \times \mathbb R^n \to \mathbb R^n\] eine stetige Funktion, die einer lokalen Lipschitz-Bedingung in der zweiten Variablen genügt und durch $M$ beschränkt ist. Dann besitzt das Anfangswertproblem \eqref{e_awp} eine eindeutig bestimmte Lösung mit Definitionsbereich $\mathbb R$.
Beweis. Es sei $a>0$ beliebig. Wir setzen $b := aM + 1$. Da $f$ stetig ist und einer lokalen Lipschitz-Bedingung in der zweiten Variablen genügt, genügt die Einschränkung $f_a$ von $f$ auf das Kompaktum \[[t_0-a,t_0+a] \times \{x \in \mathbb R^n:|x-x_0|\leq b\} \subset \mathbb R \times \mathbb R^n\] einer globalen Lipschitz-Bedingung in der zweiten Variablen. Nach dem Satz von Picard-Lindelöf besitzt also das Anfangswertproblem \[x' = f_a(t,x), \qquad x(t_0)=x_0\] eine eindeutig bestimmte Lösung $\phi_a$ mit Definitionsbereich gleich $[t_0-a,t_0+a]$; man beachte, dass \[\frac bM = \frac{aM+1}M > a\] und mithin \[\min(a,\frac bM) = a\] gilt. Wir heben nun unsere Fixierung von $a$ auf und definieren \[\phi := \bigcup_{a>0} \phi_a = \{(x,y) : (\exists a>0) \phi_a(x)=y\}.\] Dann ist $\phi$ eine Funktion $\mathbb R \to \mathbb R^n$, da für alle $a'>a>0$ aufgrund der Eindeutigkeit der Lösung $\phi_a$ die Beziehung \[\phi_{a'} \mid [t_0-a,t_0+a] = \phi_a\] gilt. Da für alle $a>0$ \[\phi \mid [t_0-a,t_0+a] = \phi_a\] (nach Definition von $\phi$), ist $\phi$ offensichtlich eine Lösung des Anfangswertproblems \eqref{e_awp}. Dass für jede weitere Lösung $\psi \colon J\to \mathbb R^n$ von \eqref{e_awp} gilt \[\psi = \phi \mid J\] folgt aus dem Eindeutigkeitssatz. $\Box$

Lösung der Aufgabe. Es genügt zu bemerken, dass die Funktion \[f \colon \mathbb R \times \mathbb R \to \mathbb R, \qquad f(x,y) = \sin(xy)\] stetig und bezüglich der zweiten Variablen stetig differenzierbar ist, so dass sie einer lokalen Lipschitz-Bedingung genügt. Zudem ist $f$ beschränkt durch $M := 1$. Demnach ergibt sich die Behauptung der Aufgabe, die eindeutige Existenz einer Lösung von \eqref{e_sinawp} auf $\mathbb R$, unmittelbar aus unserem Korollar. $\Box$

Mittwoch, 7. November 2012

Gödel und die Grenzen der Logik: Zur Bedeutung der Russellschen Antinomie

In Abschnitt 1.2.5 unserer Textgrundlage wird die „Grundlagenkrise“ thematisiert, die Betrand Russell durch seine „Antinomie“ auslöste.

Im Folgenden möchte ich kurz erklären, warum die Russellsche Antinomie nichts anderes sagt, als dass jede Mengenlehre, die das Axiomenschema der allgemeinen (oder „uneingeschränkten“) Komprehension umfasst, automatisch inkonsistent ist. Dies ist eine ganz und gar pragmatische Sicht der Dinge – genau richtig für unser Seminar. Der paradoxe Charakter der „Antinomie“ wird gewissermaßen entzaubert. In letzter Konsequenz warnt uns Russells Idee lediglich davor, zu starke Axiome in unsere (Mengen-)Theorien aufzunehmen, um diese nicht unmittelbar inkonsistent werden zu lassen.
Proposition. Im Sequenzenkalkül der Prädikatenlogik erster Stufe mit einer Signatur, die durch ein zweistelliges Relationensymbol $E$ gegeben ist, ist der Ausdruck \begin{equation}\forall y\neg \forall x(Exy \leftrightarrow \neg Exx) \label{e_0}\end{equation} ableitbar.
Beweisskizze. In einem ersten Schritt stellt man fest, dass sich für jede Formel $\alpha$ der Ausdruck $\neg(\alpha\leftrightarrow\neg\alpha)$ ableiten lässt, das heißt: \begin{equation}\vdash \neg(\alpha\leftrightarrow\neg\alpha).\label{e_1}\end{equation} Tatsächlich ergeben sich vermittels Fallunterscheidung und Modus ponens die Ableitungsbeziehungen \[(\alpha\rightarrow\neg\alpha) \vdash \neg\alpha\] und \[(\neg\alpha\rightarrow\alpha) \vdash \alpha.\] Damit ist klar, dass \[(\alpha \leftrightarrow \neg\alpha) \vdash \alpha,\neg\alpha\] und es folgt \eqref{e_1}.
Durch universelle Instanziierung haben wir: \[\forall x(Exy \leftrightarrow \neg Exx) \vdash (Eyy \leftrightarrow \neg Eyy).\] Zudem lautet \eqref{e_1} für $\alpha = Eyy$ speziell \[\vdash \neg(Eyy \leftrightarrow \neg Eyy),\] so dass wir auf \[\vdash \neg\forall x(Exy \leftrightarrow \neg Exx)\] schließen können. Universelle Generalisierung liefert die Ableitbarkeit von \eqref{e_0}. $\Box$
Folgerung. Jede Theorie, die das Axiomenschema der uneingeschränkten Komprehension enthält, ist inkonsistent.
Beweis. Uneingeschränkte Komprehension ($\mathsf{Kom}$) meint das Schema \[\exists y\forall x(Exy \leftrightarrow \phi),\] wobei $\phi$ eine Formel ist, in der die Variable $y$ nicht frei (oder strenger: gar nicht) vorkommt. Da für $\phi$ der Ausdruck $\neg Exx$ eingesetzt werden darf, haben wir \[\mathsf{Kom} \vdash \neg\forall y\neg\forall x(Exy \leftrightarrow \neg Exx).\] Schreibt man $\psi$ für den Ausdruck in \eqref{e_0}, so gilt gemäß unserer Proposition \[\mathsf{Kom} \vdash \psi, \neg\psi,\] also \[\mathsf{Kom} \vdash \beta\] für alle Formeln $\beta$ der Sprache. Dies zeigt die Inkonsistenz von Theorien $T$ mit $\mathsf{Kom} \subset T$. $\Box$

Freitag, 2. November 2012

Übungen zu Höhere Mathematik für Physiker: Das Thomson-Problem

In unserer Übung vom Dienstag dieser Woche hat Lukas (W.) das Problem aufgeworfen, für eine gegebene natürliche Zahl $n$, $n$ (paarweise verschiedene) Punkte möglichst gleichmäßig auf der Oberfläche der 3-dimensionalen Einheitskugel, der sogenannten 2-Sphäre, zu verteilen.

Einige Anmerkungen hierzu: Wir bezeichnen die 2-Sphäre wie üblich mit $S^2$, das heißt \[S^2 = \{(a,b,c) \in \mathbb R^2:a^2+b^2+c^2 = 1\}.\] Zudem fixieren wir eine natürliche Zahl $n\geq 2$. In Lukas' Problem geht es darum, gewisse ausgezeichnete Teilmengen $p \subset S^2$ der Kardinalität $n$, in Zeichen $|p|=n$, zu bestimmen.

Die Auszeichnung von $p$ erfolgt über die Forderung, die (paarweise verschiedenen) Elemente \[x_0,\dots,x_{n-1} \in p\] mögen möglichst gleichmäßig über $S^2$ verteilt sein. Denkt man ein wenig über diese Forderung nach, so wird man feststellen, dass gar nicht ohne Weiteres klar ist, wann, mathematisch präzise, die Punkte $x_0,\dots,x_{n-1}$ „möglichst gleichmäßig“ über $S^2$ verteilt sind. Welche mathematische Größe, die sich aus $p$ errechnen lässt, eignet sich als Maß für die Gleichmäßigkeit der Verteilung der Elemente von $p$ auf der Sphäre?

Auf diese Frage gibt es zahlreiche Antworten – ein Aspekt, der bereits die genaue Formulierung unseres Problems interessant werden lässt! Um die Diskussion sehr konkret zu halten, betrachten wir folgende Größe: \[E(p) := \sum_{0\leq i<j<n} \frac1{||x_i-x_j||},\] wobei es sich bei $x_0,\dots,x_{n-1}$ um eine Aufzählung der Elemente von $p$ handelt und wir mit doppelten Betragsstrichen (im Nenner) die euklidische Norm auf $\mathbb R^3$ bezeichnen. Man überlegt sich leicht, dass die rechte Seite obiger Gleichung von der gewählten Aufzählung der Elemente von $p$ unabhängig ist; dies rechtfertigt die Bezeichnung „$E(p)$“ auf der linken Seite der Gleichung.

Weiterhin setzen wir \[X := \{p: p\subset S^2, |p|=n\}.\] Damit ist \[E(X) = \{y:(\exists p\in X) y=E(p)\}\] eine nach unten beschränkte Teilmenge der Menge der reellen Zahlen, denn offensichtlich gilt für alle $p\in X$ \[E(p)>0\] oder sogar \[E(p) \geq \sum_{0\leq i<j<n}\frac12 = \binom{n}2\cdot\frac12 = \frac{n(n-1)}{4}.\] Lukas' Problem lässt sich nun so formulieren:
Thomson-Problem. Man charakterisiere (geometrisch?) diejenigen $p\in X$, für die gilt \begin{equation}E(p) = \inf E(X).\label{e_tp}\end{equation}
Bemerkenswerterweise ist das Thomson-Problem lediglich für \[n \in \{2,3,4,5,6,12\}\] gelöst! Der Fall $n=2$ ist dabei mehr oder weniger trivial; die minimierenden Konfigurationen sind gerade durch Paare antipodaler Punkte gegeben. Der Fall $n=3$ ist bereits etwas aufwendiger, lässt jedoch ebenfalls noch gut „zu Fuß“ bewältigen (Übungsaufgabe!): die minimierenden Konfigurationen sind hier durch diejenigen $p=\{x_0,x_1,x_2\}$ gegeben, für die $x_0,x_1,x_2$ die Eckpunkte eines gleichseitigen Dreiecks bilden, das einem Großkreis der Sphäre einbeschrieben ist. Dass im Fall $n=4$ die Lösungen genau durch die Mengen der Eckpunkte der Sphäre einbeschriebener regulärer Tetraeder gegeben sind, ist wohl bereits seit rund 100 Jahren bekannt (vgl. Föppl 1912). Rigoros bewiesen wurde dieser Sachverhalt jedoch erst von Yudin in einer Arbeit von 1992. Die Fälle $n=6$ und $n=12$ gehen (respektive) zurück auf Yudin (1992) und Andreev (1996). Der Fall $n=5$ wurde schließlich erst 2010 in einer Arbeit von Richard Schwartz (Computer-gestützt) abgehandelt.

Als abschließende Arbeitsanregung möchte ich eine Übungsaufgabe stellen, die mit unseren bisher erworbenen mathematischen Fähigkeiten und Kenntnissen, sofern geschickt eingesetzt, zu bewältigen ist.
Aufgabe. Man zeige, dass (für alle $n \in \mathbb N_{\geq2}$) ein $p \in X$ dergestalt existiert, dass \eqref{e_tp} erfüllt ist.
Die in der Aufgabe formulierte Aussage besagt, dass das Thomson-Problem stets überhaupt eine Lösung besitzt. Diese Tatsache macht das Thomson-Problem erst recht interessant. So zeichnet die Bedingung \eqref{e_tp} nämlich (auch für noch so „absurde“ Zahlen $n$) gewisse Geometrien von $n$ Punkten auf einer Sphäre aus, wobei mit Geometrie hier in erster Linie die Struktur der Symmetriegruppe \[G = G(p) := \{g \in \mathop{O}(3):g(p) \subset p\}\] gemeint ist.