Category: Studium

Mein Auslandssemester am MIT

Das letzte Semester habe ich als Visiting Student im Brain and Cognitive Sciences Department des MIT verbracht. Was folgt ist der Versuch einer Zusammenfassung dessen, was ich in Cambridge getan und gelernt habe. Besonders wenn ich von dem berichte, was ich gelernt habe, wird vieles skizzenhaft bleiben und vieles andere werde ich gar nicht erwähnen, weil ich nur begrenzt Zugriff auf die Veränderungen habe, die in meinem Kopf stattgefunden haben. Ich weiß jetzt mehr über das Denken und wie ich es erforschen will, über meine Zukunft und darüber, was für ein Mensch ich sein will. Im Folgenden will ich ein Bisschen davon vermitteln.

Mein Verständnis davon, wie das menschliche Denken funktioniert, hat Fortschritte gemacht. Grob lassen sich diese Fortschritte in drei Kategorien einteilen: Modelldenken, Wahrscheinlichkeitsdenken und Entwicklungsforschung. Zusammen haben sie dazu geführt, dass ich eine Vorstellung davon habe, wie ein Pfad hin zu einem naturwissenschaftlichen Verständnis des menschlichen Geistes aussehen könnte und, fundamentaler, dass ich mir überhaupt vorstellen kann, wirklich zu verstehen, wie das menschliche Denken funktioniert. Letzteres ist schwer zu vermitteln, und doch ist es das, was mir lange Zeit gefehlt hat (auch wenn mir das nicht klar war) und was zentrale Teile der Kognitionswissenschaft für mich weg von der Philosophie und in die Naturwissenschaftsecke rückt.

Der erste Punkt, das Modelldenken, ist der, der am meisten Auswirkungen auf meinen Alltag hat. Wissenschaftlich meine ich damit die repräsentationale Theorie des Geistes, insbesondere wie von Fodor in seiner Theorie einer Sprache des Geistes beschrieben. Im Alltag äußert sich das darin, dass ich häufiger zwischen meinem (und anderer Leute) geistigem Modell der Welt und der dahinter liegenden, wirklichen Welt unterscheide. Wenn ich eine E-Mail bekomme, die auf den ersten Blick schwer nachvollziehbare Dinge sagt, dann hilft es, wenn ich mir überlege, wie das Modell der Welt und das Modell von mir im Kopf des Schreibers aussehen könnte. Erst dann kann ich mir überlegen, was ich schreiben muss, um in diesem Modell das zu rekonstruieren, was ich beschreiben will. Wenn ich dagegen direkt das schreibe, was mich überzeugen würde, weil es in mein Modell der Welt passt, dann würde oft keine Kommunikation zustande kommen.

Dass man nicht um Wahrscheinlichkeitstheorie herumkommt, wenn man das Denken verstehen will, war auch schon vor der Zeit hier meine Einstellung. “I am interested in the theoretical foundations of inductive learning” hatte ich in der E-Mail geschrieben, mit der ich mich um das Praktikum hier am MIT beworben hatte, und bei induktivem Lernen hatte ich an probabilistisches Generalisieren gedacht. Und auch daran, dass für das Denken und Handeln in der echten Welt Annäherungen an das exakte Berechnen von Wahrscheinlichkeiten (z.B. von zukünftigen Ereignissen) wohl nötig sind, weil die exakte Lösung prinzipiell zu rechenaufwändig sein könnte, hatte ich schon damals wenige Zweifel. In einem Philosophie-Aufsatz schrieb ich: “Besides using approximate reasoning, prior beliefs that are tuned to the statistics of our world and access to a large amount of real-world data are two other strategies that are likely to be used in any solution to the AI problem.” Wovon ich wenig wusste, war, wie solche Annäherungen aussehen könnten und, allgemeiner, wie Wahrscheinlichkeitstheorie und die oben genannten — oft sehr komplexen — mentalen Modelle zusammen passen. Durch meine Arbeit an der probabilistischen Programmiersprache Church und an probabilistischen Modellen von schlussfolgerndem Denken, von Pragmatik und Konzeptlernen ist mir das klarer geworden.

Bevor ich am MIT-Harvard Seminar “Computational Models and Cognitive Development” teilgenommen hatte, wusste ich nicht zu schätzen, wie geeignet das Denken von (Klein-)Kindern als Studienobjekt ist, wenn man mehr über das Denken im Allgemeinen lernen will. Drei Fragen, die mich in meiner Forschung interessieren, sind: Was sind Konzepte? Wie lernen wir Konzepte? Was läuft ab, wenn wir in unserem Denken Konzepte manipulieren? Insbesondere wenn man annimmt, dass Konzepte aufeinander aufbauen, wird klar, warum man von Kindern besonders viel über das Denken mit Konzepten lernen kann: Die vorhandenen Konzepte sind weniger komplex und es kann praktisch live beobachtet werden, wie sich die Konzepte verändern. Ein Beispiel dafür ist das phasenweise Verstehen von Zahlen (no-knower, one-knower, two-knower, three-knower, number-knower), das in praktisch allen Kindern der zivilisierten Welt gleich abläuft.

Wenn ich sage, dass ich jetzt besser verstehe, was für eine Art von Mensch ich sein will und was für ein Leben ich leben will, dann ist das wahr, aber auch irreführend. Auch vor meiner Zeit hier war klar, dass, besonders wenn man nach gesellschaftlichem Urteil “alles richtig macht”, die Gefahr groß ist, sich und die großen Fragen, die man einst hatte, in institutionalisierten Systemen zu verlieren. Auch ohne groß zu suchen findet man in solchen Systemen zu jedem beliebigen Zeitpunkt im Leben Ausreden, warum jetzt gerade nicht die richtige Zeit ist für die großen Fragen. Systeme sind wie Lückentexte — sie machen es einfach, weil sie Struktur vorgeben, und aus dem gleichen Grund machen sie es schwierig, wenn man Wert auf die Freiheit legt, seinem Handeln selbst Struktur zu verleihen. Vor meinem inneren Auge sehe ich mich als Postdoc rechtfertigen, warum ich unbedingt an einem Projekt arbeiten muss, das zwar nicht wirklich spannend ist, aber die Konferenz-Deadline ist nahe, so langsam wird es Zeit für eine Professorenstelle und irgendetwas muss beim Vorstellungsgespräch ja erzählt werden — nur dummerweise wurde die PhD-Arbeit schon zu oft wiedergekäut, darum muss jetzt was Neues her, aber die großen Fragen sind dafür ungeeignet, die brauchen viel mehr Zeit, die kann ich mir jetzt nicht leisten. Die Gefahr sah und sehe ich, aber es macht einen Unterschied, ob man sich ihrer abstrakt bewusst ist oder ob man sich regelmäßig mit PhD-Studenten und Postdocs unterhält, die einen ähnlichen Hintergrund haben und sich ähnliche Fragen stellen und sieht, wie sie die in den Institutionen der Wissenschaft verwirklichen und nicht verwirklichen. “Ist das deine Zukunft?” frage ich mich regelmäßig und in verschiedenen Situationen habe ich diese Frage unterschiedlich beantwortet. Konkret stellt sich die Frage jetzt, wenn ich mir überlege, ob ich nach dem Bachelor einen PhD machen will, und bis jetzt ist meine Antwort “ja, aber”.

Auch außerhalb meines Labs habe ich interessante Menschen getroffen, und vielleicht war die Hauptmoral, die sich mir dabei eingeprägt hat, dass wir alle nur Menschen sind, ohne Ausnahmen. Vom Abendessen mit dem Physik-Nobelpreisträger Wolfgang Ketterle sind mir die karriereorientierten Fragen in Erinnerung geblieben, die die anderen Anwesenden gestellt haben, außerdem Ketterles Erzählung davon, wie er zeitweise seine Arbeit für seine Familie und zeitweise seine Familie für seine Arbeit vernachlässigt hat. Und die Erkenntnis, dass auch Handeln, das zu allgemeiner Anerkennung führt, oft aus Zielen folgt, die nur von innen einsichtig sind und unter Reflektion vielleicht nicht in sich konsistent wären. Vom Abendessen mit Garrett Lisi (unabhängig arbeitender Physiker und Extremsportler) blieb mir ein Wortwechsel besonders in Erinnerung. Ich habe ihn gefragt, ob er jetzt (da er gerade viel mit anderen Wissenschaftlern zu tun hat) glücklicher ist oder eher früher (als er hauptsächlich für sich allein gearbeitet hat), und er meinte daraufhin, dass er bis jetzt sagen würde, dass es früher schöner war. Dass es schwierig sei, die Vorstellungen verschiedener Menschen zu koordinieren. Worauf ich gefragt habe, ob es ihm denn lieber wäre, wenn jeder genau das täte, was er ihnen zu tun gäbe, und er wurde fast ein bisschen wütend, jedenfalls lauter als im Gespräch davor: “NO! No! Everyone should do what they want to do!” Seitdem denke ich ab und an daran, wie er das gesagt hat, und wie sehr ich das auch so sehe.

Es gibt zahlreiche andere Dinge, die ich letztes Semester gelernt habe — dass ich aus wissenschaftsphilosophischer Sicht struktureller Realist bin, dass ich klassische Musik hören kann, dass ich Hermann Hesse mag — und einige andere Dinge, die ich getan habe — der Lab-Ausflug nach New Hampshire, das Treffen mit Lena in New York, Neujahrsklettern in Dresden — aber was ich oben beschrieben habe ist das, was mir aus akademischer Sicht und aus dem aktuellen Moment heraus am bedeutendsten scheint.

The Windmills of Academia

After reading Kuhn, visiting the ICP and talking to friends, one thing became clear to me: From an individual point of view, science is often slow, frustrating and not at all like childhood thoughts and popmedia depictions. This is a problem for two kinds of people: Those who started out as idealists but ended up cynical, seeing science as just a job, and those who are about to choose their path and who have second thoughts. I am in the latter camp and I feel like I have ample company. What’s one to do in this situation?

You know the situation. Someone is presenting his research, PowerPoint slides up, room slightly darkened, and what you understand best is what he communicates nonverbally: “I don’t care either. I know that the question my research answers is not the kind of question that keeps me from falling asleep at night, but hey, it’s not as if that’s what I’m living for.” — at the same time, he goes on talking about the effects of auditory priming on the calcium ion concentration in parvocellular neurons of the chimpanzee lateral geniculate nucleus. If you were thinking in words, your thoughts would be along these lines:

“I want to learn about the world, but this does not feel right. It’s not the fact that what’s presented is a minuscule piece of detail — I care about details. But the reason I care about details is because they are necessary to piece together the larger picture. I want to find answers to the big questions. To study, to travel, to get to know people and to exchange ideas sounds perfect, but then I see those who call themselves ‘scientists’ and, most of the time, I don’t want to live their lives.”

“I don’t want to spend two years working on a project where the result is a 2% improvement of efficiency in some manufacturing procedure and a journal article. At the same time, I don’t want to deceive myself by pretending to tackle the big questions while all I’m engaged in is philosophical word games. I don’t want to solve puzzles for the sake of puzzle-solving. Enjoyment from puzzle-solving has never been my primary motivation for doing science. It may be part of my motivation, but a necessary condition for me to enjoy what I do is to feel that it is significant. I want to believe in choosing science, but reality always gets in the way.”

So, do you choose an academic career, hoping that things will be different for you, or that, by then, you have changed enough not to notice anymore?

“Academia” is a name for a set of standard solutions to standard problems. You don’t have to accept all of them, or any of them, to do science. It’s just the most convenient way. It appears to me that, if you don’t want to, you do not need to make any choices in life — there is always a most convenient way. Once you start out (and you did not have a say in that decision), there is a default answer to almost every question life poses, conditioned on how well you perform at certain tests and on what you state as your interests.

If ‘knowledge’ is high on your list of interests, here’s what to do: Finish high school, get a bachelor’s degree and don’t forget to take some jobs at your university (you want experience in teaching!), write your bachelor’s thesis about a topic that’s somewhat familiar to you (even if it’s not the thing you really want to do — after all, it’s only three months of your life) and get a bachelor’s degree. Next step, join a master’s program, internship included, during which you publish a few papers (research experience is crucial!). Your master’s thesis ends up using knowledge you already have from working on your bachelor’s thesis (because there is not enough time to start from scratch) and luckily you manage to suppress any thoughts about how your research is taking more and more directions that are not truly yours, for the sole reason that that’s what you’re an expert in. By the time you are working on your PhD thesis, you’re thinking that you are probably the only person that understands why one would spend years working on the problem you are trying to solve, and sometimes you are close to admitting that you do not understand it yourself, but rationalization goes a long way. By then, a significant portion of the possibility that once lay before you and that you didn’t appreciate at that time is already gone.

You can deviate from the most convenient way, of course, but only a small minority does. The sad thing about the whole situation is that there are people who want to do science but for whom the most convenient way is soul-crushing, while alternative choices are not an option (think money, acceptance, etc.). Therefore, they either don’t end up in science (despite their interest and motivation) or they do choose academia and suffer from the restrictions it imposes, fighting against the windmills of institutionalization that, like Dementors, suck out any sense of purpose until it’s just a job, fight over, next generation please.

(This is a gloomy way of seeing things, but to me it’s a real problem in search of a solution — not necessarily or primarily for personal reasons, but because, for some people, academia does not live up to its promise, the primacy of the pursuit of knowledge. I believe that it could and should, since they tend to be the kinds of people that would make good scientists.)

Gödels Unvollständigkeitssatz in der Physik

Gödels erster Unvollständigkeitssatz besagt, dass jedes formale System, das widerspruchsfrei ist und das gewisse elementare Arithmetik erlaubt, unvollständig ist bezüglich der Aussagen dieser Arithmetik. Für ZFC, das Axiomensystem, das die Grundlage für große Teile der Mathematik und damit auch für den mathematischen Teil der Physik bildet, sind die Voraussetzungen für Gödels Unvollständigkeitssatz erfüllt: Wenn das System widerspruchsfrei ist, so ist es unvollständig bezüglich seiner arithmetischen Aussagen. Was bedeutet das für die Physik?

Stanley Jaki und Stephen Hawking argumentieren, dass Gödels Satz (bzw. eine Analogie dazu) impliziert, dass es niemals eine Theory of Everything (TOE) geben kann, eine vereinheitlichte Theorie, die alle physikalischen Phänomene verknüpft und erklärt.

Torkel Franzen dagegen bezweifelt in [1] die Relevanz der arithmetischen Unvollständigkeit für die Aussagen einer solchen Theorie:

Gödel’s theorem only tells us that there is an incompleteness in the arithmetical component of the theory. The basic equations of physics, whatever they may be, cannot indeed decide every arithmetical statement, but whether or not they are complete considered as a description of the physical world, and what completeness might mean in such a case, is not something that the incompleteness theorem tells us anything about.

Die Gödelsche Unvollständigkeit eines formalen Systems bedeutet, dass das System Sätze enthält, die als Aussagen über die natürlichen Zahlen interpretiert werden können und für die aus den Axiomen weder die Sätze selbst noch deren Negationen abgeleitet werden können. Eine widerspruchsfreie TOE, die gewisse elementare Arithmetik erlaubt, würde damit manche Gleichungen prinzipiell nicht entscheiden können.

Die physikalische Welt an sich kennt keinen Status “unentscheidbar” — könnte eine TOE dann nicht ebenfalls ohne einen solchen auskommen? Das würde bedeuten, dass mindestens eine der beiden Voraussetzungen für Gödels Satz in dieser Theorie nicht erfüllt wäre. Da die physikalische Welt auch den Status “widersprüchlich” nicht kennt, bliebe nur, die Annahme aufzugeben, dass die TOE gewisse elementare Arithmetik enthält. Das heißt: Sie dürfte unter keiner Interpretation eine Theorie der natürlichen Zahlen enthalten.

Was bleibt? Erstaunlich viel. Es gibt beispielsweise ein Axiomensystem für die elementare Arithmetik der reellen Zahlen, das vollständig und widerspruchsfrei ist! Die Axiome dieses Systems ermöglichen es nicht, die natürlichen Zahlen als Untermenge herauszupicken. Aber braucht die Physik die natürlichen Zahlen und deren Mathematik? Anders gefragt: Kennt die wirkliche Welt natürliche Zahlen?

Ursprung der Idee: Diskussion im Seminar Weltbilder der Naturwissenschaft nach Lektüre von [1] Gödel’s Theorem: An Incomplete Guide to Its Use and Abuse.

But what do you mean?

Formalisierung von Wissen

The problem with informal speculation is that it is easy to be unclear in your writing, and being unclear in your writing usually results from being unclear in your thinking.

Take, for example, my last post, where I was speculating about the properties of recursively improving systems. When I wrote that a system cannot predict a system of greater algorithmic complexity, I did not make clear whether I meant that not all systems of a certain greater complexity can be predicted (which is true) or that no system of a certain greater complexity can be predicted (which is false). For a system to improve recursively with respect to some goal in a way that increases its complexity, there is no need for it to be able to predict all systems of a certain greater complexity. Thus, the whole argument breaks down.

The problem with formal argumentation is that, even if you resort only to the most basic rules of logic, what you prove might not be what you intended to prove.

Take, for example, the paragraph above. The claim that some systems can learn to predict systems of higher algorithmic complexity can be proven formally. You define what you mean by “system”, “complexity” and “learn to predict” in mathematical terms, show an example of two systems, one with lower, one with higher algorithmic complexity, and how the former can learn to predict the latter. From now on, you are free to proclaim that there are simple systems that can learn to predict complex systems. Impressive!

Caveat: Do not mention that you were using the standard definition of “learning to predict” which says that a system learns to predict another system if, after a finite number of observations, the system knows all following outputs of the other system. And, please, stay quiet about the fact that the system that was predicted in your proof did not output anything but zeros after a finite time of complex behavior. Otherwise, people might think that what you have shown has little relation to what is usually meant when we talk about “learning to predict” behavior. And, more destroyingly, they would be right.

As soon as the context changes just a little, as soon your assumptions differ just a little, the value of a formal argument immediately becomes negative. Not only does such an argument say nothing about whether a conclusion is true or false, it will also let you sleep soundly, with the security that there is no need to further think about what you know — it is proven.

Informal arguments, on the other side, cannot provide security in the first place. The truth of informal arguments depends on what you mean by the words you use. Different people associate different meanings with different words, and what was once a discussion soon becomes a game for idle linguists — a fact that is painfully clear if you are doing philosophy. When rational people disagree, even after prolonged discussion, you can almost always trace it back to words being used in slightly different ways.

Your blurry, informal argument based on theorems used out of scope might well convince me. At that point, arguing has long stopped being our joint search for truth. Why bother?