Category: Künstliche Intelligenz

Inference and Preference

‘Beginning to reason is like stepping onto an escalator that leads upward and out of sight. Once we take the first step, the distance to be travelled is independent of our will and we cannot know in advance where we shall end.’

— Peter Singer (1982)

‘You seriously believe a universe in which billions of sentient beings on this planet alone die horrible deaths in war, famine and plauge [sic], a universe in which people have a fleetingly short time to live before their health and strength drain away, a universe in which misunderstanding is endemic and barriers between minds are unbreechable, a universe in which most sentients are forced to serve others to obtain the basic necessities of life and in which a great many live under fear and repression, a universe where the only known planet with sentient life is under constant threat of being wiped clean by a whole range of disasters, where the entire population is under some degree of harmful delusion, doesn’t suck?’

Michael Wilson

There are many situations where we lack knowledge to move the world from an undesired state to a more desired state. We call these situations problems. In the following, I describe what I see as one of the major challenges that a technical solution to the problem of problem solving faces.

If we cannot ignore a problem, what we do is this: We take our limited knowledge about the world, our limited knowledge about what we want, and use our limited reasoning capabilities to find out what we should do to move the world closer to how we want it to be. Given that we believe the world to be like this, and given that we would like the world to be like that, we infer what action we should take.

In general, inference denotes the process of assuming that certain statements about the world are true and deriving what follows for the truth of other statements. Machines are potentially much better at inference than the human mind is. Programs have the potential to encode much more and much more precise knowledge than any one of us could learn in a lifetime. The laws of probability theory and approximations thereof can be used to infer precise knowledge about the world from data and to reason using this knowledge.

The fact that we can use machine inference to solve problems that are too difficult to be solved using human reasoning makes research into inference methods important. When we use machine inference to figure out what the dynamics of protein folding are in order to solve diseases like Alzheimer’s, we do so because, given all our data and our wish to cure the disease, our human minds still cannot figure out the cure on their own. A prerequisite for the use of machine inference is to have the problem statement available formally, as a program, a mathematical object. By singling out a small, well-defined problem, we can formally write down knowledge about the problem domain (or a program for inferring such knowledge from data) and a program that uses this knowledge to solve a particular reasoning task, i.e. to help us in determining how to change things for the better.

Any such small, formal problem statement captures only very little about what we want things to be like more generally. What do we want things to be like? We know that there are some things we want because they lead to other good things — these we call instrumental values — and there are some we want for their own sake — terminal values. We can make guesses about what our terminal values are, what we value for its own sake — joy, freedom, discovery, beauty, kindness — but ultimately, what we want the world to be like is not summed up well by any (or all) of the individual concepts behind our guesses. The name for that which does capture all about what we want is preference.

Because preference is stored opaquely in our brains, we cannot directly access its content, we can only use it to some extent. Similarly, we have little access to how our minds represent concepts like “tree”, “word”, or “spring”. This does not mean that there is no precise structure behind any given concept. On the contrary, the theories that best predict human concept learning and reasoning in recent psychological experiments are those that assume that concepts are represented as probabilistic programs.

Likewise in the case of preference: Our meager introspective abilities obscure the fact that the term ‘preference’ denotes a precise informational structure. This is easy to see where limitations of reasoning make us more uncertain than dictated by what can be deduced from the information that we know is stored in our brains, but is likely to be true more generally.

Take our search for a cure for Alzheimer’s: We have an intuitive idea what results are good and what results are bad — those that actually cure the disease and that do so without side-effects are the good ones. Nonetheless, we are uncertain about how our preferences rank different states of the world; without using machine inference to figure out the dynamics of protein folding, we do not know how preference orders possible states of the world because we cannot tell which state corresponds to a cure and which to a useless substance. By using machine inference to determine which state corresponds to a cure and which does not, we factor out a small part of our preferences that we assume to be independent from the rest (although it is not!). We thus hope to improve our understanding of what this part of our preferences says about the world.

When we — or our machines — work towards the solution of any particular subproblem without taking into account our preferences as a whole, we commit what could be called a mistaken factorization of preference. Preference as a whole makes a statement about what is the best choice at any given point in time, and if we look at only a small part of this statement, we lose value. On the other hand, if we can access the formal statement that our preferences make as a whole, then we may be able to use the reasoning capabilities of machines to determine much more precisely what the best choice looks like than would be possible through introspection.

If preference is a mathematical structure — even if it is currently implemented in our brains in a distributed and implicit way — then what kind of structure could it be? I do not know the answer to this question, but there are situations that are similar in the sense that they also take an intuitive idea and reify it into a mathematical object.

In computer science, there is the notion of the future of a computation. For example, at point # in the program (* 3 (+ 4 #)), what the future holds is that whatever value we hand it, it will add 4, multiply the result by 3, and then do whatever it does to the return value of a program that has finished, e.g. print the result to the screen. The notion of a continuation captures the idea of taking the future of a computation and storing it in an object. If we capture the continuation at #, the future starting from this point becomes a mathematical object, a value that we can pass around just like any other object and that we can reason about formally.

Analogously, we would like to take the diffuse notion of the preferences of a decision-making system (like you and me) and reify it into a formal object. And analogously, we expect this object to be a computational structure that contains information about what will — or, in the case of preference, should — be done in the future, but it may take lots of computation to determine what exactly this information says.

The project of formalizing preference has two parts: understanding the structure of preference (i.e. what kind of object are preferences, how do they compose) and getting at the actual content of human preference (i.e. extracting or pointing to the preferences of a given agent).

There are proposals for what the structure of preference could look like (e.g. preference logics, utility theory), but they seem insufficient in non-trivial situations. Two examples of such situations are (1) that we want our preferences not to lose meaning when it turns out that we have been mistaken about some of the things our preferences talk about (the so-called ontology problem), and (2) that we may have preferences about how we want preferences to interact. Different people appear to want different things, and even within a single mind, seemingly contradicting wishes exist. For example, there are things we want to do and there are things we actually enjoy doing, and these are often not the same. How do we figure out the statement that such a system of preferences makes about what should be done? This is called preference aggregation across agents and could be called compositionality of preference within a single agent.

Formalizing the content of our preferences, i.e. pointing to preference in a precise, machine-readable way, poses similarly challenging problems. The strongest illustration of this that I can currently think of is the following: If our preferences determine which method of formalizing their content is the correct one (namely the one that results in our actual preferences), and if we cannot know or use our preferences with precision until they are available as mathematical objects, then how can we find the correct formalization method? I can imagine that knowing the structure of preference would clarify what properties a method needs to have that allows us to formally refer to the preference content of any given agent, but to what extent this is the case is an open question.

To summarize, the fundamental problem is this: We have only limited access to what we want, and we cannot really figure out what follows from that which we do know about what we want. Machines are potentially much better at reasoning about what follows if we can give a formal description of what we want. However, if we formalize only a few small problems, we lose value due to our limited reasoning about the remaining part of our preferences and due to assuming independence between preferences when in reality they are intertwined. We need to understand preference as a formal object if we want to use machine inference to figure out what should be done to make this world a nicer place.

I thank Vladimir Nesov for useful discussion and for originating many of the ideas mentioned here.

Metabolic Pathways

Metabolic Pathways

Irgendwo hier liegen die Grenzen des Mustererkennungsapparats in unserem Kopf. Das, was wir verstehen können, ist keine obere Schranke für die Komplexität unserer Welt. Aber ich wiederhole mich.

Almost Optimal Planning in Complex Worlds

If you have always wondered why everyone says that your pancakes taste interesting, why women tend to be better at cooking (hint: they think in relations) and what your friends really mean when they rave about heuristic search planning for first-order Markov decision processes, wonder no more. Few answers but lots of pretty pictures, fresh from today’s relational reinforcement learning seminar:

Alan Turing: Computing Machinery and Intelligence

“Half of the meaningful things philosophy has said about artificial intelligence have already been said by Turing 50 years ago.” I do not remember who said this, and it is probably an overstatement, but it is not far from the truth. Even the AI textbook by Russell and Norvig claims that Turing’s paper Computing Machinery and Intelligence contains “virtually all objections [against the possibility of thinking machines] that have been raised in the half century since his paper appeared.”

Here are the slides for the presentation I held in Tuesday’s philosophy class, in the hope that they may be of some use, even if part of it is incomprehensible for anyone who did not read the paper or listen to the talk:

Convergence of Arbitrary Goals to Reproduction

Bird in Zürich

You probably heard of the idea that, at some point in time, we might create systems that solve certain tasks and that get better at these tasks by recursively modifying their code. Here is some scary reasoning:

  1. A system cannot predict (=understand) a system of greater algorithmic complexity.
  2. Therefore, the only way for a system to improve in a way that increases its algorithmic complexity is trial and error, thereby keeping the best results — i.e. evolution.
  3. The only goal that is stable under evolution is rapid reproduction.
  4. Therefore, the only stable goal for recursively self-improving systems is rapid reproduction.

I really hope that someone will point out the flaw in this line of thought or show me the reason why it does not apply to our world and to any self-modifying systems we might create.

Utopia

Hier und jetzt ist der Anfang von allem, was nach uns kommt. Vielleicht werden Sonnensysteme und Galaxien einst unsere Heimat, vielleicht werden Milliarden Leben zu Trillionen, Quadrillionen oder zu einer ähnlich unvorstellbaren Zahl, so viel größer und bedeutender als alles, was jetzt ist, doch es geht nicht ohne uns. Unsere Generation hat sich Fragen und Entscheidungen zu stellen, für die es keine zweite Chance gibt. (Eine davon: Wie überleben wir die nächsten 30 Jahre, wenn fortgeschrittene Bio-, Nano- und Informationstechnologien Einzelpersonen und kleinen Gruppen enormen Einfluss geben?)

Wir Menschen unterscheiden uns nicht großartig in unseren Wünschen. Wir wollen Glück, Freude, Freiheit, Unabhängigkeit, Sicherheit, Wissen, Kreativität, Individualität, Sexualität, Freundschaft und Liebe (nun ja, Männer zumindest). Wir schätzen unser Leben, das unserer Freunde, unserer Familie und das unserer sechs Milliarden Mitmenschen. Trotzdem ziehen wir in verschiedene Richtungen, konkurrieren, intrigieren und machen generell den Eindruck, als ob wir es darauf anlegen, paradox zu handeln.

Wenn wir verstehen, welches Ausmaß die Zukunft hat, die auf dem Spiel steht, und wenn wir uns im Großen und Ganzen einig sind, was uns jetzt und für diese Zukunft wichtig ist, warum funktioniert es dann nicht besserTM?

Lugano

Warum leben wir nicht längst in Utopia, wenigstens asymptotisch?

Die Erklärung, die ich nicht glaube: Es geht nicht besser. Würde man jeden Menschen fragen, wie sehr diese Welt seinen Vorstellungen entspricht, und so zu einem Gesamtbild kommen, so gäbe es nichts, was dieses Bild dauerhaft besser machen könnte. Für diese Erklärung spricht die Anpassungsfähigkeit unseres Gehirns, die daran schuld ist, dass die meisten Änderungen unsere Gesamtzufriedenheit nicht dauerhaft verbessern. Glück ist die erste Ableitung positiver Veränderung. Aber, erstens: Lasst uns die offensichtlichen Unmenschlichkeiten dieser Welt beheben, dann können wir noch einmal darüber reden, ob es nicht besser geht. Zweitens: Manche Leute scheinen immer ein bisschen glücklicher zu sein als andere. Gene und Umwelteinflüsse legen die Biochemie unseres Gehirns fest und wir sind dabei, beides zu verstehen.

Die Erklärung, die ich gerne glauben würde: Die Probleme unserer Welt sind komplex. Wir sind auf dem Weg zu Lösungen, aber die erfordern ein gewisses Mindestmaß an Zeit und Technologie. Es wäre falsch, sich an neue Technologien zu klammern, weil diese beinahe immer zu polaren Zwecken eingesetzt werden können, aber ein Blick auf die Geschichte macht klar, dass neue Technologien Einfluss haben. Die Kombination aus omnipräsentem mobilem Web für die Massen und Suchmaschinen, die natürliche Sprache verstehen, könnte die Wissensverteilung weiter demokratisieren. Prognosemärkte (die von Google, Microsoft, HP und Intel bereits intern eingesetzt werden) könnten Teile der Politik rationaler gestalten, der Anfang der vollständigen Aufzeichnung der Menschheitsgeschichte alle kollektiven Entscheidungen.

Die Erklärung, die immer nur andere betrifft: Das sind alles egoistische Nichtsnutze, denen die Menschheit egal ist, so lange sie Familie, Job und ein halbwegs interessantes Leben haben. Unterstützt werden sie in ihrer Haltung von Wissenschaft und Wirtschaft, die Gedanken über den Lauf der Welt zugunsten kurzfristiger und handfester Resultate bestrafen. Andererseits werden gesellschaftliche Fragen gerne mal eben beim Mittagessen gelöst (wenn gerade keine Fußball-WM stattfindet) und mit zufriedenem “Tja, so müsste man’s machen” abgehakt. Zu Handlungen kommt es natürlich nicht, denn dafür bräuchte man Lösungen, die tatsächlich funktionieren, müsste herausfinden, wie man als einzelner zur Umsetzung beitragen kann, und müsste die Lösungen finden, von denen man selbst profitiert. Wozu die Menschheit retten, wenn es nicht entweder Geld, Sex oder Status bringt oder sowieso auf dem Weg zur Rettung des eigenen Lebens liegt?

Die Erklärung, die mich (und dich!) betrifft: Wir arbeiten auf Teilziele hin, die nicht direkt dem entsprechen, was wir wirklich wollen. Weil das fast jeder tut, weil verschiedene Teilziele oft gegensätzliche Aktionen erfordern und weil die Ziele selbst dann oft nicht erreicht werden, heben sich unsere Bemühungen mehr oder weniger auf. Unser Tun führt so zwar zu neuen Methoden und zu neuen Erkenntnissen über unsere Welt, die indirekt zur Realisierung unserer Wünsche beitragen können, ist aber ineffektiv und potentiell schädlich. In dem Moment, in dem wir uns einer Ideologie verschreiben, weil wir glauben, dass die Durchsetzung von deren Axiomen den Menschen das geben wird, was sie wirklich wollen, arbeiten wir an der Verbreitung der Ideologie und nicht mehr an den eigentlichen Problemen.

Chess

Glücklicherweise ist die Lösung einfach: Wir wählen in jedem Moment die Handlung, die für sich genommen am ehesten unseren Werten entspricht, anstatt uns auf eine Ideologie oder auf ein langfristiges Ziel festzulegen und darauf hinzuarbeiten.

Dummerweise funktioniert sie nicht in jedem Fall, insbesondere dann nicht, wenn wir existentielle Risiken — Katastrophen, die das Ende der Menschheit bedeuten können — in Betracht ziehen und uns der Fortbestand der Menschheit doch ein bisschen kümmert.

KI in zwei Sätzen: Die Annahme, dass wir in absehbarer Zeit auf einen relativ allgemeinen Mustererkennungsalgorithmus stoßen, der mit genügend Rechenpower die Mustererkennungs- und Vorhersagefähigkeiten des menschlichen Gehirns übertrifft, ist (für diese Art von Annahmen) weit verbreitet. Deutlich kontroverser ist die Idee, dass Algorithmen praktisch möglich sein könnten, die Veränderungen an sich selbst vornehmen, um so große Klassen von formalisierbaren Probleme bestmöglich zu lösen — unabhängig davon, wie anspruchsvoll diese Probleme sind, d.h. wie viel Intelligenz zu deren Lösung nötig ist.

Die formale Analyse der Approximierbarkeit theoretischer Modelle von Superintelligenz in unserer physikalischen Welt benötigt unsere Aufmerksamkeit, wenn wir wissen wollen, wo auf unserer Liste existentieller Risiken und Chancen maschinelles Lernen steht. Forschung auf dem Gebiet ist ein langfristiges Vorhaben, eines, das jahrelanges Lernen voraussetzt und das mit signifikanter Wahrscheinlichkeit fehlschlägt. Das ändert nichts daran, dass solche Forschung wirklich, wirklich wichtig ist.

Letzte Woche, bei Pasta und Pizza, hat Jürgen die Frage in die Runde geworfen, wie groß denn der Anteil unserer Zeit sei, den wir für das Jetzt leben, und wie groß der, den wir für die Zukunft leben. Zunächst allgemeine Übereinkunft, dass man seine Zeit wohl kaum so klar kategorisieren könne. Dann, von dem, dessen theoretische Grundlagenforschung auch in 100 Jahren noch relevant sein wird (mehr als jetzt): I don’t care about the future.

I do. Aber vielleicht macht das keinen Unterschied.

AAAI 2007: A Mildly Heretical Conference Review

Of course, I have no idea what I am talking about. I am a first-year undergraduate, I have never been to any other conference, and when a fellow student from Germany asked me “What, then, are you doing here?”, I didn’t really mind. The AAAI conference is one of the most popular international AI conferences, certainly the most popular one in North America. This year it took place in Vancouver, Canada. What follows is a list of the tutorials, talks and technical sessions I attended, each with a one-line summary of what I learned.

In the city

Tutorials I attended

  • General Game Playing is the task to write programs that learn to play arbitrary games solely by being given the rules of a game. Allow games with an infinite number of states and this is as close as you can get to working on AGI without being considered weird by the traditional AI community.
  • Autonomous Bidding Agents: If you want people to bid their true values in an auction, use a sealed-bid second-price auction (similar to eBay’s system). The Trading Agent Competition is a useful testbed if you like game theory and view AI as a tool for automated trading and scheduling.
  • Constraint-Based Local Search in Comet: If you want to solve constraint satisfaction problems (e.g. a Sudoku), don’t want to spend much time programming and like nice visualizations, use Comet.
  • Practical Statisticial Relational AI: We may finally be able to unify logical inference, inductive logic programming, probabilistic inference, and statistical learning using Markov logic networks. Alchemy is supposed to fulfill Prolog’s promises (and it looks like it could).

General Game Playing

Talks I heard

  • Agents, Bodies, Constraints, Dynamics and Evolution: Robot soccer is a great challenge. We can’t completely avoid ethical choices (but please, don’t think ahead too far, let’s start with Asimov). Robot architectures need to provide an easy way to model constraints on the agent’s actions.
  • Graph Identification and Alignment: Nice algorithms for entity resolution, link prediction, and collective classification exist that make it possible to extract useful information from noisy input data, e.g. social relations from a bunch of e-mails.
  • AI in a Moore’s Law World: The Stories of Farecast and KnowItAll: The story of Farecast: You can make lots of money using data mining. The story of KnowItAll: It would be awesome if web search engines understood web pages and answered questions instead of just doing keyword searches, but we’re really not there yet and we need much more computing power for more sophisticated approaches.
  • Representing and Reasoning about Preferences: You can force people to vote truthfully instead of opportunistically by making manipulation a NP-hard problem.
  • Big “A”, Small “I”: Smart Ends from Simple Means: If you are designing a game, don’t compute things the player never gets to see, think about whether sophisticated planning really is better than just-the-next-step computation and remember that Matt Brown likes to do things in a very non-rocket-science kind of way.

Vancouver

Technical sessions

  • Deriving a Large-Scale Taxonomy from Wikipedia: Wikipedia’s categories make for a useful network of concepts and, with a little effort, are just as good as the current largest taxonomies, WordNet and ResearchCyc.
  • A New Algorithm for Generating Equilibria in Massive Zero-Sum Games: The range of skill in a game, i.e. how many different skill levels exist, is a reasonable measure of the complexity of a game. There is an iterative algorithm for computing approximate equilibrium strategies by fixing the opponent’s set of strategies but I don’t remember how it works.
  • Reasoning Patterns of Agents: We can think of five basic reasoning patterns agents use in games — direct effect, influence for no reason, manipulation, signaling and revealing/denying — and these can be used to talk about actions in a more fine-grained way than just saying that an agent maximizes expected utility.
  • On the prospects of building a Working Model of the Visual Cortex: More computing power is good and Jeff Hawkins approach may not be totally off, but we don’t want to mention his name.
  • Modeling Crowd Behavior using Social Comparison Theory: People act similar to those who are like themselves but not too much like themselves. Simulate this and what you get is fairly convincing crowd behavior.
  • Retaliate: Learning Winning Policies in First-Person Shooter Games: Really simple reinforcement learning produces good team strategies for Unreal Tournament’s domination mode.
  • Analyzing Reading Behavior by Blog Mining: People who write comments on your blog tend to be regular readers. People who visit your blog are likely to visit similar blogs, too. If you don’t believe this, remember that we can still mention preferential attachment in our paper and thus have a few formulae that make the obvious much more convincing.

Arriving

(Not quite) random remarks

  • Man vs. Machine Poker Tournament: Poker players are lots of fun. This is the last year the human players won, but it is still not clear whether the bot that wins next year will be a boring equilibrium player or a learning bot that exploits its opponent’s weaknesses.
  • The outside view of “traditional” AI research is right. I got the impression that most people are happy working on smallish problems. Let’s improve an existing optimization algorithm here and think about a new heuristic there, but don’t even mention general intelligence. That’s science fiction.
  • And wrong. Whatever you do, be it natural language processing or robotics, the signs are there that quick hacks won’t get you anywhere near intelligent behavior, that the combination of faster hardware and new neuroscience provides an upper bound for the advent of silicon intelligence and that there are ethical and societal issues that need to be taken care of.
  • Times change. On the way back from the conference, an uncle of mine who lives in Vancouver told me about his youth. Most of the time progress feels slow and boring. When you just return from a place where 200 people think about how to make the international network of computers reply to questions in an intelligent way and someone tells you about how he started out as a kind of millwright 50 years ago, that’s not the case.

Machine Learning from Scratch

Ich habe einige Zahlen, will die nächste in der Folge vorhersagen und weiß nichts über die Herkunft der Zahlen. Kann ich eine Vorhersage treffen? (Nein.)

1010101010101010101010101010101010101010_

Nun habe ich dieselben Zahlen, darf aber annehmen, dass einfache Erklärungen wahrscheinlicher sind als komplizierte. Kann ich jetzt eine Vorhersage treffen? (Nein.)

1010101010101010101010101010101010101010_

Ich nehme zusätzlich an, dass die Folge auf irgendeine Weise berechnet werden kann. Kann ich jetzt die wahrscheinlichste nächste Zahl vorhersagen? (Nein, nicht in endlicher Zeit. Das allgemeine Vorhersageproblem ist unlösbar.)

1010101010101010101010101010101010101010_

Kann ich einen Algorithmus schreiben, dessen Ausgabe gegen die wahrscheinlichste nächste Zahl konvergiert, wenn die Laufzeit gegen unendlich geht? (Ja. Dovetailer über alle möglichen Programme, angefangen mit dem kürzesten; die Ausgabe des kürzesten Programms, das die Zahlen und eine zusätzliche ausgibt, ist die aktuelle Hypothese.)

Wir Menschen treffen jeden Tag Vorhersagen. Der Vorteil, den wir gegenüber derzeitigen Algorithmen haben, liegt in den zusätzlichen Annahmen, die wir unbewusst machen, in der Art von inductive bias, mit dem uns die Evolution ausgestattet hat. Die Aufgabe von Forschern auf dem Gebiet des maschinellen Lernens ist es, den Suchraum von Algorithmen derart einzuschränken, dass die Laufzeit der Algorithmen polynomiell wird, und dabei möglichst wenige Lösungen für Vorhersageprobleme auszuschließen, die für unsere Welt relevant sind.

Der Raum des Möglichen

Ich bin Determinist und jede Sekunde entscheide ich mich zwischen unzähligen Handlungen. Mit der Einsicht, dass Lazy Reason nicht alltagstauglich ist, bleibt nur nicht fassbare Freiheit.

The infinite possibilities each day holds should stagger the mind. The sheer number of experiences I could have is uncountable, breathtaking. And I’m sitting here refreshing my inbox. We live trapped in loops. reliving a few days over and over, and we envision only a handful of paths laid out ahead of us. We see the same things each day, we respond the same way, we think the same thoughts, each day a slight variation on the last, every moment smoothly following the gentle curves of societal norms. We act like if we just get through today, tomororrow our dreams will come back to us. — xkcd

In einer Welt, die ohne vorgegebenen Sinn einfach existiert, erfinden wir uns und das, was wir als sinnvoll ansehen, auf dem Weg in die Zukunft. Jegliche Gründe, Ziele und Zwecke jenseits der biologischen erschaffen wir selbst. Aus “Wie soll ich handeln?” wird “Wer will ich sein?” und “In welcher Welt will ich leben?”.

Mit jeder Handlung machen wir aus dem aktuellen Zustand unserer Welt einen anderen. Der Raum aller möglichen Zustände ist die Menge der Zustände, die keine physikalischen Gesetze verletzen. Denkbar ist eine astronomische Zahl, wünschenswert sind die wenigsten davon. Die Menge der Zustände, die bewusstes Leben enthalten, macht nur eine winzige Ecke im Raum aller möglichen Zustände aus. Unsere Welt ist ein Punkt irgendwo in dieser Ecke.

Unsere Position im Raum aller möglichen Zustände

Manche Zustände unterscheiden sich stärker voneinander als andere. Der Zustand der Welt, in der die Tasse Tee neben mir zwei Zentimeter weiter links steht, liegt näher am aktuellen als der, in dem sich die Tasse in einen feuerspeienden Drachen verwandelt hat. Ein mögliches Maß für den Abstand von zwei Zuständen wäre eine Art Informationsdistanz: Die Länge oder Laufzeit des kürzesten Algorithmus, der aus einer vollständigen Beschreibung von Zustand A die entsprechende Beschreibung von Zustand B berechnet.

Indem ich mich für eine Handlung entscheide, wähle ich einen unserer Nachbarn im im Raum aller möglichen Zustände. Wie sieht die Teilmenge der Zustände aus, die vom jetzigen Zustand der Welt aus durch mein Handeln oder Nicht-Handeln erreicht werden können? Das bestimmt, welchen Einfluss ich mit meinen Entscheidungen als einzelner auf die Welt habe.

Erreichbare Zustände

Die Frage, was festlegt, welche Zustände ich erreichen kann und welche nicht, führt unmittelbar zu der Frage danach, was unsere Position im Raum aller möglichen Zustände bis jetzt am stärksten verändert hat. Die Antwort definiert, was Optimierungsprozesse sind: Systeme, die den Zustand unserer Welt auf einen kleinen Zielraum mit bestimmten Eigenschaften hin bewegen.

  • Evolution ist ein Optimierungsprozess, der Replikatoren — Bakterien, Tiere, Menschen und die Gene dahinter — durch Mutation, Rekombination und Selektion auf effektivere Vermehrung hin optimiert.
  • Ein Schachcomputer ist ein Optimierungsprozess, der aus der Vielzahl möglicher Kombinationen von Schachzügen die auswählt, die die Position der Figuren auf einem Schachbrett so verändern, dass sich die Welt in einen Zielraum mit der Eigenschaft “Der Schachcomputer gewinnt.” bewegt.
  • Menschliche Intelligenz ist ein mächtiger Optimierungsprozess, der für verschiedenste Ziele eingesetzt werden kann. Rationalität erreicht klar definierte Ziele, nonlineares Handeln die unbewussten.

Cognitive Science ist die Lehre von den Optimierungsprozessen. In Psychologie und Neurobiologie wird der effektivste bekannte Optimierungsprozess, das menschliche Gehirn, analysiert, in Mathe, Informatik, Statistik und Logik werden die methodische Grundlagen für den Bau von künstlichen Optimierungsprozessen unterrichtet.

Optimierung ist ein Vorhersageproblem. Jeder Maschine steht eine festgelegte Menge an Aktionen zur Verfügung. Um ein Ziel zu erreichen, muss die Maschine vorhersagen, welche Kombination aus Aktionen die Welt dem Zielzustand am nächsten bringt. Dass wir Menschen die Auswirkungen unserer Handlungen vorhersagen können, zeigt, dass Quanten- und Chaoseffekte bei Vorhersagen umgangen werden können, wenn man Abstriche bei der Genauigkeit der Prognosen macht.

Intelligenz ist die Fähigkeit, akkurate Vorhersagen zu treffen um Aktionsfolgen zu finden, die unsere Zukunft auf kleine, weit entfernte Regionen im Raum des Möglichen hinsteuern. Die Frage, ob künstliche Intelligenz möglich ist, lautet eigentlich: “Wie weit werden wir uns übertreffen? Wo liegen die Grenzen der Berechenbarkeit?”

Weil die Grenzen, denen wir unterliegen, universell sind, sehen wir sie nicht. Algorithmen, die Information optimal extrahieren, unterliegen keinen kognitiven Fehlern. Die unvoreingenommene Instrumentalisierung aller verfügbaren Mittel stellt einen enormen Machtzuwachs dar; als Menschen schaffen wir es oft nicht, funktionaler Fixiertheit zu entrinnen, sobald wir einmal gelernt haben, wozu etwas gut ist.

Im nächsten und letzten Schritt, der genauso unvermeidbar und unintuitiv ist wie die davor, schreiben wir Optimierungsprozesse, die den Teil ihrer selbst restrukturieren, der für das Optimieren zuständig ist. Algorithmen, die vorhersagen, welche Veränderungen es braucht, um bessere Vorhersagen zu treffen. Prozesse, die Welt auf Zielregionen hin bewegen, von denen wir nicht gedacht hätten, dass sie in unserer unmittelbaren Nachbarschaft liegen.

Wohin

Goodbye, Searle

For a long time, two types of entities shared our world. On the one hand, there were entities that had intentionality and that behaved in a way that lead us to conclude that they did, namely human beings. On the other hand, there were entities like cars and rocks that clearly did not have intentionality and that did not show behavior that could have lead us to conclude that they do. Soon there may be a third type of entities: Robots that show behavior similar to the behavior of human beings and that do neither clearly possess intentionality nor clearly not possess intentionality.

It is amazing that, after almost 30 years of philosophical discussions, John Searle’s argument against the possibility of programming a robot in a way that makes it really think is still alive. I am now going to analyze what it means for an entity to have intentionality, then give a short account of the strongest version of Searle’s thought experiment and finally argue that the only way to deny intentionality to robots on the grounds of Searle’s thought experiment is to assume a priori that intentionality is tied to biochemical processes. Read on »