<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: Optimale Vorhersagen</title>
	<atom:link href="http://www.aiplayground.org/artikel/prediction/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.aiplayground.org/artikel/prediction/</link>
	<description>Thoughts on artificial intelligence, cognitive science, academia, and life in general.</description>
	<lastBuildDate>Thu, 19 Aug 2010 14:51:14 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
	<item>
		<title>By: Benedict</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-1472</link>
		<dc:creator>Benedict</dc:creator>
		<pubDate>Sat, 24 Mar 2007 16:02:03 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-1472</guid>
		<description>An Andreas:

&quot;Weil intelligentes Leben nur in Welten entstehen kann, die gen&#252;gend Regelm&#228;&#223;igkeit aufweisen, so dass zuverl&#228;ssige Vorhersagen &#252;ber die Umgebung m&#246;glich sind, und gen&#252;gend Komplexit&#228;t, so dass Konstrukte wie das menschliche Gehirn evolution&#228;r entstehen k&#246;nnen.&quot;

Mhm... das klingt so, als w&#252;rde irgendetwas wie &quot;Intelligenz&quot; auch unabh&#228;ngig von der Welt existieren. (Du meinst mit &quot;Welt&quot; doch die Gesetzm&#228;&#223;igkeiten unseres Universums, und nicht &quot;die Erde&quot;, oder?)
Ich w&#252;rde spontan sagen, dass Intelligenz doch den Gesetzen unserer Welt folgt. Also ist Intelligenz immer abh&#228;ngig von der Welt in der sie entsteht. Und dann ist auch klar, dass die Welt sch&#246;n ist, wenn der Betrachter, der sie als sch&#246;n betrachtet, ihr entspringt. Und das w&#228;re dann sogar unabh&#228;ngig davon, wie die Welt gebaut ist, solange ein bewusster Beobachter entsteht. Ok, ist aber alles Spekulatius.</description>
		<content:encoded><![CDATA[<p>An Andreas:</p>
<p>&#8220;Weil intelligentes Leben nur in Welten entstehen kann, die gen&#252;gend Regelm&#228;&#223;igkeit aufweisen, so dass zuverl&#228;ssige Vorhersagen &#252;ber die Umgebung m&#246;glich sind, und gen&#252;gend Komplexit&#228;t, so dass Konstrukte wie das menschliche Gehirn evolution&#228;r entstehen k&#246;nnen.&#8221;</p>
<p>Mhm&#8230; das klingt so, als w&#252;rde irgendetwas wie &#8220;Intelligenz&#8221; auch unabh&#228;ngig von der Welt existieren. (Du meinst mit &#8220;Welt&#8221; doch die Gesetzm&#228;&#223;igkeiten unseres Universums, und nicht &#8220;die Erde&#8221;, oder?)<br />
Ich w&#252;rde spontan sagen, dass Intelligenz doch den Gesetzen unserer Welt folgt. Also ist Intelligenz immer abh&#228;ngig von der Welt in der sie entsteht. Und dann ist auch klar, dass die Welt sch&#246;n ist, wenn der Betrachter, der sie als sch&#246;n betrachtet, ihr entspringt. Und das w&#228;re dann sogar unabh&#228;ngig davon, wie die Welt gebaut ist, solange ein bewusster Beobachter entsteht. Ok, ist aber alles Spekulatius.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andreas</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-1438</link>
		<dc:creator>Andreas</dc:creator>
		<pubDate>Sat, 24 Mar 2007 12:20:26 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-1438</guid>
		<description>An Lucas:

&lt;blockquote&gt;Daher wirst du eine Entscheidungsregel brauchen, die entscheidet, welche Werte in die Berechnung mit einbezogen werden und welche nicht - genauso wie du gezwungen bist, dich bei einem aktuellen Zustand auf bestimmte Teilbereiche (Faktoren) zu konzentrieren.&lt;/blockquote&gt;

Mich k&#252;mmert, wie ein Algorithmus aussieht, der f&#252;r eine Menge an Datenpunkten &lt;em&gt;jeden&lt;/em&gt; Datenpunkt betrachtet und &lt;em&gt;jeden&lt;/em&gt; &quot;in die Rechnung miteinbezieht&quot;. Deine Entscheidungsregel, die besagt, welcher Wert in die Rechnung miteinbezogen wird, entspricht einem gewichtenden &quot;in die Rechnung miteinbeziehen&quot;.

Wie bestimmt wird, wie die Menge an Datenpunkten aussehen soll, mag Grund zu der Annahme sein, dass Physiker und Astronomen demn&#228;chst nicht v&#246;llig arbeitslos werden, ist aber f&#252;r mich irrelevant. (Okay, nicht v&#246;llig irrelevant. Ein optimaler Algorithmus, wie er von mir beschrieben wurde, kann auch zur Optimierung der einzubeziehenden Daten verwendet werden.)

&lt;blockquote&gt;Dann l&#228;sst du also nur Hypothesen zu, die EXAKT diese Sequenz ausgeben?&lt;/blockquote&gt;

Was ich oben geschrieben habe, gilt auch f&#252;r probabilistische Vorhersagealgorithmen. Wie ein optimaler Algorithmus aussieht, h&#228;ngt dann von der Gewichtung der Exaktheit der &#220;bereinstimmung mit der Sequenz einerseits und der K&#252;rze des Algorithmus andererseits ab. Je fehlerfreier die vorhandenen Daten, desto st&#228;rker muss die Exaktheit der &#220;bereinstimmung gewichtet werden.

Dass eine exakte Vorhersage des n&#228;chsten Zustands unm&#246;glich ist, &lt;a href=&quot;#comment-332&quot; rel=&quot;nofollow&quot;&gt;ist klar&lt;/a&gt;.</description>
		<content:encoded><![CDATA[<p>An Lucas:</p>
<blockquote><p>Daher wirst du eine Entscheidungsregel brauchen, die entscheidet, welche Werte in die Berechnung mit einbezogen werden und welche nicht &#8211; genauso wie du gezwungen bist, dich bei einem aktuellen Zustand auf bestimmte Teilbereiche (Faktoren) zu konzentrieren.</p></blockquote>
<p>Mich k&#252;mmert, wie ein Algorithmus aussieht, der f&#252;r eine Menge an Datenpunkten <em>jeden</em> Datenpunkt betrachtet und <em>jeden</em> &#8220;in die Rechnung miteinbezieht&#8221;. Deine Entscheidungsregel, die besagt, welcher Wert in die Rechnung miteinbezogen wird, entspricht einem gewichtenden &#8220;in die Rechnung miteinbeziehen&#8221;.</p>
<p>Wie bestimmt wird, wie die Menge an Datenpunkten aussehen soll, mag Grund zu der Annahme sein, dass Physiker und Astronomen demn&#228;chst nicht v&#246;llig arbeitslos werden, ist aber f&#252;r mich irrelevant. (Okay, nicht v&#246;llig irrelevant. Ein optimaler Algorithmus, wie er von mir beschrieben wurde, kann auch zur Optimierung der einzubeziehenden Daten verwendet werden.)</p>
<blockquote><p>Dann l&#228;sst du also nur Hypothesen zu, die EXAKT diese Sequenz ausgeben?</p></blockquote>
<p>Was ich oben geschrieben habe, gilt auch f&#252;r probabilistische Vorhersagealgorithmen. Wie ein optimaler Algorithmus aussieht, h&#228;ngt dann von der Gewichtung der Exaktheit der &#220;bereinstimmung mit der Sequenz einerseits und der K&#252;rze des Algorithmus andererseits ab. Je fehlerfreier die vorhandenen Daten, desto st&#228;rker muss die Exaktheit der &#220;bereinstimmung gewichtet werden.</p>
<p>Dass eine exakte Vorhersage des n&#228;chsten Zustands unm&#246;glich ist, <a href="#comment-332" rel="nofollow">ist klar</a>.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andreas</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-1436</link>
		<dc:creator>Andreas</dc:creator>
		<pubDate>Sat, 24 Mar 2007 11:22:35 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-1436</guid>
		<description>An Benedict:

&lt;blockquote&gt;Warum scheint unsere Welt so einem Prinzip wie “Sch&#246;nheit” zu folgen? &lt;/blockquote&gt;

Weil intelligentes Leben nur in Welten entstehen kann, die gen&#252;gend Regelm&#228;&#223;igkeit aufweisen, so dass zuverl&#228;ssige Vorhersagen &#252;ber die Umgebung m&#246;glich sind, und gen&#252;gend Komplexit&#228;t, so dass Konstrukte wie das menschliche Gehirn evolution&#228;r entstehen k&#246;nnen.

Beim Blick auf den Wikipedia-Artikel zum Thema Sch&#246;nheit ist mir folgender Absatz aufgefallen: &quot;J&#252;rgen Schmidhubers komplexit&#228;tsbasierte Theorie der Sch&#246;nheit sieht daher das subjektiv sch&#246;nste Muster aus einer Reihe vergleichbarer Muster als dasjenige mit der k&#252;rzesten Beschreibung in der Musterkodiersprache des subjektiven Beobachters.&quot; -- Jep, das ist &lt;a href=&quot;http://www.idsia.ch/~juergen/&quot; rel=&quot;nofollow&quot;&gt;&lt;em&gt;der&lt;/em&gt; Schmidhuber&lt;/a&gt;.

&lt;blockquote&gt;Wieso k&#246;nnen Menschen Kraft ihres Kopfes so sehr tiefgreifende, vorhersagekr&#228;ftigen Theorien aufstellen, ohne rekursiv oder wie auch immer sich Messungen ann&#228;hernd zu arbeiten?&lt;/blockquote&gt;

Weil manche Menschen einen sehr effektiven Ansatz entwickelt haben, um m&#246;glichst kurze Beschreibungen komplexer Ph&#228;nomene zu finden. &lt;a href=&quot;http://en.wikipedia.org/wiki/Minimum_description_length&quot; rel=&quot;nofollow&quot;&gt;Sehr kurze Beschreibungen&lt;/a&gt; zu finden ist nicht umsonst ein KI-vollst&#228;ndiges Problem.</description>
		<content:encoded><![CDATA[<p>An Benedict:</p>
<blockquote><p>Warum scheint unsere Welt so einem Prinzip wie “Sch&#246;nheit” zu folgen? </p></blockquote>
<p>Weil intelligentes Leben nur in Welten entstehen kann, die gen&#252;gend Regelm&#228;&#223;igkeit aufweisen, so dass zuverl&#228;ssige Vorhersagen &#252;ber die Umgebung m&#246;glich sind, und gen&#252;gend Komplexit&#228;t, so dass Konstrukte wie das menschliche Gehirn evolution&#228;r entstehen k&#246;nnen.</p>
<p>Beim Blick auf den Wikipedia-Artikel zum Thema Sch&#246;nheit ist mir folgender Absatz aufgefallen: &#8220;J&#252;rgen Schmidhubers komplexit&#228;tsbasierte Theorie der Sch&#246;nheit sieht daher das subjektiv sch&#246;nste Muster aus einer Reihe vergleichbarer Muster als dasjenige mit der k&#252;rzesten Beschreibung in der Musterkodiersprache des subjektiven Beobachters.&#8221; &#8212; Jep, das ist <a href="http://www.idsia.ch/~juergen/" rel="nofollow"><em>der</em> Schmidhuber</a>.</p>
<blockquote><p>Wieso k&#246;nnen Menschen Kraft ihres Kopfes so sehr tiefgreifende, vorhersagekr&#228;ftigen Theorien aufstellen, ohne rekursiv oder wie auch immer sich Messungen ann&#228;hernd zu arbeiten?</p></blockquote>
<p>Weil manche Menschen einen sehr effektiven Ansatz entwickelt haben, um m&#246;glichst kurze Beschreibungen komplexer Ph&#228;nomene zu finden. <a href="http://en.wikipedia.org/wiki/Minimum_description_length" rel="nofollow">Sehr kurze Beschreibungen</a> zu finden ist nicht umsonst ein KI-vollst&#228;ndiges Problem.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Lucas</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-1365</link>
		<dc:creator>Lucas</dc:creator>
		<pubDate>Fri, 23 Mar 2007 13:48:56 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-1365</guid>
		<description>&lt;blockquote&gt;Wer an Faktoren und an die Aufteilung der Zeit zwischen der Suche nach Faktoren und der eigentlichen Prognose denkt, hat sich bereits auf einen konkreten und vermutlich nicht optimalem Ansatz f&#252;r das Vorhersageproblem festgelegt.&lt;/blockquote&gt;

Anderes, einfacheres Problem: Berechne aus einer ungeordneten Liste von Werten das Maximum. Wie kannst du dir jemals sicher sein, das Maximum gefunden zu haben, bevor du dir nicht alle Werte angeschaut hast?
So essentiell wie die Betrachtung der Werte f&#252;r das Auffinden eines Maximums ist, ist es auch der aktuelle Zustand f&#252;r eine Prognose. Doch unter Zeitdruck (d.h. unter Ber&#252;cksichtung der Ressource Zeit) wirst du dir nicht alle Werte anschauen k&#246;nnen. Schon gar nicht, wenn es nahezu unendlich viele gibt. Daher wirst du eine Entscheidungsregel brauchen, die entscheidet, welche Werte in die Berechnung mit einbezogen werden und welche nicht - genauso wie du gezwungen bist, dich bei einem aktuellen Zustand auf bestimmte Teilbereiche (Faktoren) zu konzentrieren.

&lt;blockquote&gt;Wir wissen nicht, durch welches Programm sich diese Sequenz — und damit der n&#228;chste Datenpunkt in dieser Sequenz — berechnen l&#228;sst. Jedes Programm, &lt;i&gt;das diese Sequenz ausgibt&lt;/i&gt;, ist eine unserer Hypothesen.&lt;/blockquote&gt;

Dann l&#228;sst du also nur Hypothesen zu, die EXAKT diese Sequenz ausgeben? Wenn dies der Fall ist und nur solche Hypothesen als optimal zu bezeichnen sind, dann wage ich zu behaupten, dass sie in der Praxis keinerlei Relevanz haben, denn die Realit&#228;t l&#228;sst sich nicht zu 100% vorhersagen.

Sch&#246;ne Gr&#252;&#223;e,
Lucas</description>
		<content:encoded><![CDATA[<blockquote><p>Wer an Faktoren und an die Aufteilung der Zeit zwischen der Suche nach Faktoren und der eigentlichen Prognose denkt, hat sich bereits auf einen konkreten und vermutlich nicht optimalem Ansatz f&#252;r das Vorhersageproblem festgelegt.</p></blockquote>
<p>Anderes, einfacheres Problem: Berechne aus einer ungeordneten Liste von Werten das Maximum. Wie kannst du dir jemals sicher sein, das Maximum gefunden zu haben, bevor du dir nicht alle Werte angeschaut hast?<br />
So essentiell wie die Betrachtung der Werte f&#252;r das Auffinden eines Maximums ist, ist es auch der aktuelle Zustand f&#252;r eine Prognose. Doch unter Zeitdruck (d.h. unter Ber&#252;cksichtung der Ressource Zeit) wirst du dir nicht alle Werte anschauen k&#246;nnen. Schon gar nicht, wenn es nahezu unendlich viele gibt. Daher wirst du eine Entscheidungsregel brauchen, die entscheidet, welche Werte in die Berechnung mit einbezogen werden und welche nicht &#8211; genauso wie du gezwungen bist, dich bei einem aktuellen Zustand auf bestimmte Teilbereiche (Faktoren) zu konzentrieren.</p>
<blockquote><p>Wir wissen nicht, durch welches Programm sich diese Sequenz — und damit der n&#228;chste Datenpunkt in dieser Sequenz — berechnen l&#228;sst. Jedes Programm, <i>das diese Sequenz ausgibt</i>, ist eine unserer Hypothesen.</p></blockquote>
<p>Dann l&#228;sst du also nur Hypothesen zu, die EXAKT diese Sequenz ausgeben? Wenn dies der Fall ist und nur solche Hypothesen als optimal zu bezeichnen sind, dann wage ich zu behaupten, dass sie in der Praxis keinerlei Relevanz haben, denn die Realit&#228;t l&#228;sst sich nicht zu 100% vorhersagen.</p>
<p>Sch&#246;ne Gr&#252;&#223;e,<br />
Lucas</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Benedict</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-1208</link>
		<dc:creator>Benedict</dc:creator>
		<pubDate>Wed, 21 Mar 2007 15:24:14 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-1208</guid>
		<description>Hi, 
ich will mich hier gar nicht in die Diskussion einmischen (das k&#246;nnte ich auch gar nicht ;)

Ich lese gerade die Einstein-Biografie von J&#252;rgen Neffe- so ganz intuitiv denke ich, dass der menschliche Geist in der Lage ist, ziemlich &#252;berraschende und auch gar nicht nur auf Messungen beruhende Aussagen zu machen, die dann erstaunlich weit reichende Folgen haben. Einstein hat seine Relativit&#228;tstheorie mit Papier und Bleistift gefunden. (Er war ja theoretische Physiker.) Nat&#252;rlich wusste er von der Arbeit der Experimentalphysiker seiner Zeit, aber trotzdem hat seine Theorie, gr&#246;&#223;tenteils entstanden aus Gedankenexperimenten, Vorhersagen m&#246;glich gemacht, an denen die Experimentalphysik immer noch zu knappsen hat, z.B. steht die Messung von Gravitationswellen noch aus.

Das finde ich ziemlich krass :)
Wieso ist der menschliche Geist dazu &#252;berhaupt in der Lage? Haben wir mehr evolution&#228;res a priori-Wissen, als ich so spontan denke? Warum scheint unsere Welt so einem Prinzip wie &quot;Sch&#246;nheit&quot; zu folgen? (Auch wenn mancher die Quantenphysik nicht als &quot;sch&#246;n&quot; bezeichnen mag, inklusive Einstein, auch wenn sie ja sicher richtig ist.) 
Meine Frage also ist: Wieso k&#246;nnen Menschen Kraft ihres Kopfes so sehr tiefgreifende, vorhersagekr&#228;ftigen Theorien aufstellen, ohne rekursiv oder wie auch immer sich Messungen ann&#228;hernd zu arbeiten? Wieso spielt so viel &quot;Philosophie&quot; mit? OK, ist evtl. etwas abseits des Themas, aber egal ;)</description>
		<content:encoded><![CDATA[<p>Hi,<br />
ich will mich hier gar nicht in die Diskussion einmischen (das k&#246;nnte ich auch gar nicht ;)</p>
<p>Ich lese gerade die Einstein-Biografie von J&#252;rgen Neffe- so ganz intuitiv denke ich, dass der menschliche Geist in der Lage ist, ziemlich &#252;berraschende und auch gar nicht nur auf Messungen beruhende Aussagen zu machen, die dann erstaunlich weit reichende Folgen haben. Einstein hat seine Relativit&#228;tstheorie mit Papier und Bleistift gefunden. (Er war ja theoretische Physiker.) Nat&#252;rlich wusste er von der Arbeit der Experimentalphysiker seiner Zeit, aber trotzdem hat seine Theorie, gr&#246;&#223;tenteils entstanden aus Gedankenexperimenten, Vorhersagen m&#246;glich gemacht, an denen die Experimentalphysik immer noch zu knappsen hat, z.B. steht die Messung von Gravitationswellen noch aus.</p>
<p>Das finde ich ziemlich krass :)<br />
Wieso ist der menschliche Geist dazu &#252;berhaupt in der Lage? Haben wir mehr evolution&#228;res a priori-Wissen, als ich so spontan denke? Warum scheint unsere Welt so einem Prinzip wie &#8220;Sch&#246;nheit&#8221; zu folgen? (Auch wenn mancher die Quantenphysik nicht als &#8220;sch&#246;n&#8221; bezeichnen mag, inklusive Einstein, auch wenn sie ja sicher richtig ist.)<br />
Meine Frage also ist: Wieso k&#246;nnen Menschen Kraft ihres Kopfes so sehr tiefgreifende, vorhersagekr&#228;ftigen Theorien aufstellen, ohne rekursiv oder wie auch immer sich Messungen ann&#228;hernd zu arbeiten? Wieso spielt so viel &#8220;Philosophie&#8221; mit? OK, ist evtl. etwas abseits des Themas, aber egal ;)</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: tiefgedacht &#187; Eine Theorie für alles</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-856</link>
		<dc:creator>tiefgedacht &#187; Eine Theorie für alles</dc:creator>
		<pubDate>Sat, 17 Mar 2007 23:45:11 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-856</guid>
		<description>[...] optimaler Vorhersagealgorithmus muss alle m&#246;glichen Einflussfaktoren kennen, deren tats&#228;chlichen Einfluss beurteilen, [...]</description>
		<content:encoded><![CDATA[<p>[...] optimaler Vorhersagealgorithmus muss alle m&#246;glichen Einflussfaktoren kennen, deren tats&#228;chlichen Einfluss beurteilen, [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andreas</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-704</link>
		<dc:creator>Andreas</dc:creator>
		<pubDate>Wed, 14 Mar 2007 20:20:06 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-704</guid>
		<description>Deswegen die Einschr&#228;nkung &quot;wozu auch die algorithmische Komplexit&#228;t z&#228;hlen kann&quot;. Dass ich damit die Komplexit&#228;t der vorherzusagenden Sequenz und nicht die des Vorhersagealgorithmus gemeint habe, war undeutlich. Ich habe bis jetzt noch keine feste Meinung zur praktischen Relevanz der Ergebnisse von Shane Legg. H&#228;tte aber gerne eine — das Thema (und vieles von dem, was bei Idsia gemacht wird) ist spannend.

Shane Legg beweist doch, dass es keinen Vorhersagealgorithmus der Kolmogorov-Komplexit&#228;t k gibt, der lernen kann, &lt;em&gt;alle&lt;/em&gt; Sequenzen mit einer Komplexit&#228;t von ungef&#228;hr k vorherzusagen, auch nicht probabilistisch (weil sich dann aus dem Algorithmus leicht eine Sequenz konstruieren lie&#223;e, f&#252;r die der Algorithmus fehlschl&#228;gt).

Er beweist desweiteren, dass ab einer bestimmten Komplexit&#228;t k des Vorhersagealgorithmus nicht mehr bewiesen werden kann, dass der Algorithmus zu der Menge der Vorhersagealgorithmen geh&#246;rt, die lernen k&#246;nnen, &lt;em&gt;alle&lt;/em&gt; Sequenzen mit h&#246;chstens Komplexit&#228;t k vorherzusagen.

Ist denn damit schon gezeigt, dass es keinen Vorhersagealgorithmus geben kann, der beweisbar &lt;em&gt;mehr&lt;/em&gt; Sequenzen (oder &lt;em&gt;mehr&lt;/em&gt; Sequenzen mit h&#246;chstens einer bestimmten Komplexit&#228;t) lernen kann als jeder andere Algorithmus gleicher Komplexit&#228;t? Oder, schw&#228;cher: Als jeder andere Algorithmus gleicher Komplexit&#228;t, von dem bewiesen werden kann, welche Menge an Sequenzen er lernen kann?

&lt;em&gt;Zuletzt bearbeitet am 18.3.2007, 00:10 Uhr.&lt;/em&gt;</description>
		<content:encoded><![CDATA[<p>Deswegen die Einschr&#228;nkung &#8220;wozu auch die algorithmische Komplexit&#228;t z&#228;hlen kann&#8221;. Dass ich damit die Komplexit&#228;t der vorherzusagenden Sequenz und nicht die des Vorhersagealgorithmus gemeint habe, war undeutlich. Ich habe bis jetzt noch keine feste Meinung zur praktischen Relevanz der Ergebnisse von Shane Legg. H&#228;tte aber gerne eine — das Thema (und vieles von dem, was bei Idsia gemacht wird) ist spannend.</p>
<p>Shane Legg beweist doch, dass es keinen Vorhersagealgorithmus der Kolmogorov-Komplexit&#228;t k gibt, der lernen kann, <em>alle</em> Sequenzen mit einer Komplexit&#228;t von ungef&#228;hr k vorherzusagen, auch nicht probabilistisch (weil sich dann aus dem Algorithmus leicht eine Sequenz konstruieren lie&#223;e, f&#252;r die der Algorithmus fehlschl&#228;gt).</p>
<p>Er beweist desweiteren, dass ab einer bestimmten Komplexit&#228;t k des Vorhersagealgorithmus nicht mehr bewiesen werden kann, dass der Algorithmus zu der Menge der Vorhersagealgorithmen geh&#246;rt, die lernen k&#246;nnen, <em>alle</em> Sequenzen mit h&#246;chstens Komplexit&#228;t k vorherzusagen.</p>
<p>Ist denn damit schon gezeigt, dass es keinen Vorhersagealgorithmus geben kann, der beweisbar <em>mehr</em> Sequenzen (oder <em>mehr</em> Sequenzen mit h&#246;chstens einer bestimmten Komplexit&#228;t) lernen kann als jeder andere Algorithmus gleicher Komplexit&#228;t? Oder, schw&#228;cher: Als jeder andere Algorithmus gleicher Komplexit&#228;t, von dem bewiesen werden kann, welche Menge an Sequenzen er lernen kann?</p>
<p><em>Zuletzt bearbeitet am 18.3.2007, 00:10 Uhr.</em></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Tom</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-693</link>
		<dc:creator>Tom</dc:creator>
		<pubDate>Wed, 14 Mar 2007 17:05:16 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-693</guid>
		<description>Sieht so aus als sei ich hier auf einen Idsia-fan gestossen :o)

Leider hab ich eine schlechte Nachicht: es kann keinen beweisbar optimalen Vorhersagealgorithmus geben, jedenfalls nicht sobald die Vorhersagen von einer gewissen Kolmogorov-Komplexitaet sind (der Beweis hierfuer ist neu, und kommt von Shane: http://www.idsia.ch/~shane/).</description>
		<content:encoded><![CDATA[<p>Sieht so aus als sei ich hier auf einen Idsia-fan gestossen :o)</p>
<p>Leider hab ich eine schlechte Nachicht: es kann keinen beweisbar optimalen Vorhersagealgorithmus geben, jedenfalls nicht sobald die Vorhersagen von einer gewissen Kolmogorov-Komplexitaet sind (der Beweis hierfuer ist neu, und kommt von Shane: <a href="http://www.idsia.ch/~shane/)" rel="nofollow">http://www.idsia.ch/~shane/)</a>.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Andreas</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-332</link>
		<dc:creator>Andreas</dc:creator>
		<pubDate>Wed, 07 Mar 2007 17:41:52 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-332</guid>
		<description>&lt;blockquote&gt;
Was w&#228;re dann eine optimale Vorhersagemethode ohne Ber&#252;cksichtigung eventueller Ressourcenknappheiten? Eine Methode, die aus allen m&#246;glichen Faktoren den exakten Folgezustand errechnet.
&lt;/blockquote&gt;

Eine optimale Vorhersagemethode muss nicht den exakten Folgezustand errechnen. Tats&#228;chlich kann das keine Methode: Induktion erlaubt &lt;em&gt;niemals&lt;/em&gt; Vorhersagen mit der Wahrscheinlichkeit 1.

Wenn wir zwei Vorhersagemethoden vergleichen, wird trotzdem eine im Durchschnitt besser abschneiden als die andere. F&#252;r die Bezeichnung &quot;optimal&quot; gen&#252;gt, dass eine Methode bei gleicher Information exakter ist als jede andere Methode.

&lt;blockquote&gt;
Wieviel der vorhandenen Zeit verwende ich f&#252;r die Findung der f&#252;r die Vorhersage wichtigen Faktoren und wieviel Zeit verwende ich auf die Vorhersage selbst?
&lt;/blockquote&gt;

Muss man diese beiden Rechenschritte trennen? Kann man das &#252;berhaupt, wenn man einen Vorhersagealgorithmus finden will, der f&#252;r eine m&#246;glichst gro&#223;e Menge an Umgebungen optimal ist -- also abgesehen von der Annahme, dass die Umgebung berechenbar ist, keine (oder kaum) weitere Annahmen macht?

Wer an Faktoren und an die Aufteilung der Zeit zwischen der Suche nach Faktoren und der eigentlichen Prognose denkt, hat sich bereits auf einen konkreten und vermutlich nicht optimalem Ansatz f&#252;r das Vorhersageproblem festgelegt.

Eine andere Sichtweise: Jedes Vorhersageproblem l&#228;sst sich auf die Form der Vorhersage bin&#228;rer Sequenzen bringen.

&lt;code&gt;011011100101110111100010 ... ?&lt;/code&gt;

Wir wissen nicht, durch welches Programm sich diese Sequenz — und damit der n&#228;chste Datenpunkt in dieser Sequenz — berechnen l&#228;sst. Jedes Programm, das diese Sequenz ausgibt, ist eine unserer Hypothesen. &lt;a href=&quot;http://de.wikipedia.org/wiki/Ockhams_Rasiermesser&quot; rel=&quot;nofollow&quot;&gt;Ockham&#039;s Rasiermesser&lt;/a&gt; besagt, dass von mehreren Hypothesen, die den gleichen Sachverhalt erkl&#228;ren, die einfachste zu bevorzugen ist.

Programme sind dann einfacher, wenn sie eine niedrigere algorithmische Komplexit&#228;t haben. Ein Programm x ist umso einfacher, je k&#252;rzer das k&#252;rzeste Programm ist, das dieselbe Ausgabe besitzt wie x. Die L&#246;sung des Vorhersageproblems besteht grob gesagt darin, das k&#252;rzeste Programm zu finden, das diese Sequenz generiert.

&lt;blockquote&gt;
Die Evolution hat das Gehirn anders geformt. Wir besitzen fest installierte Filter, die die f&#252;r uns wichtigen Informationen schnell herausfiltern und alles andere vernachl&#228;ssigen.
&lt;/blockquote&gt;

Dass unser Gehirn nicht nur die Informationen besitzt, die wir im Laufe unseres Lebens aufnehmen, sondern aufgrund Millionen von Jahren Evolution auch &#252;ber einige Dispositionen a priori verf&#252;gt, die f&#252;r das Verst&#228;ndnis der Welt Voraussetzung sein k&#246;nnten, ist ein wichtiger Punkt. Ein theoretisch optimaler Algorithmus ist vielleicht nur dann brauchbar, wenn er &lt;a href=&quot;http://en.wikipedia.org/wiki/Inductive_bias&quot; rel=&quot;nofollow&quot;&gt;zus&#228;tzliche Annahmen &#252;ber die Umgebung&lt;/a&gt; macht.

&lt;em&gt;Zuletzt bearbeitet am 7. M&#228;rz 2007, 21:31 Uhr.&lt;/em&gt;</description>
		<content:encoded><![CDATA[<blockquote><p>
Was w&#228;re dann eine optimale Vorhersagemethode ohne Ber&#252;cksichtigung eventueller Ressourcenknappheiten? Eine Methode, die aus allen m&#246;glichen Faktoren den exakten Folgezustand errechnet.
</p></blockquote>
<p>Eine optimale Vorhersagemethode muss nicht den exakten Folgezustand errechnen. Tats&#228;chlich kann das keine Methode: Induktion erlaubt <em>niemals</em> Vorhersagen mit der Wahrscheinlichkeit 1.</p>
<p>Wenn wir zwei Vorhersagemethoden vergleichen, wird trotzdem eine im Durchschnitt besser abschneiden als die andere. F&#252;r die Bezeichnung &#8220;optimal&#8221; gen&#252;gt, dass eine Methode bei gleicher Information exakter ist als jede andere Methode.</p>
<blockquote><p>
Wieviel der vorhandenen Zeit verwende ich f&#252;r die Findung der f&#252;r die Vorhersage wichtigen Faktoren und wieviel Zeit verwende ich auf die Vorhersage selbst?
</p></blockquote>
<p>Muss man diese beiden Rechenschritte trennen? Kann man das &#252;berhaupt, wenn man einen Vorhersagealgorithmus finden will, der f&#252;r eine m&#246;glichst gro&#223;e Menge an Umgebungen optimal ist &#8212; also abgesehen von der Annahme, dass die Umgebung berechenbar ist, keine (oder kaum) weitere Annahmen macht?</p>
<p>Wer an Faktoren und an die Aufteilung der Zeit zwischen der Suche nach Faktoren und der eigentlichen Prognose denkt, hat sich bereits auf einen konkreten und vermutlich nicht optimalem Ansatz f&#252;r das Vorhersageproblem festgelegt.</p>
<p>Eine andere Sichtweise: Jedes Vorhersageproblem l&#228;sst sich auf die Form der Vorhersage bin&#228;rer Sequenzen bringen.</p>
<p><code>011011100101110111100010 ... ?</code></p>
<p>Wir wissen nicht, durch welches Programm sich diese Sequenz — und damit der n&#228;chste Datenpunkt in dieser Sequenz — berechnen l&#228;sst. Jedes Programm, das diese Sequenz ausgibt, ist eine unserer Hypothesen. <a href="http://de.wikipedia.org/wiki/Ockhams_Rasiermesser" rel="nofollow">Ockham&#8217;s Rasiermesser</a> besagt, dass von mehreren Hypothesen, die den gleichen Sachverhalt erkl&#228;ren, die einfachste zu bevorzugen ist.</p>
<p>Programme sind dann einfacher, wenn sie eine niedrigere algorithmische Komplexit&#228;t haben. Ein Programm x ist umso einfacher, je k&#252;rzer das k&#252;rzeste Programm ist, das dieselbe Ausgabe besitzt wie x. Die L&#246;sung des Vorhersageproblems besteht grob gesagt darin, das k&#252;rzeste Programm zu finden, das diese Sequenz generiert.</p>
<blockquote><p>
Die Evolution hat das Gehirn anders geformt. Wir besitzen fest installierte Filter, die die f&#252;r uns wichtigen Informationen schnell herausfiltern und alles andere vernachl&#228;ssigen.
</p></blockquote>
<p>Dass unser Gehirn nicht nur die Informationen besitzt, die wir im Laufe unseres Lebens aufnehmen, sondern aufgrund Millionen von Jahren Evolution auch &#252;ber einige Dispositionen a priori verf&#252;gt, die f&#252;r das Verst&#228;ndnis der Welt Voraussetzung sein k&#246;nnten, ist ein wichtiger Punkt. Ein theoretisch optimaler Algorithmus ist vielleicht nur dann brauchbar, wenn er <a href="http://en.wikipedia.org/wiki/Inductive_bias" rel="nofollow">zus&#228;tzliche Annahmen &#252;ber die Umgebung</a> macht.</p>
<p><em>Zuletzt bearbeitet am 7. M&#228;rz 2007, 21:31 Uhr.</em></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Lucas</title>
		<link>http://www.aiplayground.org/artikel/prediction/comment-page-1/#comment-263</link>
		<dc:creator>Lucas</dc:creator>
		<pubDate>Mon, 05 Mar 2007 11:54:08 +0000</pubDate>
		<guid isPermaLink="false">http://www.aiplayground.org/artikel/prediction/#comment-263</guid>
		<description>Zun&#228;chst ein bisschen Definition. Ohne mir Solomonoffs Theorie durchgelesen zu haben [1], wie funktionieren Vorhersagemethoden? Sie approximieren aus dem Zustand der in diesem Augenblick g&#252;ltigen Faktoren einen Folgezustand, der zu einer bestimmten Zeit in der Zukunft existiert.

Was w&#228;re dann eine optimale Vorhersagemethode ohne Ber&#252;cksichtigung eventueller Ressourcenknappheiten? Eine Methode, die aus allen m&#246;glichen Faktoren den exakten Folgezustand errechnet.

Eine optimale Vorhersagemethode unter Ber&#252;cksichtigung der Ressource Speicherplatz w&#252;rde nur die Faktoren mit dem gr&#246;&#223;ten Einfluss auf den Folgezustand ber&#252;cksichtigen und daraus eine (im Durchschnitt) m&#246;glichst genaue Vorhersage errechnen.

Eine optimalste Vorhersagemethode unter Ber&#252;cksichtigung der Ressourcen Speicherplatz und Zeit w&#252;rde in gegebener Zeit m&#246;glichst die Faktoren mit gro&#223;em Einfluss auf den Folgezustand finden und daraus eine m&#246;glichst genaue Vorhersage berechnen.

Letzteres trifft vermutlich am besten die Realit&#228;t, da wir es mit Platz- und Zeitproblemen zu tun haben. Durch die Ressource Zeit wird das Problem auch erst richtig kompliziert. Wieviel der vorhandenen Zeit verwende ich f&#252;r die Findung der f&#252;r die Vorhersage wichtigen Faktoren und wieviel Zeit verwende ich auf die Vorhersage selbst? Wenn wir die Antwort auf diese Frage errechnen wollen, m&#252;ssen wir weitere Rechenzeit investieren. Doch wieviel? Wir k&#246;nnten es wieder errechnen. Wiederum lautet die Frage, wieviel Zeit darf ich maximal f&#252;r die Errechnung der maximalen Zeit f&#252;r die Errechnung der wichtigen Faktoren verwenden? Diese Reihe lie&#223;e sich unendlich fortsetzen.
Erst wenn man dieses Problem gel&#246;st hat, k&#246;nnte man sich um die eigentliche Vorhersage k&#252;mmern.

Die Evolution hat das Gehirn anders geformt. Wir besitzen fest installierte Filter, die die f&#252;r uns wichtigen Informationen schnell herausfiltern und alles andere vernachl&#228;ssigen. Dabei ist vor allem die Schnelligkeit bis man zu einer Vorhersage kommt ein Selektionsvorteil gegen&#252;ber der Exaktheit des Ergebnisses gewesen.

Ich bin skeptisch, ob ein theoretisches Konstrukt wie das einer universellen Induktion zu effizienten und praktikablen L&#246;sungen f&#252;hren wird, lasse mich aber auch gerne von etwas anderem &#252;berzeugen.

[1] Habe gerade keinen PDF-Reader zur Hand. Werde ich nachholen, wenn ich wieder zu Hause bin.</description>
		<content:encoded><![CDATA[<p>Zun&#228;chst ein bisschen Definition. Ohne mir Solomonoffs Theorie durchgelesen zu haben [1], wie funktionieren Vorhersagemethoden? Sie approximieren aus dem Zustand der in diesem Augenblick g&#252;ltigen Faktoren einen Folgezustand, der zu einer bestimmten Zeit in der Zukunft existiert.</p>
<p>Was w&#228;re dann eine optimale Vorhersagemethode ohne Ber&#252;cksichtigung eventueller Ressourcenknappheiten? Eine Methode, die aus allen m&#246;glichen Faktoren den exakten Folgezustand errechnet.</p>
<p>Eine optimale Vorhersagemethode unter Ber&#252;cksichtigung der Ressource Speicherplatz w&#252;rde nur die Faktoren mit dem gr&#246;&#223;ten Einfluss auf den Folgezustand ber&#252;cksichtigen und daraus eine (im Durchschnitt) m&#246;glichst genaue Vorhersage errechnen.</p>
<p>Eine optimalste Vorhersagemethode unter Ber&#252;cksichtigung der Ressourcen Speicherplatz und Zeit w&#252;rde in gegebener Zeit m&#246;glichst die Faktoren mit gro&#223;em Einfluss auf den Folgezustand finden und daraus eine m&#246;glichst genaue Vorhersage berechnen.</p>
<p>Letzteres trifft vermutlich am besten die Realit&#228;t, da wir es mit Platz- und Zeitproblemen zu tun haben. Durch die Ressource Zeit wird das Problem auch erst richtig kompliziert. Wieviel der vorhandenen Zeit verwende ich f&#252;r die Findung der f&#252;r die Vorhersage wichtigen Faktoren und wieviel Zeit verwende ich auf die Vorhersage selbst? Wenn wir die Antwort auf diese Frage errechnen wollen, m&#252;ssen wir weitere Rechenzeit investieren. Doch wieviel? Wir k&#246;nnten es wieder errechnen. Wiederum lautet die Frage, wieviel Zeit darf ich maximal f&#252;r die Errechnung der maximalen Zeit f&#252;r die Errechnung der wichtigen Faktoren verwenden? Diese Reihe lie&#223;e sich unendlich fortsetzen.<br />
Erst wenn man dieses Problem gel&#246;st hat, k&#246;nnte man sich um die eigentliche Vorhersage k&#252;mmern.</p>
<p>Die Evolution hat das Gehirn anders geformt. Wir besitzen fest installierte Filter, die die f&#252;r uns wichtigen Informationen schnell herausfiltern und alles andere vernachl&#228;ssigen. Dabei ist vor allem die Schnelligkeit bis man zu einer Vorhersage kommt ein Selektionsvorteil gegen&#252;ber der Exaktheit des Ergebnisses gewesen.</p>
<p>Ich bin skeptisch, ob ein theoretisches Konstrukt wie das einer universellen Induktion zu effizienten und praktikablen L&#246;sungen f&#252;hren wird, lasse mich aber auch gerne von etwas anderem &#252;berzeugen.</p>
<p>[1] Habe gerade keinen PDF-Reader zur Hand. Werde ich nachholen, wenn ich wieder zu Hause bin.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
