<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2full.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<channel>
	<title>Semantik-Blog</title>
	
	<link>http://www.kraus-sonja.de/semantik</link>
	<description />
	<pubDate>Mon, 03 Nov 2008 18:02:29 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.7</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/semantik-blog" /><feedburner:info uri="semantik-blog" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><item>
		<title>Countdown</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/FH4uhEodVtE/</link>
		<comments>http://www.kraus-sonja.de/semantik/182008-11/countdown/#comments</comments>
		<pubDate>Mon, 03 Nov 2008 18:02:29 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Allgemein]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=18</guid>
		<description><![CDATA[So langsam wird es bei mir ernst, denn der Endspurt auch in Richtung der Magistra Artium mit den letzten beiden Klausuren steht an.
Und ich muss mich dann doch dafür entschuldigen, dass ich lange Zeit keine neuen Beiträge geschrieben habe. Ideen habe ich genug, allerdings soll gerade hier dann auch die Qualität stimmen. Der Preisverleihung folgten [...]]]></description>
			<content:encoded><![CDATA[<p>So langsam wird es bei mir ernst, denn der Endspurt auch in Richtung der Magistra Artium mit den letzten beiden Klausuren steht an.</p>
<p>Und ich muss mich dann doch dafür entschuldigen, dass ich lange Zeit keine neuen Beiträge geschrieben habe. Ideen habe ich genug, allerdings soll gerade hier dann auch die Qualität stimmen. Der Preisverleihung folgten viele Dinge, die liegen geblieben waren, ein Praktikum in einer anderen Stadt, schließlich nun eben die letzten beiden Klausuren.</p>
<p>Wen es interessiert: Es sind noch meine beiden Nebenfächer Allgemeine Sprachwissenschaft und Sprachliche Informationsverarbeitung fällig; mein Hauptfach Deutsch ist vom Staatsexamen anerkannt worden.</p>
<p>In der Allgemeinen Sprachwissenschaft lauten meine Themenbereiche &#8220;Morphologische Produktivität&#8221; und &#8220;Fachsprachen&#8221; - meiner Ansicht nach auch für computerlinguistische Fragestellungen nicht ganz uninteressant, denn: Wie kann ich unbekannte Wörter bzw. Wortformen behandeln und nach welchen Prinzipien können diese potenziell gebildet werden? Und Fachsprachen sind per se für alle domänenspezifischen Anwendungen interessant.</p>
<p>In der Sprachlichen Informationsverarbeitung kommt zum einen der Bereich Softwaretechnologie dran - mit Java und Prolog. Die zweite Aufgabe darf ich entweder im Bereich POS-Tagging oder im Bereich Text Mining / Information Retrieval lösen.</p>
<p>Und damit das auch klappt, muss ich dann doch noch etwas Zeit ins Lernen investieren. Danach habe ich aber Zeit zum Schreiben - bis zum ersten festen Job!</p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/FH4uhEodVtE" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/182008-11/countdown/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/182008-11/countdown/</feedburner:origLink></item>
		<item>
		<title>Theseus - ein kleiner Presseüberblick</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/OVHcDkcbfx8/</link>
		<comments>http://www.kraus-sonja.de/semantik/162008-08/theseus-ein-kleiner-presseuberblick/#comments</comments>
		<pubDate>Tue, 12 Aug 2008 23:40:51 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Allgemein]]></category>

		<category><![CDATA[artikel]]></category>

		<category><![CDATA[preisverleihung]]></category>

		<category><![CDATA[presse]]></category>

		<category><![CDATA[ruggaber]]></category>

		<category><![CDATA[theseus]]></category>

		<category><![CDATA[videos]]></category>

		<category><![CDATA[wahlster]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=16</guid>
		<description><![CDATA[Bevor in den kommenden Tagen auch wieder ein paar Inhalte zur Semantik folgen werden, möchte ich an dieser Stelle einen kleinen &#8220;Pressespiegel&#8221; posten, der einige Artikel zur mir und der Preisverleihung, aber auch zu Theseus allgemein umfasst.
Fangen wir mit den Videos an, von denen erst vor wenigen Stunden einige mehr veröffentlicht wurden. Diese sind auf [...]]]></description>
			<content:encoded><![CDATA[<p>Bevor in den kommenden Tagen auch wieder ein paar Inhalte zur Semantik folgen werden, möchte ich an dieser Stelle einen kleinen &#8220;Pressespiegel&#8221; posten, der einige Artikel zur mir und der Preisverleihung, aber auch zu Theseus allgemein umfasst.<span id="more-16"></span></p>
<p>Fangen wir mit den Videos an, von denen erst vor wenigen Stunden einige mehr veröffentlicht wurden. Diese sind auf <a href="http://theseus-programm.de/videos" target="_blank">http://theseus-programm.de/videos</a> zu finden - alternativ, da teilweise Videos mit angezeigt werden, die &#8220;related&#8221; sein sollen, aber es leider nicht sind: <a href="http://www.youtube.com/user/THESEUSBerlin" target="_self">http://www.youtube.com/user/THESEUSBerlin</a></p>
<p>Beim BMWi stehen schon seit einigen Wochen <a href="http://www.bmwi.de/BMWi/Navigation/Service/fotoreihen,did=253812.html?page=1" target="_blank">Fotos der Theseus-Preisverleihung</a> online.</p>
<p>Am 25.7.2008 konnte ich mich rühmen, in der Beilage &#8220;Perspektiven&#8221; des Handelsblattes als &#8220;Kopf der Woche&#8221; vorgestellt zu werden.</p>
<p>Unsere örtliche Lokalzeitung hier, die <a href="http://www.ngz-online.de/public/article/nachrichten/591553/Neue-Strategien-fuers-Web.html" target="_blank">Neuß-Grevenbroicher Zeitung</a>, hat sich ebenfalls für meinen Erfolg interessiert. Leider haben sich im Artikel ein paar kleine Detailfehler eingeschlichen.</p>
<p>Im Netz gibt es recht viele Berichte über die Preisverleihung, hier eine kleine Auswahl:</p>
<ul>
<li><a href="http://www.onetoone.de/index.php?we_objectID=15353" target="_blank">ONEtoONE</a></li>
<li><a href="http://www.initiatived21.de/News-Detailansicht.181.0.html?&amp;tx_ttnews%5btt_news%5d=1744&amp;tx_ttnews%5bbackPid%5d=132" target="_blank">Initiative D 21</a></li>
<li><a href="http://www.heise.de/newsticker/Theseus-Talente-ausgezeichnet--/meldung/109585" target="_blank">heise.de</a></li>
<li><a href="http://www.media.nrw.de/media2/site/index.php?id=73&amp;no_cache=1&amp;tx_ttnews%5Btt_news%5D=54664&amp;cHash=3214ff015c" target="_blank">media NRW</a></li>
<li><a href="http://www.computerzeitung.de/articles/semantikbeitrag_gewinnt_wettbewerb_im_forschungsprogramm_theseus:/2008026/31561841_ha_CZ.html?thes=&amp;tp=/themen/forschung/&amp;page=1" target="_blank">Computerzeitung</a></li>
<li>weiterer Artikel <a href="http://www.onetoone.de/index.php?we_objectID=15395" target="_blank">ONEtoONE</a></li>
</ul>
<p>Dann noch ein paar Artikel und Interviews zum Theseus Programm allgemein, die hoffentlich zum besseren Verständnis beitragen können, worum es da eigentlich geht:</p>
<ul>
<li>Computerwoche: <a href="http://www.computerwoche.de/knowledge_center/web/1866022/index2.html" target="_blank">Das Web 3.0 als Massenbewegung</a> (Interview Prof. Wolfgang Wahlster)<a href="http://www.computerwoche.de/knowledge_center/web/1866022/index2.html" target="_blank"><br />
</a></li>
<li><a href="https://it-gipfelblog.hpi-web.de/2007/12/11/interview-mit-dr-rainer-ruggaber-sap-theseus-projekt/" target="_blank">Interview Dr. Rainer Ruggaber (SAP)</a></li>
<li>Silicon.de: <a href="http://www.silicon.de/mittelstand/0,39038986,39192819,00/web+2_0+ist+erst+der+anfang.htm" target="_blank">Web 2.0 ist erst der Anfang</a> (Interview Prof. Wolfgang Wahlster)</li>
<li>Spiegel online: <a href="http://www.spiegel.de/netzwelt/web/0,1518,561831,00.html" target="_blank">Das Internet soll klüger werden</a></li>
<li>Silicon.de: <a href="http://www.silicon.de/mittelstand/0,39038986,39191792,00/das+web+3_0+ist+eine+antwortmaschine.htm" target="_blank">Das Web 3.0 ist eine Antwortmaschine</a></li>
</ul>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/OVHcDkcbfx8" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/162008-08/theseus-ein-kleiner-presseuberblick/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/162008-08/theseus-ein-kleiner-presseuberblick/</feedburner:origLink></item>
		<item>
		<title>Powerset hat einen Käufer gefunden: Microsoft</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/H24ZbBVhQa4/</link>
		<comments>http://www.kraus-sonja.de/semantik/152008-07/powerset-hat-einen-kaufer-gefunden-microsoft/#comments</comments>
		<pubDate>Thu, 03 Jul 2008 07:42:55 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Semantische Suche]]></category>

		<category><![CDATA[microsoft]]></category>

		<category><![CDATA[powerset]]></category>

		<category><![CDATA[semantische suchmaschine]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=15</guid>
		<description><![CDATA[Nicht allzu lange nach ihrem Start hat die semantische Suchmaschine Powerset bereits einen Käufer gefunden.
Der Softwaregigant Microsoft. der mit Live.com ebenfalls eine Suchmaschine betreibt, hat zugeschlagen. wieviel genau bezahlt wurde, ist nicht bekannt; Gerüchte spreche von 100 Millionen Euro.
Das Entwicklerteam, um das es Microsoft wohl in erster Linie ging, wird in San Francisco ansässig bleiben.
Vorgestellt [...]]]></description>
			<content:encoded><![CDATA[<p>Nicht allzu lange nach ihrem Start hat die <a href="http://www.kraus-sonja.de/semantik/62008-05/semantische-suchmaschine-powerset-gestartet/">semantische Suchmaschine Powerset</a> bereits einen Käufer gefunden.<span id="more-15"></span></p>
<p>Der Softwaregigant Microsoft. der mit Live.com ebenfalls eine Suchmaschine betreibt, hat zugeschlagen. wieviel genau bezahlt wurde, ist nicht bekannt; Gerüchte spreche von 100 Millionen Euro.</p>
<p>Das Entwicklerteam, um das es Microsoft wohl in erster Linie ging, wird in San Francisco ansässig bleiben.</p>
<p>Vorgestellt hatte ich <a href="http://www.kraus-sonja.de/semantik/62008-05/semantische-suchmaschine-powerset-gestartet/">Powerset</a> ja bereits hier im Blog.</p>
<p>Weitere Infos befinden sich u.a. hier:</p>
<p><a href="http://www.computerwoche.de/knowledge_center/web/1867840/" target="_blank">Computerwoche</a></p>
<p><a href="http://www.netzwoche.ch/News/NWTickerHeadlines.aspx?Id=33867&amp;Date=02.07.2008&amp;Digest=jYTAxea/tPfVKGhNncC7sw&amp;AspxAutoDetectCookieSupport=1" target="_blank">Netzwoche</a></p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/H24ZbBVhQa4" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/152008-07/powerset-hat-einen-kaufer-gefunden-microsoft/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/152008-07/powerset-hat-einen-kaufer-gefunden-microsoft/</feedburner:origLink></item>
		<item>
		<title>THESEUS TALENTE 2008</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/Ug6hz2EB9-U/</link>
		<comments>http://www.kraus-sonja.de/semantik/142008-06/theseus-talente-2008/#comments</comments>
		<pubDate>Tue, 17 Jun 2008 23:21:28 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Allgemein]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=14</guid>
		<description><![CDATA[Nachdem ich in den letzten Wochen aufgrund von Prüfungen nicht in der vorgesehenen Form bloggen konnte, habe ich heute einen äußerst triftigen Grund dazu.
In Berlin wurden gestern, also am 17. Juni 2008, die Preisträger des Wettbewerbs &#8220;THESEUS TALENTE 2008&#8243; ausgezeichnet, zu denen auch ich gehörte. Was ich allerdings erst vor Ort erfuhr, war die Tatsache, [...]]]></description>
			<content:encoded><![CDATA[<p>Nachdem ich in den letzten Wochen aufgrund von Prüfungen nicht in der vorgesehenen Form bloggen konnte, habe ich heute einen äußerst triftigen Grund dazu.</p>
<p>In Berlin wurden gestern, also am 17. Juni 2008, die Preisträger des Wettbewerbs &#8220;THESEUS TALENTE 2008&#8243; ausgezeichnet, zu denen auch ich gehörte.<span id="more-14"></span> Was ich allerdings erst vor Ort erfuhr, war die Tatsache, dass ich mit meiner Ideenskizze - für mich vollkommen unerwartet - den ersten Platz belegt habe. Das hat mich natürlich sehr gefreut und um so mehr darin bestärkt, diesen Weg weiter zu verfolgen.</p>
<p>Sicherlich habe ich auch meiner Staatsexamensarbeit &#8220;Semantische Netze, semantische Merkmalsstrukturen und Prädikationen vor dem Hintergrund einer maschinellen Verarbeitung&#8221; einige Anregungen und vor allem viel fachspezifisches Wissen zu verdanken. Auch das Seminar &#8220;Embedded Metadata&#8221;, das ich im vergangenen Wintersemester &#8220;just for fun&#8221; belegt habe, hat rückblickend betrachtet sicherlich einige Impulse geben können. Der Rest speist sich aus meinen Erfahrung als ganz normaler Nutzer des Internets.</p>
<p>Pressestimmen gibt es bislang <a href="http://www.heise.de/newsticker/Theseus-Talente-ausgezeichnet--/meldung/109585">hier</a> (heise.de - ich bin so stolz!) und <a href="http://www.pressrelations.de/new/standard/result_main.cfm?pfach=1&amp;n_firmanr_=116840&amp;sector=pm&amp;detail=1&amp;r=328146&amp;sid=&amp;aktion=jour_pm&amp;quelle=0">hier</a> sowie auf der Seite des <a href="http://theseus-programm.de/news/staatssekret%C3%A4rin-w%C3%B6hrl-zeichnet-gewinner-bei-theseus-talente-aus" target="_blank">Thesus-Programms</a> direkt.</p>
<p>Auch die <a href="http://computerzeitung.de/articles/semantikbeitrag_gewinnt_wettbewerb_im_forschungsprogramm_theseus:/2008026/31561841_ha_CZ.html?thes=&amp;tp=/themen/forschung/&amp;page=1" target="_blank">Computerzeitung</a> hat mittlerweile einen Artikel veröffentlicht.</p>
<p>Nach einer kleinen Rikschatour durch Berlin und der etwas längeren Heimfahrt im Zug wünsche ich vorerst eine gute Nacht und verspreche, in den nächsten Tagen auch noch einige Inhalte einzupflegen.</p>
<p>P.S.: zur Benutzung der blogeigenen Tagging-Funktion bin ich jetzt mal ein wenig &#8220;zu faul&#8221; <img src='http://www.kraus-sonja.de/semantik/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> und bitte um Nachsicht - auch wenn Wordpress 2.5.1 mittlerweile schon Vorschläge liefert. Diese sind allerdings nur alphabetischer und noch nicht semantischer Natur.</p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/Ug6hz2EB9-U" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/142008-06/theseus-talente-2008/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/142008-06/theseus-talente-2008/</feedburner:origLink></item>
		<item>
		<title>Das Internet als Antwortmaschine</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/9sTm7KMBEFI/</link>
		<comments>http://www.kraus-sonja.de/semantik/132008-05/das-internet-als-antwortmaschine/#comments</comments>
		<pubDate>Sat, 24 May 2008 19:56:41 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Semantische Suche]]></category>

		<category><![CDATA[computerlinguistik]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=13</guid>
		<description><![CDATA[Die &#8220;taz&#8221; hat einen recht interessanten Artikel zu den Visionen eines Internets, in dem die sich Suchmaschinen in &#8220;Findmaschinen&#8221; verwandeln. Das alles soll auf computerlinguistischer und eben semantischer Basis geschehen.
Link zum Artikel
]]></description>
			<content:encoded><![CDATA[<p>Die &#8220;taz&#8221; hat einen recht interessanten Artikel zu den Visionen eines Internets, in dem die sich Suchmaschinen in &#8220;Findmaschinen&#8221; verwandeln. Das alles soll auf computerlinguistischer und eben semantischer Basis geschehen.</p>
<p><a href="http://www.taz.de/1/leben/internet/artikel/1/das-internet-als-antwortmaschine/?src=ST&amp;cHash=f74ffb0000" target="_blank">Link zum Artikel</a></p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/9sTm7KMBEFI" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/132008-05/das-internet-als-antwortmaschine/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/132008-05/das-internet-als-antwortmaschine/</feedburner:origLink></item>
		<item>
		<title>Yahoo! wird semantisch</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/zL4-r12F-38/</link>
		<comments>http://www.kraus-sonja.de/semantik/122008-05/yahoo-wird-semantisch/#comments</comments>
		<pubDate>Sun, 18 May 2008 13:35:21 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Semantische Suche]]></category>

		<category><![CDATA[datenbank]]></category>

		<category><![CDATA[microformats]]></category>

		<category><![CDATA[powerset]]></category>

		<category><![CDATA[rdf]]></category>

		<category><![CDATA[search monkey]]></category>

		<category><![CDATA[semantic web]]></category>

		<category><![CDATA[Semantik]]></category>

		<category><![CDATA[yahoo]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=12</guid>
		<description><![CDATA[Na ja, ein bisschen zumindest. Die Internetsuchmaschine Yahoo! ermöglicht es mit Hilfes des neuen Dienstes Yahoo! SearchMonkey den Anbietern von Inhalten, ihre Seiten auf semantischer Ebene indizieren zu lassen.
Dabei handelt es sich nicht um eine &#8220;echte&#8221; semantische Indizierung, sondern um genau das, was gemeinhin als &#8220;Semantic Web&#8221; bezeichnet wird. Damit greife ich einem Thema vor, [...]]]></description>
			<content:encoded><![CDATA[<p>Na ja, ein bisschen zumindest. Die Internetsuchmaschine Yahoo! ermöglicht es mit Hilfes des neuen Dienstes <a title="Yahoo! Search Monkey" href="http://developer.yahoo.com/searchmonkey/" target="_blank">Yahoo! SearchMonkey</a> den Anbietern von Inhalten, ihre Seiten auf semantischer Ebene indizieren zu lassen.<span id="more-12"></span></p>
<p>Dabei handelt es sich nicht um eine &#8220;echte&#8221; semantische Indizierung, sondern um genau das, was gemeinhin als &#8220;Semantic Web&#8221; bezeichnet wird. Damit greife ich einem Thema vor, das ich noch in einem anderen Beitrag genauer erläutern möchte.</p>
<p>Dabei greift der veröffentlichende Mensch, der weiß, was welche Bedeutung hat, der Maschine unter die Arme. Er kennzeichnet seine Inhalte mit Hilfe eines speziellen Markups, beispielsweise mit Microformats oder per RDF oder weiteren XML-Derivaten. Der Mensch nimmt hier die semantische Annotation gewisser Teile seines Inhalts vor und greift dabei auf bestimmte Standards zurück - die natürlich erst einmal existieren lassen. Für Adressdaten zum Beispiel funktioniert etwas schon sehr gut. Wenn ich aber nun statt meiner Adresssdaten ein Kuchenrezept als meine Adresse kennzeichne? Ich denke, hier wird sehr deutlich, dass das Semantic Web erst einmal nur eine Krücke, aber immerhin eine Brücke in die Zukunft einer semantischen Datenverarbeitung ist.</p>
<p>Das Ganze hat fast noch ein wenig den Charakter einer Datenbank, die sich aus den eingelesenen Daten selbst organisiert, aber auch auf andere Weise eingelesen werden oder - vom Umfang einmal abgesehen - manuell eingegeben werden könnte. Spannend wird es, wenn man diese Daten dann mit dem eigentlichen semantischen Wissen verknüpft, also z.B. mit einer eingegebenen Frage in Zusammenhang bringen kann. Nützlich könnte eine solche Vorstrukturierung beispielweise auch für <a title="Artikel zu Powerset, der semantischen Suchmaschine" href="http://www.kraus-sonja.de/semantik/62008-05/semantische-suchmaschine-powerset-gestartet/">die letzte Woche gestartete semantische Suchmaschine Powerset</a> sein.</p>
<p>Yahoo! SearchMonkey bietet den Webentwicklern alles an <a title="Yahoo! Search Monkey für Entwickler" href="http://developer.yahoo.com/searchmonkey/" target="_blank">Informationen</a> an, was sie brauchen, um aktiv mitzuarbeiten. Die Benutzer sollen so aktiv Einfluss auf die Suchergebnisse und deren Präsentation nehmen können. Sie können sogar eigene Applikationen bauen, wenn ihnen die vorhandenen Data Services nicht ausreichend sind.</p>
<p>Mein erstes Fazit dazu: Yahoo! SearchMonkey spricht vorerst weniger den Feld-, Wald- und Wiesen-Webmaster an. Weder in den gängigen Editoren noch dem Großteil der CMSe am Markt dürfte ein entsprechendes Markup überhaupt enthalten sein. Hier ist also zunächst Handarbeit angesagt, was das Coden angeht. Im Vorteil sind diejenigen, die bereits jetzt auf XML bzw. RDF setzen oder schon Microformats (etwa XING) integriert haben. Zwei Faktoren sprechen gegen eine explosionsartige Verbreitung in Deutschland: Erst einmal müssen sich diese neuen Möglichkeiten in der Gemeinde der Webmaster und Suchmaschinenoptinierer - für letztere sollte das Thema eigentlich hochinteressant sein - herumsprechen. Der zweite Faktor liegt in der derzeitigen Marktbeherrschung des Yahoo!-Konkurrenten Google in Deutschand, dessen Marktanteil bei etwa 90% liegt. Viele Leute denken, dass es sich gar nicht mehr lohnt, sich auf spezielle Eigenheiten einer Suchmaschine einzustellen, deren Marktanteil im eigenen Land und bei der eigenen Zielgruppe bei deutlich weniger als 10% liegt.</p>
<p>Ich persönlich finde die neuen Möglichkeiten nichtsdestotrotz sehr spannend und werde mich mal ans Testen begeben, so weit ich neben meiner Lernerei die Zeit dafür finde. Für die Zeit nach meinen mündlichen Prüfungen weiß ich jetzt jedenfalls, was ich dann tun kann.</p>
<p>Der einzige Wermutstropfen: Dieses Blog ist noch etwas zu neu, als dass ich auch ein Päckchen von Yahoo! hätte bekommen können, wie etwa die Herren <a title="Tekka" href="http://www.tekka.de/2008/05/16/yahoo-searchmonkey-gestartet/" target="_blank">hier</a>, <a title="der gute alte Fridaynite" href="http://www.fridaynite.de/blog/278-yahoo-search-monkey-startet-auch-in-deutschland-durch.htm" target="_blank">hier</a>, <a title="Rentaseo" href="http://www.rentaseo.de/web-marketing/yahoo/yahoo-search-monkey.html" target="_blank">hier</a> und <a title="Gerald Steffens - SOS-Seo-Blog" href="http://www.suchmaschinen-optimierung-seo.info/sosblog/2008/05/16/yahoo-searchmonkey/" target="_blank">hier</a>. Aber auch andere haben schon einfach so berichtet, wie der <a title="Bloggonaut" href="http://bloggonaut.afrobs-lifestyle.de/yahoo-searchmonkey-gestartet" target="_blank">Bloggonaut</a>, <a title="handelskraft.de" href="http://www.handelskraft.de/2008/05/16/bei-yahoo-ist-der-affe-los/" target="_blank">handelskraft.de</a>, <a title="netzwertig.com" href="http://netzwertig.com/2008/05/16/searchmonkey-transformiert-suche-in-eine-offene-plattform/" target="_blank">netzwertig.com</a>, <a title="Uwe Tippmann" href="http://www.uwe-tippmann.de/blog/2008/05/16/open-search-bei-yahoo/" target="_blank">Uwe Tippmann</a>, <a title="entwickler.de" href="http://entwickler.de/zonen/portale/psecom,id,99,news,43269.html" target="_blank">entwickler.de</a> und der <a title="Inhouse-SEO" href="http://www.inhouse-seo.de/suchmaschinen/yahoo/yahoo-offene-suche-searchmonkey-gestartet/" target="_blank">Inhouse-SEO</a>.</p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/zL4-r12F-38" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/122008-05/yahoo-wird-semantisch/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/122008-05/yahoo-wird-semantisch/</feedburner:origLink></item>
		<item>
		<title>Computer als Helfer des Menschen</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/iF6DR029N1c/</link>
		<comments>http://www.kraus-sonja.de/semantik/82008-05/computer-als-helfer-des-menschen/#comments</comments>
		<pubDate>Sat, 17 May 2008 19:44:55 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Allgemein]]></category>

		<category><![CDATA[computer]]></category>

		<category><![CDATA[computerprogramme]]></category>

		<category><![CDATA[lsi]]></category>

		<category><![CDATA[maschinelle verarbeitung]]></category>

		<category><![CDATA[Semantik]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=8</guid>
		<description><![CDATA[Warum eigentlich soll Sprache maschinell verarbeitet werden? Warum können wir auf die Unterstützung des Computers nicht mehr verzichten?
Mit dem Siegeszug des Computers im privaten wie im kommerziellen Bereich ist vor allem eines passiert: Die Menge der digital vorliegenden Informationen ist explosionsartig angewachsen. Jedermann kann zum Publisher - und sei es nur einiger Gedanken in einem [...]]]></description>
			<content:encoded><![CDATA[<p>Warum eigentlich soll Sprache maschinell verarbeitet werden? Warum können wir auf die Unterstützung des Computers nicht mehr verzichten?<span id="more-8"></span></p>
<p>Mit dem Siegeszug des Computers im privaten wie im kommerziellen Bereich ist vor allem eines passiert: Die Menge der digital vorliegenden Informationen ist explosionsartig angewachsen. Jedermann kann zum Publisher - und sei es nur einiger Gedanken in einem Weblog - werden. Diese digitalen Informationen können nahezu beliebig dupliziert werden und sich überall hin verbreiten.</p>
<p>Die Kehrseite dieser Entwicklung ist, dass diese gewaltige Informationsmenge von Menschen allein gar nicht mehr überschaubar und zu verarbeiten ist. Es liegen zwar unheimlich viele Informationen vor, aber darin die gerade relevanten Informationen zu finden, gleicht der Suche nach der Nadel im Heuhaufen.</p>
<p>Da die Daten ohnehin in digitaler Form vorliegen, liegt es nahe, diese auch direkt vom Computer verarbeiten zu lassen. Denn für einen Computer ist eine große Anzahl an Rechenoperationen in sehr kurzer Zeit möglich - sofern der Computer weiß, was er überhaupt berechnen soll. Dies ist dem menschlichen Geist so nicht gestattet. Selbst das Lesen eines Textes auf rein perzeptiver Ebene nimmt für den Menschen eine Zeitspanne an, die um ein Vielfaches größer ist als die, die ein Computer für diese Art von Erfassung benötigt. Das Gleiche gilt natürlich auch, wenn in riesigen Datenbeständen gesucht werden soll. Hier ist der Mensch lediglich dann überlegen, wenn er die benötigte Information in ihrem gesamten Kontext zufällig &#8220;gespeichert&#8221; hat und in der Lage ist, diese abzurufen.</p>
<p>Heutzutage verwenden viele maschinelle Systeme in erster Linie immer noch Verfahren, die mit Schlüsselwörtern arbeiten, um die &#8220;Bedeutung&#8221; eines Textes bzw. dessen Relevanz zu erfassen. Je häufiger ein Schlüsselwort in einem Text vorkommt, desto relevanter muss dieser Text sein. Auch die großen Internetsuchmaschinen arbeiten immer noch nach diesem Grundprinzip, auch wenn die Algorithmen natürlich im Laufe der Zeit verfeinert und komplizierter geworden sind. Mit latent-semanstischer Indizierung (LSI) kommt ein Verfahren hinzu, das semantischen Faktoren auf mathematischer statt linguistischer Ebene Rechnung zu tragen versucht.</p>
<p>Denn nicht immer kommt das Schlüsselwort selbst in einem Text vor. Zur Relevanzermittlung sollten Synonyme, also bedeutungsgleiche Wörter, ebenso berücksichtigt werden können wie semantisch verwandte Wörter oder Sachverhalte, die sich aus dem Textzusammenhang ergeben. Zufallstreffer sollten minimiert werden, die das Schlüsselwort zwar enthalten, wo es aber außerhalb des Zusammenhangs steht.</p>
<p>Ohne Frage fällt Menschen die Differenzierung und Gewichtung leichter als Computerprogrammen. Der Computer ist aber dort eindeutig im Vorteil, wo es um die Verarbeitung und Vorabselektion ungeheuer großer Informationsmengen geht. Die Übertragung menschlicher Denkprozesse bei der Verarbeitung von Sprache auf Computerprogramme ist wahrlich keine triviale Aufgabe; ob Bedeutung überhaupt durch Maschinen berechenbar ist, ist umstritten. Meine Meinung dazu ist: warum nicht, wenn wir es schaffen, die Denkprozesse und sprachlichen Regelmäßigkeiten aus dem menschlichen Gehirn auf eine Maschine zu übertragen?</p>
<p>Sicherlich gibt es Sonderfälle, in denen eine korrekte Analyse im Rahmen der vorliegenden Informationen im entsprechenden Zusammenhang nahezu unmöglich sein dürfte. In manchen Gesprächen abends am Stammtisch wurden mir durchaus schon solche Fälle entgegen gehalten. Meiner Meinung nach ist in diesen Fällen ein Mensch aber ebenso mit der korrekten Analyse überfordert.</p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/iF6DR029N1c" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/82008-05/computer-als-helfer-des-menschen/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/82008-05/computer-als-helfer-des-menschen/</feedburner:origLink></item>
		<item>
		<title>Semantische Suchmaschine Powerset gestartet</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/PJ4hIMDp5o0/</link>
		<comments>http://www.kraus-sonja.de/semantik/62008-05/semantische-suchmaschine-powerset-gestartet/#comments</comments>
		<pubDate>Wed, 14 May 2008 16:40:31 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Semantische Suche]]></category>

		<category><![CDATA[beta]]></category>

		<category><![CDATA[powerset]]></category>

		<category><![CDATA[Semantik]]></category>

		<category><![CDATA[semantische suchmaschine]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=6</guid>
		<description><![CDATA[Sie ist sicher nicht der erste Versuch, aber wohl eine der am heißesten erwarteten semantischen Suchmaschinen. Seit vergangenem Montag ist die bislang nur für den englischsprachigen Bereich funktionierende Suchmaschine Powerset des in San Francisco ansässigen Anbieters Powerlabs offiziell in der Beta-Phase im Netz.Die Benutzer können weiterhin auf herkömmliche Weise ihre Suchbegriffe eingeben, diese aber auch [...]]]></description>
			<content:encoded><![CDATA[<p>Sie ist sicher nicht der erste Versuch, aber wohl eine der am heißesten erwarteten semantischen Suchmaschinen. Seit vergangenem Montag ist die bislang nur für den englischsprachigen Bereich funktionierende <a title="Powerset - semantische Suchmaschine" href="http://www.powerset.com" target="_blank">Suchmaschine Powerset</a> des in San Francisco ansässigen Anbieters Powerlabs offiziell in der Beta-Phase im Netz.<span id="more-6"></span>Die Benutzer können weiterhin auf herkömmliche Weise ihre Suchbegriffe eingeben, diese aber auch in ganzen Sätzen als Fragen ausformulieren. Geantwortet wird aber weiterhin größtenteils mit Suchergebnislisten.</p>
<p>Bislang wurden als Quellen nur die Wikipedia und die Datenbank Freebase eingespeist. Das schränkt die Anzahl möglicher Suchergebnisse natürlich stark ein, so dass eine Vergleichbarkeit der Suchergebnisse im positiven wie im negativen Sinne mit den herkömmlichen großen Suchdiensten nicht gegeben ist.</p>
<p>Einige kleine Tests meinerseits - bislang läuft alles nur in englischer Sprache, der ich aber mächtig bin - verliefen auf den allerersten Blick noch nicht sehr verheißungsvoll.</p>
<p>Die Frage &#8220;who is merkel?&#8221; brachte mir als erstes Suchergebnis einen Treffer zu einer Stadt in den USA und erst an zweiter Stelle unsere Bundeskanzlerin, dahinter weitere Personen. Das ist natürlich legitim, denn warum sollte ich ausgerechnet nach dieser bestimmten Frau Merkel suchen? Andererseits würde es sich für die Zukunft anbieten, einen gewissen Popularitätsgrad zu berücksichtigen: wenn sich zeigt, dass die meisten User, die diese oder eine ähnliche Frage stellen, Angela Merkel meinen.</p>
<p>Erst &#8220;who is angela merkel?&#8221; zeigte dann direkt im Kopf der Suchergebnisse eine Tabelle mit einem Artikelanriss und Daten aus einer Datenbank, so z.B. dem Namen ihres Ehemannes.</p>
<p>Dann wollte ich mal sehen, wie die Amis es so mit ihrem Noch-Präsidenten halten. Frau Merkel ist vielleicht doch zu unbekannt. &#8220;who is bush?&#8221; zeigte nun auch gleich eine Tabelle im Kopf - aber diese enthielt nicht die Daten eines gewissen George W., sondern die der gleichnamigen Band. Ein paar Karteikartenreiter verwiesen auf andere Tabellen - eine gute Möglichkeit, mehrere potenziell gesuchte Entitäten mit Datenbankeinträgen zu präsentieren - die aber allesamt nichts mit dem Präsidenten zu tun hatten. Bis auf das zweite Suchergebnis, in dem der Gesuchte zumindest mittelbar vorkam (es ging um John McCain), gar nichts zu ihm auf der ersten Seite. Selbst Sängerin Kate Bush hat den Vorzug bekommen.</p>
<p>Die Frage &#8220;how is bush?&#8221; probiere ich lieber gar nicht erst, aber wie  wäre es mit &#8220;where is bush?&#8221;? Ich erfahre, dass er &#8220;Contained by&#8221; United States, Williamson County und Illinois ist, ersteres mit Flagge versehen. Ja, das kann schon sein, ist aber aufgrund der Quellen auch nicht so unwahrscheinlich.</p>
<p>Nun fallen mir aber so langsam die farblich markierten Textstellen auf, und genau hier kann man teilweise nachvollziehen, auf welche semantischen und linguistschen Prinzipien diese Suche in etwa basiert. Ortsnamen sind dunkelgelb hinterlegt, andere &#8220;Ortsbezeichnungen&#8221; wie etwa &#8220;school&#8221; geringfügig heller. Offensichtlich sind Powerset bestimmte Örtlichkeiten sowie Dinge, die die Bedeutung eines Ortes haben können, bekannt.</p>
<p>Hellgelb (über die von mir gewählten Farbbezeichnungen kann man durchaus streiten) hingegen ist alles hinterlegt, wodurch Powerset die Verbindung zwischen der gesuchten Entität und in diesem Beispiel der Ortsangabe herstellt - beispielsweise Präpositionen wie &#8220;of&#8221;, &#8220;in&#8221;, &#8220;on&#8221; samt weiterer dazwischen stehender Wörter wie bestimmten Artikeln oder weiteren aus semantischer Sicht nicht besonders interessanten &#8220;Füllseln&#8221;. Ähnlich funktioniert dies, wenn man zur Frage &#8220;who is &#8230;?&#8221; zurückkehrt. Hier ist das, was derjenige &#8220;ist&#8221;, mittelgelb hinterlegt, das Verb (und wiederum weitere Füllwörter), das die Prädikation über die gesuchte Entität herstellt - wie etwa &#8220;is&#8221;, &#8220;was&#8221; - hellgelb hinterlegt.</p>
<p>Fakt ist, dass noch eine Menge Arbeit zu machen ist und noch viel Verbesserungspotenzial drinsteckt. Die Suchgeschwindigkeit lässt gegenüber dem, was man von den üblichen Suchmaschinen gewohnt ist, auch noch zu wünschen übrig, und das trotz sehr viel weniger zu analysierender Datensätze - die aber natürlich um so rechenintensiver sind. Allzu praxistauglich ist Powerset somit noch nicht, aber es ist ja auch erst die Beta.</p>
<p>Aber für das semantisch geschulte Auge lassen sich durchaus Strategien erkennen, die sich <a title="Diskussion zum Thema im Hese-Forum" href="http://www.heise.de/newsticker/foren/S-Semantische-Suchmaschine-gestartet/forum-137119/list/" target="_blank">dem Laien nicht unbedingt erschließen</a>. Sicherlich kann man viel Kritik üben. Man darf aber von einer semantischen Suchmaschine auch nicht von heute auf morgen Wunder erwarten. Denn es ist, selbst bei zumindest halbautomatisch lernenden Systemen, schon ein großer Haufen Arbeit, menschliches Wissen über Konzepte und Bedeutungsbeziehungen auf eine Maschine bzw. ein Computerprogramm zu übertragen.</p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/PJ4hIMDp5o0" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/62008-05/semantische-suchmaschine-powerset-gestartet/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/62008-05/semantische-suchmaschine-powerset-gestartet/</feedburner:origLink></item>
		<item>
		<title>Bloggen über Semantik-Themen</title>
		<link>http://feedproxy.google.com/~r/semantik-blog/~3/iveyrI7HolI/</link>
		<comments>http://www.kraus-sonja.de/semantik/42008-05/bloggen-uber-semantik-themen/#comments</comments>
		<pubDate>Tue, 13 May 2008 20:27:28 +0000</pubDate>
		<dc:creator>Sonja Kraus</dc:creator>
		
		<category><![CDATA[Allgemein]]></category>

		<category><![CDATA[Semantik]]></category>

		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=4</guid>
		<description><![CDATA[An dieser Stelle möchte ich zunächst die Besucher in meinem neuen Blog willkommen heißen.
Ich bediene hier mit der Semantik sicherlich ein etwas ausgefalleneres Thema, das in anderen Weblogs so gut wie gar nicht thematisiert wird. Oft kommen ja mehr oder weniger allgemeine IT-Themen vor, oder jemand bloggt über alles Mögliche, was ihm gerade in den [...]]]></description>
			<content:encoded><![CDATA[<p>An dieser Stelle möchte ich zunächst die Besucher in meinem neuen Blog willkommen heißen.</p>
<p>Ich bediene hier mit der <strong>Semantik</strong> sicherlich ein etwas ausgefalleneres Thema, das in anderen Weblogs so gut wie gar nicht thematisiert wird. Oft kommen ja mehr oder weniger allgemeine IT-Themen vor, oder jemand bloggt über alles Mögliche, was ihm gerade in den Sinn kommt.</p>
<p>Dieses Blog soll sich jedoch ausschließlich mit Semantik-Themen beschäftigen, und zwar in mehr oder weniger IT-affiner Ausrichtung.</p>
<p>Warum ausgerechnet das Thema Semantik?</p>
<p>Nun, ich finde dieses Gebiet interessant, wichtig und strebe zumindest mittelfristig eine berufliche Tätigkeit in der Verknüpfung der linguistischen Theorien mit modernen IT-Technologien an.</p>
<p>Für das Erste Staatsexamen innerhalb meines Erststudiengangs (Deutsch + Latein Lehramt Sek. II; dazu kommen dann noch Abschlussklausuren für die Nebenfächer Allgemeine Sprachwissenschaft und Sprachliche Informationsverarbeitung im Magisterstudiengang), den ich derzeit beende, habe ich die Abschlussarbeit über folgendes Thema geschrieben: &#8220;Semantische Netze, semantische Merkmalsstrukturen und Prädikationen vor dem Hintergrund einer maschinellen Verarbeitung&#8221; - mit einer tendenziell eher linguistischen Ausrichtung, da im Fach Deutsch geschrieben.</p>
<p>Bei der Bearbeitung konnte ich vielfach nur an der Oberfläche bleiben und habe festgestellt, dass das Großthema sehr viel mehr hergibt.  So entstand die Idee, darüber zu bloggen. Dabei werde ich in loser Folge linguistische Grundlagen und in meiner Examensarbeit behandelte Teilbereiche ebenso vorstellen wie Entwicklungen in der &#8220;Szene&#8221; oder Bereiche wie etwa das &#8220;Semantic Web&#8221;, das in meiner Arbeit nicht thematisiert wurde, aber dennoch ein heißes Thema darstellt. Dazu kommen ganz grundsätzliche Überlegungen zu Sinn und Umsetzung.</p>
<p>Feedback ist dabei hochwillkommen. Denn in Gesprächen habe ich immer wieder festgestellt, dass es etwa über die Realisierbarkeit einer semantischen Suchmaschine unterschiedliche und bisweilen sehr pessimistische Ansichten gibt. Diskussionen in den Kommentaren sind also erwünscht.</p>
<img src="http://feeds.feedburner.com/~r/semantik-blog/~4/iveyrI7HolI" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.kraus-sonja.de/semantik/42008-05/bloggen-uber-semantik-themen/feed/</wfw:commentRss>
		<feedburner:origLink>http://www.kraus-sonja.de/semantik/42008-05/bloggen-uber-semantik-themen/</feedburner:origLink></item>
	</channel>
</rss>
