<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2full.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<channel>
	<title>‫מדע בזיוני‬</title>	
	<link>http://www.sciencefriction.net/blog</link>
	<description>‫מעניין. אולי זה אפילו נכון.‬</description>	<lastBuildDate>Fri, 30 Jul 2010 05:53:06 +0000</lastBuildDate>
	<language>he</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/scifri" /><feedburner:info uri="scifri" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><item>
		<title>‫סינית אני מדברת אליך‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/7nuWxWvc5EE/</link>
		<comments>http://www.sciencefriction.net/blog/2010/07/29/1005/#comments</comments>
		<pubDate>Thu, 29 Jul 2010 10:53:22 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[לשון הרע]]></category>
		<category><![CDATA[מגדל השן]]></category>
		<category><![CDATA[רכישת שפה]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=1005</guid>
		<description><![CDATA[&#8235;על מבטאים, כנסים וערוצים רועשים. נפתח בצחוקים על השכבות החלשות. למה בכלל לדבר אנגלית דווקא? במדור 'השראה' בכלכליסט כותב שיזף רפאלי  מה סוד כוחה של האנגלית (שמועברת לטיפול בדגש קל שישפכו עליה את זעמם).  אבל העיתוי מסתדר לי מצויין עם סיכום כנס ה-ACL. השנה קיבלתי החלטה לא להשחית את זמני על הרצאות של סינים. כשגזען [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p><strong>על מבטאים, כנסים וערוצים רועשים.</strong></p>
<p>נפתח בצחוקים על השכבות החלשות.<br />
<object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="350" height="320" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="src" value="http://www.youtube.com/v/oX708n-i-2U&amp;hl=en_US&amp;fs=1?rel=0&amp;border=1" /><param name="allowfullscreen" value="true" /><embed type="application/x-shockwave-flash" width="350" height="320" src="http://www.youtube.com/v/oX708n-i-2U&amp;hl=en_US&amp;fs=1?rel=0&amp;border=1" allowscriptaccess="always" allowfullscreen="true"></embed></object></p>
<p>למה בכלל לדבר אנגלית דווקא? במדור 'השראה' בכלכליסט כותב שיזף רפאלי  <a href="http://www.calcalist.co.il/local/articles/0,7340,L-3412162,00.html" target="_blank">מה סוד כוחה של האנגלית</a> (שמועברת לטיפול בדגש קל שישפכו עליה את זעמם).  אבל העיתוי מסתדר לי מצויין עם <a href="http://www.sciencefriction.net/blog/2010/07/25/979/" target="_blank">סיכום כנס ה-ACL</a>. השנה קיבלתי החלטה לא להשחית את זמני על הרצאות של סינים. כשגזען שכמותי אומר סינים מתכוון הוא מתכוון לכל סוגי האסייתיים מהמזרח הרחוק. הסיבה לזה היא שאני פשוט לא מצליח להבין מילה ממה שהם אומרים (באנגלית). המושג broken english מקבל אצלם משמעות חדשה. האנגלית שלהם לא שבורה אלא מרוסקת, כתושה וכתותה.  וזה לא רק התחביר אלא גם, בעיקר, המבטא. תוסיפו לזה שקפים עם עומס וויזואלי שיכול לגרום להלם קרב ותקבלו חצי שעה של בהייה תוך מאמץ קוגניטיבי שנידון לכישלון. בעבר הייתי מתאמץ. היום אני כבר למוד תבוסות ויודע שאין לי סיכוי. אני מעדיף לחכות עד שיגמרו לפתח את המתרגם הסימולטני &#8211; עניין של שנה-שנתיים. או עשר.</p>
<p><span id="more-1005"></span></p>
<p>הערה: זה טוב יפה לצחוק על שינים סינים והאנגלית שלהם, אבל כידוע, גם לנו היו כמה שרים בכירים שנשמעים כמו בוראט (וברשת מסתובבים גם כמה סרטונים בהם אני מדבר אנגלית ומי שרוצה לינק שימצא לבד):</p>
<p><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="350" height="320" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="src" value="http://www.youtube.com/v/BtcLRTMkx5M&amp;hl=en_US&amp;fs=1?rel=0&amp;border=1" /><param name="allowfullscreen" value="true" /><embed type="application/x-shockwave-flash" width="350" height="320" src="http://www.youtube.com/v/BtcLRTMkx5M&amp;hl=en_US&amp;fs=1?rel=0&amp;border=1" allowscriptaccess="always" allowfullscreen="true"></embed></object></p>
<p>בקיצור &#8211; אין יותר הרצאות של סינים (ולא של עמיר פרץ). חרם. וזה חבל. כי בכנסים במדעי המחשב (עיבוד שפה)  יש כחמישים אחוז אסייתיים (איך זה בתחומים אחרים? התגובות לרשותכם ). מה שאומר שחצי מהכנס הופך מראש ללא רלוונטי.  משיחות אקראיות עם קולגות מרחבי העולם עלו תובנות דומות. חלקם לא נכנסים להרצאות של סינים וחלקם נכנסים ועובדים על הלפטופ, יודעים מראש שקל יותר לפצח את האניגמה מאת המבטא של הדובר.  כאמור, חבל.</p>
<p>וכאן מגיעות כמה תהיות  עמוקות מני ים:</p>
<p>1. מה אפשר לעשות? (נניח, לחייב אותם למסור את התמליל מראש ולהפיק כתוביות כמו באופרה).<br />
2. מה זו האנגלו-צנטריות הזו? אם חמישים אחוז מהדוברים בכנס הם סינים (כבר שנים אומרים לנו שהם משתלטים על העולם) &#8211; אז מה פתאום מחייבים אותם לדבר אנגלית ולא סינית. הסתייגויות: א) 50% הם לא סיניים אלא אסייתיים. והם לא מדברים שפה משותפת. אפילו הסינים לא חולקים שפה משותפת. ב) הפניה חוזרת לרשימה שלונקקה מהשראה עם התאוריות המוזרות שלה.<br />
3. למה באמת הפכה האנגלית ללינגואה פרנקה? (<strong>פוליטיקה, השפעה כלכלית</strong>, וכו' הם החשודים המיידיים והנכונים)  האם באמת יש במבנה של האנגלית משהו קל יחסית ללימוד? או מבנים דיקדוקיים שמאפשרים העברה יחסית נקיה של מסר למרות רעש בדמות טעויות דקדוק והגייה?<br />
4. כששינים סינים [עם כינור גדול] מדברים אנגלית במבטא סיני &#8211; האם הם מבינים אחד את השני טוב יותר מנניח, איטלקי שמקשיב להם?</p>
<h3>ערוץ רועש, קידוד מקור, קידוד ערוץ</h3>
<p><span style="font-weight: normal; font-size: 13px;">הנקודה השלישית הזו גורמת לי להרהר בערוץ הרועש ותאוריות של <a href="http://en.wikipedia.org/wiki/Shannon's_source_coding_theorem" target="_blank">קידוד מקור</a> ו<a href="http://en.wikipedia.org/wiki/Noisy-channel_coding_theorem" target="_blank">קידוד ערוץ</a>. אני נכנס כאן לשדה מוקשים בלי מפה. <strong>הפסקה הבאה היא איזור הדימדומים של הספקולציות הפרועות</strong> (<strong>אני לא מבין מספיק בבלשנות</strong> או <strong>בשפות</strong>, גם לא <strong>בתורת האינפורמציה</strong>).  האם המבנים הדיקדוקיים, המורפולוגיה והפונטיקה של האנגלית מאפשרים קידוד יעיל כך שגם כשהמסר עובר ב&quot;ערוץ רועש&quot; (כלומר דיקדוק משובש ומבטא מוזר) ניתן לפענח אותו בקלות יחסית.  ותהייה נוספת בעקבות #4 &#8211; איך התפלגויות רעש שונות (כלומר מבטאים שונים, למשל סיני, קוריאני או עברי) משפיעות על הקושי בפיענוח. ﻿כאן אני חוזר לרעיון דומה לזה שכתב שיזף רפאלי בכלכליסט. הוא דיבר על &quot;</span><span>הגמישות והנוחות שלה [של האנגלית, א.צ.] לבריות&quot;</span>. האנגלית, הוא כותב &quot;<span> יותר מכל שפה אחרת, האנגלית תמיד היתה מוכנה להתגמש, &quot;לרדת אל העם&quot;, לעטות בלויי סחבות&quot;. אני חושב שהוא מתכוון במובן הסוציולוגי. אני לוקח את זה לכיוון הבלשני-קוגניטיבי (אבל אני לא מדבר על מבנים דיקדוקיים &quot;קלים&quot; ללימוד אלא על מבנים ופונטיקה קלים לפיענוח). כמובן שסביר להניח שכמוהו-כמוני &#8211; גם אני מדבר שטויות.<br />
</span></p>
<p>אהמ&#8230; הפסקה הקודמת שנכתבה כלאחר יד  נראית לי פתאום נורא מעניינת. האם יש עבודות ומחקרים בכיוון הזה? האם זה כיוון מופרך מיסודו? בין המשיבים יוגרל פוסט חינם.</p>
<h3>נספחים:<br />
<span style="font-weight: normal; font-size: 13px;">1. בפינת טקבק למטקבק, אני חייב לצטט את הטוקבק (#7) המקושקש הבא <strong>אנגלית היא שפה דמוקרטית</strong> (בחיי, לא נגעתי): </span></h3>
<p>&quot;לדעתי האנגלית היא שפה &quot;דמוקרטית&quot;. היא מייצגת תרבות ושפע, כח והשפעה וגם  תפיסה פוליטית מדינית וחופש מעריצות דתית. הכינוי  &quot;לינגווה פראנקה&quot; &#8211; השפה הכנה, ניתן לאנגלית באירופה עוד במאות ה-16, וה-17  משום שהאנגלית הייתה חופשיה מהכבלים שהכנסיה הקתולית הטילה על ההשכלה  והאינטלקטואלים. זו גם הסיבה לדעיכתה של השפה הלטינית מול עלייתה של השפה  האנגלית ככלי לביטוי רעיונות חופשיים ומחקרים מדעיים החופשי מכבלי הכנסייה.  התעצבות המשטר הדמוקרטי בארה&quot;ב ובבריטניה רק חיזק את מעמד השפה החופשית  הדמוקרטית &#8211; זו שלא כפתה את עצמה בכוח, בניגוד לרוסית ולסינית שלימודן נכפה  בכוח על תלמידי הטריטוריות שבתחום הכיבוש וההשפעה של אותן מעצמות&quot;.<br />
פחחחחחחחח.</p>
<p>2. ביפן לא עובדים רק על המבטא אלא על האינטונאציה. זו של ברק אובמה:</p>
<p><object id="wsj_fp" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="350" height="335" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="flashvars" value="videoGUID=18ABFD73-31F6-435C-A8CD-25EBA4A5B254&amp;playerid=1000&amp;plyMediaEnabled=1&amp;configURL=http://wsj.vo.llnwd.net/o28/players/&amp;autoStart=false" /><param name="src" value="http://s.wsj.net/media/swf/main.swf" /><param name="name" value="flashPlayer" /><param name="bgcolor" value="#FFFFFF" /><param name="allowfullscreen" value="true" /><embed id="wsj_fp" type="application/x-shockwave-flash" width="350" height="335" src="http://s.wsj.net/media/swf/main.swf" bgcolor="#FFFFFF" name="flashPlayer" flashvars="videoGUID=18ABFD73-31F6-435C-A8CD-25EBA4A5B254&amp;playerid=1000&amp;plyMediaEnabled=1&amp;configURL=http://wsj.vo.llnwd.net/o28/players/&amp;autoStart=false" allowscriptaccess="always" allowfullscreen="true"></embed></object></p>
<p>3. ב<a href="http://www.sciencefriction.net/blog/2007/09/16/12/" target="_blank">מבצע: פינוקי בריות</a> כתבתי על מבטאים, דיאלקטים, חוקים דיקדוקיים ושינויים בהם.</p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/7nuWxWvc5EE" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/07/29/1005/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/07/29/1005/</feedburner:origLink></item>
		<item>
		<title>‫ACL CoNLL 2010 – פרינג' מדעי ועל הצורך בקהילה‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/kv2J9Pqn_qM/</link>
		<comments>http://www.sciencefriction.net/blog/2010/07/25/979/#comments</comments>
		<pubDate>Sun, 25 Jul 2010 13:18:14 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[מגדל השן]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=979</guid>
		<description><![CDATA[&#8235;לפני שבועיים התקיים באופסלה, שוודיה כנס ה-ACL (Association for Computational Linguistics) ובצמוד לו ה-CoNLL (Computational Language Learning). בגדול אפשר להגדיר את הכנס כשיעמום. הריגוש הגדול נרשם בדרך לכנס כשאחרי שעתיים נחת המטוס שוב בבן גוריון (&#34;תקלה קלה במערכת החשמל&#34;). נחיתה שגרמה לפיספוס הקונקשן, ביזבוז לילה בהונגריה ופיספוס של החצי הראשון של גמר המונדיאל ושל חצי [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p>לפני שבועיים התקיים באופסלה, שוודיה כנס ה-<a href="http://acl2010.org/index.htm" target="_blank">ACL</a> (Association for Computational Linguistics) ובצמוד לו ה-CoNLL (Computational Language Learning). בגדול אפשר להגדיר את הכנס כשיעמום. הריגוש הגדול נרשם בדרך לכנס כשאחרי שעתיים נחת המטוס שוב בבן גוריון (&quot;תקלה קלה במערכת החשמל&quot;). נחיתה שגרמה לפיספוס הקונקשן, ביזבוז לילה בהונגריה ופיספוס של החצי הראשון של גמר המונדיאל ושל חצי היום הראשון של הכנס. מלבד זאת עבר הכנס ללא אירועים מיוחדים. ובכל זאת &#8211; שליחנו בשוו\בדיה מדווח על כמה מאמרים מעניינים, מתחבט בחשיבותה של הקהילה האקדמית ומביא לכם כמה תמונות* (אופסלה, סטוקהולם**).</p>
<p style="text-align: center;"><a href="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/12072010315.jpg"><br />
</a><img class="size-medium wp-image-993 alignleft" title="מדרחוב באופסלה. מה אתה רואה?" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/13072010321-225x300.jpg" alt="" width="225" height="300" /></p>
<p><span id="more-979"></span></p>
<p>יש הסוברים כי כנסים אקדמיים מטרתם שמיעת הרצאות והחלפת דעות. כמובן שזו טעות. כנסים מטרתם שיווק עצמי ויצירת קשרים. החלפת דעות היא רק אחד הכלים בארסנל &#8211; משני בחשיבותו לשתיית בירה משותפת. ובכן, בזירת הבירה נרשמה אכזבה רבתי. תוסיפו לזה את אופסלה &#8211; עיר אקדמית משמימה עד מוות, גל חום ששטף את סקנדינביה נטולת המזגנים ואת השיעמום הצפוי מכנס ענק וטכני ברובו וקבלו סוג של שירות מילואים. חום כבד, הפגישה השנתית עם האנשים המוכרים וימים מעולפים נגררים בלי תכלית מוגדרת. איך (בערך) שר מאיר אריאל &#8211; &quot;בחדר מחכים לי חום ותה, פילחי תפוח וסיגריה וסיפור חזק וטוב&#8230; נפלו עוד ארבע חמש סיגריות  ופתאום נגמר לי כאן השיר&#8230; לילה קצר עבר על כוחותינו באופסלה&quot;.</p>
<p style="text-align: center;"><a href="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/12072010315.jpg"><img class="aligncenter" title="זהירות חתולים חוצים. מרתק באופסלה." src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/12072010315-1024x768.jpg" alt="" width="442" height="332" /></a></p>
<p><strong>סיכום ביניים מיקצועי</strong> &#8211; שלוש שיחות ארוכות וחשובות עם פוטנציאל מחקרי/שת&quot;פי (כולן עם ישראלים עמם אני נפגש גם בארץ). שתי שיחות שלח לחמך קלושות עם חוקרים מחו&quot;ל. אכזבה רבתי מהברזתה של <a href="http://www.cs.cornell.edu/home/llee/" target="_blank">ליליאן לי</a> המעולה שהייתה אמורה להעביר את ההרצאה המוזמנת (ואני הייתי אמור להתקרצץ עליה בקשר לפוסט-דוק).</p>
<h3>קהילה</h3>
<p>אחת התובנות אותם רוכש בעמל תלמיד הדוקטורט היא חשיבותה של הקהילה. לאוניברסיטה מגיע סטודנט חדור אידיאליים ותשוקת מחקר. רוממות החופש האקדמי בגרונו והוא משוכנע שכל מה שהוא צריך הוא לעשות מה שבא לו. לחקור את מה שמעניין אותו. ואז, בין דחיה לדחיה הוא מגלה שהמחקר לא מתקיים בוואקום אלא בקהילה. המאמר צריך להיות ממוען לקהילה מסויימת, הן תוכנית והם סיגנונית. ואז להתגמש ולהיתפתל. או למצוא את הקהילה המתאימה שלא תמיד קיימת. במובן זה השיעמום שלי מה-ACL הוא די צפוי. אבל במקרה שלי עוד לא ממש מצאתי את הקהילה הנכונה. והשם (שטוב משמן טוב) בקהילה הוא קריטי עד למאוד בבואך לחפש פוסט-דוק או משרה. ענייני הקהילה האקדמית וחסרונה דורשים פוסט נפרד, אולי תרומה ל<a href="http://hahem.co.il/false/%D7%9E%D7%93%D7%A8%D7%99%D7%9A-%D7%9E%D7%A4%D7%95%D7%9B%D7%97-%D7%9C%D7%AA%D7%9C%D7%9E%D7%99%D7%93%D7%99-%D7%9E%D7%97%D7%A7%D7%A8-%D7%90%D7%A8%D7%9B%D7%99%D7%95%D7%9F" target="_blank">מדריך המפוכח לתלמיד המחקר</a>.</p>
<p style="text-align: center;"><a href="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/15072010375.jpg"><img class="size-medium wp-image-997 aligncenter" title="איזו מין שלווה (אמסטרדמית כמעט)" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/15072010375-300x225.jpg" alt="" width="300" height="225" /></a></p>
<p>לזכות  קברניטי ה-ACL נציין שגם הם מודעים לשיממון שהכנס משרה ולכן בשנים האחרונות מנסים לרענן קצת את השורות, לקבל גם מאמרים קצת שונים והשנה אפילו דיברו באריכות על שינוי שיטת הקבלה . כמעט ימות משיח. השינוי מתחיל מבפנים ויגיע, אולי, בעוד עשור.</p>
<p><strong>הרגע המרגש</strong> &#8211; הצגתי את המאמר של <a href="http://www.sciencefriction.net/blog/2010/07/09/956/" target="_blank">דמיטרי</a> ז&quot;ל. המאמר עצמו אלגנטי מאוד עם אלגוריתם שמשלב גרפים ואיחזור מידע מבוסס תבניות על מנת להעריך גדלים מסתוריים: <a href="http://www.cs.huji.ac.il/~arir/10-objsize-acl-2010.pdf" target="_blank">Extraction and approximation of numerical attributes from the web</a>.  כרגיל אצל דמיטרי, התוצאות הן לא פחות ממרשימות. הקדשתי גם כמה דקות לדבר על דמיטרי ועל המחקר שלו באופן כללי. אני חייב לציין שזה היה קשה (נפשית) ממה שחשבתי. אחרי המושב ניגשו אלי כמה אנשים שהכירו את דמיטרי ואת העבודות שלו וזה היה מנחם משהו.</p>
<h3>ומה בכל זאת היה לנו</h3>
<p>באופן כללי, סכמטי ולגמרי סובייקטיבי אני אחלק את הכנס לשלושה תחומים עיקריים. פרסינג  (parsing), איחזור מידע ושימוש אינטליגנטי (IR, summarization, entailment) ואחרים. מביני דבר מספרים שהפרסינג היה די משעמם למרות כמה מאמרים חזקים. באופן מסורתי, <a href="http://nlpers.blogspot.com/" target="_blank">האל דאום</a> (השלישי!) נוהג לספק סקירה של המאמרים שעניינו אותו בכנסים. הסקירה שלו בא תבוא, אני מניח, והיא כנראה תהיה שונה לגמרי מהסקירה שתובא להלן ותורכב בעיקר מהפרינג'.</p>
<p>ביאטה קלבנוב הציגה מאמר נאה שמשתמש במודל תורת-משחקימי כדי לתאר שימוש חוזר במטאפורות על יריבים פוליטיים (השאלה המרכזית היא למה יריבים פוליטיים משתמשים באותה מטאפורה למרות שהיא נתבעה על ידי צד אחד ואימוץ המטפורה על ידי הצד השני משחק, לכאורה, לידיים של טובע המטאפורה):<br />
<a href="http://www.aclweb.org/anthology-new/P/P10/P10-1072.pdf" target="_blank">A Game theoretical model for metaphorical bergaining</a><br />
אסוציאציה &#8211; מאמר/שיחה של בורחס על עושר מטאפורי אינסופי שנבנה על מספר מצומצם מאוד של מטאפורות. המאמר הבורחסי מופיע בספר <a href="http://readingmachine.co.il/home/books/1193067462" target="_blank">מלאכת השיר</a>.</p>
<p>בגזרת ה-entailment (המצאה ישראלית מבית בר אילן שהפכה ללהיט מחקרי ולתחום בפני עצמו), מלבד מאמרים נאים של יהונתן ברנט ושל שחר מירקין, משך את תשומת ליבי דווקא מאמר-פוסטר של האיש רב השמות כריסטיאן דנסקו-ניקולסקו-מיציל (עם ליליאן לי). מה שנחמד במאמר הוא השימוש במושג המרתק של negative polarity items &#8211; מושג בלשני טהור, על מנת לפתור בעייה הנדסית של הסקת מסקנות מסוג מסויים (downward entailing operators). השילובים האלו של בלשנות אמיתית במחקר הטכני (NLP) הם נדירים ומשובבים. מלבד זאת, NPI הם קבוצת ביטויים חביבה עלי במיוחד, למשל ב<a href="http://www.sciencefriction.net/blog/2007/11/01/41/" target="_blank">שום שרוכי נעליים</a>. אה, והמאמר מכיל גם התחכמות מעניינת על יציר תביטויים כאלו באופן מלאכותי, טריק ליליאני אופיני:  <a href="http://www.cs.cornell.edu/home/llee/papers/clue.pdf" target="_blank">Don't have a clue? Unsupervised learning of downward entailing operators</a>.</p>
<p>מאמר נוסף שאהבתי, מעט יותר מיינסטרימי הוא של זורניצה קוזרבה (Zornitsa Kozareva) ואדוארד הובי:  <a href="http://www.google.com/url?sa=t&amp;source=web&amp;cd=1&amp;ved=0CBYQFjAA&amp;url=http%3A%2F%2Fwww.isi.edu%2F~kozareva%2Fpapers%2Fkozareva_acl2010.pdf&amp;ei=wiVMTKipNoynOPiz-JUD&amp;usg=AFQjCNEIz3IAmPkpv_JX-VOcoP_0FVEz9g&amp;sig2=Hlo9sadrCH-aYv8Jpe-fvw" target="_blank">Learning arguments and supertypes of semantic relations using recursive patterns</a>. המאמר מציע אלגוריתם ללמידת יחסים סמנטיים, זה לא חדש, אבל הוא משתמש בזרע (seed) יחיד לתהליך המינכהוזני של ה-bootstrappingוזה כבר מעניין כי תהליך כזה, אלגנטי ומגניב בעיקרון, נוטה להכניס למערכת רעש בלתי נשלט. אגב, היה שווה לשמוע את זורניצה ולו בשל האיזכור של מאמר אחר שלה מה-NAACL. המאמר הזה עבר לי מתחת לרדאר ובעיקרון הוא עוסק הערכה של הפרודוקטיביות של 'זרעים' (שכאמור, יש להם נטיה להצמיח גידולי פרא): <a href="http://www.isi.edu/~kozareva/papers/kozareva_goodness_seeds_naacl10.pdf" target="_blank">Not all seeds are equal: measuring the quality of text mining seeds</a>.</p>
<p>ועדיין בבמיינסטרים, אם כי בפרבריו &#8211; מאמר של הקולגות עמרי אבנד ורועי רייכרט שעושים unsupervised pos tagging ,תוך שימוש בפרסר לא סטנדרטי (ומעניין) ותוך הישענות על תורת הטיפוסים (prototypes) הקוגניטיבית: <a href="http://www.google.com/url?sa=t&amp;source=web&amp;cd=2&amp;ved=0CBsQFjAB&amp;url=http%3A%2F%2Fwww.cs.huji.ac.il%2F~arir%2F10-proto_pos-acl-2010.pdf&amp;ei=QShMTIPWAo-6OLGEhJcD&amp;usg=AFQjCNGRVCTiTtBxeYCrPHQSyU3hwXQf9A&amp;sig2=EGB0j4S3RKGUTQ-ff2Zhcg" target="_blank">Improved unsupervised POS induction through prototype discovery</a>.</p>
<p>הקורא חד העיין ורגיש הלב כבר שם לב שההעדפות שלי נוטות למאמרים שמערבים קצת רגש, כלומר תובנות מתחומים אחרים ולא רק מדווחים על איזה טוויק אלגוריתמי ששיפר תוצאה קודמת בפרומיל &#8211; מה שאני מכנה ביומרה &#8211; מאמרים עם שאר רוח. לכן הזוכה הגדול (שאכן זכה בפרס המאמר הסטודנטיאלי הטוב ביותר) הוא: <a href="http://www.google.com/url?sa=t&amp;source=web&amp;cd=1&amp;ved=0CBYQFjAA&amp;url=http%3A%2F%2Fwww.cs.columbia.edu%2F~delson%2Fpubs%2FACL2010-ElsonDamesMcKeown.pdf&amp;ei=QypMTPj-F6WiOKuatJYD&amp;usg=AFQjCNEJza_v38BKBs5ZqCpA7CUTyp2L7g&amp;sig2=RwY77-FqU7BHQwnCe6U-0w" target="_blank">Extracting Social Networks from Literary Fiction</a>, של אלסון, דמס ומק-אוון. במאמר הם בונים מעין רשת חברתית של דמויות מקלסיקות של המאה ה-19. הרשת החברתית בנויה על סמך ניתוח (אוטומטי, כן?) של דיאלוגים בין הדמויות. זה מגניב. אבל מגניב מזה הוא השימוש שהם עושים בגרף החברתי על מנת להפריך תאוריות ספרותיות מקובלות שמנתחות את תופעת העייור (אורבניזציה) כפי שהיא משתקפת ביחסי הדמויות בקלסיקות תקופתיות. זה מה שאני קורא מאמר עם השלכות מעשיות. הקץ להנדסה! ריתמו את האלגוריתמיקה לטובת מדעי הרוח!</p>
<p><a href="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/15072010337.jpg"><img class="aligncenter size-medium wp-image-992" title="מדעי הרוח בקתדרלה של אופסלה" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/07/15072010337-300x225.jpg" alt="" width="300" height="225" /></a></p>
<div>
<p>&#8212;-</p>
</div>
<p>*את המצלמה שכחתי בבית ואתם זוכים להנות ממצלמת הסלולרי (nokia 5800). לא רעה בצילומי חוץ רבי תאורה. נוראית לצילומי פנים. עמכם הסליחה.<br />
**בניגוד לאופסלה המשמימה***, הארכיפלגו הסטוקהולמי דווקא מגניב על שלל המוזאונים, הקניונים המפוארים (לא שמעו על המיתון העולמי?!) והקסבה הימי-ביניימית של העיר העתיקה .<br />
***הקתדרלה הגדולה של אופסלה דווקא מעניינת והמעוניינים הסינמטיים יוכלו להתחקות בעיר על עקבותיו של אינגמיר ברגמן אוייב הכנסיה****.<br />
****(*****)לפי מאמר שלו שהופיע באסופה עולם בדים של הלגה קלר [מזיכרון].<br />
*****לא יכולתי להתאפק מלהוסיף עוד הערה עטורת כוכביות.</p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/kv2J9Pqn_qM" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/07/25/979/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/07/25/979/</feedburner:origLink></item>
		<item>
		<title>‫בין חסמבה ל-GNU‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/5jYl2i3anh4/</link>
		<comments>http://www.sciencefriction.net/blog/2010/07/18/969/#comments</comments>
		<pubDate>Sun, 18 Jul 2010 14:51:48 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[לא חודש ולא שבת]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=969</guid>
		<description><![CDATA[&#8235;בכיתה ד' או ה' נחת עלי חיידק הסדרות. באותה שנה קראתי בשיטתיות את כל ספרי טרזן (10), כל סיפורי שרלוק הולמס (4 קובצי סיפורים קצרים ועוד 3 או ארבעה סיפורים ארוכים יותר) וגם את כל סיפרי חסמב&#34;ה שיצאו עד אז (32, נדמה לי). כשאורי קציר הזמין אותי לסיור בעקבות חסמבה בתל אביב ששתי כמוצא שלל [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p>בכיתה ד' או ה' נחת עלי חיידק הסדרות. באותה שנה קראתי בשיטתיות את כל ספרי טרזן (10), כל סיפורי שרלוק הולמס (4 קובצי סיפורים קצרים ועוד 3 או ארבעה סיפורים ארוכים יותר) וגם את כל סיפרי חסמב&quot;ה שיצאו עד אז (32, נדמה לי). כשאורי קציר הזמין אותי לסיור <a href="http://www.aplaton.co.il/story_610" target="_blank">בעקבות חסמבה בתל אביב</a> ששתי כמוצא שלל רב. גם נוסטלגיה מהילדות, גם סיפורי תל אביב גם מדריך שעל טיבו הגיעו אלי שברי שמועות וגם רציתי לפגוש את אורי.</p>
<p><span id="more-969"></span></p>
<p>כבר בתחילת הסיור הסתבר שאני בור סוד סדוק. אורי הקריא מהספר הראשון שסצנה דרמטית ממנו התרחשה בפינת הרחובות דיזינגוף וארלוזרוב, בדיוק במקום בו עמדנו. בעוונותי לא ממש זכרתי שום דבר מעלילות חסמבה. זכרתי את הגיבורים, זכרתי את המערה החשמלית אבל לא זכרתי ולו אחד מגיבורי המשנה ואף אחת מהעלילות.  אוי לבושה.</p>
<p>ולמרות זאת הסיור היה מרתק. יגאל מוסינזון, שבתוך עמו הוא ישב, כתב על בעלי הבית (ירון לונדון) ועל השכנים. על הרוקח בפינת הרחוב ועל תחנת המשטרה שמול החלון (שם התחיל הסיור). אורי הוביל אותנו במרחבי הספקולציה הספרותית שקושרת פיסות מהחיים של מוסינזון אל השמות והמקומות בספר. אין חובב רכילות שלא יתענג על ההשערות בדבר זהותה של תמר או גישתו החברתית של מוסינזון.</p>
<p>[הערה: הופתעתי לגלות שרבים מהדמויות משוייכות במובהק למשפחות פועלים. זה (ירון) בנו של מסגר וזה [אהוד השמן] בנו של נהג משאית&#8230; ]</p>
<p>בנוסף לענייני חסמבה השונים סיפר אורי גם על אושיות תל אביביות צבעוניות. בין היתר הופיעו לסיור גם לאה גולדברג הערירית וחובבת הילדים. שמעון צבר, פסל וסופר ילדים [עשה את הפסיפס בבריכה בגן העצמאות] שגלה ללונדון, מרגוט קלאוזנר המליונרית הייקית שהביאה לארץ את תאטרון הבימה, פרשה בכעס ובסוף הפכה לספיריטואליסטית ועוד טיפוסים מטיפוסים שונים כמו גם בית קברות סודי וכמובן מערה חשמלית אחת נסתרת בין סלעי הכורכר.  [לסיור הצטרף גם ילד ששאל האם המערה באמת קיימת. העירוב הבורחסי בין בדיה למציאות בהחלט היה מבלבל ומענג.]</p>
<p>בקיצור &#8211; תודה לאורי ומומלץ לחובבי הנוסטלגיה, משוגעי ההיסטוריה ולאוהבי תל אביב.</p>
<p>אורי. למעשה הצטרפתי לסיור גם כדי לפגוש את אורי, האיש שמאחורי אפלטון. לצערי לא יצא לי ממש לדבר איתו כי בסוף הסיור הייתי חייב לרוץ לקחת את הילד מהגן. אולי בסיור הבא.</p>
<p>וכמובן שאני לא יכול בלי הערה טרחנית-מקצועית-אסוציאטיבית-מנפחת שכל. חסמב&quot;ה היא הרי 'חבורת סוד מוחלט בהחלט'. בכל פעם שמישהו פלט את הצירוף &quot;חבורת חסמבה&quot; צרם לי הייתור המיותר. זה אמנם לא ממש שם רקורסיבי כמו GNU וגם לא ממש למת הניפוח אבל אלו קפצו לי לראש.</p>
<p>תוכן חצי מסחרי: <a href="http://www.aplaton.co.il/story_610" target="_blank">כאן</a> תוכלו לראות הזמנה לסיור הבא ולינקים לפוסטים אחרים המספרים על הסיור, כל אחד מהזווית שלו, חלקם כוללים צילומים מהסיור.</p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/5jYl2i3anh4" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/07/18/969/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/07/18/969/</feedburner:origLink></item>
		<item>
		<title>‫הרב יהודה עמיטל, דמיטרי דוידוב‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/MKEbK6HB8y4/</link>
		<comments>http://www.sciencefriction.net/blog/2010/07/09/956/#comments</comments>
		<pubDate>Fri, 09 Jul 2010 14:29:28 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[לא חודש ולא שבת]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=956</guid>
		<description><![CDATA[&#8235;אַרְבַּע מִדּוֹת בָּאָדָם. הָאוֹמֵר שֶׁלִּי שֶׁלִּי וְשֶׁלְּךָ שֶׁלָּךְ, זוֹ מִדָּה בֵינוֹנִית. וְיֵשׁ אוֹמְרִים, זוֹ מִדַּת סְדוֹם. שֶׁלִּי שֶׁלָּךְ וְשֶׁלְּךָ שֶׁלִּי, עַם הָאָרֶץ. שֶׁלִּי שֶׁלָּךְ וְשֶׁלְּךָ שֶׁלָּךְ, חָסִיד. שֶׁלִּי שֶׁלִּי וְשֶׁלְּךָ שֶׁלִּי, רָשָׁע (מסכת אבות ה,י) הרב יהודה עמיטל, ראש ישיבת הר עציון ומייסד מימד נפטר היום. את המשנה הזו שמעתי אותו מסביר לא כמחלוקת בין [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><blockquote><p>אַרְבַּע מִדּוֹת בָּאָדָם. הָאוֹמֵר שֶׁלִּי שֶׁלִּי וְשֶׁלְּךָ שֶׁלָּךְ,  זוֹ מִדָּה בֵינוֹנִית. וְיֵשׁ אוֹמְרִים, זוֹ מִדַּת סְדוֹם. שֶׁלִּי  שֶׁלָּךְ וְשֶׁלְּךָ שֶׁלִּי, עַם הָאָרֶץ. שֶׁלִּי שֶׁלָּךְ וְשֶׁלְּךָ  שֶׁלָּךְ, חָסִיד. שֶׁלִּי שֶׁלִּי וְשֶׁלְּךָ שֶׁלִּי, רָשָׁע (מסכת אבות ה,י)</p></blockquote>
<p>הרב <a href="http://www.haaretz.co.il/hasite/spages/1178830.html" target="_blank"><strong>יהודה עמיטל</strong></a>, ראש ישיבת הר עציון ומייסד מימד נפטר היום. את המשנה הזו שמעתי אותו מסביר לא כמחלוקת בין התנא ל'יש אומרים' אלא באופן הבא: כשאדם בודד אומר &quot;שלי- שלי ושלך-שלך&quot; זוהי מידה בינונית. כלומר מצב סביר שאפשר לקבל. כשלא אדם אחד חושב כך כפרט אלא רבים (&quot;יש אומרים&quot;), כלומר התפיסה החברתית המקובלת היא של חוסר ערבות הדדית (קפיטליזם דורסני)  אז זוהי מידת סדום.</p>
<p>אני חושב שהפירוש ההומניסטי הזה, שמובא כאן כאנקדוטה לזכרו, משקף את הגישה של הרב עמיטל כמחנך וכאיש ציבור.</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8211;</p>
<p>השתיקה בבלוג נבעה ממותו של <strong>דמיטרי דוידוב</strong> (<strong>Dmitry Davidov</strong>) &#8211; קולגה שכתב איתי כמה מאמרים (שני המאמרים על ה<a href="http://www.sciencefriction.net/blog/category/%D7%9E%D7%92%D7%93%D7%9C-%D7%94%D7%A9%D7%9F/%D7%A1%D7%A8%D7%A7%D7%96%D7%9D-%D7%90%D7%99%D7%A8%D7%95%D7%A0%D7%99%D7%94-%D7%95%D7%99%D7%A8%D7%A7%D7%95%D7%AA/" target="_blank">סרקזם</a> ומאמר על זיהוי סנטימט בטוויטר). דמיטרי נפטר לפני כמה שבועות. רציתי לכתוב עליו כמה מילים ולא בדיוק ידעתי איך. הנה, נעשה את זה יבש.</p>
<p>דמיטרי הגיש את הדוקטורט לפני חודש והיה אמור לנסוע לפוסט-דוק בקיימברידג'. ביום ראשון הקרוב היינו אמורים לנסוע ביחד לכנס בשוודיה (ACL, CoNLL), אחריו הוא תכנן להמשיך לטרק חוצה סקנדינביה (הלונלי פלנט נורבגיה שלי אצלו). אני ארצה בכנס במקומו על המחקר <strong>שלו</strong>. וזה מוזר וקשה. ובכל זאת אשמח לעשות את זה ולנצל חלק מזמן ההרצאה לדבר על דמיטרי וגם לסקור את המחקר שלו באופן כללי ולא להציג רק את המאמר הספציפי.</p>
<p>דמיטרי, שהיה חוקר מבריק (14 מאמרים בפורומים נחשבים במהלך הדוקטורט) היה גם אדם צנוע, מעט מופנם אבל מעולם לא מתנשא ותמיד שמח לעזור. ללא ספק הוא היה מאלו האומרים &quot;שלי &#8211; שלך ושלך &#8211; שלך&quot;, עליהם נאמר &quot;חסיד&quot;.</p>
<p>יהי זיכרו ברוך.</p>
<p><small><br />
ל<a href="http://icnc.huji.ac.il/dmitrydavidov/" target="_blank">דף הזיכרון</a> שיצרו עבורו בתוכנית לחישוביות עצבית (ICNC).<br />
והנה התרשמות יפה ב<a href="http://dagesh.wordpress.com/2010/07/10/%D7%93%D7%9E%D7%99%D7%98%D7%A8%D7%99-%D7%93%D7%95%D7%99%D7%93%D7%95%D7%91-1975-2010/" target="_blank">דגש</a> קל.<br />
</small></p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/MKEbK6HB8y4" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/07/09/956/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/07/09/956/</feedburner:origLink></item>
		<item>
		<title>‫מחול אחרון ופרידה‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/JgyO4DFiZIk/</link>
		<comments>http://www.sciencefriction.net/blog/2010/06/14/930/#comments</comments>
		<pubDate>Mon, 14 Jun 2010 08:13:47 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[מגדל השן]]></category>
		<category><![CDATA[סרקזם אירוניה וירקות]]></category>
		<category><![CDATA[רשת]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=930</guid>
		<description><![CDATA[&#8235;אל חשש, לא פרידה מהבלוג, לא יסתמו לי את הפה כל כך מהר, אלא פרידה מחמש עשרה הדקות שלי שמרחתי עד עכשיו. מכאן והלאה יחזור הבלוג לעסוק בהא וב-duh! הרגילים שלו. ובינתיים הודעה מנהלתית (ISCOL), עוד צרור לינקים אחרון בענייני זיהוי סרקזם (עידכון ראיונות כמובטח), קומיקס ועל הגילגול של המחקר האקדמי אל הדיווח הפופולרי: שבעים [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p><span style="font-family: 'DejaVu Sans';">אל חשש</span>, <span style="font-family: 'DejaVu Sans';">לא פרידה מהבלוג</span>, <span style="font-family: 'DejaVu Sans';">לא יסתמו לי את הפה כל כך מהר</span>, <span style="font-family: 'DejaVu Sans';">אלא פרידה מחמש עשרה הדקות שלי שמרחתי עד עכשיו</span>. <span style="font-family: 'DejaVu Sans';">מכאן והלאה יחזור הבלוג לעסוק בהא וב</span>-duh! <span style="font-family: 'DejaVu Sans';">הרגילים שלו</span>. <span style="font-family: 'DejaVu Sans';">ובינתיים הודעה מנהלתית</span> (ISCOL), <span style="font-family: 'DejaVu Sans';">עוד צרור לינקים אחרון בענייני זיהוי סרקזם (עידכון ראיונות כמובטח)</span>, <span style="font-family: 'DejaVu Sans';">קומיקס ועל הגילגול של המחקר האקדמי אל הדיווח הפופולרי</span>: שבעים פנים לתורה. <span id="more-930"></span></p>
<h3><span style="font-family: 'DejaVu Sans';">מנהלה</span>: <span style="font-family: 'DejaVu Sans';">הרצאה שלי על זיהוי סרקזם באוניברסיטת תל אביב (ISCOL)</span></h3>
<p><span style="font-family: 'DejaVu Sans';"><strong>ביום רביעי</strong> הקרוב תארח אוניברסיטת תל אביב  את ה</span>-ISCOL (<span style="font-family: 'DejaVu Sans';">הסמינר הישראלי לבלשנות חישובית</span>) <span style="font-family: 'DejaVu Sans';">השנתי </span>(<span style="font-family: 'DejaVu Sans';">בערך</span>). <span style="font-family: 'DejaVu Sans';">אם אתם רוצים לדעת מה עושים אנשי הבלשנות החישובית הישראלים אז זה המקום להתעדכן</span>. <span style="font-family: 'DejaVu Sans';">בפאנל האחרון אני ארצה על זיהוי סרקזם ואירוניה באמזון ובטוויטר ומשמח שתהיה שם הרצאה נוספת על אירוניה </span>(<span style="font-family: 'DejaVu Sans';">רחל גיורא</span>). <span style="font-family: 'DejaVu Sans';">הכניסה חופשית אבל מותנית ברישום מוקדם</span>. <span style="font-family: 'DejaVu Sans';">אגב</span>, <span style="font-family: 'DejaVu Sans';">על התכנון מופקדים השנה נחום דרשוביץ</span>, <span style="font-family: 'DejaVu Sans';">שלום לפין</span>, <span style="font-family: 'DejaVu Sans';">שולי וינטנר</span>, <span style="font-family: 'DejaVu Sans';">כפיר בר ורשף שילון שלקחו את המפגש ברצינות יתרה ושידרגו אותו לעומת שנים קודמות</span>. <span style="font-family: 'DejaVu Sans';">סחתיין</span>.<br />
ל<a href="http://www.cs.tau.ac.il/~nachum/iscol10/" target="_blank">הרשמה, תוכנית, אבסטרקטים (מורחבים) ופרטים נוספים</a>.</p>
<h3><span style="font-family: 'DejaVu Sans';">שביל קליפות התפוזים האינטרנטי שלי</span></h3>
<p><strong>BBC</strong>:  <span style="font-family: 'DejaVu Sans';">דן דיימון </span>(Dan Damon) <span style="font-family: 'DejaVu Sans';">מראיין אותי בתוכנית </span><strong>World Update</strong>. <span style="font-family: 'DejaVu Sans';">התרגשתי עד למאוד </span>(<span style="font-family: 'DejaVu Sans';">פעם ראשונה בים</span>), <span style="font-family: 'DejaVu Sans';">אבל הבריטיות שלו הפכה את הראיון לנינוח עד למאוד</span>. <span style="font-family: 'DejaVu Sans';">כמובן שברגע שיצא לי משפט מהפה כבר הבנתי שהייתי צריך לומר משהו אחר</span>. <span style="font-family: 'DejaVu Sans';">ובכל זאת</span>, <span style="font-family: 'DejaVu Sans';">הרי </span>4 <span style="font-family: 'DejaVu Sans';">דקות למי שמוכן לצלוח את המבטא ואת טעויות האנגלית שלי</span>. (<a href="http://staff.science.uva.nl/~otsur/Sarcasm.mp3" target="_blank">mp3</a>)</p>
<p><strong>Science</strong>: <span style="font-family: 'DejaVu Sans';">חלומו של כל מדען הוא להיכנס ל</span>-Scicene (<span style="font-family: 'DejaVu Sans';">או ל</span>-Nature, <a href="http://www.phdcomics.com/comics/archive.php?comicid=1200" target="_blank"><span style="font-family: 'DejaVu Sans';">מצא את ההבדלים</span></a>) <span style="font-family: 'DejaVu Sans';">והנה עשיתי את זה בדלת האחורית, דרך כניסת המשרתים</span>. <span style="font-family: 'DejaVu Sans';">כלומר, לא מאמר שלי שפורסם במגזין אלא ראיון קצרצר ומקוצרר שהפך לידיעה סקירתית שפורסמה בחלק ה</span>-Random Samples. <span style="font-family: 'DejaVu Sans';">הכותרת מקורית מאין כמוה</span>: <a href="http://staff.science.uva.nl/~otsur/papers/SasiScience.pdf" target="_blank">Yeah, Right</a>.</p>
<p><strong>Discovery News</strong>: <span style="font-family: 'DejaVu Sans';">אמלי סוהן </span>(Emily Sohn) <span style="font-family: 'DejaVu Sans';">ראיינה אותי ל</span>-<a href="http://news.discovery.com/tech/sarasm-online-computer-program.html" target="_blank">Discovery</a> <span style="font-family: 'DejaVu Sans';">ויש שם גם סיפור אישי מרגש שלא יהיה חדש לקוראי הבלוג</span>. <span style="font-family: 'DejaVu Sans';">דיסקברי עובדים בסינדיקציה עם </span><a href="http://abcnews.go.com/Technology/computer-program-recognizes-sarcasm/story?id=10774537" target="_blank">ABC news</a> <span style="font-family: 'DejaVu Sans';">ועם </span><a href="http://www.msnbc.msn.com/id/37383671/ns/technology_and_science-innovation/" target="_blank">NBC</a> <span style="font-family: 'DejaVu Sans';">כך שהראיון זלג גם לשם</span>.</p>
<p><span style="text-decoration: line-through;"><strong>NPR</strong>: <span style="font-family: 'DejaVu Sans';">ראיון ב</span>-<strong>All Thing Considered</strong>.</span> <span style="font-family: 'DejaVu Sans';">אחרי ראיון טלפוני ואין ספור תיאומים גורשתי מפתח האולפן בנימוס אמריקאי </span>&quot;<span style="font-family: 'DejaVu Sans';">בשל עודף פוליטיקה המגיש מאוד עמוס ופשוט לא יהיה זמן לראיון היום</span>. <span style="font-family: 'DejaVu Sans';">מצטערים</span>. <span style="font-family: 'DejaVu Sans';">תודה על טרחה</span>, <span style="font-family: 'DejaVu Sans';">אולי לתוכנית של אמצע השבוע</span>. <span style="font-family: 'DejaVu Sans';">שוב סליחה</span>&quot;. <span style="font-family: 'DejaVu Sans';">אז הבנתי שזה לא הולך לקרות</span>.</p>
<p><span style="font-family: 'DejaVu Sans';">ובינתיים בקצה השני של העיר</span>, <span style="font-family: 'DejaVu Sans';">המנחה שלי עסוק בניהול החזית הישראלית </span>(+<span style="font-family: 'DejaVu Sans';">אמריקה הלטינית</span>) <span style="font-family: 'DejaVu Sans';">עם ראיונות ל<a href="http://www.ynet.co.il/articles/0,7340,L-3893376,00.html" target="_blank">אהוד קינן ב</a></span><a href="http://www.ynet.co.il/articles/0,7340,L-3893376,00.html" target="_blank">-YNET</a>, <span style="font-family: 'DejaVu Sans';">ל</span>-<a href="http://www.jpost.com/HealthAndSci-Tech/InternetAndTechnology/Article.aspx?id=176375" target="_blank">Jerusalem Post</a>, <span style="font-family: 'DejaVu Sans';">ל</span><a href="http://www.israel21c.org/201006108038/culture/a-tool-to-detect-sarcasm-online-yeah-right" target="_blank">israel21c</a>, <span style="font-family: 'DejaVu Sans';">ל</span>-<a href="http://veja.abril.com.br/noticia/ciencia-tecnologia/computadores-ja-conseguem-captar-sarcasmo-textos-561157.shtml" target="_blank">Veja</a> ול-<a href="http://www.newscientist.com/article/dn18956-just-what-we-need-sarcasm-software.html" target="_blank">New Scientist</a> (שם ביקשו התייחסות גם מליליאן לי (Lillian Lee) שאמרה, אני מקווה שלא בסרקזם: &quot;It is a very exciting paper, because it attacks a problem that I didn't  really think we were ready to make headway on&quot;).</p>
<p><span style="font-family: 'DejaVu Sans';">בדגש קל (עכשיו הם ב&quot;סייפשל מונדיאל: רשומות על שפה טבעית!&quot;) <a href="http://dagesh.wordpress.com/2010/05/21/%D7%91%D7%90%D7%95%D7%A4%D7%9F-%D7%90%D7%99%D7%A8%D7%95%D7%A0%D7%99-%D7%95%D7%9E%D7%95%D7%93%D7%A2-%D7%9C%D7%90%D7%97%D7%A8%D7%99%D7%9D/" target="_blank">פירגנו</a> ואספו חלק מהאיזכורים </span>(<span style="font-family: 'DejaVu Sans';">טרם הראיונות</span>), <span style="font-family: 'DejaVu Sans';">כשהחביבים עלי הם </span><a href="http://go2.wordpress.com/?id=725X1342&amp;site=dagesh.wordpress.com&amp;url=http%3A%2F%2Fnews.cnet.com%2F8301-17938_105-20005320-1.html&amp;sref=http%3A%2F%2Fdagesh.wordpress.com%2F2010%2F05%2F21%2F%25d7%2591%25d7%2590%25d7%2595%25d7%25a4%25d7%259f-%25d7%2590%25d7%2599%25d7%25a8%25d7%2595%25d7%25a0%25d7%2599-%25d7%2595%25d7%259e%25d7%2595%25d7%2593%25d7%25a2-%25d7%259c%25d7%2590%25d7%2597%25d7%25a8%25d7%2599%25d7%259d%2F" target="_blank">CNET</a> <span style="font-family: 'DejaVu Sans';">ו-</span><a href="http://gizmodo.com/5541649/this-sarcasm+detecting-algorithm-is-a-really-good-idea" target="_blank">Gizmodo</a>. <span style="font-family: 'DejaVu Sans';"><br />
בגוגל פירגנו גם כן ואספו עוד הרבה מאוד איזכורים</span>. <span style="font-family: 'DejaVu Sans';">נדמה לי שעוד לא הגענו ל</span>-WIRED <span style="font-family: 'DejaVu Sans';">ול</span>-NYT. <span style="font-family: 'DejaVu Sans';">אני שוקל לבטל את המינוי</span>.</p>
<h3>מדע פופולרי</h3>
<p>לסיכום אומר שהעיסוק התקשורתי והראיונות היו בהחלט חוויה. גם למדתי לא מעט על איך עובדת התקשורת ועל חשיבותו של היח&quot;צ. <span style="font-family: 'DejaVu Sans';">עם כל הרעש, הקורא האובססיבי שיעבור על המקורות האלו</span>, <span style="font-family: 'DejaVu Sans';">יתקשה לקבל תמונה ברורה של מה שעשינו</span>. להיפך, הוא ימצא עצמו מבולבל קמעה. <span style="font-family: 'DejaVu Sans';">כמספר הראיונות והאיזכורים כך מספר השמות לאלגוריתמים</span>, <span style="font-family: 'DejaVu Sans';">מספר בסיסי הנתונים ומספר התיאורים של הממצאים</span>. <span style="font-family: 'DejaVu Sans';">די משעשע</span>. <span style="font-family: 'DejaVu Sans';">שיבעים פנים לתורה. אין מנוס מלהביא את הסטריפ המדוייק עד למאוד מ</span>-PhD comics (<span style="font-family: 'DejaVu Sans';">דרך גדי ברשימה איך בוטל </span>'<span style="font-family: 'DejaVu Sans';">איך ביטלו את המתמטיקה</span>', על ספרו <span style="font-family: 'DejaVu Sans';">של <a href="http://www.gadial.net/?p=504" target="_blank">אביעד קליינברג</a></span>):</p>
<p style="text-align: center;"><img class="aligncenter" src="http://www.phdcomics.com/comics/archive/phd051809s.gif" alt="" width="480" height="534" /></p>
<p><span style="font-family: 'DejaVu Sans';">על פער והבעייתיות בסיקור פופולרי של מחקרים מדעיים כתבתי כאן</span>: <a href="http://www.sciencefriction.net/blog/2008/02/15/77/" target="_blank"><span style="font-family: 'DejaVu Sans';">האמת העירומה</span></a>. <span style="font-family: 'DejaVu Sans';">שחר</span>, <span style="font-family: 'DejaVu Sans';">כדרכו</span>, <span style="font-family: 'DejaVu Sans';">כתב באופן מעמיק הרבה יותר</span>: <span style="font-family: 'DejaVu Sans';">ה<a href="http://hahem.co.il/false/archives/215" target="_blank">מומחה מתעצבן</a></span>. <span style="font-family: 'DejaVu Sans';">למעשה</span>, <span style="font-family: 'DejaVu Sans';">התיאור הקרוב ביותר למחקר נמצא בדגש קל</span> (<a href="http://dagesh.wordpress.com/2010/05/21/%D7%91%D7%90%D7%95%D7%A4%D7%9F-%D7%90%D7%99%D7%A8%D7%95%D7%A0%D7%99-%D7%95%D7%9E%D7%95%D7%93%D7%A2-%D7%9C%D7%90%D7%97%D7%A8%D7%99%D7%9D/" target="_blank">באופן מודע לעצמו ולאחרים</a>). <span style="font-family: 'DejaVu Sans';">יישר כח</span>. <span style="font-family: 'DejaVu Sans';">ומי שירצה תיאור קרוב עוד יותר יבוא ל</span>-ISCOL <span style="font-family: 'DejaVu Sans';">ביום רביעי</span> (או יצפה ב<a href="http://videolectures.net/icwsm2010_tsur_gcn/" target="_blank">וידאו של ההרצאה מה-ICWSM</a> בוושינגטון). <span style="font-family: 'DejaVu Sans';">וכמובן שמי שלא מוכן להתפשר על ניפנופי הידיים שלי יכול לקרוא את המאמר</span>(<span style="font-family: 'DejaVu Sans';">ים</span>) <span style="font-family: 'DejaVu Sans';">המקוריים</span>.</p>
<p><span style="font-family: 'DejaVu Sans';">&#8212;</span></p>
<p><span style="font-family: 'DejaVu Sans';">פוסטים קשורים</span>: הרי הם תחת הקטגוריה <a href="http://www.sciencefriction.net/blog/category/%d7%9e%d7%92%d7%93%d7%9c-%d7%94%d7%a9%d7%9f/%d7%a1%d7%a8%d7%a7%d7%96%d7%9d-%d7%90%d7%99%d7%a8%d7%95%d7%a0%d7%99%d7%94-%d7%95%d7%99%d7%a8%d7%a7%d7%95%d7%aa/" target="_blank">סרקזם אירוניה וירקות</a>.<span style="font-family: 'DejaVu Sans';"><br />
</span></p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/JgyO4DFiZIk" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/06/14/930/feed/</wfw:commentRss>
		<slash:comments>14</slash:comments>

		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/06/14/930/</feedburner:origLink><enclosure url="http://feedproxy.google.com/~r/scifri/~5/Ec99xkdsNjk/Sarcasm.mp3" length="3676787" type="audio/mpeg" /><feedburner:origEnclosureLink>http://staff.science.uva.nl/~otsur/Sarcasm.mp3</feedburner:origEnclosureLink></item>
		<item>
		<title>‫בין סרקזם לאירוניה‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/ORjMIAUBWEE/</link>
		<comments>http://www.sciencefriction.net/blog/2010/05/21/917/#comments</comments>
		<pubDate>Fri, 21 May 2010 11:33:32 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[אמזון]]></category>
		<category><![CDATA[לשון הרע]]></category>
		<category><![CDATA[מבחן טורינג]]></category>
		<category><![CDATA[מגדל השן]]></category>
		<category><![CDATA[סרקזם אירוניה וירקות]]></category>
		<category><![CDATA[רשת]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=917</guid>
		<description><![CDATA[&#8235;הבלוג, כלומר בעליו, זכה לחמש עשרה דקות התהילה שלו כשבכל רחבי הרשת, על כל גבעה גבוהה ותחת כל עץ רענן,  מתייחסים למאמר(ים) על זיהוי אוטומטי של סרקזם על ידי מחשב (בדגש קל פירגנו וגם אספו חלק מהלינקים, מגיזמודו, דרך הטלגרף ועד CNET). כמובן שכמו בכל פעם שמתעסקים עם מדע בצורה פופולרית נופלים אי דיוקים ודברים [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p>הבלוג, כלומר בעליו, זכה לחמש עשרה דקות התהילה שלו כשבכל רחבי הרשת, על כל גבעה גבוהה ותחת כל עץ רענן,  מתייחסים ל<a href="http://www.sciencefriction.net/blog/2010/05/13/903/" target="_blank">מאמר(ים) על זיהוי אוטומטי של סרקזם על ידי מחשב</a> (ב<a href="http://dagesh.wordpress.com/2010/05/21/%D7%91%D7%90%D7%95%D7%A4%D7%9F-%D7%90%D7%99%D7%A8%D7%95%D7%A0%D7%99-%D7%95%D7%9E%D7%95%D7%93%D7%A2-%D7%9C%D7%90%D7%97%D7%A8%D7%99%D7%9D/" target="_blank">דגש קל פירגנו</a> וגם אספו חלק מהלינקים, מגיזמודו, דרך הטלגרף ועד CNET). כמובן שכמו בכל פעם שמתעסקים עם מדע בצורה פופולרית נופלים אי דיוקים ודברים מוצאים מהקשרם אבל איך אומרים &#8211; as long as they spell my name right.<br />
את יום אתמול ביליתי בראיונות למיני מדיה שונים, החל מ-Science (לא ידעתי שהם גם מפרסמים סיפורים/ידיעות על מחקרים), דרך Discovery, New Scientist ועד ל BBC. כשיתפרסם (בסופ&quot;ש הזה ובמהלך שבוע הבא) אתן לינקים. ידעתי שעיסוק בזיהוי סרקזם ואירוניה הוא סקסי ומשעשע אבל חשבתי שזה  סייד-קיק אקדמי. אני חייב להודות שלא צפיתי את העניין שזה יעורר. כאמור,  לחמש עשרה דקות.</p>
<p>בינתיים על ההבדל בין סרקזם לאירוניה + דוגמה + תודות.</p>
<p><span id="more-917"></span></p>
<h3>מה ההבדל בין סרקזם לאירוניה?</h3>
<p>כמובן שגם מעיתוני הארץ לא נפקד איזכורינו (<span style="text-decoration: line-through;">אבל אף אחד לא התקשר</span> <a href="http://www.ynet.co.il/articles/0,7340,L-3893376,00.html" target="_blank">אהוד קינן ריאיין</a>). ב<a href="http://www.themarker.com/tmc/article.jhtml?ElementId=skira20100519_63552" target="_blank">טוש</a> העתיקו ידיעות ממקורות זרים וב-YNET, אריאנה מלמד <a href="http://www.ynet.co.il/articles/0,7340,L-3891882,00.html" target="_blank">התייחסה</a> למחקר כחלק מסקירה כללית על מצב התרבות הירוד בישראל. אני רוצה לצטט חלק:</p>
<p><span> </span></p>
<blockquote><p>השבוע אפשר היה להתגאות בעוד  המצאה ישראלית מקורית: אלגוריתם שפיתחו אורן צור, דימיטרי דוידוב וארי  רפופורט מן האוניברסיטה העברית, שמאפשר למחשב לזהות אמירות סרקסטיות,  בינתיים רק בציוצי טויטר ובביקורות ספרים באתר &quot;אמזון&quot;. בעתיד, אני מניחה,  המחשב יבין עברית וגם יוכל להתמודד עם טקסטים לא-כתובים, ואז הוא יגלה  עובדה שאינה סיבה גדולה לגאווה: רוב ההומור הישראלי הפופולרי בשנים  האחרונות נשען על סרקזם בוטה שמקצין והולך עם הזמן.<br />
&#8230;<br />
סרקזם הוא תמיד בעיטה בפרצוף, והצחוק המגיע בעקבותיו נולד מתוך שמחה  לאידו של הזולת, בתנאי אחד: שהצוחק לא מזהה את עצמו כמושא לסרקזם. אז זה  סתם כואב וחסר טעם, או חמור מזה &#8211; חשוד כאירוניה. <strong>היחס בין אירוניה לסרקזם  הוא כיחס בין בעיטה לבין דגדוג פתאומי, מפתיע אבל נעים</strong>, באיבר רגיש.  אירוניה, אמר כבר ג'ונתן סוויפט, אבי &quot;גוליבר&quot;, מבוזבזת על טפשים. אז מה  יוכל המחשב ללמוד מהעדרה הבולט של אירוניה בהומור הישראלי (מאז שהחמישיה  הקאמרית מתה)? שצרכני ההומור הזה הם טפשים, או שהם משוכנעים שרק הזולת  טיפש? (ההדגשה שלי. א.צ.)</p></blockquote>
<p><span><span>אני לא משוכנע שהחלוקה בין סרקזם לאירוניה כה ברורה. יש המחלקים אבל  יש לא מעט חוקרים שמזהים אירוניה כסיטואציה ואומרים שסרקזם הוא אירוניה  מילולית (verbal irony)  בניגוד לאירוניה מצבית-כללית (situational irony).  אני גם לא משוכנע שאירוניה היא תמיד דיגדוג נעים, לפעמים היא כואבת לא  פחות מבעיטה בפרצוף וגם לא ברור לי שסרקזם הוא תמיד גס וברוטאלי. אם אפנה  אתכם למאמרים של האדונים הנכבדים צור, דוידוב ורפופורט תוכלו למצוא שם כמה דוגמאות חוצות  גבולות ובעייתיות להגדרה. למען האמת, הגדרת האירוניה והסרקזם הן בעייתיות  מאין כמותן. <a href="../2008/10/19/181/" target="_blank">בין ג'ז  לפורנוגרפיה</a>, קראתי לזה פעם (והמנחה ניפה לי מהמאמר).<br />
</span></span></p>
<h3>דוגמה טריה טריה לאירוניה (של מצב)</h3>
<p>אחת הבעיות שנתקלנו בהן במחקר הייתה שלא היו מספיק דוגמאות אימון איכותיות כדי לבצע למידת מכונה. תיוג אנושי של אלפי או מיליוני משפטים שרק מיעוטם אירוניים (נניח לעבור על עשרות אלפי ביקורות באמזון או על מיליוני טוויטים) זה משהו שניסינו להימנע ממנו. בסוף מצאנו דרך לעשות את זה עם מעט דוגמאות (semi-supervised) ועם משהו מעין לימוד עצמי (self training) ומסתבר שאם עובדים עם הדטא הנכון זה פועל.</p>
<p>ואז, ביומיים האחרונים, הגיע הבום הפירסומי ובכל אתר שהוזכרנו משתרך שובל ארוך של הערות סרקסטיות שמטילות ספק או מבקשות: &quot;נראה אם תזהו את זה XXX&quot;. והנה לנו, אחרי שהמחקר כבר בוצע, אוסף איכותי של דוגמאות אימון חינם אין כסף. מישהו אמר אירוניה?<br />
<small>(הסתייגות אקדמית נוקדנית: כמובן שעדיין צריך לסנן ידנית אבל זה כבר פשוט וממוקד. יכולה להיות בעיית הטיה אם רוב ההערות דומות אחת לשניה ומכוונות לנושא מסויים. טעון בדיקה.) </small></p>
<h3>צרור תודות</h3>
<p>אני חייב להודות כאן לחלק מקוראי הבלוג שהסכימו להיות שפני ניסיון ולהוות חלק מאוסף הבודקים שלנו. כלומר הם קיבלו כמה עשרות משפטים ודירגו את רמת הסרקזם שבהם (מ1-לא סרקסטי בעליל, ועד 5- סרקזם בוטה). תודה תודה תודה. אם כי כשהמחקר עבר להילוך גבוה ננטשתם בצד הדרך לטובת הטורקים המכניים של אמזון. אבל שוב תודה על ההענות. אתם אחלה קוראים.</p>
<p><small>הולך טוב עם:<br />
1. <a href="http://www.sciencefriction.net/blog/2009/12/31/721/" target="_blank">פיל במגדל השן</a> &#8211; על סרקזם, פילים וילדים.<br />
2. <a href="http://www.sciencefriction.net/blog/2009/08/09/442/" target="_blank">לא לפני הילדים &#8211; קורטוב של רישעות מרנינה</a> &#8211; מאימתי ילדים מבינים אירוניה (ומבוגרים?)<br />
3. <a href="http://www.sciencefriction.net/blog/2008/10/19/181/" target="_blank">בין ג'ז לפורנוגרפיה</a> &#8211; על ההגדרה החמקמקה של אירוניה וסרקזם.<br />
4. <a href="http://www.sciencefriction.net/blog/2010/05/13/903/" target="_blank">באופן אירוני ומודע לעצמו</a> &#8211; על סגירת המעגל האירוני או איך ולמה בכלל הגעתי לזה.<br />
</small></p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/ORjMIAUBWEE" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/05/21/917/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/05/21/917/</feedburner:origLink></item>
		<item>
		<title>‫באופן אירוני ומודע לעצמו*‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/rTowiRaRnXE/</link>
		<comments>http://www.sciencefriction.net/blog/2010/05/13/903/#comments</comments>
		<pubDate>Thu, 13 May 2010 11:07:57 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[אמזון]]></category>
		<category><![CDATA[לשון הרע]]></category>
		<category><![CDATA[מבחן טורינג]]></category>
		<category><![CDATA[מגדל השן]]></category>
		<category><![CDATA[סרקזם אירוניה וירקות]]></category>
		<category><![CDATA[רשת]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=903</guid>
		<description><![CDATA[&#8235;סגירת מעגל: אלגוריתם לזיהוי אירוניה וסרקזם. כן. בטח. עריצה היא הלבנה לא אוהב מדע בדיוני. כמעט לא קורא מדע בדיוני. אבל מעט הספרים שקראתי דווקא היו מעולים. את עריצה היא הלבנה קראתי בפעם הראשונה בכיתה י’ (שורה אחרונה שולחן ימני, כיסא ימני). הקטע הזה עם המחשב שלומד להבין בדיחות ממש הפיל אותי מהכיסא. לפני כמה [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p>סגירת מעגל: אלגוריתם לזיהוי אירוניה וסרקזם. כן. בטח.</p>
<p><span id="more-903"></span></p>
<h3>עריצה היא הלבנה</h3>
<p>לא אוהב מדע בדיוני.  כמעט לא קורא מדע בדיוני. אבל מעט הספרים שקראתי דווקא היו מעולים. את  עריצה היא הלבנה קראתי בפעם הראשונה בכיתה י’ (שורה אחרונה שולחן ימני,  כיסא ימני). הקטע הזה עם המחשב שלומד להבין בדיחות ממש הפיל אותי מהכיסא. לפני כמה  שנים, כשקראתי את הספר שוב הבנתי שללמידת המכונה תפקיד משני לחלוטין.  ובכל  זאת, באופן מסויים השפיעה האנקדוטה הזו על החיים שלי.</p>
<h3>תודה לך פרופסור אורן</h3>
<p>בחודש הראשון בשנה  הראשונה של התואר הראשון קיבלתי אימייל ששיעשע אותי קשות. “תודה לך פרופסור  אורן XXX,” היה כתוב שם. הם הודו לי על התרומה לכנס ZZZ בשנה שעברה ותהו  אם אסכים להיות גם השנה בוועדת המארגנת של הכנס שיתקיים בפלורידה.</p>
<p>כתבתי להם שפלוקידה זה מצויין כי אפשר לקפוץ לדיסניוורלד אבל אני קצת עסוק באדמיניסטרציה  של תחילת שנת הלימודים ולכן אין לי כל כך פנאי. &quot;אולי בעוד חודש חודשיים אוכל  להחזיר להם תשובה&quot; עניתי, נהנה מהשידרוג המפתיע במעמדי האקדמי (ומיד רץ להגיש תרגיל באינפי).</p>
<p>“אין בעיה**. קח חודש,” הם אמרו ושאלו גם על מה אני עובד עכשיו.   ללא היסוס עניתי שעל זיהוי אירוניה בטקסטים כמו אימייל. “מרתק!” הם ענו.  “אכן,” סיכמתי גם אני “זה תחום שגם בני אדם מתקשים בו”.</p>
<p>ובמהלך הלימודים לקחתי  קורסים בלמידת מכונה ובבלשנות חישובית, נזכרתי בעריצותה של הלבנה והחלטתי  לכתוב סמינר (בוסרי עד בושה) על מודלים חישוביים לזיהוי אירוניה. ואז  החלטתי להתמקד בעיבוד שפה גם בלימודי המאסטר. וגם בדוקטורט. ובמסלול מפותל  שעבר דרך מערכות QA (שו”ת), מודלים של רכישת שפה שניה ודירוג ביקורות  באמזון נסגר מעגל והשנה כתבנו שני מאמרים על זיהוי משפטים  אירוניים/סרקסטיים  בביקורות מוצרים (אמזון) וזיהוי טוויטים סרקסטיים.</p>
<h3>זיהוי אירוניה</h3>
<p>אני חושב שזו הפעם  הראשונה שאני מלנקק כאן מאמר שלי (מאמרים של אחרים יש כאן למכביר). זה מאמר  חמוד מאוד, משעשע לפרקים, מפתיע ושיש סיכוי שיעניין את קהילת  הקוראים/מצייצים. והוא כמובן אירוני ומודע לעצמו. או שלא.</p>
<p style="text-align: left;" dir="ltr"><a href="http://staff.science.uva.nl/~otsur/papers/conll_camFINAL.pdf" target="_blank">Semi-supervised  Recognition of Sarcastic Sentences in Twitter and Amazon</a>*** [pdf]<br />
(CoNLL 10-  Computaitonal Natural Lanuage Learning)</p>
<p style="text-align: right;">המאמר דחוס מאין כמוהו כדי להתאים לסד מכסת העמודים המוקצית. למרות זאת, המבוא, החלק על טוויטר והדיון על התוצאות (פרקונים 1,2 ו-5) קלים לקריאה גם למי שלא מבין במדעי המחשב ובעיבוד שפה. למעשה גם החלק האלגוריתמי הוא מעט טכני ומייגע אבל לא מסובך במיוחד. תהנו. בטח.</p>
<p style="text-align: right;">&#8212;</p>
<p><small><br />
* מוקדש ל<a href="http://hahem.co.il/false/archives/category/%D7%90%D7%9E%D7%9F-%D7%94%D7%A6%D7%99%D7%95%D7%A5-%D7%94%D7%A7%D7%A6%D7%A8" target="_blank">אמן הציוץ הקצר</a> שציוץ שלו נכנס למאמר כדוגמה למבנה של טוויט ושעבר בטובו על הקטע שמתאר את  טוויטר והעיר את הערותיו לצפצפן-טירון שכמותי.<br />
** כמובן שבדיעבד גיליתי שזה כנס ספאם. רק שהוא היה חלוץ בתחומו &#8211; עוד לפני שהמציאו את המושג. והכנס הספציפי הזה ראוי לפוסט משל עצמו.<br />
*** המאמר הזה משלים מ<a href="http://staff.science.uva.nl/~otsur/papers/sarcasmAmazonICWSM10.pdf" target="_blank">אמר אחר</a> (שיוצג בעוד שבועיים ב-AAAI-ICWSM) שמתעסק רק באמזון, מניח את התשתית האלגוריתמית ומנתח אותה (גם) במנותק מהדטא. המאמר המלונקק מנתח בעיקר את הייחוד של טוויטר מול אמזון. ואני מאוד אוהב את <a href="http://www.phdcomics.com/store/mojostore.php?_=view&amp;ProductID=12681" target="_blank">החולצה הזו</a>.<br />
</small></p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/rTowiRaRnXE" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/05/13/903/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/05/13/903/</feedburner:origLink></item>
		<item>
		<title>‫נינט ממתינה לילד‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/0Tollub0qHc/</link>
		<comments>http://www.sciencefriction.net/blog/2010/04/14/896/#comments</comments>
		<pubDate>Wed, 14 Apr 2010 14:38:53 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[לשון הרע]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=896</guid>
		<description><![CDATA[&#8235;ממתינה לילד, מסיימת במיטה ובין לבין רושמת שירים. טוב, לא בדיוק נינט אלא יעל ולא בדיוק ממתינה (אבל זונת טראפיק שכמותי לא יכלה להתאפק). מדובר בתשדיר המוצדק עד למאוד בו נינט מדרבנת אותנו לחתום על כרטיס אדי. צריך קצת דרמה ורגש ולכן נינט מספרת על &#34;יעל בת שלושים&#34; שכמעט ומתה אבל זכתה להשתלה ברגע האחרון [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p>ממתינה לילד, מסיימת במיטה ובין לבין רושמת שירים.</p>
<p><span id="more-896"></span></p>
<p>טוב, לא בדיוק נינט אלא יעל ולא בדיוק ממתינה (אבל זונת טראפיק שכמותי לא יכלה להתאפק). מדובר בתשדיר המוצדק עד למאוד בו נינט מדרבנת אותנו לחתום על <a href="http://www.agudatadi.org.il/" target="_blank">כרטיס אדי</a>. צריך קצת דרמה ורגש ולכן נינט מספרת על &quot;יעל בת שלושים&quot; שכמעט ומתה אבל זכתה להשתלה ברגע האחרון והיום היא חיה באושר וממתינה לילד. 'ממתינה', כך מקריינת נינט. לא על נינט אני מלין כאן, היא הרי המאמי הלאומית, אלא על מי שכתב לה את הטקסט. ממתינה?! הא?!?!</p>
<p>קשה לי לשים את האצבע על ממקור הצרימה אבל אני מניח שהביטוי הנכון הוא 'מצפה לילד' (באנגלית &#8211; expecting vs. waiting). לא בדיוק הוכחה, אבל אסמכתא בעלמא מתקבלת על ידי גיגול &quot;ממתינה לילד&quot; (88 מופעים) לעומת &quot;מצפה לילד&quot; (~8000 מופעים)*.  אבל אני חושב שלכולם ברור ההבדל בין מצפה שיש בו משמעות של 'מחכה למשהו טוב שיקרה'. בדגש על טוב ובדגש על משהו שעוד לא בהכרח קיים. ממתין זה מחכה (בסבלנות או בעצבנות) למשהו שקיים ועוד לא הגיע. אולי מי מהקוראים יסביר את זה יותר טוב.</p>
<h3>הילד מסיים</h3>
<p>הטהרנות שלי אל מול רידוד הדקויות קיבלה לאחרונה סתירה מהדיקטטור הקטן-הגדול. &quot;סיימתי&quot; הוא הכריז בגאווה כשגמר לאכול. סיימתי הוא מקרה מעניין. מצד אחד אין מניעה לומר סיימתי את האוכל. זו פשוט שפה גבוהה מעט יותר מ'גמרתי'. מצד שני &#8211; הוא בוודאי לא שמע את זה מאיתנו &#8211; הוריו בעלי המשלב הנמוך (אבא אומר 'גמרת?', ואמא למדה אותו להגיד all done, וכך אכן היה אומר). את סיימתי הוא למד בגן והסייעות הערסיות (ארסיות?) שלו לא משתמשות בשורש סיים בגלל גבהותו או גבהותן אלא בגלל (בשל) הקונוטציה המינית שהודבקה לגמירה &#8211; קונוטציה שמכלה כל חלקה טובה ובעשרים השנים האחרונות גורמת לשילובים מוזרים (אני מחכה לחזרת המטוטלת הלשונית ולהוא שיצעק במיטה &quot;אני מסיים!&quot;). כלומר מפריע לי שהדיקטטור אומר 'לסיים' במקום 'לגמור' &#8211; אני רואה בזה רידוד של השפה שמוציא את לגמור מהלקסיקון.<br />
מצד שני, שימו לב לרשימת הארכיון האנונימית הזו (כנראה של רוביק רוזנטל) שם הוא מבכה דווקא את <a href="http://www.nrg.co.il/online/archive/ART/225/157.html" target="_blank">העלמותו של הסיום</a> וטוען לרידוד השפה (זה האייטם השני).</p>
<h3>והיד רושמת</h3>
<p>השורש ר.ש.מ. מקפיץ אותי גם הוא. גם כאן קשה לי לשים את האצבע על הטעות היסודית, ובכל זאת, אני מקבל לא מעט אימיילים מסטודנטים שטוענים &quot;אבל היה רשום במבחן&quot; או &quot;אבל רשמתי בתרגיל&quot;.</p>
<p>&quot;מה רע בשורש כ.ת.ב&quot; התבכיינתי לחבר דוקטור לנאנו-מיקרו-הכנס-מילה-מרשימה-ביולוגיה-כימו-מולקולרית. &quot;טוב, זו סתם ערסית מצוייה&quot; הוא פסק. אבל שמח לשמוע שאלו לא רק הסטודנטים שלו.</p>
<p><small>טוב, חלק מהפער יכול להיות מוסבר בזה ש'מצפה' יכול להיקרא גם בלשון זכר בעוד 'ממתינה' הוא רק נקבה. יצאתי ידי חובת האיזכור.</small></p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/0Tollub0qHc" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/04/14/896/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/04/14/896/</feedburner:origLink></item>
		<item>
		<title>‫מעשיה לשבת + טיפ (בקטנה)‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/pFYb6yvZnTQ/</link>
		<comments>http://www.sciencefriction.net/blog/2010/04/09/888/#comments</comments>
		<pubDate>Fri, 09 Apr 2010 14:53:58 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[בקטנה]]></category>
		<category><![CDATA[לא חודש ולא שבת]]></category>
		<category><![CDATA[צרכנות]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=888</guid>
		<description><![CDATA[&#8235;מותר להודות שהסיבה האמיתית בגינה אני לא קונה עיתונים כבר כמה שנים היא לא הזבל שהם כוללים, לא הפרסומות, לא הזילזול בקוראים, לא שגיאות הכתיב והעריכה המביכות, לא האג'נדה הגלויה והסמויה ולא הליקוק לבעלי ההון בכללם ולבעלי העיתון בפרט. גם לא אג'נדה אקולוגית  שמעקמת את האף נוכח המרת יערות הגשם לערימות של נייר מאיכות ירודה. [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p>מותר להודות שהסיבה האמיתית בגינה אני לא קונה עיתונים כבר כמה שנים היא לא הזבל שהם כוללים, לא הפרסומות, לא הזילזול בקוראים, לא שגיאות הכתיב והעריכה המביכות, לא האג'נדה הגלויה והסמויה ולא הליקוק לבעלי ההון בכללם ולבעלי העיתון בפרט. גם לא אג'נדה אקולוגית  שמעקמת את האף נוכח המרת יערות הגשם לערימות של נייר מאיכות ירודה.</p>
<p>הסיבה האמיתית היא , לא נעים להודות, ששבת הוא הזמן העיקרי (ועדיין מצומצם) לקריאת ספרים ואם יש עיתון בבית אני פשוט מכלה את זמני על העיתון. קצת ספורט, קצת כתבות, קצת דעות, קצת צהוב והספר מונח בקרן זוית. כך, בקיצור, אמרתי היום למוכרת בצומת-ס'* כשניסתה לדחוף לי עיתון ב-8 ש'.</p>
<p>קיבלתי חיוך של הבנה. או כך לפחות היה נדמה לי.</p>
<p><small>*<strong>טיפ</strong>: הרשתות מתכחשות לערכם של תווי הקניה המחולקים להמוני בית ישראל. כלומר בתווי הקניה אפשר לקנות רק ספרים במחיר מלא ולא את ה4 במאה, 2+1 ספר שני בחצי מחיר וכו'.<br />
<strong>הטריק</strong> &#8211; קנה ספרים כלשהם בסכום התווים. ללא שהות והיסוס בקש להחזיר את הספר ולקבל זיכוי. נצל את הזיכוי לרכישת ספרים במבצע. (עוד חיוך של הבנה והזדהות). </small></p>
<p>[מעשה לשבת - <a href="http://he.wikipedia.org/wiki/%D7%A2%D7%9C_%D7%93%D7%A2%D7%AA_%D7%A2%D7%A6%D7%9E%D7%95" target="_blank">עמוס הגבר</a> (ספר נפלא ומופלא [לפחות עד עמ' 187 שם אני כרגע]) שהחל מיום ראשון אני מוגדר כמאחר בהחזרה והאימיילים המאיצים מגיעים-רצים-דחופים מהסיפריה כבר משך כל השבוע שעבר.]</p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/pFYb6yvZnTQ" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/04/09/888/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/04/09/888/</feedburner:origLink></item>
		<item>
		<title>‫שחמט עצלני‬</title>		<link>http://feedproxy.google.com/~r/scifri/~3/JJSZrWTahGM/</link>
		<comments>http://www.sciencefriction.net/blog/2010/03/25/869/#comments</comments>
		<pubDate>Thu, 25 Mar 2010 17:17:12 +0000</pubDate>
		<dc:creator>‫אורן‬</dc:creator>				<category><![CDATA[לא חודש ולא שבת]]></category>
		<category><![CDATA[נע ונד תהיה בארץ]]></category>

		<guid isPermaLink="false">http://www.sciencefriction.net/blog/?p=869</guid>
		<description><![CDATA[&#8235;שוטטות אקראית כפויה במבוכי הסנטר (דיזינגוף) ומצאתי את עצמי עובר בגשר עגבניה שהיה די נטוש בבוקרו של יום. ראיתי שם שני זקנים שקועים במשחק שח. צילמתי. מרחוק (לא נעים להיתקע). במצלמה סלולרית. וזה הזכיר לי שאני אוהב לצלם אנשים משחקים שח במקומות ציבוריים. כלומר אני אוהב לצפות בהם. שחמט, בניגוד לקריאת ספר, הוא פעולה תובענית. [...]&#8236;]]></description>			<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'><p>שוטטות אקראית כפויה במבוכי הסנטר (דיזינגוף) ומצאתי את עצמי עובר בגשר עגבניה שהיה די נטוש בבוקרו של יום. ראיתי שם שני זקנים שקועים במשחק שח. צילמתי. מרחוק (לא נעים להיתקע). במצלמה סלולרית. וזה הזכיר לי שאני אוהב לצלם אנשים משחקים שח במקומות ציבוריים. כלומר אני אוהב לצפות בהם. שחמט, בניגוד לקריאת ספר, הוא פעולה תובענית. זה לוקח זמן. הרבה. ודורש ריכוז. אי אפשר, מעשה קורא בספר, לשחק שח בהמתנה לאוטובוס. צריך להיות בטלן אמיתי כדי לשחק שח כך סתם באמצע היום. אני אוהב בטלנים אמיתיים. תוסיפו לזה את ארכיאולוגיית הדימויים הפרטית שכוללת את משחק השחמט בחותם השביעי או בפְרֶש ויש כאן גם רומנטיזציה של מאבק אינטלקטואלי בבלתי נמנע (מחוץ לאולם הקולנוע, הבלתי נמנע הוא יום עבודה עמוס).  בקיצור תירוץ טוב לפוסטמונות שמעלות אבק בנבכי ההארד-דיסק.</p>
<div class="mceTemp mceIEcenter">
<div id="attachment_873" class="wp-caption aligncenter" style="width: 526px"><img class="size-large wp-image-873   " title="בין  קולומביה להארלם" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/03/IMG_4430-1024x768.jpg" alt="" width="516" height="387" /><p class="wp-caption-text">בין  קולומביה להארלם, NYC. יותר מדי סימבוליקה בסיטואציה הזו. </p></div>
<p><span id="more-869"></span></p>
<p style="text-align: center;">
<div id="attachment_870" class="wp-caption aligncenter" style="width: 527px"><img class="size-large wp-image-870   " title="שח מט בדיזינגוף סנטר" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/03/18022010115-1024x768.jpg" alt="" width="517" height="387" /><p class="wp-caption-text">שח מט בדיזינגוף סנטר. הפוגה בדרך לקופת חולים בזמנהוף?</p></div>
<p style="text-align: center;">
<p style="text-align: center;">
<dl id="attachment_871" class="wp-caption aligncenter" style="width: 310px;">
<dt class="wp-caption-dt"><img class="size-medium wp-image-871 " title="וושינגטון סקוור" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/03/539253568405-200x300.jpg" alt="" width="300" height="450" /></dt>
<dd class="wp-caption-dd">וושינגטון סקוור, NYC </dd>
</dl>
</div>
<div id="attachment_872" class="wp-caption aligncenter" style="width: 514px"><img class="size-full wp-image-872" title="חוף מציצים" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/03/chess7seal.gif" alt="" width="504" height="378" /><p class="wp-caption-text">אישקוקי בחוף גורדון. &quot;בא לי למות מהמטקות האלו. אולי נשחק שש בש?&quot;</p></div>
<p style="text-align: center;">
<p style="text-align: center;">
<div id="attachment_874" class="wp-caption aligncenter" style="width: 527px"><img class="size-large wp-image-874   " title="איזו כיבר באמסטרדם, NL" src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/03/scan0001-1024x767.jpg" alt="" width="517" height="387" /><p class="wp-caption-text">איזו כיבר באמסטרדם, NL</p></div>
<p style="text-align: center;">
<div id="attachment_876" class="wp-caption aligncenter" style="width: 522px"><img class="size-full wp-image-876 " title="בעל חנות ספרים ולקוח (?) מזדמן. כפר (val david) בלב קוויבק." src="http://www.sciencefriction.net/blog/wp-content/uploads/2010/03/IMG_5386.jpg" alt="" width="512" height="384" /><p class="wp-caption-text">בעל חנות ספרים ולקוח (?) מזדמן. כפר (val david) בלב קוויבק.</p></div>
<p>חופשי תוסיפו בתגובות לינקים לתמונות נוספות.</p>
<p><strong> </strong></p>
</div></div><img src="http://feeds.feedburner.com/~r/scifri/~4/JJSZrWTahGM" height="1" width="1"/>]]></content:encoded>			<wfw:commentRss>http://www.sciencefriction.net/blog/2010/03/25/869/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		<feedburner:origLink>http://www.sciencefriction.net/blog/2010/03/25/869/</feedburner:origLink></item>
	</channel>
</rss>
