<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:georss="http://www.georss.org/georss" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>投筆從農</title>
	<atom:link href="https://hjwu.wordpress.com/feed/" rel="self" type="application/rss+xml" />
	<link>https://hjwu.wordpress.com</link>
	<description>我愛台灣</description>
	<lastBuildDate>Tue, 30 Aug 2011 15:38:08 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>http://wordpress.com/</generator>
<cloud domain='hjwu.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>https://s0.wp.com/i/buttonw-com.png</url>
		<title>投筆從農</title>
		<link>https://hjwu.wordpress.com</link>
	</image>
	<atom:link rel="search" type="application/opensearchdescription+xml" href="https://hjwu.wordpress.com/osd.xml" title="投筆從農" />
	<atom:link rel='hub' href='https://hjwu.wordpress.com/?pushpress=hub'/>
	<item>
		<title>Neural Network Design (四)</title>
		<link>https://hjwu.wordpress.com/2010/04/09/neural-network-design-%e5%9b%9b/</link>
					<comments>https://hjwu.wordpress.com/2010/04/09/neural-network-design-%e5%9b%9b/#respond</comments>
		
		<dc:creator><![CDATA[hsinjungwu]]></dc:creator>
		<pubDate>Fri, 09 Apr 2010 08:50:40 +0000</pubDate>
				<category><![CDATA[工作靠腰]]></category>
		<category><![CDATA[數學]]></category>
		<category><![CDATA[Directional Derivatives]]></category>
		<category><![CDATA[gradient]]></category>
		<category><![CDATA[Hessian Matrix]]></category>
		<category><![CDATA[Neural Network]]></category>
		<category><![CDATA[Performance Learning]]></category>
		<category><![CDATA[positive define matrix]]></category>
		<category><![CDATA[quadratic function]]></category>
		<category><![CDATA[Taylor series expansion]]></category>
		<category><![CDATA[教學]]></category>
		<category><![CDATA[最佳化]]></category>
		<guid isPermaLink="false">http://blog.hjwu.org/?p=4272</guid>

					<description><![CDATA[由於昨天破了一場病，所以這週只有介紹了 Performance Surface  &#8230; <a href="https://hjwu.wordpress.com/2010/04/09/neural-network-design-%e5%9b%9b/">繼續閱讀 <span class="meta-nav">&#8594;</span></a>]]></description>
										<content:encoded><![CDATA[<p>由於昨天破了一場病，所以這週只有介紹了 <em>Performance Surface and Optimum Points</em>。老實說我覺得這章數學概念是非常難的(基本上扯到多變數我就覺得很吃力了。 <img src="https://hjwu.files.wordpress.com/2010/11/mysweat.gif?w=500" alt=":sweat:" /> )，所以我也只能簡單的描述一下，如果有錯那我只能說聲不好意思啦。 <img src="https://hjwu.files.wordpress.com/2010/11/mywatch.gif?w=500" alt=":watch:" /> 有心想學的人還是把課本翻翻，然後把微積分後面關於多變數的地方看一下吧。</p>
<p><span id="more-4272"></span></p>
<p>這章主要是為了 <em>Performance Learning</em> 來鋪路。課本的定義如下</p>
<blockquote>
<p>Performance Learning is a learning law, in which the network parameters are adjusted to optimize the performance of the network</p>
</blockquote>
<p>也就是說它是要調整參數以達到效能最佳化。上面這句話看起來很清楚，可是仔細想想卻很模糊。什麼叫效能最佳化？這牽涉下面兩件事情</p>
<blockquote>
<ol>
<li>Find a quantitative measure of network performance, called the <em>performance index</em>,  which is small when the network performs well and large when the network performs poorly.</li>
<li>Adjust the network weights and biases in order to reduce the performance index.</li>
</ol>
</blockquote>
<p>在這章我們將研究 performance surface。所以如何選擇 performance index 等等會在之後的章節介紹。</p>
<p>首先假設我們的 performance index 為 F(<strong>x</strong>)，那麼我們可以用泰勒戰神<a target="_blank" href="http://en.wikipedia.org/wiki/Taylor_series">泰勒展開式</a>來估計 F(<strong>x</strong>)。我們比較感興趣的是 <strong>x</strong> 是多變數，那 F(<strong>x</strong>) 的泰勒展開式如下</p>
<p><a href="http://www.flickr.com/photos/pi301415/4504258775/" title="Flickr 上 貼圖 的 Taylor Series Expansions"><img src="https://i2.wp.com/farm3.static.flickr.com/2738/4504258775_98dbb8260f.jpg" width="500" height="39" alt="Taylor Series Expansions" /></a></p>
<p>其中 ∇F(<strong>x<sup>*</sup></strong>) 是 <a target="_blank" href="http://en.wikipedia.org/wiki/Gradient">Gradient</a> at <strong>x<sup>*</sup></strong> (你可以把它想成在過 <strong>x<sup>*</sup></strong> 的切平面的法向量)，∇<sup>2</sup>F(<strong>x<sup>*</sup></strong>) 是 <a target="_blank" href="http://en.wikipedia.org/wiki/Hessian_matrix">Hessian Matrix</a> (我不知道可以把它想成什麼 <img src="https://hjwu.files.wordpress.com/2010/11/myconfuse.gif?w=500" alt=":confuse:" /> )。另外後面還有提到 <a target="_blank" href="http://en.wikipedia.org/wiki/Directional_derivative">Directional Derivatives</a> (我會把它看成是 <a target="_blank" href="http://en.wikipedia.org/wiki/Gradient">Gradient</a> 在某個方向的投影)。這方面的東西請容我跳過，因為我真的很弱。 <img src="https://hjwu.files.wordpress.com/2010/11/myjiong.gif?w=500" alt="jiong" /> 有興趣的人可以參考<a target="_blank" href="http://csm00.csu.edu.tw/0166/2005calculus/84.htm">這裡</a>的解說或是<a target="_blank" href="http://people.chu.edu.tw/~cclu/">這裡</a>提供的工程數學提要吧。</p>
<p>接著是介紹 Minima (極小點)。課本把 Minima 分成三種。</p>
<blockquote>
<ol>
<li>最簡單的莫過於 Global Minima 這個從字面上就知道。</li>
<li>Strong Minima 是指如果 <strong>x<sup>*</sup></strong> 是 Strong Minima 則存在某個 δ 使得任何落在以 <strong>x<sup>*</sup></strong> 為圓心，δ 為半徑的 open <a target="_blank" href="http://en.wikipedia.org/wiki/Ball_(mathematics)">ball</a> 的非圓心點 <strong>y</strong> 都會滿足 F(<strong>x<sup>*</sup></strong>) &lt; F(<strong>y</strong>)。</li>
<li>而 Weak Minima 跟 Strong Minima 差不多，只要最後的條件改成 ≦ 而且它不是 Strong Minima (也就是說一定還有一點 <strong>y≠x<sup>*</sup></strong>，但是 F(<strong>y</strong>) = F(<strong>x<sup>*</sup></strong>)。)就可以了。</li>
</ol>
</blockquote>
<p>下一段是 Necessary Condition for Optimality。我今天很不自量力的介紹<a target="_blank" href="http://en.wikipedia.org/wiki/Necessary_and_sufficient_condition">充分必要條件</a>，結果差點死在黑板前。(BTW, 我很喜歡阿共用<a target="_blank" href="http://zh.wikipedia.org/zh-tw/%E5%BD%93%E4%B8%94%E4%BB%85%E5%BD%93">當且僅當</a>，我一直覺得這會比若且唯若容易理解。)這段其實可以利用當初【微分來判斷極值】的概念來延伸就可以了。總之結論如下</p>
<ul>
<li>如果 <strong>x<sup>*</sup></strong> 是 Minima =＞ ∇F(<strong>x<sup>*</sup></strong>) = <strong>０</strong> 且  ∇<sup>2</sup>F(<strong>x<sup>*</sup></strong>) 是半<a target="_blank" href="http://en.wikipedia.org/wiki/Positive-definite_matrix">正定矩陣</a>。</li>
<li>如果 ∇F(<strong>x<sup>*</sup></strong>) = <strong>０</strong> 且  ∇<sup>2</sup>F(<strong>x<sup>*</sup></strong>) 是<a target="_blank" href="http://en.wikipedia.org/wiki/Positive-definite_matrix">正定矩陣</a>  =＞ <strong>x<sup>*</sup></strong> 是 Strong Minima。</li>
</ul>
<p>這章還剩下 <a target="_blank" href="http://en.wikipedia.org/wiki/Quadratic_function">Quadratic Function</a> 還沒介紹，我想這就下次再說吧，雖然我今天是一口氣教完。 <img src="https://hjwu.files.wordpress.com/2010/11/myxd.gif?w=500" alt="XD" /> 最後我覺得我每次上的內容跟 blog 上貼的都不一樣啊！ <img src="https://hjwu.files.wordpress.com/2010/11/mypig.gif?w=500" alt=":pig:" /> </p>
]]></content:encoded>
					
					<wfw:commentRss>https://hjwu.wordpress.com/2010/04/09/neural-network-design-%e5%9b%9b/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		
		<media:content url="https://2.gravatar.com/avatar/8144edd7c122d3cc95a4565767ce5f1c?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">海怪</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mysweat.gif" medium="image">
			<media:title type="html">:sweat:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mywatch.gif" medium="image">
			<media:title type="html">:watch:</media:title>
		</media:content>

		<media:content url="http://farm3.static.flickr.com/2738/4504258775_98dbb8260f.jpg" medium="image">
			<media:title type="html">Taylor Series Expansions</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myconfuse.gif" medium="image">
			<media:title type="html">:confuse:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myjiong.gif" medium="image">
			<media:title type="html">jiong</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myxd.gif" medium="image">
			<media:title type="html">XD</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mypig.gif" medium="image">
			<media:title type="html">:pig:</media:title>
		</media:content>
	</item>
		<item>
		<title>Neural Network Design (三)</title>
		<link>https://hjwu.wordpress.com/2010/03/26/neural-network-design-%e4%b8%89/</link>
					<comments>https://hjwu.wordpress.com/2010/03/26/neural-network-design-%e4%b8%89/#respond</comments>
		
		<dc:creator><![CDATA[hsinjungwu]]></dc:creator>
		<pubDate>Fri, 26 Mar 2010 11:38:58 +0000</pubDate>
				<category><![CDATA[工作靠腰]]></category>
		<category><![CDATA[數學]]></category>
		<category><![CDATA[diagonalization]]></category>
		<category><![CDATA[Donald Hebb]]></category>
		<category><![CDATA[eigenvector]]></category>
		<category><![CDATA[Frobenius norm]]></category>
		<category><![CDATA[Hebb's postulate]]></category>
		<category><![CDATA[linear translation]]></category>
		<category><![CDATA[Neural Network]]></category>
		<category><![CDATA[orthonormal]]></category>
		<category><![CDATA[supervised learning]]></category>
		<category><![CDATA[教學]]></category>
		<guid isPermaLink="false">http://blog.hjwu.org/?p=4269</guid>

					<description><![CDATA[這禮拜做了兩次很糟糕的演講，相當對不起台下的聽眾。 或許以後我會把這週要報告的東 &#8230; <a href="https://hjwu.wordpress.com/2010/03/26/neural-network-design-%e4%b8%89/">繼續閱讀 <span class="meta-nav">&#8594;</span></a>]]></description>
										<content:encoded><![CDATA[<p>這禮拜做了兩次很糟糕的演講，相當對不起台下的聽眾。 <img src="https://hjwu.files.wordpress.com/2010/11/myorz.gif?w=500" alt="orz" /> 或許以後我會把這週要報告的東西先放在 blog 上吧！ <img src="https://hjwu.files.wordpress.com/2010/11/mysick.gif?w=500" alt=":sick:" /> </p>
<p><span id="more-4269"></span></p>
<p>第一天的主題是 <em>Linear Translation for Neural Networks</em>，我希望我能表達出</p>
<blockquote>
<ol>
<li>對於每一個線性變換(linear transformation)都可以轉譯成一個矩陣(matrix)，而這個矩陣是由基底(basis)來決定的。</li>
<li>我們可以利用 eigenvector 為 column 形成的 matrix 來把原來的矩陣做對角化(diagonalization)，藉此來判斷該 matrix 乘了 n 次後是否會收斂。</li>
</ol>
</blockquote>
<p>不過就台下的反應與我的表達能力，我是失敗了。 <img src="https://hjwu.files.wordpress.com/2010/11/mysweat.gif?w=500" alt=":sweat:" /> </p>
<p>第二天的主題是 <em>The Hebb Rule</em>，這篇主要是基於 <a target="_blank" href="http://en.wikipedia.org/wiki/Donald_O._Hebb">Donald Hebb</a> 在 1949 年出版的 Organization of Behavior 裡面提到的這段 Hebb&#8217;s postulate</p>
<blockquote>
<p>When an axons of cell A is near enough to excite a cell B and repeatedly or persistently takes part in firing it, some growth process or metabolic change takes place in one or both cells such that A&#8217;s efficiency, as one of the cells firing B, is increased.</p>
</blockquote>
<p><a target="_blank" href="http://bbs.nsysu.edu.tw/txtVersion/treasure/neurology/M.890305598.A/M.890306087.A/M.890306123.D.html">它的中文翻譯</a>如下</p>
<blockquote>
<p>若一神經細胞 A , 足以興奮另一神經細胞 B, 並經常重複地參與 B 細胞的神經衝動, 其一或二細胞產生質的變化, 則 AB 細胞的聯繫的強度因而增強, 最後光憑 A 細胞的神經衝動便足以激發 B 細胞。</p>
</blockquote>
<p>我很抱歉我無法像<a target="_blank" href="http://zh.wikipedia.org/zh-tw/%E7%99%BD%E5%B1%85%E6%98%93">白居易</a>一樣能給出<a target="_blank" href="http://dict.idioms.moe.edu.tw/mandarin/fulu/dict/cyd/2/cyd02073.htm">老嫗能解</a>的解釋。所以體貼的課本又再敘述的更白話一點</p>
<blockquote>
<p><font color="red"><u>If two neurons on either sides of a synapse are activated simultaneously, the strength of the synapse will increase.</u></font></p>
</blockquote>
<p>在本章我們主要是介紹 Hebb&#8217;s rule，所以我們選擇了一個很簡單的架構：Linear Associator。免得我們執著於複雜的架構而逃不出來。</p>
<div align="center"><a href="http://www.flickr.com/photos/pi301415/4463821879/" title="Flickr 上 貼圖 的 Linear Associator"><img src="https://i1.wp.com/farm5.static.flickr.com/4054/4463821879_610798f32a_m.jpg" width="240" height="215" alt="Linear Associator" /></a></div>
<p>它主要是學習給定的 Q 個 prototype input/output vector pairs {(<strong>p</strong>_q, <strong>t</strong>_q)｜q=1, …, Q} ，也就是說我們希望當類神經網路接收 <strong>p</strong>_q 時，output 值 <strong>a</strong>_q 會是 <strong>t</strong>_q。另外我們也希望當我 input 值稍微改變一點點，output 值也只會稍微改變，這有點像是我們以前在證明連續函數時玩 δ-ε 的感覺。 <img src="https://hjwu.files.wordpress.com/2010/11/myxd.gif?w=500" alt="XD" /> </p>
<p>好吧，上面說了一堆屁話。但是重點還是我們要如何用 Hebb&#8217;s Rule 。我們利用課本重新敘述的 Hebb&#8217;s postulate 那段(本文中紅色底線文字)以及一點基本常識知道每個 input vector <strong>p</strong>_q 的第 j 個位置 p_jq 與 output <strong>a</strong>_q 的第 i 個位置 a_iq 中間牽連的 weight 是 W_ij，所以我們可以得到</p>
<div align="center"><a href="http://www.flickr.com/photos/pi301415/4463847865/" title="Flickr 上 貼圖 的 Hebb rule"><img src="https://i0.wp.com/farm3.static.flickr.com/2751/4463847865_283014241a_m.jpg" width="240" height="31" alt="Hebb rule" /></a></div>
<p>不過在這一章是以 <a target="_blank" href="http://en.wikipedia.org/wiki/Supervised_learning">supervised learning</a> 為主所以我們把 <strong>a</strong>_q 用 <strong>t</strong>_q 取代，而且設定 f_i 與 g_j 為 identical function for all i, j 以及 learning rate <em>alpha</em>(a positive constant) 為 1。於是就變成下面的形式。</p>
<div align="center"><a href="http://www.flickr.com/photos/pi301415/4464669128/" title="Flickr 上 貼圖 的 Hebb rule-supervised form"><img src="https://i2.wp.com/farm3.static.flickr.com/2735/4464669128_e855045a76_m.jpg" width="240" height="42" alt="Hebb rule-supervised form" /></a></div>
<p>如果我們初始的 weight matrix 為零矩陣，而且跑完全部Ｑ個 training data 後我們可以得到下面的方程式</p>
<div align="center"><a href="http://www.flickr.com/photos/pi301415/4464638306/" title="Flickr 上 貼圖 的 matrix form"><img src="https://i0.wp.com/farm3.static.flickr.com/2711/4464638306_6c516ec3d2_m.jpg" width="240" height="184" alt="matrix form" /></a></div>
<p>接下來我們可以針對 {<strong>p</strong>_q｜q=1, …, Q} 彼此是否 <a target="_blank" href="http://en.wikipedia.org/wiki/Orthonormality">orthonormal</a>，如果是，則 output  值 <strong>a</strong>_q 會是 <strong>t</strong>_q ，這個證明很簡單，跳過。 <img src="https://hjwu.files.wordpress.com/2010/11/mysleep.gif?w=500" alt=":sleep:" /> 如果不是則會有誤差，所以我們用 Pseudoinverse Rule 來修正 weight matrix，方法是計算 <strong>T-A</strong>=<strong>T-WP</strong> 的 <a target="_blank" href="http://mathworld.wolfram.com/FrobeniusNorm.html">Frobenius norm</a>。基於這篇文章已經太長了，所以就看下面的概述吧，如果不明白就翻書吧。 <img src="https://hjwu.files.wordpress.com/2010/11/mywatch.gif?w=500" alt=":watch:" /> </p>
<p><a href="http://www.flickr.com/photos/pi301415/4464658764/" title="Flickr 上 貼圖 的 Pseudoinverse Rule"><img src="https://i2.wp.com/farm5.static.flickr.com/4064/4464658764_9336ee8456.jpg" width="500" height="198" alt="Pseudoinverse Rule" /></a></p>
<p>最後一段要說的不是 application 也不是 variations of Hebbian Learning 而是 bias 的加入。這時我們把原來的 <strong>p</strong> 增加一個維度改成向量 <strong>p&#8217; = [P, 1]</strong>，接著利用之前的方法來得到 <strong>W&#8217; = [W, b]</strong>。之所以會提這個方法是因為我之前 K 書時也看過這個手法，我這個沒見過市面的鄉巴佬覺得很妙，所以特地野人獻曝。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://hjwu.wordpress.com/2010/03/26/neural-network-design-%e4%b8%89/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		
		<media:content url="https://2.gravatar.com/avatar/8144edd7c122d3cc95a4565767ce5f1c?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">海怪</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myorz.gif" medium="image">
			<media:title type="html">orz</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mysick.gif" medium="image">
			<media:title type="html">:sick:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mysweat.gif" medium="image">
			<media:title type="html">:sweat:</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4054/4463821879_610798f32a_m.jpg" medium="image">
			<media:title type="html">Linear Associator</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myxd.gif" medium="image">
			<media:title type="html">XD</media:title>
		</media:content>

		<media:content url="http://farm3.static.flickr.com/2751/4463847865_283014241a_m.jpg" medium="image">
			<media:title type="html">Hebb rule</media:title>
		</media:content>

		<media:content url="http://farm3.static.flickr.com/2735/4464669128_e855045a76_m.jpg" medium="image">
			<media:title type="html">Hebb rule-supervised form</media:title>
		</media:content>

		<media:content url="http://farm3.static.flickr.com/2711/4464638306_6c516ec3d2_m.jpg" medium="image">
			<media:title type="html">matrix form</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mysleep.gif" medium="image">
			<media:title type="html">:sleep:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mywatch.gif" medium="image">
			<media:title type="html">:watch:</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4064/4464658764_9336ee8456.jpg" medium="image">
			<media:title type="html">Pseudoinverse Rule</media:title>
		</media:content>
	</item>
		<item>
		<title>Neural Network Design (二)</title>
		<link>https://hjwu.wordpress.com/2010/03/22/neural-network-design-%e4%ba%8c/</link>
					<comments>https://hjwu.wordpress.com/2010/03/22/neural-network-design-%e4%ba%8c/#comments</comments>
		
		<dc:creator><![CDATA[hsinjungwu]]></dc:creator>
		<pubDate>Mon, 22 Mar 2010 07:17:15 +0000</pubDate>
				<category><![CDATA[專業截圖]]></category>
		<category><![CDATA[工作靠腰]]></category>
		<category><![CDATA[數學]]></category>
		<category><![CDATA[一圖萬言]]></category>
		<category><![CDATA[Gram–Schmidt process]]></category>
		<category><![CDATA[Neural Network]]></category>
		<category><![CDATA[Perceptron Learning Rule]]></category>
		<category><![CDATA[教學]]></category>
		<guid isPermaLink="false">http://blog.hjwu.org/?p=4265</guid>

					<description><![CDATA[沒想到居然有(二)！ 這禮拜主要是講 Perceptron Learning R &#8230; <a href="https://hjwu.wordpress.com/2010/03/22/neural-network-design-%e4%ba%8c/">繼續閱讀 <span class="meta-nav">&#8594;</span></a>]]></description>
										<content:encoded><![CDATA[<p>沒想到居然有(二)！ <img src="https://hjwu.files.wordpress.com/2010/11/mysick.gif?w=500" alt=":sick:" /> </p>
<p><span id="more-4265"></span></p>
<p>這禮拜主要是講 Perceptron Learning Rule 跟簡單的線性代數。線性代數我帶大家回憶了什麼叫 <a target="_blank" href="http://en.wikipedia.org/wiki/Gram%E2%80%93Schmidt_process">Gram–Schmidt process</a>、基底變換及其他基本的東西。而課堂上有人叫我舉個 Infinitely many dimensions 的例子，不過線性代數很弱的我裝死跳過。 <img src="https://hjwu.files.wordpress.com/2010/11/myhappy.gif?w=500" alt=":happy:" /> </p>
<p>而說到  Perceptron Learning Rule 就要先提什麼是 Learning Rules 呢？課本給了以下的定義</p>
<blockquote>
<p>A procedure for modifying the weights and biases of a net work.</p>
</blockquote>
<p>而 Perceptron Learning Rule 我就用以下的圖來簡單介紹，如果有人看不懂就去翻書吧。 <img src="https://hjwu.files.wordpress.com/2010/11/mywatch.gif?w=500" alt=":watch:" /> 首先我們有下面三個點，我們最終的目的是找一條分隔線平面分成白色跟灰色區域，使得藍點在白色區域而紅點在灰色區域。<a href="http://www.flickr.com/photos/pi301415/4452776997/" title="Flickr 上 貼圖 的 step01"><img src="https://i2.wp.com/farm5.static.flickr.com/4053/4452776997_feb764d541_m.jpg" width="240" height="191" alt="step01" /></a></p>
<p>首先我們就隨便畫兩條黃色的線在平面上，虛線是分格線，實線跟虛線垂直，所以你可以把實線看成是虛線的握把。我們接下來就是要旋轉握把，讓虛線變成我們最後要的分隔線。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4453553142/" title="Flickr 上 貼圖 的 step03"><img src="https://i2.wp.com/farm5.static.flickr.com/4066/4453553142_859a76677b_m.jpg" width="240" height="188" alt="step03" /></a></p>
<p>接著檢查編號 1 的點，你發現他跑錯地方了，於是你就旋轉把手，變成下面這樣。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4452777097/" title="Flickr 上 貼圖 的 step06"><img src="https://i0.wp.com/farm5.static.flickr.com/4072/4452777097_0252245e7b_m.jpg" width="240" height="193" alt="step06" /></a></p>
<p>接著檢查編號 2 的點，你發現他還是跑錯地方了，於是你再次旋轉把手，變成下面這樣。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4453553016/" title="Flickr 上 貼圖 的 step09"><img src="https://i0.wp.com/farm5.static.flickr.com/4055/4453553016_91096a3626_m.jpg" width="240" height="203" alt="step09" /></a></p>
<p>然後檢查編號 3 的點，結果還是跑錯地方，於是又旋轉把手，變成下面這樣。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4453553048/" title="Flickr 上 貼圖 的 step12"><img src="https://i1.wp.com/farm5.static.flickr.com/4045/4453553048_1b8ca08cd2_m.jpg" width="240" height="191" alt="step12" /></a></p>
<p>這時候你就要再次檢查編號 1 的點有沒有錯，如果有錯就旋轉，沒錯就不轉，按照編號順序直到所有點都落在正確區域。</p>
<p>接著就開始牽涉要怎麼轉，這裡我就打算用向量來說了。我們把實線都當成向量，虛線不管他。從圖形知道黃色向量要逆時針旋轉。所以我們採用了這個方法：【把黃色向量加上編號 1 的點的向量(即藍色向量)變成綠色向量】。而按照【虛線要垂直實線】的法則，所以黃色虛線也就變成綠色虛線。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4453553110/" title="Flickr 上 貼圖 的 step02"><img src="https://i0.wp.com/farm5.static.flickr.com/4044/4453553110_08ce8e3da7_m.jpg" width="180" height="143" alt="step02" /></a> 變成 <a href="http://www.flickr.com/photos/pi301415/4452882037/" title="Flickr 上 貼圖 的 step04"><img src="https://i0.wp.com/farm5.static.flickr.com/4051/4452882037_6a7e797372_m.jpg" width="180" height="141" alt="step04" /></a></p>
<p>接著從圖形知道綠色向量要順時針旋轉。所以我們採用了：【把綠色向量減去編號 2 的點的向量(即紅色向量)變成紫色向量】。而按照【虛線要垂直實線】的法則，所以綠色虛線也就變成紫色虛線。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4453678964/" title="Flickr 上 貼圖 的 step05"><img src="https://i0.wp.com/farm5.static.flickr.com/4046/4453678964_6875ff61f0_m.jpg" width="180" height="145" alt="step05" /></a> 變成 <a href="http://www.flickr.com/photos/pi301415/4453553068/" title="Flickr 上 貼圖 的 step07"><img src="https://i2.wp.com/farm5.static.flickr.com/4025/4453553068_3b90be4670_m.jpg" width="180" height="148" alt="step07" /></a></p>
<p>接著從圖形知道紫色向量要逆時針旋轉。所以我們採用了：【把紫色向量加上編號 3 的點的向量(即紅色向量)變成棕色向量】。而按照【虛線要垂直實線】的法則，所以紫色虛線也就變成棕色虛線。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4453690616/" title="Flickr 上 貼圖 的 step08"><img src="https://i0.wp.com/farm5.static.flickr.com/4025/4453690616_137e3cceb5_m.jpg" width="180" height="152" alt="step08" /></a> 變成 <a href="http://www.flickr.com/photos/pi301415/4453553028/" title="Flickr 上 貼圖 的 step10"><img src="https://i1.wp.com/farm5.static.flickr.com/4020/4453553028_bac3b1d56f_m.jpg" width="180" height="153" alt="step10" /></a></p>
<p>接著以此類推繼續轉，轉到 ok 為止。在本例中這時已經轉好了。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4453703212/" title="Flickr 上 貼圖 的 step11"><img src="https://i0.wp.com/farm3.static.flickr.com/2707/4453703212_1073d706cd_m.jpg" width="180" height="144" alt="step11" /></a></p>
<p>接著如果再把虛線扯進來以及把上面講的東西稍微數學一點的話，虛線就是 <a target="_blank" href="http://en.wikipedia.org/wiki/Hyperplane">hyperplane (超平面)</a>，實線就是對應的 <a target="_blank" href="http://en.wikipedia.org/wiki/Surface_normal">normal vector (法向量)</a>。如果還要再更深更詳細就翻書吧，因為我手酸了。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://hjwu.wordpress.com/2010/03/22/neural-network-design-%e4%ba%8c/feed/</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
		
		<media:content url="https://2.gravatar.com/avatar/8144edd7c122d3cc95a4565767ce5f1c?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">海怪</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mysick.gif" medium="image">
			<media:title type="html">:sick:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myhappy.gif" medium="image">
			<media:title type="html">:happy:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mywatch.gif" medium="image">
			<media:title type="html">:watch:</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4053/4452776997_feb764d541_m.jpg" medium="image">
			<media:title type="html">step01</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4066/4453553142_859a76677b_m.jpg" medium="image">
			<media:title type="html">step03</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4072/4452777097_0252245e7b_m.jpg" medium="image">
			<media:title type="html">step06</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4055/4453553016_91096a3626_m.jpg" medium="image">
			<media:title type="html">step09</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4045/4453553048_1b8ca08cd2_m.jpg" medium="image">
			<media:title type="html">step12</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4044/4453553110_08ce8e3da7_m.jpg" medium="image">
			<media:title type="html">step02</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4051/4452882037_6a7e797372_m.jpg" medium="image">
			<media:title type="html">step04</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4046/4453678964_6875ff61f0_m.jpg" medium="image">
			<media:title type="html">step05</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4025/4453553068_3b90be4670_m.jpg" medium="image">
			<media:title type="html">step07</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4025/4453690616_137e3cceb5_m.jpg" medium="image">
			<media:title type="html">step08</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4020/4453553028_bac3b1d56f_m.jpg" medium="image">
			<media:title type="html">step10</media:title>
		</media:content>

		<media:content url="http://farm3.static.flickr.com/2707/4453703212_1073d706cd_m.jpg" medium="image">
			<media:title type="html">step11</media:title>
		</media:content>
	</item>
		<item>
		<title>Neural Network Design (一)</title>
		<link>https://hjwu.wordpress.com/2010/03/10/neural-network-design-%e4%b8%80/</link>
					<comments>https://hjwu.wordpress.com/2010/03/10/neural-network-design-%e4%b8%80/#comments</comments>
		
		<dc:creator><![CDATA[hsinjungwu]]></dc:creator>
		<pubDate>Wed, 10 Mar 2010 09:13:20 +0000</pubDate>
				<category><![CDATA[專業截圖]]></category>
		<category><![CDATA[工作靠腰]]></category>
		<category><![CDATA[生物]]></category>
		<category><![CDATA[Hamming Network]]></category>
		<category><![CDATA[Hopfield Net]]></category>
		<category><![CDATA[Neural Network]]></category>
		<category><![CDATA[nonsense]]></category>
		<category><![CDATA[Perceptron]]></category>
		<category><![CDATA[教學]]></category>
		<guid isPermaLink="false">http://blog.hjwu.org/?p=4264</guid>

					<description><![CDATA[這篇主要是要報告我這禮拜會上的內容，投影片我放在這裡，至於下面的內容會充斥髒話與 &#8230; <a href="https://hjwu.wordpress.com/2010/03/10/neural-network-design-%e4%b8%80/">繼續閱讀 <span class="meta-nav">&#8594;</span></a>]]></description>
										<content:encoded><![CDATA[<p>這篇主要是要報告我這禮拜會上的內容，投影片我放在<a target="_blank" href="http://wikifat.wordpress.com/2010/03/12/neural-network-design-%e4%b8%80/">這裡</a>，至於下面的內容會充斥髒話與廢話，所以有心要學<a target="_blank" href="http://zh.wikipedia.org/zh-tw/%E4%BA%BA%E5%B7%A5%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C">類神經網路</a>的人請跳過。 <img src="https://hjwu.files.wordpress.com/2010/11/mywatch.gif?w=500" alt=":watch:" /> 還有我也不知道還會不會有「Neural Network Design (二)」？畢竟我的「屏東車站之旅(2)」到現在拖了快兩年還沒有生出來。 <img src="https://hjwu.files.wordpress.com/2010/11/mysweat.gif?w=500" alt=":sweat:" /> </p>
<p><span id="more-4264"></span><br />
<a href="http://www.flickr.com/photos/pi301415/4422174032/" title="Flickr 上 貼圖 的 Schematic Drawing of Biological Neurons"><img src="https://i0.wp.com/farm3.static.flickr.com/2739/4422174032_00a19f4d75.jpg" width="500" height="424" alt="Schematic Drawing of Biological Neurons" /></a></p>
<p>這張圖是生物神經元，西元 2000 年以前認識我的人都知道我生物爛到靠盃，所以我也就簡單說吧。如果有問題，請找強者我同學 <a target="_blank" href="http://www.wretch.cc/blog/bughole">papa</a> 吧！</p>
<blockquote>
<p>神經元用 Dendrites 接收謎樣的信號 <em>p</em>，而這信號經過了 Cell Body 發生了神奇的變化 f 後轉變成新的信號 <em>a</em> 再透過 Axon 傳遞給另一個神經元的 Dendrites。而 Synapse 則是 Dendrites 和 Axon 的結合點。而神經元的排列跟 Synapse 的強度 <em>w</em> 則確立了神經網路的功能。</p>
</blockquote>
<p>結果有人就利用這個想法搞出了下圖，害得我現在要教類神經網路。 <img src="https://hjwu.files.wordpress.com/2010/11/myfire.gif?w=500" alt=":fire:" /> </p>
<p><a href="http://www.flickr.com/photos/pi301415/4426678164/" title="Flickr 上 貼圖 的 Single Input Neuron"><img src="https://i2.wp.com/farm3.static.flickr.com/2729/4426678164_e33cae59a4_o.png" width="255" height="240" alt="Single Input Neuron" /></a></p>
<p>當然啦，這張圖只是 trivial case，反正最後一定會變成這種亂七八糟又基掰的東西。</p>
<p><a href="http://www.flickr.com/photos/pi301415/4426697842/" title="Flickr 上 貼圖 的 Multiple Layers of Neurons"><img src="https://i0.wp.com/farm5.static.flickr.com/4071/4426697842_50f1635fe8.jpg" width="500" height="273" alt="Multiple Layers of Neurons" /></a></p>
<p>嚇完之後再告訴你，我們可以用線性代數把這東西變成簡單的矩陣與向量相乘，然後你就覺得幹他老師的線性代數真神。</p>
<p>接著課本就給個蘋果跟橘子的實例來介紹三個 Neural Networks : <a target="_blank" href="http://en.wikipedia.org/wiki/Perceptron">Perceptron</a>，<a target="_blank" href="http://home.agh.edu.pl/~vlsi/AI/hamming_en/">Hamming Network</a> 跟 <a target="_blank" href="http://en.wikipedia.org/wiki/Hopfield_net">Hopfield Net</a>。由於<del datetime="2010-03-12T05:53:35+00:00">我懶得打了</del>篇幅有限，我只能告訴你大概是這樣，如果不明白就去翻書吧！ <img src="https://hjwu.files.wordpress.com/2010/11/mysleep.gif?w=500" alt=":sleep:" /> 你設定好蘋果與橘子的 prototype vector，然後第一個會讓蘋果的 output 值是1, 橘子的 output 是 -1，然後你隨便丟個東西進去，最後 output 出來一個值，你就能知道這東西究竟是蘋果還是橘子。當然啦你也可以丟西瓜進去，不過它應該會崩潰吧。 <img src="https://hjwu.files.wordpress.com/2010/11/myxd.gif?w=500" alt="XD" /> 第二個說穿了你隨便丟個東西進去，然後在第一層算出它跟蘋果跟橘子的 <a target="_blank" href="http://en.wikipedia.org/wiki/Hamming_distance">Hamming Distance</a>，第二層找出它跟誰距離最近，然後就說它是那一個。但是如果距離一樣近的話就哭哭了。 <img src="https://hjwu.files.wordpress.com/2010/11/myshame.gif?w=500" alt=":shame:" /> 最後一個就是你隨便丟個東西進去，然後 output 出來的 vector 只會是蘋果或橘子的 prototype vector，然後你就能判斷它是撒小了。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://hjwu.wordpress.com/2010/03/10/neural-network-design-%e4%b8%80/feed/</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
		
		<media:content url="https://2.gravatar.com/avatar/8144edd7c122d3cc95a4565767ce5f1c?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">海怪</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mywatch.gif" medium="image">
			<media:title type="html">:watch:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mysweat.gif" medium="image">
			<media:title type="html">:sweat:</media:title>
		</media:content>

		<media:content url="http://farm3.static.flickr.com/2739/4422174032_00a19f4d75.jpg" medium="image">
			<media:title type="html">Schematic Drawing of Biological Neurons</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myfire.gif" medium="image">
			<media:title type="html">:fire:</media:title>
		</media:content>

		<media:content url="http://farm3.static.flickr.com/2729/4426678164_e33cae59a4_o.png" medium="image">
			<media:title type="html">Single Input Neuron</media:title>
		</media:content>

		<media:content url="http://farm5.static.flickr.com/4071/4426697842_50f1635fe8.jpg" medium="image">
			<media:title type="html">Multiple Layers of Neurons</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/mysleep.gif" medium="image">
			<media:title type="html">:sleep:</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myxd.gif" medium="image">
			<media:title type="html">XD</media:title>
		</media:content>

		<media:content url="https://hjwu.files.wordpress.com/2010/11/myshame.gif" medium="image">
			<media:title type="html">:shame:</media:title>
		</media:content>
	</item>
	</channel>
</rss>
