<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2enclosuresfull.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:media="http://search.yahoo.com/mrss/" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" version="2.0"><channel><title>FUNcLogs</title><link>http://function1122.blogspot.com/</link><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/function1122" /><description>FUNction said: "這是我想到什麼就寫什麼的記事本，所以內容多不具任何樂趣，因為我的生活無趣嘛"</description><language>en</language><managingEditor>noreply@blogger.com (FUNction)</managingEditor><lastBuildDate>Sun, 25 Dec 2011 07:22:29 PST</lastBuildDate><generator>Blogger http://www.blogger.com</generator><openSearch:totalResults xmlns:openSearch="http://a9.com/-/spec/opensearch/1.1/">195</openSearch:totalResults><openSearch:startIndex xmlns:openSearch="http://a9.com/-/spec/opensearch/1.1/">1</openSearch:startIndex><openSearch:itemsPerPage xmlns:openSearch="http://a9.com/-/spec/opensearch/1.1/">25</openSearch:itemsPerPage><feedburner:info xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" uri="function1122" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><itunes:owner><itunes:email>noreply@blogger.com</itunes:email></itunes:owner><itunes:explicit>no</itunes:explicit><itunes:subtitle>FUNction said: "這是我想到什麼就寫什麼的記事本，所以內容多不具任何樂趣，因為我的生活無趣嘛"</itunes:subtitle><item><title>免註冊指考落點分析 (Powered by 台大資管)</title><link>http://function1122.blogspot.com/2011/07/ntu-im-predict-your-university.html</link><category>實用</category><category>經驗分享</category><author>noreply@blogger.com (FUNction)</author><pubDate>Fri, 08 Jul 2011 07:27:53 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-1055536763111927855</guid><description>又到了填志願的時間，掐指一算過了好多年。只記得當年我沒有考指考，直接用推甄的，而推的學校也是親戚不知道哪裡弄來的「去年錄取分數表」，然後就不知不覺的過了大學。最近因緣際會下，朋友要我比較一下落點分析的網站，才發現原來現在好多學校都有提供這樣的服務，不禁讓我覺得，要是當年有這樣的工具也許會上更好的科系XD

市面上落點分析工具最麻煩的地方是要註冊或下載，不過現在都已經是雲端時帶了，下載幹嘛呢？讓我話不多說看看2011台大資管落點分析系統-ImWhatIM怎麼操作吧！

▲2011台大資管落點分析系統

這個系統很簡單的分成三個步驟：

第一步：填寫大學指考科目成績
假設我國文67、英文72、數甲50、物理80、化學77，我在有考的科目填上分數，沒考的分數記不要勾，以免被以零分計算影響結果。

▲可以看到「指考神」貼心的提示

第二步：填入學測成績
假設當時我學測時國文12、英文13、數學</description><app:edited xmlns:app="http://www.w3.org/2007/app">2011-07-08T22:27:53.745+08:00</app:edited><media:thumbnail url="http://2.bp.blogspot.com/-63WtAGjxbIo/ThcHpS6TkkI/AAAAAAAABEI/5OCv5rvH_IE/s72-c/whatim0.png" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">8</thr:total></item><item><title>碼上會！Java+libSVM 分析動態資料 (144行)</title><link>http://function1122.blogspot.com/2011/01/javalibsvm-144.html</link><category>邊學邊寫</category><category>Java</category><category>Text Mining</category><author>noreply@blogger.com (FUNction)</author><pubDate>Thu, 13 Jan 2011 23:22:13 PST</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-3752954237544758326</guid><description>沒想到「碼上會」還會有第二集，標題有點聳動，但在這裡的「動態資料」指的是從資料庫load 出資料(一般libSVM都是標準格式的讀檔案來分析)。此外這篇還涉及處理一個文字探勘(Text Mining)中重要問題 ─ 資料分散(Sparse data)。由於網路上沒有其他實作，所以我想使用以下講解的程式碼，可以讓你加快libSVM的分析效能，也可以提升不少工作效率(不用再輸出多個檔案就能交叉測試)。       ▲將libSVM嵌入你的java程式，從資料庫中撈出資料直接訓練  libSVM簡介     這是台大林智仁老師所開發的SVM工具，應該是世界上最好用且最主流的SVM，許多國內外的研究都透過他完成的。其實SVM之所以會成為主流，是因為它的效率較高，而且結果也不錯，甚至有學者認為SVM可以取代類神經網路(林國峰等，2009)。沿襲「碼上會」的精簡風格，廢話就不多說，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2011-01-14T15:22:13.563+08:00</app:edited><media:thumbnail url="http://lh5.ggpht.com/_9SvAhoxMa6g/TS_4mSbQo5I/AAAAAAAAA-8/lF9QMUK36yI/s72-c/libsvm-java%5B3%5D.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>碼上會！ mmseg4j 中文斷詞java 實作 (55行)</title><link>http://function1122.blogspot.com/2010/10/mmseg4j-java-55.html</link><category>邊學邊寫</category><category>Java</category><category>Text Mining</category><category>資訊檢索</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sat, 16 Oct 2010 07:15:01 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-5245565735626011890</guid><description>好，我承認標題下得有點好笑，而且也很意外寫這種實作的文章(我早就往理論派轉型了)。總之照著這篇文章的步驟，你可以使用java 將一串正體(繁體)中文的字串依照詞彙切開，以方便進行中文文字探勘(Text Mining)等計算詞頻的工作。       ▲mmseg4j中文斷詞結果，可以看到它把「處理」、「文章」等詞分割出來  首先呢，為了簡化開發，程式都在Eclipse 上開發，以下用簡單兩句話說明Eclipse 如何安裝：     到Java網站，下載並安裝JRE (請選擇合適的作業系統)     到Eclipse官網，下載Eclipse Classic 版本，將之解壓縮之後，執行資料夾中的Eclipse.exe ，就可以用它來寫Java 程式了    簡單介紹MMSeg 與mmseg4j     mmseg4j 是採用蔡志浩先生在2000 年發表的一個中文分詞演算法 ─ MMSeg，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-10-16T22:15:01.323+08:00</app:edited><media:thumbnail url="http://lh5.ggpht.com/_9SvAhoxMa6g/TLmxV3yssBI/AAAAAAAAA9Q/TM2FYdMgVqo/s72-c/image%5B15%5D.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">3</thr:total></item><item><title>感知學習演算法(Perceptron Learning Algorithm)白話說明</title><link>http://function1122.blogspot.com/2010/10/perceptron-learning-algorithm.html</link><category>背景知識</category><category>邊學邊寫</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sat, 16 Oct 2010 03:44:17 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-1710421841429800903</guid><description>看完這篇文章，你會對機器學習最入門的概念─「感知學習演算法」有基本的認知。因為筆者數學並不好，為了寫這篇，我花了大約30小時，看了10多個版本的教學(n次)，在成大數學的高手歐民同學的指導下，站在好懂的角度撰寫，希望不會令你感到失望 :)  感知器是幹麻用的？       用來產生判斷結果！會經由多個輸入的數據，透過運算產生一個非黑即白的結果，用途相當廣泛。例如透過收入、負債的數據，協助銀行判斷顧客是否可以核辦信用卡(可發/不可發)、或是可以找出潛在消費者(潛在/非潛在)、判斷股票未來的走勢(漲/跌)等等。  感知器的靈感是來自生物的神經元(下圖)，神經元從樹狀突接收不同來源的訊號，其中有些來源的刺激具正向效果、有些來源則是抑制效果，經過加總計算後，如果結果達到該神經的門檻值，則會將訊號從軸索末端傳出；或沒達到門檻，則不傳出訊號(在此為了講解方便，將訊號簡化為有與無，實際上神經元有很多種</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-10-16T18:44:17.978+08:00</app:edited><media:thumbnail url="http://lh4.ggpht.com/_9SvAhoxMa6g/TLmB_zBPClI/AAAAAAAAA9I/5xpb7-t87D0/s72-c/image%5B21%5D.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">2</thr:total></item><item><title>2010 暑假生活總回顧</title><link>http://function1122.blogspot.com/2010/09/2010.html</link><category>見解</category><category>朋友</category><category>家人</category><category>經驗分享</category><category>遊記</category><category>資訊種子</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sun, 12 Sep 2010 06:30:27 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-6380229844465210102</guid><description>明天(9/13)即將開學，讓我們來回顧一下這個暑假吧！整個暑假近三個月的時間(6/24~7/12)，大致上可以分成三個部分。前半段以資種生活為主，令人流連的南京海外參訪、招生專案以及中間的許多小活動；後半段以政大生活為中心，包括大和國的畢業旅行、新生迎新共識營等等。至於第三個部分，是一直貫串的創業與家庭生活，我認為是我的主軸，雖然創業進度大大落後，讓人不堪回顧放假前訂的計畫(說的大話)，但我想累積的這些知識，與自我學習的態度，仍是相當可觀的收穫！  暑期作息表        七月十八日，老楊的研討會論文告一段落(deadline:7/16)，我花了兩天的時間，安排暑假的作息，如下表：       ▲ FUNction's 2010 年暑期作息表  規定自己如果沒做到就扣錢，不少內行人問我扣錢要扣到哪去，我說扣掉的錢會統一放著，變成只能用來吃飯，不能玩樂(如看電影、唱歌…)的吃飯金。</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-09-12T21:30:27.910+08:00</app:edited><media:thumbnail url="http://lh5.ggpht.com/_9SvAhoxMa6g/TIzUKmC-bcI/AAAAAAAAA8Q/u4F5PkDRHxA/s72-c/Image.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">3</thr:total></item><item><title>中譯：進階領域獨立的線性文件分段 (Advances in domain independent linear text segmentation)</title><link>http://function1122.blogspot.com/2010/08/advances-in-domain-independent-linear.html</link><category>邊學邊寫</category><category>Text Mining</category><category>資訊檢索</category><author>noreply@blogger.com (FUNction)</author><pubDate>Thu, 19 Aug 2010 02:51:32 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-6549267923891016804</guid><description>這依然是一篇逐字翻譯的文章，需要注意的是第四節「評估」我沒有完全翻完，因為我已經在第三節「演算法」找到我想看的東西了，而第四節主要就有點老王賣瓜的比較與其他分段方法的優越性，因此我只翻譯了第四節的結論，有興趣的讀者可以閱讀原文。本文分段完全依照原文所訂，對照起來應該相當容易，末段「心得」為我的見解，也一併與你分享。當然，翻譯的目的依然是讓中文為母語的讀者能快速掌握這些知識，以利後進學者的研究。        ▲研究苦悶可以到郊外走走，看見藍天白雲和蔚藍的大海，必能使人心曠神怡(圖為筆者6:40 在墾丁南灣飯店所攝)  原文：Choi, Freddy Y. Y. 2000. Advances in domain independent linear text segmentation. In Proceedings of the Sixth Applied Natural Language</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-08-19T17:51:32.549+08:00</app:edited><media:thumbnail url="http://lh6.ggpht.com/_9SvAhoxMa6g/TGz-XbTEuFI/AAAAAAAAA5g/M-YJnMfnwZw/s72-c/20100814%20%2813%29_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>中譯：使用語彙鏈建立文件摘要(Text Summarzation Using Lexical Chains)</title><link>http://function1122.blogspot.com/2010/08/text-summarzation-using-lexical-chains.html</link><category>邊學邊寫</category><category>Text Mining</category><author>noreply@blogger.com (FUNction)</author><pubDate>Fri, 13 Aug 2010 20:29:01 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-7692320915096155019</guid><description>找到這篇是因為看了一篇寫得非常非常好的國內論文《混合式自動文件摘要方法》(這真的寫得非常好，學習Text Mining 非常推薦以之為基礎)，想要多了解文法剖析法(Linguistic Approach)，因為文中指出Brunn所作的《Text Summarization Using Lexical Chains》提出的系統架構與我的想法相近。但後來發現命題相近的《Using lexical chains for text summarization》可能才是所謂的key paper(引用598次)，不過都翻譯了，就丟上來啦。我依照原文的章節形式分段，並用標楷體標註非作者提及的內容，文末心得處亦為我讀後的見解，為了避免讀者混淆，特別在此註明。   原文：M. Brunn, Y. Chali and C. J. Pinchak, “Text Summarization Using </description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-08-14T11:29:01.911+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TGYJE0Il3lI/AAAAAAAAA44/5vsM-Z6hpy4/s72-c/image31.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>資訊種子：即將大三到碩一的你 請讀這篇可能改變你一生的文章</title><link>http://function1122.blogspot.com/2010/08/3.html</link><category>朋友</category><category>經驗分享</category><category>資訊種子</category><author>noreply@blogger.com (FUNction)</author><pubDate>Tue, 17 Aug 2010 19:18:58 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-1029236155491486940</guid><description>「資訊種子」不限資訊相關科系學生參加，是台北縣電腦公會辦的公益(免費)活動，為期一年。聘請經理級以上講師固定於周六下午上課(課程內容包含資訊產業、數位內容、生涯規劃、智慧財產…)，此外還有企業參訪、專案參與及海外參訪，最重要的是，誠如我說的，可以完成學生階段「認識不同領域的優秀人才」的目標。        ▲想要成為眾所矚目的焦點，加入資種，你也可以！  好了，其實已經差不多介紹完了！我認為在資訊種子最大的收穫是能夠認識許多優秀、負責且活躍的同儕，這些人脈的培養將會使你在未來的人生上左右逢源。舉個簡單的例子，據我所知，本屆資訊種子的學員報名微軟實習計畫全部都錄取了，由此可知將資訊種子比喻為成功的搖籃毫不為過。  參加資訊種子的人都很厲害耶…我行嗎？     朋友看到了七屆錄取名單，對我說：「資訊種子的學員都很厲害，我怕我不行耶…」。我對他說：「如果你參加了，你就有機會認識34個厲害的人；</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-08-18T10:18:58.484+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TGFPdmQrAiI/AAAAAAAAA4s/Riia4q0l6HY/s72-c/ITSEED%20happy3_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">4</thr:total></item><item><title>什麼是 馬...馬可夫鏈(Markov Chains)？</title><link>http://function1122.blogspot.com/2010/08/markov-chains.html</link><category>背景知識</category><category>邊學邊寫</category><author>noreply@blogger.com (FUNction)</author><pubDate>Fri, 06 Aug 2010 02:39:26 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-5246333694265455548</guid><description>「人生的課題，如果你沒有學會處理，它就會一而再、再而三的讓你練習」…其實也沒那麼嚴肅啦，只是小時候沒學好，最近讀論文的時候一直碰到馬可夫鏈…讓我覺得很卡，於是想說花一些時間把這個關節打通。我希望用一些淺顯易懂的文字寫一些老嫗能解的馬可夫鏈概念(千萬不要像維基百科寫得像天書般)，這就是邊學邊寫的最高境界吧，我想！       ▲當我聽到「馬可夫鏈」的時候，總會想像一條長長的鏈子，鏈住馬的頭@@  正文開始     我們想像有一些加以編號的桶子，每個桶子裡面裝著數顆編號過的球，如下圖所示：       ▲有1~n個桶子，桶子中的球也編有1~n號  接下來玩法是這樣的，例如我們先在2號桶子中抽到3號球，於是我們就跑到3號桶子再抽一顆球；我們發現3號桶子抽出來的球是5號，於是又跑去5號桶子抽…總之從任一個桶子中抽出球的號碼，決定著接下來目的桶子的號碼，然後一直抽到沒完沒了(或某個次數)，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-08-06T17:39:26.954+08:00</app:edited><media:thumbnail url="http://lh5.ggpht.com/_9SvAhoxMa6g/TFvSvVAYZVI/AAAAAAAAA38/W3ea_VBRr7s/s72-c/%C2%AC%C3%AF%2B%C3%88_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>使用基因演算法進行自動文件切割(Story Segmentation)之研究</title><link>http://function1122.blogspot.com/2010/08/story-segmentation.html</link><category>邊學邊寫</category><category>Text Mining</category><category>基因演算法</category><author>noreply@blogger.com (FUNction)</author><pubDate>Thu, 05 Aug 2010 19:50:42 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-8804989284202877803</guid><description>實不相瞞，我想要找出一種方法，可以偵測一篇文章中論及多少事件，並將這些事件自動切出段落。但目前礙於我搜尋能力的不足，以及論文閱讀速度的限制，實在沒有找到一個合適的方法。今天來介紹成大資工所方國安所撰寫的《應用基因演算法於中文廣播新聞中情境切割及分類》學位論文，希望能得到一些啟發。  這篇論文主要在描述使用基因演算法，試圖對中廣同一個主播連續報導不同新聞事件的語音進行切割。最重要的是對新聞加以分類，並在每個分類中找出具有代表性的專有詞彙，作為辨識新聞主題的工具。下圖描述新聞情境切割的流程，也是本篇文章的主軸。整個演算法主要分成兩大部分：一、找出分界點；二、評估分界點；以下詳述之。    ▲新聞內容切割流程圖(Story Segmentation)  使用滑動視窗找出分界點     作者先將新聞分成14群建立類別，再從這14群中找出代表的關鍵字。接著作者對長串的新聞，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-08-06T10:50:42.160+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TFt2qHTvhyI/AAAAAAAAA30/mIJLDvd-Jd0/s72-c/image_thumb5.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">1</thr:total></item><item><title>文件自動分段之研究 (含心得)</title><link>http://function1122.blogspot.com/2010/08/blog-post.html</link><category>邊學邊寫</category><category>Text Mining</category><category>向心理論</category><author>noreply@blogger.com (FUNction)</author><pubDate>Tue, 03 Aug 2010 02:20:02 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-3231665882100381029</guid><description>如果在龐大的語料庫中搜尋「資訊系統」，我們希望得到的是「包含了相互關聯的一組蒐集、處理、儲存以及散佈資訊之單元，以支援組織內的決策與控制」的答案，而不希望出來的是Laudon的MIS一整本書的內容。前述的資訊檢索技術只能提供使用者需要資訊的所在文件，但更進一步我們需要得到的是在文件中哪一個段落，甚至把使用者想要的文句摘錄出來，因此便需要文件自動分段的技術。    ▲Laudon的(周宣光譯)《管理資訊系統─管理數位化公司》一書中對於資訊系統的定義  另一個必須分段的原因在如果一大篇文章講述許多主題，在詞頻統計中的權重就會因為主題分散而被降低，使得排名落後；分段後主題應更為凝聚，比較能與查詢條件匹配，提高了recall與precision。以下介紹常見的自動分段方法：  依文件架構分段(Discourse Passages)     依照文章原有的段、節分割成不同部分。好處是有效率，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-08-03T17:20:02.874+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TFfdS6RA8LI/AAAAAAAAA3s/FFwbnMMUKu4/s72-c/DSC01621_thumb4.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">1</thr:total></item><item><title>文件搜尋的方法 - 資訊檢索(Information Retrieval)</title><link>http://function1122.blogspot.com/2010/08/information-retrieval.html</link><category>邊學邊寫</category><category>Text Mining</category><category>Ontology</category><category>資訊檢索</category><author>noreply@blogger.com (FUNction)</author><pubDate>Tue, 03 Aug 2010 02:14:44 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-8692828899377559189</guid><description>資訊檢索系統(Information Retrieval System)可以定義為儲存、展示、組織與存取資訊的系統。文件分析與索引可以協助資訊檢索工作的進行，一般來說可以透過以下模型進行。  基礎方法  布林模型 (Boolean Model)     簡單說就是字串比對，找出「完全符合」搜尋條件字串的文件集合。查詢的條件是單字或片語，並可使用布林運算式：AND/OR/NOT加以連接字串。布林模型的優點是效能高，缺點是不提供查詢結果的相關性排名，使用者無法知道文件符合查詢條件的程度。此外布林模型缺乏彈性，必須要完全符合字串才能被找出。  向量空間模型 (Vector Space Model)     由Gerard Salton提出，他認為資訊檢索過程必須對文件本身進行分析，以建立索引(Indexing)。建立索引的目的是透過索引代表文件集合中的某篇文件，一篇文件可以對應一組索引，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-08-03T17:14:44.116+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TFfZcfjS1RI/AAAAAAAAA3k/KJfdyhD3Mh4/s72-c/%2111_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>中英混雜自發性語言語音辨識之研究</title><link>http://function1122.blogspot.com/2010/06/blog-post_17.html</link><category>邊學邊寫</category><category>語音辨識</category><author>noreply@blogger.com (FUNction)</author><pubDate>Thu, 17 Jun 2010 07:23:30 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-841341715697679462</guid><description>在meeting 中常聽到：     你有什麼comment？     這是個good point！     在這個Algorithm中，我們會先…    雖然既有的單語辨識系統已經漸趨成熟，但在實務上，雙語辨識系統的確有其需要。要建構中英雙語辨識系統，必須要考慮兩種語言的特性，並加以整合。此外，實務應用上的「自發性語音(spontaneous speech)」常伴有許多的停頓、重複、無意義的語助詞或不完整的段落。而且演說者常會把英文說得有點想像中文，例如facebook會說成「非死不可」之類的，也會增加辨識的難度(中:英 = 9:1 左右)。  中英連續語音辨識技術     英文是多音節的拼音語言，一個word可以由一到多個音節所組成，因此音節(或稱音素phoneme)是英文的最小單位。而音素根據發音方式可以分為子因與母音，因此英文辨識以因素為基礎，將音素串辨識為字串。  </description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-06-17T22:23:30.847+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TBoX-eijtfI/AAAAAAAAA1I/1bZM47l5wuo/s72-c/DSC01565_thumb7.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>建立中文廣播新聞摘要之研究</title><link>http://function1122.blogspot.com/2010/06/blog-post_15.html</link><category>邊學邊寫</category><category>語音辨識</category><category>Text Mining</category><author>noreply@blogger.com (FUNction)</author><pubDate>Mon, 14 Jun 2010 21:30:28 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-1426560495423961906</guid><description>中文語音辨識     語音文件無法被概括性的瀏覽，只能循序瀏覽到最後才能了解整篇文件要表達的含意。相同內容，由不同的人說出來的語音文件，除了聲調、音量外，口音也會使每篇語音文件顯得不同。即使是相同的人，也會因為環境、身體狀況而改變語音文件的品質。  「索引特徵」是資訊檢索、分類系統表示文件或使用者問句的基礎。在中文裡，特徵分為詞(word-level)、字(Character-level)以及音節(syllable-level)三個層次。結構上中文具有以下特質：     中文一個字就是一個音節     單字通常是詞素(morpheme)，詞素是帶有語意的最小單位     詞的界限不明顯     有許多的同音字    新詞容易被創造、理解是另一大特色，例如「高鐵」。這些詞通常不存在於檢索分類的辭典，但是他們與文件的核心概念通常密切相關。由此可知，中文的構詞相當具有彈性，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-06-15T12:30:28.081+08:00</app:edited><media:thumbnail url="http://lh5.ggpht.com/_9SvAhoxMa6g/TBcAKoozQRI/AAAAAAAAA00/4RAmoBxKRVc/s72-c/DSC01563_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>新聞事件偵測與時間分析之研究</title><link>http://function1122.blogspot.com/2010/06/blog-post_14.html</link><category>邊學邊寫</category><category>Text Mining</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sun, 13 Jun 2010 22:37:22 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-2572740367093815954</guid><description>主題事件的分類(TDT, Topic Detection and Tracking)，五大追蹤方向     文件切割(Story Segmentation)：將依則包含許多新聞的文件切割成許多單獨新聞的文章     主題追蹤(Topic Tracking)：找出新進文件是否與之前主題相關     主題偵測(Topic Detection)：將探討鄉圖主題的文件分類     第一則新聞偵測(First Story Detection)：判斷新進文件是否屬於新的主題或是尚未討論過的主題     連結偵測(Link Detection)：隨意取出兩則文件，判斷此兩則文件是否屬於同一主題    大型語料的主題分析最受矚目的是「自組性語意對應圖(Self-Organizing Semantic Map)」，許多研究使用此方法；另外「機率式潛藏語意分析(Probabilistic Latent </description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-06-14T13:37:22.087+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TBXAEQXofYI/AAAAAAAAA0c/lnExCq5ZEM0/s72-c/DSC01561_thumb%5B21%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>愛後感</title><link>http://function1122.blogspot.com/2010/06/blog-post.html</link><category>見解</category><category>Annie</category><category>經驗分享</category><category>感情</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sun, 03 Oct 2010 19:57:49 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-1082824159453656091</guid><description>「人生的課題，如果你沒有學會處理，它就會一而再、再而三的讓你練習」如果沒有檢討過去，除非運氣很好或價值觀改變，這些錯誤的模式就像詛咒一樣會一輩子跟著你。雖然這是我第一次在Blog分享感情的失敗經驗，但我非常殷切企盼這也是最後一次…今天，是分手七個月，沒想到轉眼就過了這麼久，其實原本在半年就想發這篇文章，可是礙於非常忙碌，真的沒機會好好整理。導火線     
去年男孩生日的那天，女孩精心規劃了一日遊的行程、訂了浪漫的餐廳，買了昂貴的禮物、製作了精美的交往紀念冊。可是前一天晚上，女孩打電話跟男孩說，明天的行程可能會有變動，因為女孩下午要去聽某電視台的招募說明會(女孩即將畢業，說明會是女孩的老師幫女孩安排的)。於是女孩說早上先去玩，下午聽說明會，晚上再去吃大餐。當下男孩很傷心，希望女孩可以不要去說明會，用壽星的身分懇求著…早上去了北投的溫泉博物館，拍了很多漂亮的照片；到了中午，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-10-04T10:57:49.041+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/TB92gZbyjfI/AAAAAAAAA1s/jpYIv_4ElsY/s72-c/tv_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">10</thr:total></item><item><title>99台大資管所榜眼上榜心得：感恩篇</title><link>http://function1122.blogspot.com/2010/06/2010ntuim-gradschool-exam-2nd-thanks.html</link><category>朋友</category><category>家人</category><category>經驗分享</category><author>noreply@blogger.com (FUNction)</author><pubDate>Fri, 04 Jun 2010 23:23:20 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-2025440927753683642</guid><description>  我想第一要感謝的還是我的家人，他們知道我要考試讓我能安心念書，不需要操心家務。特別感謝老爸和老弟，是老爸才讓我抓住這個嘗試的機會，而老弟陪我一起念書(雖然我唸書的時間不多，而且考前的周末我老弟還跟朋友去彰化玩三天兩夜XD)，讓我有共同奮戰的感覺！     結果我瘋狂的在我家樓下的門貼上榜文，這是我與老爸的合照XD  第二是感謝文昌爺爺，雖然筆試的時候我沒有拜祂，因為我覺得我準備的不夠，拜祂是一種褻瀆。但是我跟我自己講，如果進了口試，我就有資格拜祂。果然他給我力量，讓我在台大獲取更多的資源，造福社會。口試時我一直帶著祂的御守，一定是因為祂的守護，才能讓我能如此順利…  接下來，要感謝我的老師及主管     政大的老闆：他給我很多中肯的建議，讓我自己考慮，也使我深深覺得老闆對學生開明的態度幾集體會到他的關愛。他對我說，如果光就名字來說，這兩間學校真的差不多，但是你去那裡勢必多花一年，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-06-05T14:23:20.665+08:00</app:edited><media:thumbnail url="http://lh6.ggpht.com/_9SvAhoxMa6g/TAntVu0Kk6I/AAAAAAAAAzA/P7dGHzvGsJ4/s72-c/image_thumb%5B13%5D.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>99台大資管所榜眼上榜心得：口試篇</title><link>http://function1122.blogspot.com/2010/04/2010-ntu-im-gradschool-exam-in-2nd.html</link><category>經驗分享</category><author>noreply@blogger.com (FUNction)</author><pubDate>Fri, 04 Jun 2010 22:26:54 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-1632299138078458511</guid><description>筆試的前30的考生有進入口試的機會，但口試還會再刷掉近2/3的人，所以仍不能掉以輕心。由於筆者在98年政大資管所推甄口試獲得95.4的高分，所以對於準備口試也略有心得，以下依照口試戰略、準備書審資料、口試佈局做經驗分享，最後再對應到實際台大資管的關卡。  口試戰略        我覺得口試要獲得高分，必須掌握「把基本面顧好，外加自己的創意」的原則。當考官提問時，先答出考官想聽的答案，回答後再外加一點自己對於題目的一些洞見，讓考官驚艷！例如我去年在政大口試時，有一題要求我們看一篇英文的data mining 的文章，並回答幾個問題(題目先給我們，並給一張紙讓我們擬好答案)，答案其實還蠻固定的，幾乎有標準答案，所以我除了回答完老師要求的問題外，我還     在那張紙上用表格比較三種文中提到data mining 方法的不同     把這篇文章取了一個標題(因為那篇文章沒有標題)，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-06-05T13:26:54.943+08:00</app:edited><media:thumbnail url="http://lh5.ggpht.com/_9SvAhoxMa6g/S9r13POiFtI/AAAAAAAAAxo/I_XVFxOjGqQ/s72-c/DSC01488_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">5</thr:total></item><item><title>99台大資管所榜眼上榜心得：筆試篇</title><link>http://function1122.blogspot.com/2010/04/2010-ntu-im-graduate-school-exam-in-2nd.html</link><category>參考連結</category><category>資訊管理</category><category>經驗分享</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sun, 02 May 2010 07:39:34 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-3607666590593831640</guid><description>我準備台大資管所大概只花了兩個禮拜(2/28考，電腦公會春酒弄到2/26)，第一個禮拜分析考古題；第二個禮拜看書背筆記。由於筆者是98高考第8名(已經練成九陽神功，練其他武功只要幾個時辰)，所以主要分享準備兩次考試的心態，基礎的建立與一些速成的撇步。基本上，我覺得考「資管所」是很幸運的，因為它不像機械所要做20年的考古題，資管所只要做5年！  筆試戰略     由於台大不考統計，計概又與其他學校大相逕庭，所以如果你真心準備台大資管，雖然有415個人報名，前30進口試，但是你真正的對手絕對不到100人，也就是只要搶進30%就有希望！我的分析是這樣的：研究所考試以應屆生為主，應屆同學通常為了怕沒研究所念，考5-6間是很正常的事，但因為台大的考科不太一樣，若專心準備台大，可以比其他考生省掉許多時間。所以真正的對手只有三種：一是台大學生(因為考試跟學校教的有關，而且也比較有可能鎖定台大，大約佔</description><app:edited xmlns:app="http://www.w3.org/2007/app">2010-05-02T22:39:34.831+08:00</app:edited><media:thumbnail url="http://lh5.ggpht.com/_9SvAhoxMa6g/S8iAuLNIV9I/AAAAAAAAAw8/7RslAkZgoGg/s72-c/image_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">8</thr:total></item><item><title>微軟戰友喜相逢 糗感交集</title><link>http://function1122.blogspot.com/2009/10/blog-post_27.html</link><category>朋友</category><author>noreply@blogger.com (FUNction)</author><pubDate>Tue, 27 Oct 2009 06:26:14 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-507017975090516602</guid><description>請先放個背景音樂吧XD ↓↓↓    

Jolin 的歌，陪伴著我孤寂的查著「Extended Window」，就這樣過了一年...     

    
圖：左起我、Deduce、Jamie、Ellen    

第一次見到Ellen，是在微軟的小教室，聽著琪樺姐講著AA的注意事項，他是我在微軟認識的第一個人，也沒想到，他也是4個pre-sales的其中一個。沒錯，他是我們這個team的，很巧！     

Deduce，是在微軟的大教室碰面的，我正留下來問小白學長關於pre-sales的工作內容，因為我覺得我應徵的是「技術專員助理」，不能了解我將來要幹嘛...這時候Deduce出現了，他說他跟我做一樣的工作，還給我一張上面印著大大的「林宜如」的名片，在門口他介紹了柚子(那個自我介紹時被說長得像朱木炎的北科同學)     

現在的Jamie，當時他還叫Jill，第一次見面是在敦群。</description><app:edited xmlns:app="http://www.w3.org/2007/app">2009-10-27T21:26:14.638+08:00</app:edited><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">1</thr:total></item><item><title>抓住暑假的尾巴 - 宜蘭行三天兩夜 (Day 2)</title><link>http://function1122.blogspot.com/2009/10/day-2.html</link><category>Annie</category><category>遊記</category><category>山水踏青</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sat, 10 Oct 2009 02:44:23 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-3187013709081261902</guid><description>第二天是一個轉折點，告別了怪怪的「宜蘭美樂假期」(這邊傷心的往事就不必提，簡單說是雖然經營者態度很好，但硬體實在太差了，而且因為沒經驗在網路上一次訂兩個晚上，退費凹了半天)，一大早開心的上太平山。         山上幾乎都在下雨，小火車不敢坐，步道也不敢下來走。一路邊開車邊聊開到翠峰湖...的入口，就折回去。但很開心的是可以看到蓊鬱的森林，這一直是我熱愛且夢寐以求的。開下山的路上也一直在學「讓路」的技巧(左手伸出窗外往前揮，讓候車先過)、聊著你喜歡的西洋老歌…非常開心。         後來住進了前一天在羅東夜市看到的早安！稻香民宿，雙人房一夜1500，設備很新很別致，重點是你超愛的！據說是民宿主人「周媽媽」請一個跟我們年齡相仿的女學生設計、布置的，很有「小女孩夢想中的房間fu」(我女友說的)。而且周媽媽很居家、很和善，都一直穿著圍裙呢！         重點是，民宿裡有一本本子，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2009-10-10T17:44:23.328+08:00</app:edited><media:thumbnail url="http://lh4.ggpht.com/_9SvAhoxMa6g/StBXLemOstI/AAAAAAAAArE/WYHB-gjsGoY/s72-c/1624846821_thumb%5B1%5D.jpg?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">4</thr:total></item><item><title>[秘技] 全國碩博士論文把文章開新視窗的技巧</title><link>http://function1122.blogspot.com/2009/10/blog-post.html</link><category>實用</category><category>經驗分享</category><author>noreply@blogger.com (FUNction)</author><pubDate>Wed, 07 Oct 2009 20:17:42 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-8762819659904814935</guid><description>這是前幾個禮拜發現的，今天跟同學分享時，發現這也可以稱為一個秘技XD  簡單說，就是在論文名稱的「句號」上面按右鍵，就可以選擇開在新的視窗了!! 就這麼簡單，不知道可不可以嘉惠研究生阿XD       全國碩博士論文是台灣論文的集散地，如果用在研究所報告上，蠻有可能會被老師ㄉㄧㄤ的，旦大學部的報告就綽綽有餘啦。如果要用在研究生上，建議：  從這裡找與自己研究相關的主題，找三篇文章後，再從這三篇文章的Reference找英文論文，這樣很有可能會找到所謂的Key Paper~  </description><app:edited xmlns:app="http://www.w3.org/2007/app">2009-10-08T11:17:42.822+08:00</app:edited><media:thumbnail url="http://lh3.ggpht.com/_9SvAhoxMa6g/Ss1Z0jmDraI/AAAAAAAAAqs/0V174fmhq0k/s72-c/image_thumb%5B1%5D.png?imgmax=800" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>[讀書心得] 世界是平的 - 湯瑪斯‧佛里曼</title><link>http://function1122.blogspot.com/2009/09/blog-post_22.html</link><category>見解</category><category>資訊管理</category><category>讀書心得</category><author>noreply@blogger.com (FUNction)</author><pubDate>Tue, 22 Sep 2009 09:42:49 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-2748235418086413551</guid><description>奈里坎尼說：「就坐在這兒，可以與紐約、倫敦、舊金山、波士頓同時開會，全都是現場即時。如果結果是交新加坡的廠商執行，新加坡也可以加入現場談，這就是全球化。」全球的競賽場正在被剷平─類似印度的國家已經可以競逐全世界的知識工作，這是美國前所未見的挑戰。這是人類文明的另一個里程碑。從講求國力到跨國公司為全球市場競爭，進而在十輛推土機的力量下，剷平了世界，使個人力量大增，這是佛里曼所說的「全球化3.0時代」，是一個平坦的世界。平坦世界的起因1989年柏林圍牆倒下、1995年網景瀏覽器上市，加上工作流程軟體、Web Service 技術出現，創造了平坦世界競技場的平台。加上開放原始碼、委外、岸外生產、供應鏈技術、內包、搜尋引擎等形成的新合作形式，都使世界變得更為平坦。此外，儲存媒體、檔案共享、一機多用、網路電話、無線科技等催化劑，造成競技平台的發酵，作者稱之為「類固醇」</description><app:edited xmlns:app="http://www.w3.org/2007/app">2009-09-23T00:42:49.404+08:00</app:edited><media:thumbnail url="http://3.bp.blogspot.com/_9SvAhoxMa6g/Srj82houpII/AAAAAAAAApE/Su2Nk-Dmg_c/s72-c/world-flat.jpg" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><item><title>高考分發說明會</title><link>http://function1122.blogspot.com/2009/09/blog-post_1214.html</link><category>高考</category><category>經驗分享</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sun, 20 Sep 2009 06:48:31 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-3692943114923673893</guid><description>重要日期98/9/28(一)18:00其實整個重點在於，我申請保留，所以我拿到研究所畢業證書後，要在三個月內申請補訓。如果兵單還沒下來，我可以先當公務員，當到一半再留職停薪去當兵。如果兵單在三個月內下來，我就要再申請保留，等退伍後三個月內申請補訓 申請補訓依照當月申請的先後順序排志願，所以就算我考第8名也沒啥用。重點是在每個月的1號申請，這樣才能分配到較好的志願。一、錄取身分1.正取使用人事局密碼更新個人資料填志願(程序面，稍後講)按兩次確定後不能更改列印志願表，在9/29前簽名蓋章，以限時掛號寄回人事行政局延後分發：碩士班三年、博士班五年、需求兩年。榜示後10天內提出保留錄取資格。原因消滅的3個月內向榜訓會提出補訓，重新接受分發。同月內提出補訓，依當月提出申請時間分發10/7人行局網站公告分發2.同分正額有考生核准保留，可遞補無遞補則列為候缺分發。同類科無其他增額人員，</description><app:edited xmlns:app="http://www.w3.org/2007/app">2009-09-20T21:48:31.364+08:00</app:edited><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">1</thr:total></item><item><title>關於上課筆記</title><link>http://function1122.blogspot.com/2009/09/blog-post_20.html</link><category>參考連結</category><author>noreply@blogger.com (FUNction)</author><pubDate>Sun, 20 Sep 2009 06:20:23 PDT</pubDate><guid isPermaLink="false">tag:blogger.com,1999:blog-2174931189750419814.post-8992546641487428493</guid><description>有鑑於越來越愛用網誌當上課筆記(邊上課寫網誌其實很好玩喔XD)，為了怕影響網誌文章品質，小弟決定將上課筆記開到另外一個Blog。若有修習相同課程之同學，歡迎到FUNction's 上課筆記 來參與討論與心得分享~所以這邊依然寫一些教學、心得或生活瑣事，仍請大家多多指教囉^^</description><app:edited xmlns:app="http://www.w3.org/2007/app">2009-09-20T21:20:23.731+08:00</app:edited><media:thumbnail url="http://3.bp.blogspot.com/_9SvAhoxMa6g/SrYr5nUIkMI/AAAAAAAAAo8/C4QxfCrw6PI/s72-c/%E4%B8%8A%E8%AA%B2%E7%AD%86%E8%A8%98.png" height="72" width="72" /><thr:total xmlns:thr="http://purl.org/syndication/thread/1.0">0</thr:total></item><media:rating>nonadult</media:rating></channel></rss>

