blog Search

最近又發現幾篇跟部落格搜尋有相關的論文,雖然還沒完全看完,但是很多概念都可以讓我好好地思考自己的想法。

底下是目前在看的幾篇:

Latent Friend Mining from Blog Data

Using Ontology to Map Categories in Blog

第一篇是透過分析部落格上的文章內容來找到跟某個部落格興趣類似的部落格,而第二篇則是透過分析部落格文章的分類來搜尋。第一篇很不錯的地方在於他還考量到了時間的因素,第二篇雖然還沒看完,但是應該是沒有的,畢竟類別沒有時間的因素阿。第一篇文章也談到他們不用類別的原因就是有些部落格其實沒有把文章做好分類。

第一篇主要的目的在於針對目標部落格找到可能成為朋友的部落格。主要的評斷方式在於他們是否擁有相同的興趣。主要的數學公式屬於Data Mining方面,所以實在看不太懂。主要的比對目標是部落格文章中的文字(關鍵字出現頻率,這導致每篇文章的長短將會影響比對結果。),而這些關鍵字則是採用預先建立好的資料庫來分析(此資料有階層式的關係,像是:籃球這個字屬於運動這個類別底下)。

這篇文章將之前原有的方式改良,裡頭提到以往的方法都只有一層,這導致只能分大類或是分的太粗糙(例如:籃球和足球之間的差距會跟籃球與3C的差距一樣大)。而本篇文章則會計算小類別,這使的分類可以分的更加詳盡。本篇文章的驗證方式則是找了三位使用者從搜尋結果中評斷搜尋結果與目標部落格是否擁有相近的興趣。這方法聽起來很不像一般研究的方法,文章中對於這點的說法則是在這個領域中目前並沒有標準的資料庫可供分析(像是影像處理的那些圖吧:p)。

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s