キーワード自動リンクの話を某勉強会でしました。その資料を公開します。
自動リンクのためのデータ構造としてTrieを採用し、今回は有名な実装であるsenna, Tx, dartsの比較をしました。
それぞれのライブラリの背景は次の様なデータ構造です。
今回の実験はとりあえず実装しましたレベルなので、厳密な速度や容量にはなっていない可能生があります。
というのは、それぞれのライブラリを精査したわけではないからです。
またキーワード抽出した結果がそれぞれで若干異なっています。抽出できたキーワードの件数に大きなさや検索にかかる時間に相関が無さそうなので概ね正しいと考えることにしました。
というわけで、ご参考まで。
2 Responses for "キーワード自動リンクの話"
[...] キーワード自動リンクの話 – 進・日進月歩 blog.gijutsuya.jp/harajune/2009/09/01/keyword-link – view page – cached #RSS 2.0 RSS .92 Atom 0.3 進・日進月歩 » キーワード自動リンクの話 Comments Feed 進・日進月歩 時代はwordpressだって? Txでdartsのようなtraverseをする関数 — From the page [...]
Really good work about this website was done. Keep trying more – thanks!