蔵品ブログ
自サイト内検索機能で日本語全文検索システム「namazu」を使ってみました。
- 2007-04-21 (土)
- 便利なサイト
前から気になっていた日本語全文検索システム「namazu」を使ってました。
当初はサイト内検索はgoogleのドメイン指定検索を使っていたのですが、商用サイトですと
広告が邪魔になります。せっかく自サイトまで誘導しておいて検索で競合先に行かれては
たまりません。
サイト内検索のCGIはいろいろあります。タイプとしては検索する都度全文を調査するgrep型
と予め検索しやすいように索引を作っておくインデックスタイプがあります。
インデックスタイプはインデックス用のファイルサイズが大きくなったり、毎回インデックスを作成
する手間があったりとデメリットもあるのですが、何より検索速度が高速なのが良いです。
そんなわけでインデックスタイプで評価の高いmsearchを使っていました。
設置も簡単なんですが、順位づけが更新日時(昇順・降順)・ファイル名(昇順・降順)・URL(昇順・降順)
の6種類となってます。これが実は私にとって問題で今のページの作り方では全ページ共通した
ナビゲーションメニューで右部(左部)に商品名がずらっと並んでます。
なので、msearchでキーワード[商品名]を入力して検索すると全ページがヒットして順位付けの問題で
まったく関係ない商品のページが上位に並んでしまいます。
これでは使い物にならないので、キーワード出現度などでページのスコアリングを行って順位づけを
している検索エンジンが必要になります。
そこで日本語全文検索システム「namazu」の登場です。
以前から存在は知っていたのですが、結構導入までが面倒で敬遠してました。
いろいろ調べてみたらやはり「namazu」が一番良さそうということで試験導入することにしました。
レンタルサーバ側でTelnetが許可されていないのでローカルでインデックスを作り、pnamazuで検索
するという形になります。
設置にあたりこちらのサイトが参考になりました。
namazuを使おう
- Comments: 0
- Trackbacks (Close): 0
- Search
- Feeds
- Meta