タグ

solrに関するyujioramaのブックマーク (6)

  • 魔窟と化した全文検索サーバーとふっかつのじゅもん - Cybozu Inside Out | サイボウズエンジニアのブログ

    サイボウズのクラウド黎明期から運用し続けていたSolrサーバーを Elasticsearchに置き換えるプロジェクトが先日完了しました。 プロジェクト完了報告もかねてプロジェクトのあらましを公開したいと思います。 はじめに このプロジェクトの主軸は『魔窟と化したレガシー技術をどう捌くか?』になります。 このプロジェクトの報告をする前に、いくつかエクスキューズをさせていただきます。 クラウド黎明期を支えてくれたSolrには畏敬の念に近い感謝をもっています レガシーな技術に対してマウントやディスリスペクトの意図はありません 魔窟にかかわることになってしまった人に対して負の感情は一切ありません 今回の採用している構成はElasticsearchのあるべきアーキテクチャではありません 今後、Neco 環境への移行を通して継続的に改善していきます サイボウズでのSolrの使い方と用語説明 サイボウズ

    魔窟と化した全文検索サーバーとふっかつのじゅもん - Cybozu Inside Out | サイボウズエンジニアのブログ
    yujiorama
    yujiorama 2021/06/16
    前向きな結末でよかった(導入部が辛すぎる) "そして、2021年6月にすべてのSolrサーバーへの切り替えサポート期間が終了しElasticsearch移行が完了しました。"
  • Solrのdismaxを使ってお手軽(?)レコメンド - Qiita

    はじめに レコメンドといえば協調フィルタリングがパッと思い浮かびますが、傾向を表すために必要なデータが不足している場合などはルールベースのレコメンドをまず検討するかと思います。 今回はSolrを使ってルールベースのレコメンドをどうやって(比較的楽に)実現するかを検討してみました。 Mahout+Solrでゴリゴリやるぜ。という記事ではありません。 環境 Solr4.10.4 インデクスの準備 データはiTunes Media API、スキーマ定義はDynamicFieldで定義しインデクシングしました。インデクシング部分は筋ではないので割愛します。 型の定義は、SolrのExamplesのCollection1と同様です trackIdをuniqueKeyとしています。_tはtext_ja,_lはlong,*_dtはdateです。 データのサンプルをお見せします。 "response":

    Solrのdismaxを使ってお手軽(?)レコメンド - Qiita
  • 『Solrの形態素解析で使えるフィルタあれこれ』

    「Apache Solrのschema.xmlを読み解く 」にて少し書いたことですが、Apache Solrの設定ファイル(schema.xml)には様々なフィルタが設定可能で、それによって検索結果が大きく異なってきます。 フィルタの数は多数あって、利用用途やトークナイザーによって変わってきますのでここで書いているのは一部なんですが、こんな検索にヒットさせたいといった場合にフィルタの使い方次第で検索精度を高められたりするので、どういったフィルタがあるのか知っておけば用途に応じて使い分けられて便利です。 ここではApache Solrはバージョン4.6.1を使ってフィルタの検証をしています。 フィルタ(filter)要素はschema.xmlファイルのfieldType要素内に定義していきますが、charFilterという要素もあったりして少し混同したりします。 charFilterは、文章

    『Solrの形態素解析で使えるフィルタあれこれ』
  • Block join toranomaki

    2. 自己紹介 • 海老澤 志信 • 所属 • 現業務 リクルートグループの検索システム コンサル・開発・保守・運用・サイト導入 • Solr歴 Luceneのリリースノートに日語で名前が載った唯一の男 (2015/05/13現在) ※詳しくは前回のスライドにて…… http://www.slideshare.net/ebisawashinobu/heliosearch-vs-solr

    Block join toranomaki
  • solr-tutorial/doc/import-and-indexing.md at master · hatena/solr-tutorial

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    solr-tutorial/doc/import-and-indexing.md at master · hatena/solr-tutorial
    yujiorama
    yujiorama 2014/08/26
    チュートリアル
  • オープンソース全文検索サーバー Fess

    利用環境 Apache ライセンスで提供 (フリーソフトなので、無料で利用可能) Java環境またはDocker環境で利用(OS非依存) OpenSearchまたはElasticsearchを検索エンジンとして利用 用途に応じて柔軟に対応可能な設計 クロール Web、ファイルシステム、Windows共有フォルダ、データベースをクロール MS Office(Word/Excel/PowerPoint) や PDF など多くのファイル形式に対応 リクエストヘッダーに情報付加、重複ドメインの設定、検索結果のパス変換 OCRなどの外部テキスト抽出対応

    オープンソース全文検索サーバー Fess
  • 1