検索システムrodanius for Knowledge

検索エンジン、AI検索、全文検索

rodanius for Knowledge とは

rodanius for Knowledgeは、ディビイ独自のアルゴリズムを使用したAI型検索エンジンです。
キーワードだけでなく、文章を入力することでも検索することができ、表の中の文章も検索対象とします。
検索結果は、適合率、再現率をベースにランキング形式で表示します。

rodanius for Knowledgeの使用例

マニュアル、規約、契約書、規格書、企画書等、企業内の様々な文書をピンポイントで文脈的に検索します。

rodanius for Knowledgeの特長

最適な検索精度(ランキング適合率と再現率のバランス)

文書の種類、書きぶり、専門性とユーザーの使用要件に合わせた最適な検索結果にチューニングすることができます。
検索時は、テキストボックスに単語、キーワード、文章を入力するだけ。
関連するキーワードでも検索が可能です。

AI学習

AI学習は導入時に実施し、運用後は年間2~3回程度ユーザーが画面上から実施することができます。
学習やチューニングのコストを最低限に抑えながらの運用が可能です。

「関連する書類を探すのに時間がかかる」、「以前作った提案書を参考にしたいが、どこにあるかわからない」、「ファイル名検索だけでは、なかなか必要な資料にたどり着かない」、「ファイル管理をしたいがあるがどうしたらよいかわからない」など、このような課題を解決するために、エンタープライズサーチを導入している企業は数多くあります。
しかし、エンタープライズサーチを導入したのに有効活用できていない。という課題もよく聞かれます。私たちはそんな課題に本気で向き合います。

ディビイの考えるエンタプライズサーチ

「見つからない」問題点を解消

SQLに基づく全文検索では、単語が完全一致していないと探すことはできません。
また、単語だけ一致しても、候補が多すぎて精度を欠く場合があります。
AIを使った検索エンジンでも、大量多品種の文書を読み込むと汎化が進み、適合率が下がります。
rodanius for Konwledgeは、これらの問題を解決するよう設計されています。

「見つからない」問題点とrodanius for Knowledgeの対応状況

「見つからない」
rodanius for Knowledgeの対応
  • 完全一致のキーワード、専門用語が不明
  • 文章単位で意味づけ、辞書で対応
  • 検索結果が多すぎる
  • 最適なAI学習とランキングで適合率をアップ
  • 文章で入力したら結果がおかしい
  • 文章を解析して複数検索ワードに変換、対象文書の該当文章を突合

検索システムの種類

文脈検索型:rodanius for Knowledge
  • 既存ファイルをそのまま解析し、文脈を解釈して、検索を実行
  • 表記ゆれ、新しい単語など、未知の検索にも柔軟に対応
  • AI学習により関係のないものが検索結果として提示されることがあるが、適合率、再現率の調整で解決可能
全文検索型:SQLをベース
  • 既存ファイルを解析、インデックス(索引)とカテゴリーを作成し、検索を実行 カテゴリー分類にAIを使用することがある
  • 完全一致により確実な結果が提示される
  • 表記ゆれ、新しい単語など、あいまい検索には対応できないため、辞書でカバーする
回答検索型:チャットボット
  • 登録済のQ&A、FAQと類似する質問文を検索し、検索で合致した質問文に対応する回答文を提示
  • 事前に用意された質問文、回答文の結果精度が高い
  • 一般的に、検索内容の約80%が事前に用意されていないので、検索結果として提示されない

現在の検索システムで困っていること

例えば、「東京出張へ行くときのホテル代の上限額」ということが、どの書類に記載されているか確認したい場合の各検索システムで担当者が困ることの例として、次のようなことが挙げられます。

ファイル名検索

記載のある書類が、「○○規則」に記載されていることを知らないと、そもそも記載されている書類を見つけることができない。

全文検索

「出張」という単語は、多くの書類に記載があり多くの検索結果が表示され、その中から必要な箇所を探す必要がある。
また、該当内容として、「宿泊料 A地区(政令指定都市)15,000 円」という記載であった場合、検索ワードを、「東京」「ホテル代」とすると、検索結果に入らない。

自然言語検索

該当ページ単位で検索結果表示が行われることが多く、検索結果の中から、目視で探すことになる。

私たちの検索エンジンに対する課題認識

知りたい情報へたどり着けない、見つからない、検索できない・・・
これらの問題の原因は、大きく3つあります。

検索対象の情報のキーワード(専門用語、慣用表現等)を知っている必要がある

原因:表記の揺れ、綴り違い、同異義語、文章単位で同意義があるため

検索結果の該当ページにおいて、ピンポイントで文章が明示されない

文書データは様々あり、ピンポイントで文章をマーキングする必要がある
原因:PDF,MS-wordなどの文書データをページ単位で該当箇所文章をマーキングする場合、フォーマットごとの調整が必要になるため

検索精度

運用していても検索結果に対するユーザーの評価が変わってないように感じる
原因:ユーザーのフィードバックを考慮できていない、文書データが増えても検索ロジックが同じ、学習機能がない

rodanius for Knowledgeの開発要件

検索エンジンの持つ課題の原因を、テクノロジーとノウハウで解決することに注力しています。

rodanius for Knowledge 強みまとめ

文脈検索型検索エンジンとして

  • 文書の書きぶり、情報の種類に応じて文書データを分類して各分類(格納フォルダー)ごとにAI学習を実行できる
    →運用時、常に最適な学習モデルを使用し劣化、汎化が起きない
  • ユーザーフィードバックをユーザーインターフェース上に機能として実装、フィードバックを元に学習を実行できる
  • 表記の揺れ、綴り違い、同義語、文章単位で同意義に辞書、文章構造化、文章のデータ特徴抽出方法、最適な機械学習とハイパーパラメータのチューニングにより対応できる

rodanius for Knowledgeの機能概要

人に寄り添う検索機能

自然文での検索を実現。

検索結果画面例
image

進化する検索システム

検索結果評価、パラグラフ調整、辞書調整、検索アルゴリズムチューニングなど使えば使うほど検索精度が上がります。 検索精度を上げる方法例:検索結果評価

image

ユーザー管理

システム内で利用するファイルは、フォルダ単位で管理し、フォルダごとにグループごとの参照権限、更新権限、ダウンロード権限の利用可否設定が可能です。

image

rodanius for Knowledgeの特長

高精度な検索精度

検索エンジンに弊社が独自に開発した複数のアルゴリズムを組み込むことで、自然文での文書検索を実現。これにより検索対象となるキーワードをユーザー側で把握していなくとも対象文書を探し出すことが可能となります。

AI学習

システム稼働後もユーザー様にとっての最適な文書を提供できるよう、継続的にAI学習を行います。

rodanius for Knowledgeの主な機能

ファイル検索
検索実行
自然文検索

検索ワードは、単語はもちろんのこと、検索ワードは自然文での検索も可能です。

image
入力補完

一度検索した用語が、検索候補として表示されるようになります。

image
最近検索されたワード表示

利用者全体での検索頻度の高い検索ワードが表示されます。クリックすると検索を実行します。

image
検索結果表示
強調表示

検索結果は、検索ワードに関連の高い順にパラグラフ単位で表示し、検索の意図に対応するであろうセンテンスを強調表示します。
同時に、ファイルの場所(パンくず)も表示します。

全文表示

ワンクリックで、検索結果の前後のパラグラフの表示も可能です。

ダウンロード

rodanius for Knowledge内のファイルをダウンロードできるように設定も可能です。

ドキュメント内検索

検索結果のドキュメント内に限定した検索も可能です。

検索精度の向上
検索結果評価

検索結果の+(いいね)- (わるいね)ボタンをクリックし、評価することで、検索精度の向上が図ることが可能です。

パラグラフ調整

検索対象となる段落分割の大きさや対象文書内の分かち書き(※)の調整を行うことで、検索精度の向上が図ることが可能です。
(※)分かち書き
日本語は英語などと違って、通常の文章では、空白(スペース)によって語を区切ることはありません。そのため、漢字、カタカナ、ひらがな等の文字種の違いや、句読点などにより、語や文章の区切りを識別する必要があります。この語や文章の区切りを識別するする作業のことを分かち書きといいます。

辞書調整

違う用語でも同じ意味で使われる用語があれば、類義語辞書の登録を行うことで検索精度の向上が図ることが可能です。

AI再調整

ファイルの追加、変更やパラグラフ調整、辞書調整を行った後、AI再調整を行うことで検索精度の向上を図ることが可能です。

検索アルゴリズムチューニング

rodanius for Knowledgeでは複数のアルゴリズムを組み合わせて検索を行っています。アルゴリズムごとに特徴が異なり、チューニングにより検索結果表示を調整することが可能です。ユーザーがチューニングを簡単に行えますので、ユーザー自信で好みの結果表示に近づけることが可能です。

管理機能
ユーザー管理

ユーザーの新規登録、削除、更新を行うことが可能です。管理者権限を持つユーザーだけが、ユーザー登録、ファイル登録、AI調整などの管理機能の使用が可能です。また、ユーザーは、グループ単位で管理します。

ファイル管理・フォルダ管理

ファイル新規登録、移動、削除やフォルダ作成、削除などを行うことが可能です。

アクセス管理

管理者は、ファイルごとに閲覧、ファイルダウンロードなどの利用機能管理を、グループ単位で行うことが可能です。

rodanius for KnowledgeのAI学習全体図

image

「rodanius for Knowledge」は、弊社の自然言語処理フレームワーク「rodanius」を活用したサービスです。
「rodanius」は、人間とコンピュータが「対話」により、その世界観も含めた相互理解を目指す、弊社の日本語に特化した自然言語処理フレームワークです。

ユーザー推奨環境

PC OS Windows 10、Mac OS 10.13
ブラウザ Google Chrome、Mozilla Firefox、Microsoft Edgs
モバイル OS IOS、Android
ブラウザ Safari、Google Chrome、Mozilla Firefox

rodanius for Knowledgeの導入の流れ

image

POC(Proof of Concept)
本契約の前に、実際にお客様が使用されている文書を弊社で、システムの実用化(運用)にむけての検証を行い、結果を報告します。お客様がPOCの結果をご確認いただいてから本契約締結、導入、稼働の順に進める流れとなります。

CONTACT US

↑