【大阪】BMXUG勉強会 -Kubernates体験&Watson Discovery入門- 2019年3月27日参加レポート

f:id:silverbirder180:20190522223722p:plain
BMXUG
bmxug.connpass.com 今回、k8sの体験を目的として参加したのですが、意外な収穫があったので、 共有したく、記事を書くことにしました。

twitter.com

Watson Discovery

Watson Discoveryとは??

簡単に言うと、IBM製の検索APIになります。 全文検索システムでおなじみにElasticSearchとは違った「IBM」ならではの機能が搭載されています。 また、無料で使えるとのことで、興味津々になってしまいました。

どんな特徴があるの?

なにかしらの文章データをWatsonDiscoveryに渡してあげることで、 文章にあるコンテキストを種々様々な側面から抽出してくれます。 特に、大量のドキュメントを検索したいときに使う場合に活躍します。

メタ情報による検索

登録した文章データから良い感じのメタ情報を抽出してくれます。 たとえば、下記の属性があるみたいです。

  • エンティティ
  • リレーション
  • キーワード
  • カテゴリー
  • コンセプト
  • セマンティックロール
  • センチメント
  • エモーション

例えば、怒っている文章を渡すとWatsonDiscoveryでは、 「怒りのエモーション」メタ情報を付与されます。ほえ〜!すごい! 確かに独自な機能ですよね。
この機能は、日本語ではサポートされていませんでしたが、 2018年8月ごろにできるようになったそうです!

隠れたコンセプトをみつける

文章にあるワードだけでなく、文章にないワードのコンセプトも見出してくれるそうです。 どうなってるんだ!?

クローラも提供されている(WebCrewl)

日本語のニュースを定期的にクロールして、ディスカバリーの辞書を更新してくれる機能もあるそうです。 手段の1つに、URLを指定するだけで勝手にクロールしてくれる方法もあります。簡単だ。。。 これを使えば、データを用意しなくて済みますし、お問い合わせQ&Aみたいなのが簡単に作れちゃいます。

サンプル紹介

例えば、「喜ばれるホワイトデーのプレゼント」で検索してみます。 また、メタ情報検索として、センチメンタル「ポジティブ」を指定。 (データは、WebCrewlで収集済み)

結果を、種々様々な形式のランキングを表示してくれました。 例えば、「いくらお金をつかうか?」というランキングでは、TOPが無料でした。これは面白かった。

visual insight (ベータ版)

ワードの距離を視覚的に見せてくれるそう。wordCloudもありました。

最後に

IBMならではの、独特の全文検索システムAPIでした。 無料で使えるそうなので、時間があるときにでも使ってみたいなと思います!