消費者の間でスマートスピーカーやパーソナルアシスタントが急速な広がりをみせる一方で、企業による対話システムの導入はためらいがちな歩みにとどまっています。顧客に次世代の情報システムを提供するには、さまざまな種類の対話システムが必要です。その主流となっているのは、目的駆動型(goal-driven)の対話システムです。TCS はバーチャルアシスタント、ナレッジ統合、ヘルプデスク自動化など、目的に応じて、さまざまな手法を用いてこうした対話システムを構築してきました。必要とされるナレッジベースや想定される利用シーンによって用いられる手法は異なりますが、そのいずれにおいても、深層学習(ディープラーニング)の進歩により有効性が高まっています。次の段階として、「汎用AI」と「より自然なユーザーインターフェース」の2 つの方向から、大幅な進歩の流れがやってくるとTCS は予想しています。
機械との対話は、人とコンピュータとの関わりにおけるパラダイムシフトといえるでしょう。Amazon Echo(アマゾンエコー)、Google Home(グーグルホーム)、Apple HomePod(アップルホームポッド)といったスマートスピーカーや、Siri(シリ)、Google Assistant(グーグルアシスタント)、Cortana(コルタナ)などのパーソナルアシスタントは、人々の生活の一部になりつつあります。テクノロジーの「擬人化」は始まったばかりですが、すでに世界中のあらゆる活動に大きな影響を与え始めています。その範囲は音楽を聴くことから、タクシー、航空券、あるいはホテルの予約、ショッピング、自分に合ったおすすめ商品情報や提案の受け取り、フィットネス・健康管理、高齢者介護まで、多岐にわたります。ELIZA の例のような、汎用的な対話システムを構築しようという初期の試みとは異なり、現在の対話システムは、「規程や手続きに関する問い合わせに答える」「人に替わって業務を処理する」など、特定の目的に特化しています。音声あるいは文字入力による質問応答を目的としたタスク指向型のチャットボットが急速に増えていますが、それは可能性に満ちた道のりのほんの始まりにすぎません。次世代の情報システムを顧客に提供するためには、企業はさまざまな種類の対話システムを構築する必要があります。本稿では、そのいくつかを紹介します。
バーチャルアシスタントは目的駆動型(goal-driven)対話システムの代表格です。バーチャルアシスタントは、完全に自己完結型の問いに高い精度を発揮します。「predefined intent(定義済みインテント(検索意図))」と呼ばれる1 つの回答に対して複数の異なる質問を受け付けるというのが、最も普及している形態です。ユーザーからの問い合わせに対し、用意された回答から一つを選んで回答します。学習データは通常、多数の定義済みインテントで構成されます。ユーザーから質問が寄せられると、システムはそれを定義済みインテントに照らし合わせ、該当する回答を表示します。TCS の研究では、標準的な機械学習の手法を用いた場合、システム内のインテントの数が増えると、回答の精度は使用に適さないレベルにまで低下することが確認されました。
深層学習の登場により、対話システムの有効性が向上し、定義済みインテントの数が増えても使用に耐えうるようになりました。用意されたインテントの数が多いシステムは、ユーザーに「対話能力が高い」という印象を与えます。TCS Research では、深層学習をベースとした画期的な対話システム用のアルゴリズムを開発しました。TCS には、このアルゴリズムを用いて社員からの人事規程に関する問い合わせに対応する「Cara」というデジタルアシスタントがいます。Cara はバーチャルアシスタントの好例といえます。
現在市場にあるほとんどのプラットフォームでは、過去の質問や回答に出てきた事柄を代名詞に置き換えて対話を続けることができません。また、あらかじめ設定されたQ&A の範囲を超えて会話に適切に対応する能力も備えていません。さらに、仮にシステムが間違った回答をしても、自ら誤りを認識することがなかなかできません。このため、TCS Researchはシステムがどんな場合も完全に自己完結型の答えを返すようにしました。これにより、ユーザーはシステムが示した回答の正否を判断することができ、間違っている場合はシステムにフィードバックすることができます。フィードバックはデジタルアシスタントの「教師」に伝えられ、教師はシステムが正しい答えを示せるようトレーニングを行います。システムが代名詞や指示語にも対応し、ユーザーと会話を続けながら正しい回答にたどり着くための新たな手法も開発しました。
同様のメカニズムが、フライト予約、レストランの予約、休暇申請といった処理にも利用されています。ただし、この場合は、インテントに回答を定義するのではなく、API とインテントを関連付け、APIから返されたものに基づいてユーザーに回答を示すという方法が取られています。
こうしたやりとりでは、API が要求するさまざまなパラメータについてユーザーに質問をする必要があります。例えば、フライト予約という目的であれば、行先や移動日といった情報をユーザーに求めます。不足している情報があればユーザーに促すといったやりとりも必要になります。こうした対話はしばしば、有限オートマトン(入力文章と比較した結果、正規化された文字並びが一致した文章ノードの遷移状態パターンから目的の文字列を見つける手法。応用例として、問い合わせ文(症状/原因など)に適合するナレッジ文章を見つけ出し、それらと紐づく解決策/回避策を導くなど)を内部に用いてモデル化されます。
企業内のある組織についての情報をその組織内あるいは外部の人が必要とする場合、前述したバーチャルアシスタントのようなシステムは、学習や保守に要する労力を考慮すると、あまりすばらしい選択とはいえません。組織に関する情報の多くは、業務手順/方法や、測定可能な基準、標準化された手法などというよりは、実業務での対応策や事例などで、変更も頻繁にあります。それらの情報は、組織体制や主要メンバー、そしてベストプラクティスや事例といった資料で構成されます。そうした資料を検索する場合、資料の内容よりも、その作成者、掲載チャネル、ビジネスドメイン、キーワードといったメタデータのほうが役立つことがわかっており、この問題はナレッジマネジメントの領域に当てはまると考えています。TCS はこうした情報をナレッジグラフDB(ナレッジ・ドメイン同士の関係性を示す情報)に保存し、ユーザーが自然言語を使って事実情報を検索できるよう、深層学習ベースのコンポーネントを備えたソリューションを構築しました。
このシステムは、特定のメンバーと自然言語で積極的に対話しながらナレッジを統合し、ナレッジグラフDB を最新の状態に保ちます。TCS ではこうした対話型システムを「ナレッジ統合(knowledgesynthesis)」と呼んでいます。
ナレッジ統合を活用したTCS の社内システムのひとつに、TCS Research に関する情報検索を支援するデジタルアシスタント「Loca」があります。Loca は特定の技術分野に関する最新情報や、「このテーマであればTCS Research の誰に相談すべきか」といった役立つ情報を、実務担当者やビジネスリーダーに提供します。ナレッジグラフDB には、研究プロジェクト、研究グループ、研究者といった情報が含まれます。例えば、「TCS の研究分野の中で、深層学習を使用しているのは?」という検索では、「深層学習」という言葉をキーワードと認識します。キーワードは研究レポートや再利用可能なアセットと連携しており、これらはさらに、現在進行中の研究プロジェクトと連携しています。また、研究分野(例えば「ライフサイエンス」など)によっては、複数の研究グループが関わっている場合があります。こうした質問に効果的に答えるために、システムはナレッジグラフDB を横断的に検索します。このため、ユーザー側からはシステムが論理的推論を行っているようにみえます。ナレッジグラフからのオープンドメインな(分野を限定しない)質問応答を効果的にするための試みは研究文献に多数存在しますが、その多くはナレッジグラフを深く横断検索できるまでにいたっていません。TCS の研究では、深層学習に基づく手法を用いることで、ナレッジグラフDB のクエリーに使用されるシステムの有効性が大幅に向上することが確認されています。
こうしたシステムでは、ナレッジグラフDB の情報を最新の状態に保つことが重要です。このため、Loca はユーザーと積極的に関わります。ユーザーに彼らの業務について質問し、その回答をもとにナレッジグラフDB を更新します。システムのユーザーには、ナレッジグラフDB の更新を行うことができる「教師ユーザー」と、質問あるいは情報の検索のみ行える「一般ユーザー」の2 種類がいます。ナレッジグラフDB で欠けている情報や、ユーザーからの問い合わせ内容をもとに優先度が高いとされた情報について、システムは先に教師ユーザーに問い合わせし、教師ユーザーが必要な情報を更新することができます。つまり、システム、もしくは教師ユーザー主導で、自然言語インターフェースを介しながら情報更新を行うことが可能です。こうしたシステムの強みのひとつは、ナレッジグラフDB 内の情報が不足しているために(あるいは利用できないために)システムがユーザーからの質問にうまく答えられなかった場合でも、そうした不完全さを自ら特定し、「補習」フローにより教師ユーザーから学ぶことができるという点です。自然言語ベースのクエリーメカニズムに積極的なユーザーエンゲージメントが加わると、対話システムは単なる質問応答システムの域を超え、組織内のさまざまなステークホルダーから得たナレッジを統合する能力を持つインテリジェントなシステムになります。ナレッジ統合はナレッジマネジメントの分野に革命をもたらしうると、TCS は考えています。
1990 年代後半の初期の目的駆動型(goaldriven)対話システムに似た試みとして、TCS ではヘルプデスクの自動化を目的とした対話システムを開発しました。
通常のヘルプデスクシステムでは、ユーザーはまず、複数の階層から成るカテゴリー群から問い合わせたい内容に応じたカテゴリーを選択し、具体的な質問内容をテキストで入力します。カテゴリーの階層は、ツリー構造におけるルートノード(根)からリーフノード(葉)への案内の役割を果たしています。ユーザーインターフェース上では、動的に選択肢が決まるドロップダウンの形になっていることが多いでしょう。チケットに付帯されたこうしたカテゴリー情報は、チケットを適切なサポートスタッフに振り分けるのに使われます。時には、ヘルプデスクのスタッフがチケット起票者に電話をし、適切なカテゴリーを判断するために二、三質問することもあるでしょう。そしてシステム上の情報を更新しますが、もともとのチケットの記載内容はそのまま、ということもあります。この事態を最小化するためには、ユーザーがカテゴリーを正しく判断できるよう、システムがチケット起票者に適切な質問をする必要があるのです。こうした作業は、エンジニアリングに基づく手法とバーチャルアシスタンスを組み合わせることで達成可能ではあるものの、新たなユースケースが出現するたびにシステムの設定や構成に手を加えるのでは、大変な手間がかかります。
TCS は深層学習をベースとした手法の力を借り、これまでにないシステムを開発しました。こうした手法を用いれば、ヘルプデスクのスタッフが適切なカテゴリーを見極めるためにユーザーにしたであろう質問を対話システムに学習させ、システムが自動でそうした質問を行えるようにすることが可能です。この作業には、誤ったカテゴリー選択をさせた根本原因の分析も含まれます。この手法の長所は、過去のヘルプデスクシステムのデータでアプリケーションを学習させることができること、そして新規のユースケースに対しても、設定や構成にほとんど人手を要しないという点です。
TCS はCara やLoca のような画期的な対話システムの社内への導入に加え、お客様にもそうしたソリューションを提供しています。また、お客様の実用に耐えうる同様の業務用システムをSME(Subject Matter Expert)が容易に開発できるよう、プラットフォームも整備しました。このプラットフォームの内部には、デジタルアシスタントを動かすための最先端の深層学習および機械学習を用いたアルゴリズムが使われています。
TCS は、企業におけるこうした対話システムの利用は広がっていくと考えています。なお、現時点で多くの企業は、フォームや検索、メニュー形式でナレッジをマイニングしていますが、一部では、基本的な自然言語インターフェースを取り入れているケースもみられます。
次の段階として、「汎用AI」と「より自然なユーザーインターフェース」の二方向から、大幅な進歩の流れがやってくると見ています。短期的には、特定の用途向けに構築された組織内のさまざまな対話システムが、ひとつの対話システムに統合されていくでしょう。そして全体的にデジタルアシスタントの対話の質が向上し、よりインテリジェントなものになっていくでしょう。
現在の対話システムは、文字や音声認識、自然言語処理に重点を置いています。しかし、人のコミュニケーションの3 分の2 近くを、実は非言語的な要素が占めています。未来の対話システムは視覚やジェスチャー、感情、触感、拡張現実(AR)、触覚フィードバック、その他さまざまな種類のインプットを活用し、真にコネクテッドでインタラクティブなエクスペリエンスをユーザーに提供するようになるでしょう。
TCS のタレントエンゲージメント・チーム(人事部)は、日々社内から寄せられる人事規程に関する質問の対応に、業務時間の実に40% 近くを費やしていました。規程類をイントラネットに掲示するなどの対策をとっても、社員からのメールや電話、あるいは対面での問い合わせが後を絶ちません。このようなやりとりは単なる処理的なもので、チームに真の価値をもたらす業務とはいえません。インド国内だけでもこうした問い合わせ対応を自動化することができれば、多くのメリットがあります。人事スタッフは付加価値のある業務に時間を使えるようになり、30 万人を超える社員は迅速な回答が得られるのです。そこで人事チームはTCS Research チームの協力のもと、人事規程に関する社員からの問い合わせに自動で回答する「Cara」というデジタルアシスタントを構築しました。
まず、インド国内の各オフィスの人事担当者から「よくある質問」を収集し、3 万5 千件近いクエリーを作成、そのクエリーを使ってCara を学習させました。うまく答えられなかった質問については、人事のSME(Subject Matter Expert)が継続的にトレーニングを行っています。Cara は多数のインテント(現在約1,500、さらに増加中)に対応することができ、文面上は似ているけれども意味は異なる質問を明確に見分けることができます。さらに、「デリー・オフィスに在籍しています。プロジェクトでチェンナイに常駐していますが、デリー・オフィスの規定に則って休暇申請することはできますか」といった複雑な質問にも答えることができます。
本稿執筆時点で、Cara は稼働開始からほぼ1 年を迎えます。当初懐疑的だった社内ユーザーも、今は熱心に応援してくれています。Cara はすでに、TCS 社員からの6 万件近いさまざまな問い合わせに対応しており、多いときには、1 日に650 件の質問を処理します。現在はインド国内の人事規程全般に対応しています。
世の中のデジタル化が急速に進み、デジタルインターフェースに接する機会がますます増えています。こうした機器とのやりとりを音声で行う取り組みが進んでいます。人の発話を認識する技術はすでに成熟し、標準的な携帯電話にも搭載可能になっています。TCS Research でもCara 向けの音声ベースのインターフェースを開発しており、利用の中心に据えようと試みています。音声を第一義的なインターフェースとして企業システムに導入するには、「ユーザーが口ごもった場合は?」「セキュリティ担当者は、音声認識を有効な認証方法として認めるか?」など、乗り越えなければならない、いくつかの課題がまだ存在します。
TCS Research ではその他にも、人とシステムとを結ぶチャネルとして、ヒューマノイドロボットの初期パイロットテストもすでに実施しています。
TCS Research:企業における対話システム
成果物:TCS Knowledge Assisted Dialogue Platform(KNADIA)
研究主管:Puneet Agarwal
学術パートナー:Ashwin Srinivasan 教授(バーラ・インスティテュート・オブ・テクノロジー・アンド・サイエンス ゴア・キャンパス)
適用技法:深層学習、機械学習、自然言語処理
対象業界:全産業
特許:3 件出願、3 件提出
論文:5
※掲載内容は2019年6月時点のものです