技ビス : 技術、ビジネス、スタートアップ

技術、ビジネス、スタートアップに関する情報と話題とアイディアと事例

ロボット開発と、ロボットとの対話の未来について話してきました@エンターテイメントロボットフォーラム(ERF)

書いたら意外と長くなったけど、ロボットとのコミュニケーションや会話に関する諸々についていろいろと意見交換しました。この記事の後半の方が面白いかも?

www.slideshare.net

口頭発表メインだったので資料は文字がほとんどないです。

概ねの話の内容としては下記3点でした。

  • 売れるかどうかを考えすぎないモノづくり
  • 色々な可能性を探るための横展開
  • 技術の幅を増やすための連携パートナー探し

ERFはロボットに関する勉強会で実は20年くらい続いているロボット好きが集まる団体で、「ぶっちゃけこのロボットに未来あるのかな」みたいなぶっちゃけた話を気軽にできてよかったです。

色々と面白い議論があったので差しさわりなさそうな範囲で僕が伝えたことを書いてみます。

ロボットと自然な会話を実現することは難しいので、期待値を下げることが重要

人工知能との対話というと、「アトム」や「PLUTO」に出てくるようなロボットを創造する人が多いのではないでしょうか?人と区別がつかないほどにスムーズな会話は現状無理です。

それでは、自然な対話は無理なのでしょうか?それに対する一つの答えが2014年に出ました。

f:id:harajune:20180422235232p:plain

チューリングテストをご存知でしょうか。PC越しにチャットをし、向こうにいるのが「人」なのか「ロボット」なのかを当てるテストです。もし、ロボットが人であると判定されれば、そのロボットは人と同じように対話ができるということになります。

2014年に初めてこのテストをクリアした人工知能「ユージーン」が開発されました。果たしてこの人工知能はどんな素晴らしい技術を持っているのでしょうか・・・?

f:id:harajune:20180422235503p:plain

実は、ユージーンには画期的な技術は用いられていませんでした。13歳のウクライナ人という設定によって、被験者が騙されてしまったのです。何か頓珍漢な答えが返ってきたとしても「まぁ英語が苦手な13歳だったらこんなものか・・・」と思ってしまうわけですね。

実は重要なのは「不自然じゃない設定」なのでした。人は人型のロボットを見たときに「人間と同じように会話できること」を期待してしまいます。しかしながら、現実のロボットはそうはいきません。

なので、ロボットそのものの期待値を下げてしまおうというわけです。ある意味コロンブスの卵的な転換です。実は、人がロボットとの対話に感じる違和感は、この人間の「期待値」とのギャップによるものなのです。

ユカイ工学のロボットは期待を裏切らない

ユカイ工学のロボットが受ける理由は「期待を裏切らない見た目・機能」のデザインにつきます。

f:id:harajune:20180423000028p:plain

Qooboは触ると動く。激しくたたけば激しく動く。実のところ「相手の真似をする」というのは最もプリミティブ(原始的)なコミュニケーションの形です。

f:id:harajune:20180423000153p:plain

BOCCOには、録音ボタンと再生ボタンがあります。録音ボタンを押せば声が録音され、再生ボタンを押せば声が再生されます。まったく期待を裏切りません。

f:id:harajune:20180423000347p:plain

では、Amazon Echoはどうなのでしょうか?いま、多くの人は「Alexa」と話しかければよいことを知っています。しかし、果たして初めて見た人にそれは可能でしょうか?

実は、展示会で音声認識の商品を出している企業はほとんどの場合説明書きを製品の隣に置いています。なぜなら、説明なしには使えないからです。外見から「Alexa」と話しかけることをほとんどの人は理解できません。

果たして、人類がスピーカーに話しかけるという行為を文化として獲得するのが早いのか、それとも話しかけやすい形・デザインをするのが良いのか。答えは未だわかりませんが「デザイン」の重要性は理解していただけると思います。

その音声対話、本当に使いやすいですか?

特定用途の対話はビッグニッチとして可能性が残っているかもしれない

テーマを定めない雑談はおそらくもうGoogleには勝てないでしょう。膨大なYoutubeのデータ、膨大なGoogle Homeのデータ、これらに今から太刀打ちすることは不可能でしょう。

では、特定用途に特化した対話なら?介護や子供向けの限られた対話データは実は貴重かもしれません。

Googleはインターネット上に数あるデータから最も一般的な情報を探すのが得意です。しかしながら、特定の用途やインターネット上に出ていない知識を扱うのは不得手です。なぜ、Cookpadやヤフー知恵袋がなくならないのか?それは、Googleが「ネットにない情報は探せない」メディアだからです。

こうした、ニッチな会話データを収集しようという試みは多数提案されており、システムとして提案され始めています。

f:id:harajune:20180423001459p:plain

[1801.02668] Evorus: A Crowd-powered Conversational Assistant Built to Automate Itself Over Time

このシステムは2018年の国際学会CHIの論文で、面白いところはある問いに対する答えを人間とロボットの両方で見つけようとするところです。例えば僕が「二日酔いの対処法」という問いを投げると、システムはまず複数のロボットと人間に同時に問いを投げます(青字の1)。そして、ロボットと人間の答えの中から最も良い答えを選択(赤字の3)し、それを答えとして返します。もし、最後に選択された答えが人間によるもの(緑のC)の場合、それを新しいロボットとして登録することで、自動的に答えられる問いを増やしていきます。

同種のシステムは既にコールセンターなどで導入が進んでおり、人間とロボットのハイブリッドでの自動応答システムと、そこからの知識獲得が始まっています。

ロボットが人の対話をコントロールすることは可能か

「ロボットがうまく対話を誘導できるのではないか」という意見をいただきますが、今のところ難しそうです。

面白い事例としては、「社会的な対話」という側面から自然な対話感を得ようとする大阪大学の研究があります。

resou.osaka-u.ac.jp

「CommU(コミュー)」は、複数のロボット同士の対話を人間に見せることを、より高度な対話感を実現するのに利用した新しい形態の対話ロボットです

対話している複数のロボットがいるところに対話参加すると、よりうまく対話できているような感じがする・・・というような話のようです。残念ながら研究結果の論文を見つけられていないので定量的な側面は不明なのですが、無理問答に見られるように「人間は文脈を無視した会話をすることがなかなか難しい」ということもあるので気になる事例です。

その他にもいろいろ・・・・

色々な質問をうけて30分くらいディスカッションしてたのですが、自分の知る限りの色々な事例や研究をご紹介させていただきました。懇親会二次会では、ウェアラブルの話やら腕時計は「時計が権力の象徴であった歴史から、ファッション的記号を考えると(ry」みたいな話まで色々と話をさせていただきました。

もし、ご興味がある方がいれば気軽にご連絡ください。

原田twitter↓

twitter.com