「音声認識」の常識を超えた機械たちの「耳」を創造する
人のココロを理解するための、機械たちの「耳」を創造するフェアリーデバイセズ株式会社は、音声認識関連処理・自然言語処理関連技術をコアとした、クラウドサービス「mimi®」や自社ハードウェア「THINKLET®」とそのクラウドプラットフォームを組合わせた現場支援システム「Connected Worker Solution」を運営するスタートアップ企業だ。話した声を単純文字に置き換えるサービスは数多くあるが、「mimi®」や「THINKLET®」はそれらの遥か先の未来を見据えた技術だ。
「人間の耳の機能は声を文字に直すだけではありません。話している人を識別し、感情を察知し、周囲の雑音からその人の環境を認識する。それに対して今のコンピューターに搭載された技術は、声を文字にすることだけです。つまりコンピューターは極めて限定的にしか世界を認識できていません」。こう話すのは、同社の創業者である代表取締役の藤野真人氏だ。携帯電話やカーナビなどに搭載されている機能は、たとえ機械が流暢に応答してくれたとしても、それはあくまでも、予め仕込んだ言葉を状況に応じてアウトプットしているに過ぎない。
「人間の耳のように複雑に音声を認識し、深く人間を理解した上で応答できる。その機能をクラウド上で再現し、様々な機械に聴覚機能を提供すること」(藤野氏)。これが、フェアリーデバイセズが描く一つの未来図だ。「未来の機械たちのための『聴覚』プラットフォーム」と謳うmimi®や産業。現場が遍くインターネットに繋がる時代を実現する「Connected Worker Solution」は、まさに「音声認識」の常識を遥かに超え、機械たちがヒトを理解するための「耳」を作ろうとしているのだ。
そんな未来図に対して現在の段階は、声を文字に直す音声認識はもちろんのこと、機械の聴覚に必要な話者識別、環境音認識、感情認識、言語認識、性別認識等、聴覚に必要な技術のほとんどは揃っているという。
しかし、「これらはあくまで部品=単機能であり、我々が目指すものではない。我々は、これらすべての部品やハードウェアを組み合わせてソリューションに落とし込み、人間が使ってちょっと嬉しく思えるようなものを作っています。テクノロジーは総合技術ですから」。と藤野氏は言う。
「声を文字に直す部分はこの数年で大きく進化し、認識機能だけで言えば世界中どの会社も横並びの状態です。我々は、そこで競おうとは思っていません。その先のリアクションの部分を追及し、人と機械とのコミュニケーションを可能にしたい」。
思い描く未来図に向けて、フェアリーデバイセズは進み続ける。
各分野の専門家が集結し作るのは、人の心を温かくするテクノロジー
フェアリーデバイセズという可愛らしい社名とロゴの横に描かれた妖精のシルエット。同社は、開発理念には「使う人の心を暖かくする一助となる技術開発」という言葉を、会社を表現するには「ココロ温まる技術で、ヒトと機械をつなぐ会社」という言葉を掲げる。
藤野氏は東京大学在学中、創薬ベンチャーで遺伝子創薬の研究開発に携わっていた。プライベートでのある出来事をきっかけに大学卒業後は大学院医学系研究科へ進学した。病院での実習で一人の少女との出会いが人生の大きな転機となる。
その少女の手術に立ち会った際の出来事。手術室には人工心肺等の人を生かすために作られた機械の中に、一つだけその少女がいつも大事にしていたクマのぬいぐるみが置いてあった。
その時、「ぬいぐるみは命を救えないけども、救われた命を豊かにしてくれる」その事に衝撃を受けた。そんな「必須ではない」が心を豊かにし、温かくすることにテクノロジーを役立てたいと思い、その後、フェアリーデバイセズを創業することになった。
機械の中に妖精がいるかのような心温まる技術と滑らかで自然な使い心地を目指し、この社名をつけた。最初のプロダクトはプラネタリウムソフト。これも、きっかけは小児病棟での出来事だ。入院中、病室から夜空を見上げる事ができない少女に星空を届けるために作った。そのようにしていくつかの技術開発、プロダクトを経て、機械の聴覚というテーマにたどり着き、mimi®やTHINKLET®が生まれたのだ。
音声認識を手がける会社は多く、傍から見れば一見「競合」に見える会社もあるだろう。だが、藤野氏の関心はそこにはない。「この分野の最先端の研究は大学にあります。その技術を、事業会社が自前のデータやリソースを使って実装する。最新のアルゴリズムや方式はアカデミア、応用はインダストリーという構造のなかで、競合の技術を気にするのはナンセンス。世界中で常に新しい技術が生まれており、特定の技術が競争力を持つという時代ではありません。最新の状況にキャッチアップし続けて、常に最新の研究成果を取り込み続ける継続力と人材とチーム。それこそが競争力だと思っています」。そう断言する。
その言葉通り、フェアリーデバイセズでは、この3点を意識した体制を構築してきた。今のメンバーは医学を専門とした藤野の他に、情報科学や人工知能分野の専門家、音声の専門家、心理学の専門家等、幅広い研究者が在籍。その中には、赤ちゃんが言葉を覚えるプロセスを研究する言語発達の専門家も。「コンピューターは自分で言葉を覚え得るのか」という壮大なテーマへの布石でもある。
研究とビジネスの中間で妥協のないプロダクトづくりを
「究極はそれですね」と藤野氏は言う。「今のコンピューターは、データを覚えこませるものであり、自分で言葉を覚えることは実現していません。例えばカーナビを使っていて、新しい建物が出てきた。『あれは虎ノ門ヒルズだよ』と教えると、それが共有されてみんなのカーナビにシェアされる―。そうなったらおもしろいですが、今のところ実現の兆しはありません。これは是非とも挑戦したい分野です」。人間のように言葉を覚えることはないにしても、「言葉の形」を獲得することはできるのではないか。藤野氏はそんな思いも持っている。
それを一つのゴールとすると、FairyDevicesがやるべきことはまだまだある。壮大なテーマを掲げる同社は今、共に挑戦する人材を必要としている。機械と人間の境界を探求し続ける同社において、産業現場をインターネットと常時接続 する、THNKLET®の世界展開が始まる中、聴覚以外の研究も既に始まっている。機械学習やハードウェアはもとより、UI/UX、心理学などのスペシャリストの参画も求めているのみならず、それ以外の同社が思いもよらないような提案も大歓迎だ。「例えば、コミュニケーションには表情が重要である。表情を読み取る技術とmimi®を掛け合わせて、よりリッチなコミュニケーションを実現しよう…という提案を受けたとしたら、それが幹になる技術か枝になる技術かはわかりませんが、『一緒にやりましょう』と言うかもしれません」と、藤野氏は言う。
「学術研究の世界では、穴のない完璧な姿を作り上げて発表します。それに対して産業界は締め切りがあり、妥協を重ね、納得がいかないままに世に出すこともあるでしょう。我々もその問題は抱えていますが、でも、本当にいいものを作るという点との両立は、バランスをもってやっていると思いますし、継続して取り組むなかで完成度も上がっていきます。研究ならアカデミア、プロダクトならメーカーが定石ですが、我々はその中間にあり、本気で取り組んだ研究成果をプロダクトに落とすことができる。そして多くの人が実際に使い、嬉しいと思ってくれる。それは当社ならではの魅力ではないでしょうか」とも。
「機械と人間の境界」という大きな概念の下、今、目の前にあるのは「機械は言葉を覚えるのか」という究極の命題だ。それに一つの解を見出したとき、ウェアラブルデバイスやコミュニケーションロボットが、あるいは、今は姿かたちもない未来の機械が、まさに妖精のようにやさしく人に寄り添うものになるかもしれない。そんな未来をつくる会社がフェアリーデバイセズだ。少数精鋭で自分のやりたいテーマをとことん突き詰める。そのための最高の環境を提供したい。
「THINKLET®️(シンクレット)」
現場作業者と遠隔地にいる熟練者が、作業内容や現場の状況を共有し、また同時にその作業に関する全ての情報をデータ化するデバイス。現場の作業者が「熟練者の振るまいや指摘 、指示などの情報をデータ化する」ことで技能伝承に活用したり、「蓄積されたあらゆる現場の記憶や知識」を作業者自身の「セカンドブレイン」として活用する。