25
10
人工知能(AI)の目覚ましい発展が、私たちの暮らしを目に見えるかたちで変えつつあります。
その変革の波は、感情認識ヒューマノイドロボットの『ペッパーくん』やスマートスピーカーなどといった、生活を便利で楽しくしてくれる「モノ」だけでなく、いまや人に替わって無人コンビニの決済や書類作成などの知的労働もこなす「システム」にまで成長して、社会構造そのものを揺さぶりつつあります。
AIが巻き起こす社会変革の行先は、日経ビジネスが「無人経済」と称している世界。人の能力を超えた特化型人工知能が台頭し、農業、製造業、小売業、サービス業、建築業、広告業、出版業……とあらゆる職種で人に替わって機械が働くようになると予測されています。
では、AIは具体的にどのように便利な世の中にしてくれるのでしょうか。最先端を体験できるイベントに行ってきました。
今年2回目を迎えた「AI・人工知能EXPO」には国内外から150社が集まり、2018年4月4日から6日までの3日間、東京ビッグサイトの東展示棟をにぎわせました。
プレスリリースによれば、ディープラーニング、機械学習、ニューラルネットワーク、自然言語処理などのAI技術を駆使した「はたらくAI」が大集結。アプリケーションは画像認識、音声認識、予知・予測保全、AIロボット、コンテンツ・アート制作、チャットボット、マーケティングツールと多岐に渡っています。
ご覧のとおり会場は人、人、人の海!1日では回り切れないくらいでしたが、実際に体験した中から、気になったAI技術をいくつかご紹介します。
まずはビジネスシーンで活躍するものから。私はライターですが、職業柄、逃れられない仕事のひとつが文字起こしです。しかし、ライターなくても、どこの会社に勤めようがミーティングはつきものですし、議事録の作成に費やす時間はかなりのものがありますよね。
これぞ機械にまかせたい!と願わずにはいられませんが、なんとそんな夢を叶える技術がすでに存在していたんです。
株式会社アドバンスト・メディアの『AmiVoice』は、音声のテキスト化やリアルタイムな文字起こしを可能にする音声認識技術。最新のディープラーニング技術を実装しており、会議やセミナー、インタビューなどの音声を自動でテキスト化できるそう。通常なら何時間もかかる文字起こしも、『AmiVoice』を使えばおよそ半分の時間に短縮できるとのこと。
お話を伺いながらICレコーダーに録音していたところ、『AmiVoice』の開発に携わった方から「今、そのレコーダーで試してみます?」とオファーが。エキスポ会場のいいところって、やはりこのように実際にお試しできちゃうところですね。『AmiVoice』のクラウドサービスに接続して、ICレコーダー内の音声ファイルをサクッと自動的に文字化した様子を目の当たりにできました。
さらに、PCにインストールされているスタンドアローンアプリ『AmiVoice SpeechWriter』を使い、ICレコーダーで音を録りながらリアルタイムで会話を文字化してもらいました。
会場が賑やかでノイズレベルが高かったため、最適な精度は実現できない状況でしたが、思った以上にしっかり認識してくれていました。実際はより雑音が入らない状況で使われるものですし、マイクを使用すればもっと精度は高くなります。いままで議事録作成に費やした時間はなんだったんだろうと、AIの便利さを改めて実感しました。
『AmiVoice』の音声認識の精度が高いのは、前後の文脈から判断して言葉を選んでいるから。よって、長文のしゃべり言葉を認識するのは得意なのだそうです。残念ながら会場のデモでは文章が短すぎたようで上手くいきませんでしたが、文脈さえしっかりしていれば上記の「記者」「帰社」のような同音異語もちゃんと認識してくれるそう。また、誤認識されてしまった言葉は、『AmiVoice SpeechWriter』内で訂正するとディープラーニング機能が働いてどんどん精度が向上していくそうです。
『AmiVoice』の議事録作成支援システムはおよそ300万円と、企業レベルでの導入が妥当なお値段。すでにメディア企業などで利用されているそう。一方、個人でも活用できる『VoXT』というクラウドサービスの利用料金は1分30円から。また、おまかせ文字起こしサービスの「VoXTフル」、音声をテキスト化した後は自分で確認・修正する「VoXTセルフ」などから選べるので、ニーズに合わせて気軽に利用できそうです。次回のインタビューには試してみようかな。
こちらはAIではなく、AR(拡張現実)。マイクロソフト社のHoloLensを使ってデジタルな世界をリアルな世界に重ね合わせ、強化された共同作業環境を作り出すプラットフォーム『AR匠』です。
さっそく編集部の今井が試してみました。ゴーグル(HoloLens)を通して見える、バーチャルなものさしを使ってリアルなものの計測を行っているところです。
『AR匠』を現場で使えば、作業員がゴーグルを着用するとパソコンのスクリーンが目の前に現れます。実際の装置の上に作業に必要な手順書を表示することもでき、手順を追いながら作業を行えます。途中でわからないことがあれば、遠隔地にいる熟練技術者に見ている画面を共有し、スカイプを通じて指示をもらうことが可能なのだそう。
例えば、コピー機の修理に出かけた新人技士が出先で手順がわからなくなってしまったなんてピンチも『AR匠』が救ってくれそうですね。リアルに行動を見ながら指示がもらえるので、問題がすぐに解決し、効率的に技術も修得できそうです。
あらかじめ画像やCGを用意してライブラリ化しておき、AR環境でそれを確認しながら職業訓練や職業体験に使うのも良さそうですね。
『AR匠』を開発した株式会社アウトソーシングテクノロジーは派遣会社としてスタート。新しい派遣社員が仕事を引き継ぐ際に、効率のいい情報の伝達法はないものか…と自社のニーズに応えるかたちで『AR匠』を開発したそうです。
この技術が普及すれば、どこの会社でもHoloLensを装着しながら目の前の空間を指で押したりつまんだりしている人が見られるのが日常的な光景になるんでしょうか。
AIを搭載した機械だらけの会場の中、トマトの一群が目につきました。
おいしい野菜や果物を提供するという意味で、農業は人間の営みの根本に関わる重要なビジネスなのですが、残念ながら現場の人手不足はなかなか解消されないようです。
そこでAIのちからを借りてトマトの収穫を効率化させようというのが株式会社オプティムの『トマト収量予測』。トマトの映像をAIが解析して、食べ頃と個数を判断します。このシステムをハウス中に導入すれば、「ハウスのどの場所にあと何日ぐらいで収穫できるトマトが何グラムあるか」が常にリアルタイムでわかるので、収穫の効率が上がるし無駄も省けそうですね。
ほかの野菜や果物でも画像と色(場合によっては形や大きさ)をAIに覚え込ませれば、応用可能とのこと。加えてAIに病害虫の画像や食害の痕の画像を読み込めば、害虫駆除にも応用できるそうです。
AIの力でより食べごろでジューシーなトマトを食べられるようになったら、農家もうれしいし消費者もうれしい。まさにウィンーウィンです。
続いて、ライフスタイルを便利にしてくれるものを紹介します。
首かけタイプのスピーカーにAIが搭載されたオンキヨー株式会社の「AIスマートウェアラブルスピーカー」。耳をふさがないので、まわりの人とのコミュニケーションを断つことなく自分の好きなコンテンツを楽しめます。コードレスなのでもちろん耳から落ちない、ズレない、からまない。
正直、本当に欲しいと思いました。これさえあれば、自転車に乗りながら思いっきり音楽を楽しめる! イヤホンで耳をふさぎながらの運転は道路交通法違反になっちゃいますからね。それに音楽が趣味なので、楽器を練習する際に録音された伴奏を耳元で聴きながら自分の音を重ねられそうなところが心をつかみました。
プロトタイプを装着してみるとこんな感じに。実際はバッテリーの容量を増やすためにもうちょっと大きめなつくりになるかもしれないそうですが、現時点での重さは200グラム未満。シリコンの表面がピタッと肌に落ち着き、短時間装着した際はまったく気にならない重さでした。
使ってみると、音が首のつけねからふわっと湧き上がって頭部を包み込むような心地よい感覚でした。しっかり音が鳴っているのに、周囲にはあまり音漏れがないのも好印象。会話や音声だとさらに周囲に聞かれにくいようです。
気になるお値段ですが、2万円ぐらいを予定しているとのこと。他社の同様の製品と比べるとかなりリーズナブルです。2019年に発売予定だそうですが、待ち遠しい!
スマートウェアラブルスピーカーの中身はオンキヨー株式会社独自の「Onkyo AI」で、様々な点においてグーグルやアマゾンの音声AIと違うそうです。まず1つめは、対話型AIだということ。いちいち「アレクサ…」などと呼び出さなくても、
ユーザー「おなか空いた~」
OnkyoAI「どうしますか?」
ユーザー「レストラン探して」
OnkyoAI「イタリアンがいいですか?」
というように、人と会話をするかのように話せば最終的な検索項目まで到達できるそうです(実際のデモは見れませんでしたので、この会話はあくまでイメージです)。
2つめはカスタマイズができること。音声案内の声も変えることができるそうです。今のところは3パターン用意されていて、将来的にはどのサービスにもふさわしい声を選べるように選択肢を増やしていくそうです。
さらにOnkyoAIの3つめの特徴は、場所を選ばないこと。上の写真に写っているのは、実は裏にAIプラットフォームを組み込んだ壁かけのスマートスピーカーなんです。AIのプラットフォームさえあれば鏡にも、トイレの壁にも、玄関にも、あらゆる場所に取り付けて家全体をスマート化できる。未来の家っぽい感じですね。
クラウド上にあるOnkyoAIをウェアラブルスピーカーなどのデバイスにつないでくれるアプリは、Androidをベースに開発されているので他社のサービスとの連携も可能に。例えばウェアラブルスピーカーをつけながら車で外出すれば、OnkyoAIが行先のスーパーでの安売り情報を教えてくれたりする…といったサービスも視野に入れているそうです。
NTTドコモがすでに日本の何箇所かで実証実験を行っている「AI運行バス」は、固定ルートを持たないオンデマンドサービス。事前に登録している乗客が専用のスマートフォンアプリから行先を指定すると、AIが最適なルートを考えて乗客に配車通知を出します。
AIを使うメリットとしては、複数人の乗客を異なる目的地まで最適化されたルートで運べること。渋滞なども避けてくれます。オンデマンドという点ではウーバーのようなタクシーに似ていますし、ライドシェアリングという意味ではもっとバスに近いのかもしれません。現在は試験的に自動運転も取り入れているそうで、最終的には完全に自動化するのが狙いだそうです。
バスの運行ルートからは外れている、とはいえタクシーに乗るのは経済的に苦しいので、車がないと生活できない地方では年をとっても免許を手放せない切実な問題があります。今後さらに高齢化・過疎化が進んでいくことを考えると、解決策のひとつになりそうですね。
また、個人のメリットだけではありません。ドコモによれば通常のバスをAI運行バスにすべて置き換えた場合、自治体の税金の支出を960万円ほど抑えられるのではないかと試算されているそうです。
最後に、AIポリスの登場です。子どもが迷子になった時、また徘徊癖のあるおじいちゃんの行方が分からなくなってしまった時などに、膨大な監視カメラの映像のなかから特定の人物を探し出すのは非常に時間がかかります。
ディープラーニング技術を実装したAI『Takumi Eyes』なら、たった1枚の画像から人物の特徴点を自動的に割り出して、人間より4倍速いスピードで探し出してしまうそう。こちらも高齢化社会において、安心感が増しますね。
また、リアルタイムトラッキング機能もついているため、要注意人物が店舗に足を踏み入れた瞬間から追跡することが可能になります。
トラブルを未然に防ぐことができそうですし、なにより「性善説」を信じておおらかな気持ちで他人と接することができそうです。
いぶかしむことはAIに任せて、いつくしむことに集中する。他人への思いやりの心や誠意こそが、この先AIがどんなに賢くなっても人間を越せない領域ですから。
ここではご紹介できなかったAI技術はこちらでご覧いただけます。機械と人間が肩を並べて働く未来は、もうすぐそこまで来ているのだとあらためて実感した一日でした。
Photo: 山田ちとら
Reference: 日経ビジネス, AI・人工知能EXPO