構築中。

名古屋のITインフラ屋さんです。ITイベントへの参加記録などを残していきます。

Alexa Day 2018(2/11)

今回は会社の若手2人と一緒に行ってきました。

alexaday2018.jaws-ug.jp

初めていった会場なので、入口(エレベータ)の位置がわかりづらかったのですが、とりあえず迷うことなく会場に到着。

f:id:hmatsu47:20180212114238j:plain

長くなりそうなので、気になったポイントや感想などを軽く書いていきます。

 

金融機関向けAmazon Echo/Alexaへの取り組み事例紹介(馬勝 淳史さん)

みずほ銀行のAlexaへの取り組みの紹介とその中で得られた知見がメインでした。

  • 日本への展開が後回しのサービス(Alexa/Echoもそう)でも他国(今回は米国)でPOCできる
  • 人によるロールプレイが重要
  • TDDが合っていたが、一方で自動テストは困難
  • PIN入力でOAuth 2.0の標準的な流れを変える場合の対応パターンがいくつか
  • 音声認識用の辞書とともに発声側の辞書も必要(アルファベットの読み方)
  • 過学習(「キャンドル(=カナダドル)」と「キャンセル」の区別がつかなくなってしまう)問題
  • オウム返しが有効(この話は他セッションでもよく聞いた)

ほかにもいくつかありましたが、特に気になったのは以上です。

(実際の声を使った)自動テストが困難、というのは、言われてみるとその通りですが気づかなかったポイントです(ここ重要!)。

なお、PINは固定のようでしたが、いずれOTP化も必要になりそうですね。その場合に何を使ってユーザにOTPを伝えるのか、気にする必要がありそうです(SMS/メールで送ってしまうとVUIの旨味が半減しますし…やはり、VUI付きTVとかシニアにも見やすい大きな文字のポータブルディスプレイとか?)。

 

Alexa はどこにでも。AVSが開くAlexa Enabled なライフスタイル(伊東 知治さん)

はるばるオランダから来られた伊東さんのセッションでした。

  • Skill作りはAVSのごく一部
  • バイス作りも面白いし特に日本では(まだ競合が少ないので)チャンスがある
  • Alexa Enabled Device(海外Amazonで取り扱いがあるもの)にはこんなのがある(紹介)
  • シンプルな発話で目的が達成できるように→利用シーンが限定されているほうがVUIと相性が良い
  • TV・車・キッチン・アウトドア・ベッドルーム・ガジェットのVUI対応で変わる未来

などの話がありました。

ヘンなデバイスがいっぱいあって面白そうでした。

 

※この後のランチLTも面白かったのですが、長くなるので省略します。

 

kokexaの話(坂本 知子さん)

サーバーワークス坂本さんの「こけし部個人活動」の話。参加前から密かに楽しみにしていたセッションです。

直前のランチLTで、同社小林さんが1時間間違えて「14:00から!」と宣伝するという、身内からの想定外の妨害攻撃?にもめげず、聴衆の反応が良いセッションだったと思います(セッション後「うちでkokexa製作ワークショップをお手伝いしたい」という申し出もあったり)。

こけしRaspberry PiとスピーカーとマイクでオリジナルのAlexaデバイスを作ろう!ということで、バージョン1と2(小型版/kokexa dot)の構成、およびこけしの基礎知識についての解説、デモ映像などなど。

こけしというと、私はここで「これでもか!」というほど大量のこけしを見てきたことがあるのですが(「土鈴館」なので土鈴など他ジャンルも普通にいっぱいある※)、さすがにオフィスや家にこけしが立っていても「何?」となるので、普通にマイクとカメラを組み合わせて、画像認識+VUIで受付(コマンド受付含む)などをさせたら良さそうな気がしています(その用途なら別に、リクエストに応えて音楽を流してくれなくても問題なし)。

ハウリングや風切り音を避けるようにマイクとスピーカーを取り付けるのがそこそこ難しそうですが。

Alexa for Businessでも使えるようになるといいですね(kokexa for Business)。

 

※逆に、名前から「いっぱいありそう」なイメージがある「日本民藝館」には、真っ黒なこけしが一体あるだけでほかにはないらしい。民芸運動創始者柳宗悦さんが色鮮やかなこけしを気に入らなかったから、みたいですが…私の地元にある「豊田市民芸館」では時々こけしも含めて色鮮やかな郷土玩具の展示があったような気がするので、意外でした。 

ようこそ土鈴館へ(日本土鈴館)

 

ハードウェアビジネス側から見た音声認識家電の現状とこれから(岩佐 琢磨さん)

Cerevo岩作さんの、私が今回のAlexa Dayで聞いた中では一番盛り上がっていたセッションでした。

  • スマート電球を持っている人が会場に10%もいたが、これは日本では異常値(通常は数人しか持ってない)
  • さすがに洗面台を買い替えた人はいなかったが、CES2018ではスマート洗面台が1つのブームになっていた
  • 家電は買い替えタイミングが大事
  • Cerevoでやってることあれこれ
  • 音声認識家電がいっぱい出てきた理由→スマート化に苦労して対応したおかげで、VUIへの対応は難しくなかった(すでにベースがあった)
  • ARMコア内蔵Wi-Fiモジュールの存在も後押し(コストダウン)
  • ジェネリック家電ODMベンダの台頭も
  • ある意味で「AWS責任共有モデル」
  • 「そんなもんスマートにせんでも」というようなモノもやってみたら「意外とイケるやん」となる
  • マイクがある家電の筐体設計は意外と大変
  • AmazonGoogle等、選択肢がたくさんあるのがメーカー側の悩みだが、「一本化」されることはまずありえない。

セッション後、岩作さんの前に「待ち行列」ができていたのが印象的でした。

 

Alexa連携デバイスクラウドを構成するAWS ソリューション(榎並 利晃さん)

 AWS榎並さんの、AWSのソリューションでサービスを作る場合のアーキテクチャの紹介セッションでした。

…正直、前日にサンプルSkill作成を頑張っていて寝不足だったこともあり、このあたりで睡魔がMaxになって一部記憶にない、です(すみません)。

最初にスマートホームスキルAPIについて簡単な解説があり、その後代表的な機能要件4つ:アカウント管理・デバイス管理・デバイス制御・エッジ処理に絡めてAWSの各種サービスの解説がありました(IoT Core・Device Shadow・GreengrassとML Inference・FreeRTOS(AWS海外エンジニアから「推せ」と言われている)・IoT Managementなどなど)。

このあたりの話は「Alexaに触り始め」ではなく、もう少し進んだ状態で聞いたほうが良かったかな、と反省…。

 

How do we connect VUI to the real services using serverless(吉田 真吾さん)

セクションナイン吉田さんの、Lambdaを使ったVUIアプリケーションの開発話でした。

※いつも「クラウドナイン」と言い間違えます…そっちはAWSに吸収されたやつ(というかスラング)ですね…。

  • 台本の作成が重要
  • われわれがつくりたいのはIVR(自動音声応答システム)ではなくアシスタント
  • 文脈によって反応を変えるにはステート管理が必要
  • VUXデザイナーの必要性(新職種!)
  • 「エコちっち」とHRアプリのデモ
  • ステートを制するものが対話モデルを制す
  • 現状では対話モデルをしっかり再現する実装はかなり大変(頑張ろう)

私がクソSkill作成で苦労していたのと時を同じくして、発表用のSkillを頑張って作っていらっしゃったようです。

コード量、全然違いますが。

VUXデザイナー、流行るかな?

 

Alexa Skill Contest

個別紹介は省略しますが、意外と真面目なテーマが多いLTでした。

やはり「幼児とシニア層」「手を離せないシチュエーション」というのはVUIの活躍シーンとして外せないポイントですね。

優勝された中田さん、状況が状況だけに、本当にJAWS DAYS 2018のLTに登壇できると良いですね(私もオーディエンスとして行きます)。 

 

この後、時間と体力の制約で、懇親会はパスして新大阪経由で帰りました。

新大阪で喫茶店に入った時に、前夜(というか日付の上では当日)作ったEC2起動・停止・再起動のSkillを若手2人の前でデモしました。

※以前Qiitaに英語版AlexaでPythonを使った「バルス」の記事がありましたが、今回はNode.js 6系での挑戦です。非同期/同期でしっかりハマりました。

周りの騒音等の影響でなかなか認識してくれなかったものの(というかインテントの伝え方を微妙に間違ってた)うまく動いた時には「おー!」と反応が良かったです。

※記事にできるレベルではないので、QiitaではなくGitHubにこっそり置いておきます(暇を見て随時Update予定)。

  https://github.com/hmatsu47/alexa_skill_test_ec2_reboot

 

こういうイベントに誰かを連れて行くと、

  • 若手:新技術それ自体とともに、登壇者や参加者のエンジニアにも刺激を受ける→もっと関わろう
  • 管理職:新技術とともに、登壇者や参加者のエンジニアに恐怖を覚える→自分自身は距離を置こう

という反応になるのが面白くもあり、悲しくもあり…。

 

若手は「この体験を通じて、自分自身がこれからどうしていきたいか」中心で考えるのに対し、管理職は「自分のこと」としてではなく「他者との関係をどうしていくべきか」を考えがちで。

それぞれ、現時点の「人生のステージ」が違うこともありますし、部下を持つ以上「どう教育していくか(成長してもらえるようにしていくか)」を考えざるをえないので気持ちはわかるのですが、どうしても

「自分は直接向き合いたくないから、部下に『やらせる』テーマとして考えよう(または、面倒臭くなるからやらせないようにしよう)」

という意識が透けて見えます。

人間が精神の安定を保つ上で仕方がない反応とも言えますが、「技術を怖がって楽しくなさそうな上司」の下で働くエンジニアはかわいそうだし実際につらいです。

 

…話が逸れましたが、スピーカー(Echoのことではないです…いや、Echoも含めて)・ボランティアスタッフはじめ関係者の皆様、ありがとうございました!