• HOME
  • インタビュー
  • 「音声スキルは思ったほどのものではない」そんな声が大きくなってからが本番。スキル「クラウドクイズゲーム」開発者 岡本氏に聞く。

「音声スキルは思ったほどのものではない」そんな声が大きくなってからが本番。スキル「クラウドクイズゲーム」開発者 岡本氏に聞く。

連載「スキル開発者に聞く」第5回は、株式会社DigitalCubeにてサービス開発をしているエンジニアの岡本秀高氏。岡本氏は会社でクライアントの音声スキル開発を請け負う傍ら、個人としてもいくつかのスキルを公開しています。

今回はそんな同氏のスキル開発の経緯や苦労点を、ユニークなお話と共に聞かせていただきました。

スポンサーリンク

プロフィール

お名前:岡本秀高(おかもと ひでたか)氏
お仕事:株式会社DigitalCubeにてWordPressホスティングサービス「Shifter」「AMIMOTO」のサービス開発を担当するエンジニア。

開発したスキル:
①Shifter man
会社として開発。WordPressホスティングサービス「Shifter」のニュースや利用状況を確認することができます。英語にて公開中。

「Shifter man」の詳細はこちら▼

②クラウドクイズゲーム
個人として開発。AWSのサービスをカルタ式で覚える「AWSカルタ」を遊ぶときにカルタを読みあげてくれるスキル。英語・日本語にて公開中。

「クラウドクイズゲーム」の詳細はこちら▼

③「茶道ガイド」
個人として開発。茶道に関するTipsや今月のお花などを聞くことができます。日本語にて公開中。

「茶道ガイド」の詳細はこちら▼

その他にも「京都ガイド」や「消費税計算機」、さらにいくつかのフラッシュブリーフィングスキルを開発しています。

増える「Alexaスキル開発」の依頼

ーー本日はよろしくお願い致します。まずは会社として開発されたスキルについて教えてください。

岡本 秀高氏(以下、岡本氏):自社で展開しているWordPressホスティングサービス「Shifter」のニュースや利用状況を確認できる「Shifter man」というAlexaスキルと、他にもフラッシュブリーフィングスキルを5つほど開発しました。「Shifter」というサービス自体が英語での提供なのでAlexaスキルの「Shifter man」も英語で公開していますが、他のフラッシュブリーフィングスキルは全て日本語です。

フラッシュブリーフィングスキルは自社サービスのものだけでなく、他社様からのご依頼を受けて開発したスキルもあります。

ーーどういった経緯でご依頼されたのでしょうか?

岡本氏:以前からWordPressのホスティング業務でつながりのあったクライアント様に「Alexaが日本に来るらしいのでスキルを公開したい」というお話をいただいたんです。そこで、まずはフラッシュブリーフィングスキルから作っていこうという事になりました。

ーーなるほど。そういった音声スキル開発のご依頼は多いのですか?

岡本氏:今年に入ってから結構お問い合わせをいただいています。既存のクライアント様だけでなく新規の会社様もご連絡くださいますね。

ーーご依頼される会社様は、どういったところから御社のことをお知りになるのでしょう?

岡本氏:そうですね……。たとえば2月に神戸で行われた「Alexa Day」というイベントのスポンサーセッションで「音声スキルの開発を行っています」と紹介させてもらった時は、その直後にお問い合わせを多くいただきました。そういったイベントは企業の方々も多く見に来られているので、やはり注目度が高いと思います。

エンジニア間で人気な「AWSカルタ」読み手をAlexaに

ーー個人で開発されたスキルについても教えてください。

岡本氏:「クラウドクイズゲーム」「茶道ガイド」「京都ガイド」「消費税計算機」の4つを公開しました。「クラウドクイズゲーム」はAWSのサービスをカルタ式で覚えられる「AWSカルタ」というゲームがあって、その読み手をしてくれるスキルです。「茶道ガイド」「京都ガイド」は茶道と京都の情報を教えてくれるスキルですね。「消費税計算機」はその名の通り計算スキルで、金額を伝えると税別や税込にした時の金額を調べることができます。

ーーまずは「クラウドクイズゲーム」についてくわしく教えてください。

岡本氏:元のゲームである「AWSカルタ」は横浜の方が製作されたもので、GitHabにてデータを公開されているので、カルタの読み手をAlexaにやってもらおうと作りました。ほんとはスキル名を「AWSカルタ」としたかったのですが、Amazonへの申請時に「商標は公式の許可が必要」と言われましたので、ちょっとボカした名前になっています(笑)また、AWSカルタの元データが英語でも公開されているので、「クラウドクイズゲーム」でも英語版を開発して公開しています。

反響は結構もらっていて、AWSコミュニティのイベントである「JAWS DAYS」では企画として会場に置かせてもらったりもしました。

ーーJAWS DAYSの企画にですか。

岡本氏:AWSカルタのコーナーはその前年にもあったんですが、カルタなので当然読み手が必要でして。「Amazon Echoを置いたら誰でもやれるよね」ということで、Amazon Echoを設置して私のスキルを利用してもらいました。

他にもAWSの大きなコミュニティに持っていくとみんな楽しんで使ってくれます。何故かデバックして報告までしてくれたりしますね。

ーーエンジニアの方の集まりならではですね(笑)

岡本氏:クラウドクイズゲームにはカルタの読み手以外にも、三択問題を回答するクイズモードがあるんですが、このクイズモードは当初ちょっと横着して作ってしまっていて。開発時間がなくて「正解を全て2番」にして一旦公開したら、イベントに持って行った日に「これ正解全部2番だろ?」とわずか30分ほどでバレてしまいました(笑)こちらはもう修正しましたが。

新しいコンテンツ製作方法として音声スキルに着目

ーー茶道ガイドと京都ガイドについても教えてください。

岡本氏:「茶道ガイド」は茶道に関するTipsを聞いたり、その月のお花を聞くことができます。「京都ガイド」も同じで、京都にあるカフェやお寺の情報を教えてくれるスキルです。

ーー何故このスキルを開発されたのでしょう?

岡本氏:実は以前から、茶道や京都に関するサイトなどのコンテンツは作ってみたかったんです。今ちょうど京都に住んでいまして、親戚繋がりなどで茶道にも触れる機会が多くて。本格的に習ったことはありませんが、生活の中でコーヒーの代わりに抹茶を点てたりと私自身も楽しんでいます。

しかしサイトの製作となると、画像の用意などコンテンツの準備が結構大がかりなんですよね。

音声スキルだとそういった用意するコンテンツも最小限で製作できるんです。だからまずは音声スキルから開発して、その後サイトやアプリを作っていくという従来とは逆の順序を取るというのも面白いかなと思っています。

ーーコンテンツ作りの第一弾というわけですね。

岡本氏:はい。Alexaスキルもどんどん改善していこうと思っています。「茶道ガイド」は最初ただ豆知識を教えてくれるだけでしたが、自分で実際に使用してみて「茶道を始めてみたいと思った人のアシスタントとして改善していったほうがいいな」と感じました。

「京都ガイド」も、友人に「京都で何かオススメないの?」と聞かれた時に「京都のことを教えてくれるスキルをAlexxaで作っておいたよ」と薦められるようになれば理想です。本当の意味で「アシスタント」や「ガイド」になるスキルにしたいですね。

機能だけでなく「キャラクター性」で違いが出てくる

ーー「消費税計算機」は何故作られたのですか?

岡本氏:今年の3月に「今月中にAlexaスキルを公開するとTシャツプレゼント」という企画があったんですが、3月中のスキル公開が対象だったのでそれまでに公開したスキルは含まれなかったんですよね。Tシャツがすごく欲しかった訳ではないのですが、何か悔しいので「ちょっと作ってみるか」と。それで思いついたのが消費税計算機でした。

ーースキルの公開は、3月中に間に合ったんでしょうか?

岡本氏:間に合いました。でも公開してから驚いたのですが、すでに消費税計算機と同じものを公開されていた方が他にもおられました(笑)

ーー(笑)同じ機能をもったスキルでも公開できるのですね。

岡本氏:そうですね。それに、機能が同じだからといって全く同じ音声スキルかというとそうでもないと思うんです。同じ機能のスキルでも話し方やキャラクター性で、使い勝手や使用感に違いが出てくるのではないかと感じています。

今後は他の音声スキルと同じことを、もっとキャラクターを本格的に絡めてやっていく人も出てくるんじゃないでしょうか。実際に声優を使ったスキルなどもすでに公開されていますし。みんな考えることは同じなので、「誰が最初に手を動かすか」というのも大事かなと思いますね。

自然な発音の難しさと、Amazon申請時のテスト

ーー多くのAlexaスキルを作られていますが、その中で苦労された点としてはどういったものがありますか?

岡本氏:まず大きな点としては、「自然な話し方でAlexaに発音させる」ということの難しさですね。Alexaスキルはサンプルコードが用意されているので、スキルを作るだけならわりと簡単に開発できるんです。でも、この「Alexaの話し方」というのは難しい。日本語でスキルを公開するようになってからは特に思いました。

短いやり取りだとそれほど違和感は無いのですが、「茶道の用語紹介」のような長い文章になると、単調になってしまう。テキストをベタ打ちするだけではダメなので、そのあたりの「Alexaが抑揚をつけて話してくれる」ようなコードの書き方をどんどん勉強していく必要があるな、と思っています。

あとは、ウェブサイトを作るような感覚で文章を書くと「書き言葉で話してくるので気持ち悪く感じる」という問題もありました。音声スキルを作る時は、そのあたりの製作感覚を上手く変える必要はありますね。

ーーやはり「話し方」には難しい点が多いのですね。

岡本氏:他に苦労する点としては、Amazonへの申請時に行われる「ユーザーが想定外の返答をした時にスキルがエラーを起こさないか」というテストです。このテストはAlexaスキルの全てのパターンでテストされるのですが、ここの対応漏れで手元に戻ってくることはままあります。

このテスト、「○○と話しかけたら△△のようにエラーが起きました」という内容で毎回メールが届くのですが、それがたまにすごくシュールでして。たとえば「消費税計算機」の場合だと、「1000円を税込みにして」のようにこちらが言うシーンで「カレーライス」と伝えるとエラーになりました、という内容のメールが返ってきました(笑)

ーー何故カレーライスが(笑)ちなみにその場合、「カレーライス」と答えられた後どう返答したら問題ないのでしょうか?

岡本氏:聞き直すように返答させます。普段私たちも、会話の流れで突然変なことを言われたら「もう一回言って」みたいになるのと同じですね。そういった聞き直しを入れる必要があります。

今は誰もが参加できる「最初の」盛り上がり

ーー岡本さんは、音声AIアシスタントは日本でも今後もっと普及していくと思われますか?

岡本氏:うーん、難しい質問ですね……。ガートナー社が提唱している「ハイプ・サイクル」という理論をご存知ですか?新しいテクノロジーがどのようにして広がっていくのかに関する考え方です。

この理論では、新しいテクノロジーはまず最初のフェーズで「すごい技術だ!」と盛り上がるんですけど、それがしばらく続くと今度は「思ったほどのものではない」「期待外れだな」という声が大きくなってくる。そのあとに、もう一度再注目されて盛り上がっていく。この3つのフェーズを経るだろうという考え方なんです。

個人的には、これがAlexaやGoogle Assistantにも起こるんじゃないかと思っています。今は盛り上がり出しているところなので、「とりあえず何でもいいから作っちゃえ」みたいな雰囲気もあると思います。それがずっと続くと「それ本当に使う?」みたいな音声スキルとかも増えてきて、「思ったより大したことない」と感じ出す人が今度は増えてくる。そして「AlexaやGoogle Assistantはダメだよ」という風に言う人が増えてきてからが本番なのかな、と。

ーー今はまだ、最初の盛り上がりの最中ということですね。

岡本氏:そうですね。今はサンプルコードを書き換えるだけの軽い「やってみた」で音声スキルをつくるだけでも盛り上がりに参加できますし、様々な方に見ていただけます。たとえば今スマートフォンのアプリでちょっとした声優スキルとか出しても誰も見向きもしてくれませんが、Alexaスキルなら誰かしらが使って注目してくれる。

逆に何か失敗したり、やらかしたりも今なら比較的できると思いますので、挑戦するにはいいタイミングではないでしょうか。

ーー最後に、読者の方にメッセージをお願いします。

岡本氏:Alexaスキルは周りの人からも「どう作ったらいいのかわからない」と言われる印象が結構あるんですが、最近は日本語化されているドキュメントも豊富で、チュートリアルも日本語化されてきたりしています。サンプルコードも大体公開されていますし、飛びついてみるには良い環境、良い段階だと思います。

また、東京や神戸などではAlexaや音声デバイスに関する集まりが毎月開催されているんです。そういった集まりに行って参加していくと、一番Alexaを楽しめるのではないでしょうか。

ーーありがとうございます。今後も楽しみにしています。

SmartHacks Magazine 編集部

スマートスピーカーで遊ぶ集団。

記事一覧

スマートスピーカー対応アプリの開発にご興味がある方はお気軽にご連絡ください。

お問い合わせフォーム

スポンサーリンク

ピックアップ記事

関連記事一覧