月曜日の朝です。
音声アシスタントから音声通知を受け取りました。
おはよう。
あなたのお気に入りの店で新しいパンツがセール中です。
先週、あなたはスマートグラスを着用しているときに、同僚の同じような眼鏡に惹かれました。
木曜日のパーティーに着て行きませんか?
余裕を持って明日の夜は映画をスキップすることをお勧めします。
「はい」と答えて購入を確認します。
ホストへのプレゼントも探したほうがよいかどうか教えてください。
あなたの予算と彼女のInstagramの公開プロフィールに基づいて提案をさせていただきます。
「はい」と答えて続行します。
はい。
それで、スリル満点ですか、それとも怖いですか?
なぜなら、私たちの未来はすぐにこのようになるかもしれないからです。
働くママとして、それはとても楽しいことだと思います。
Google 検索をしたり、Amazon をスクロールしたり、予算を計算したり、カレンダーを最適化したりして時間を無駄にするのはやめたいと思っています。
わくわくするのは、私のニーズや要望に具体的に応えてくれる仲間がいるという期待です。
想像してみてください。心拍数を利用してスターバックスの注文を微調整してカフェインを減らすようなことができるかもしれません。
昼食や歩いた歩数を考慮して、私に合ったトレーニングを調整してくれるかもしれません。
友人のスマートアシスタントと連携して、全員の予算、カレンダー、場所に合わせた夜の計画を立てることもできます。
明らかに、このシナリオは簡単に恐ろしい方向に傾く可能性があります。
だからこそ規制を設ける必要があるのです。
すべてのユーザー、すべての消費者は、共有するデータと、どのタイプの推奨事項を取得するか取得しないことに同意するかを常に完全に制御できるようにする必要があります。
さて、人工知能を活用したレコメンデーション エンジンは新しいものではありません。
それとは程遠い。
実際、私たちはすでに1日に何度もそれらを使用しています。
平均して、YouTube で費やされる時間の 70% は、アルゴリズムによって推奨される動画に費やされます。
また、睡眠を記録したり、トレーニングを監視したりするためにリストバンドを所有している場合もあります。
また、Google Home や Amazon Alexa など、部屋の温度を変更するために使用できる、第一世代の音声対応仮想アシスタントもあります。
あなたの車にも、音楽を管理したり、ハンズフリーで道案内をしたりするのに役立つ機能がおそらく装備されているでしょう。
しかし、これらすべてのツールに共通することが 1 つあります。
彼らは AI を活用して、生活の特定の分野であなたを支援します。
あなたの家、あなたの車、あなたの健康。
彼らは車線に留まります。
さて、すべてのレーンを横断し、すべてを同期する新世代の音声アシスタントを想像してみてください。
それで、なぜこれがまだ起こっていないのかと疑問に思うかもしれません。
それは、これを実現するために不可欠な技術的要素が 2 つまだ欠けているからです。
一つは声です。
これらのツールは、私たちが言うことをすべて理解できなければなりません。
そして明らかに、今日はそうではありません。
私の子供たちにとって、そしておそらくあなたの子供たちにとっても、Siri は今でも無限の楽しみの源です。
彼らは非常に単純な質問をするのが好きですが、それでも非常に混乱した答えが返されます。
2、呼吸。
彼らは、私たちが必要とするあらゆるものをカバーする広範な推奨事項を提供できなければなりません。
そのため、ハイテク企業は依然として、音声と呼吸という 2 つの要素を解読することに取り組んでいます。
音声に関しては、先ほども言いましたが、Alexa、Google Home、Siri などは、現時点では私たちを完全かつ体系的に理解していません。
実は人間の言葉を理解するのは難しいのです。
言葉そのものだけでなく、文脈も重要です。
そして、アクセントや背景のノイズについても考えてみましょう。
アメリカ人にとって、フランス人が英語を話すのを理解するのはすでに非常に困難です。
それでは、ロボットにとってそれがどれほど難しいか想像できますか?
そのため、ハイテク企業はこれに懸命に取り組んでいます。
2018年、GoogleはGoogle Homeスイートを利用する新興企業向けの投資プログラムを開始した。
それ以来、彼らは 15 社以上の企業に投資してきました。
Amazon では 10,000 人の従業員が Alexa 音声テクノロジーに取り組んでいます。
したがって、彼らは最終的に音声の問題を解決するでしょう。
賢いアシスタントは、私たちが言ったこと、文脈の中での言葉の意味を理解できるようになります。
たとえば、スマート アシスタントを使用していて音楽を聴いているときに、「変更してください」と言った場合です。
こんにちは、カレン。
部屋の温度を変えてみませんか?
まあ、明らかにこれはまだ機能していません。
しかし将来的には、私が話しているのは部屋の温度を変えることではなく、軌道を変えることについて話していることが理解されるでしょう。
また、私たちの長くて複雑なリクエストも理解します。
ご存知のとおり、私たちは何かを言い始めて、文の途中で気が変わるときがあります。
しかし、これで終わりではありません。
遠距離音声認識を使用すると、部屋から部屋へ、離れた場所からでも使用できるようになります。
子供の叫び声や交通渋滞などの周囲の騒音があっても。
最近、これに関しては大きな進歩があり、主に Amazon の Echo スピーカー技術への取り組みのおかげです。
それだけでなく、あなたがどのような気分にいるのかを理解できるようになります。
喜び、悲しみ、イライラ、それらの感情も真似できるようになります。
そして、自然言語処理がさらに進歩するにつれて、自然言語処理はこれを支えるテクノロジーになります。
したがって、それがさらに進歩するにつれて、音声対応のインタラクションはますます洗練されるでしょう。
さて、2 番目の課題は、私の意見では最大の課題ですが、提供される推奨事項の幅広さにあります。
彼らはできるだろうか、彼らの行動範囲はどこまでになるだろうか?
彼らは非常に特殊なタスクに限定されたままになるのでしょうか?
それとも、彼らはあなたの一日を通して真の仲間になることができるでしょうか?
あなたが望むもの、必要なものを何でも尋ねることができます。
たとえば、会議でメモを取ったり、牛乳を再注文したり、メンタルヘルスのコーチングを行ったりすることもできます。
製品カテゴリ全体にわたって推奨事項を提供してもらえますか?
現在、企業は 1 つの特定のカテゴリ内で推奨事項を提供してくれます。
たとえば、2 つのドレスや 2 冊の本から選ぶのに役立ちます。
将来的には、スマート アシスタントが実際に、本を買うかドレスを買うかの選択を手伝ってくれるようになるでしょう。
したがって、この統合された広範な推奨事項を提供できるようにするには、スマート アシスタントを担当する技術チームが適切なアルゴリズムを設計する必要があります。
そして、これらのアルゴリズムは、無数のデータポイントを処理できるほど強力である必要があります。
パターンを特定し、一連の行動をモデル化し、またエンドユーザーのフィードバックから学ぶためです。
しかし、スマート アシスタントが避けられない世界は、スマート アシスタント プレーヤーだけでなく、すべての企業にとって新たな優先事項を意味します。
将来のあらゆるビジネスは、データとアルゴリズム、音声対応のインタラクションを大幅に加速する必要があります。
また、消費者から推奨事項を提供するよう委託される必要もあります。
これは、私が 3 つの単語、つまりデータ、テクノロジー、信頼という 3 つの必須事項で要約したいことです。
したがって、幅の課題と音声の課題が解決された瞬間が、消費者によるスマート アシスタントの使用と採用の転換点となるでしょう。
今、あなたはスマートフォンなしで生きていけますか?
そうではないと思いますよね?
今から数年後には、あなたのスマート アシスタントは、あなたの日常生活に欠かせない、便利で強力で信頼できるヘルパーとなるでしょう。
したがって、それなしでは生きていけなくなります。
そしてスマートフォンとは異なり、あなたの周りのあらゆるデバイスに組み込まれます。
スマートフォン自体はもちろん、車、鏡、冷蔵庫、メガネ、そして将来的にはどんなデバイスが登場するか誰にもわかりません。
よりスマートな生活を送る準備はできていますか?
はい、カレン、そうです。
コメント