まだフリック入力してるの?音声認識で生活を効率化。

こんにちは!

突然ですが、みなさん、iPhoneで文字を入力する時、ちまちまとフリック入力していませんか?

アラーム設定するのにいちいちiPhone起動していませんか?

それ全部、音声認識でできますよ。

 

「いやいやそれが通常でしょ、フリック入力。みんなやってるよ。」

きっと多くのユーザーは、こう答えるでしょう。

確かに、iphoneで文字を入力する場合、フリック入力が最速と言われています。

また、「音声認識の精度が低い」という印象から、活用するに至らない面もあります。

 

では実際のところどうでしょう。

この記事のタイトルをフリック入力した時のタイムと、音声入力した時のタイムを測ってみます。

 

一応わたくし、iPhone3Gから利用している、iPhone歴10年ほどの大ベテラン。腕には自身があるんです。

 

 

スピード重視。フリック入力が最速。

来るべき大戦のために、鍛錬に鍛錬を重ねた結果…

 

 

音声入力めちゃくちゃ速いです。

時代の速さは、わたしの培った10年の技術をぶっちぎりで抜いてきました。

 

これだけの認識精度とスピードがあるなら、これからのスマホ世代はフリック入力しなくなるのでは?

しかも機械学習により、更に音声認識の精度と性能はアップしていきます。

 

スマートスピーカがあるように、音声認識がこれからより身近になっていく未来が見えてきました。

 

そこで今回、日常生活を効率化できる、音声認識について紹介していきます。

音声入力方法

手順1:音声入力をオンにする

まずはこちらの設定をオンにしない限り、音声入力は使えます。

手順2:マイクアイコン

まずはキーボードを表示、キーパッド左下にある、マイクアイコンタップします。

手順3:マイクに話して文字を入力する

すかさず音声入力が開始されるので、話しかけましょう。言葉が文字として表示されてきます。

手順4:音声入力を終了

音声入力を終了しましたら、下部キーバッドをタップして終了です。

入力可能な記号

!(エクスクラメーションマーク)や?(クエスチョンマーク)まで音声認識してくれるのか。言葉の抑揚や空白をそのまま文字に起こしてくれるのか。

現段階では音声認識の制度はそこまで備わっていません。

多くの記号を入力する際は、記号の読みをそのまま読むことによって、認識してくれます。

 

音声入力の活用術

ライフハック

アラーム設定

「HeySiri。アラームを6時にセットして」

「Okgoogle。アラーム6時」

通常、アラーム設定するのにはかなり深いレイヤーである、携帯の電源を付けて、アプリケーションを開き、時間を指定するという動作をしなくてはなりません。

この一連の作業が、一声だけで可能になる。決定的な差です。

メモ

アラーム同様、メモするだけなのに、起動→メモ帳→新規作成→文字入力。

どこがメモやねん、開いてる最中に忘れるは、と突っ込みたくなる面倒臭さ。

「OKGoogle」「HeySiri」などの一声だけで、メモが取れる。この差は歴然としています。

タイマー設定

「Hey siri タイマーを60秒で」

「OK Google タイマーを60秒にセット」

ちょっと手が離せない料理をしている時に凄く便利な機能も。

わざわざタイマーをセットするために、ボタンをポチポチおす必要なく、声だけでセットできる優れものです。

テープ起こし

インタビューや座談会、講演会、議事録など…

通常なら、話しを聞きながら人力でタイピングしますよね。

しかも、話す速度に追いつかなかったり、大事な部分を聞き逃してしまったり、失敗談はいくらでもあがりますが、

音声入力ツール・サービスを利用すれば、文字起こしの自動化が可能になります。

ブログ下書き

テープ起こし同様、音声入力によってアナログな作業をデジタル化にできます。

音声にすることによって、一度重い浮かんだ言葉を、文字に起こす工程を省き、直接情報出力できるので、アイデアを書き留めるにも適しています。

一度、大まかなアウトラインを音声入力で作成し、編集はパソコンで。というブロガーも増えてきた印象です。

メール、メッセージ作成

LINEなどのメッセージやメール作成など、特にメッセージ作成なら音声入力で充分でしょう。

ビジネスメールなどには不向きかもしれませんが、親しい友人や身内などに送る短文のメッセ―ジなどには相性が良いです。

HeySiri

iPhoneユーザーのかたにお馴染みの「siri」ですが、いまだ有効活用しているかたをそんなに見た事ありません。

YoutuberがSiri同士で会話させたり、架空請求詐欺と戦ったり・・・本来の使い方と逸脱していた動画がバズった原因なのか、もはや芸人同等の扱い方をされている「Siri」…

ですが、使い方次第によって超優秀な秘書になるんですよ。

メモ

瞬時に閃いたアイデアや、仕事帰りに買って帰る物、大事な用事など、覚えておくためにはどこに書き留めていますか?

わざわざ鞄の中のメモ帳や、メモ帳アプリ、WEBサービスを利用していませんか?

それ、Siriにやらせましょう。忘れておかない為にも、最速のアウトプットを!

 

「HeySiri 明日はカレーにするからじゃがいもとニンジンを買って帰るってメモして

 

こんな感じで「○○メモして」と言ってみてください。Siriがあなたの代わりにメモしてくれます。

メモしないとカサゴなんて明日には忘れてますよ。

リマインド

「Hey Siri 明日の18時にカレーをつくるとリマインド」

これで18時なったら「カレーををつくる」と通知がきます。便利。

検索

SiriはWikipediaやレストラン・ショッピングレビューサイトとも連携されているので、調べたい物を瞬時に、Safariを開かず調べられます。

また、YoutubeでPVをみたいな~と思って時にでも、

「Hey siri Youtubeできゃりーぱみゅぱみゅを流して」

よくやる操作をショートカット登録

ここでSiriからのご提案。

よくある操作をSiriに登録することによって、メールだのLINEだの、Safariだの、Amazonだの…

音声を登録するだけで、即座に実行してくれるわけです。

 

「設定」→「siriと検索」→「すべてのショートカット」から可能

例えばツイートをしたい場合、”新しいツイート”と音声登録しておけば、siriからTweetができるのです。

 

一切触れずにSiriを起動する方法

 

通常、Siriを起動する場合、iPhoneのホームボタンを長押しする必要がありますが、ある設定をすればiPhoneに一切触れず起動することが可能です。

 

 

Google音声入力

Googleアシスタント

iPhoneと言えば、「Siri」ですが、Googleが提供しているGoogleアシスタントをSiriから呼び出すことができるようになりました。

これにより、まさかの「HeySiri,OkGoogle」でGoogleアシスタントを呼び出す支離滅裂な呪文が完成したわけです。

設定は簡単。GoogleアシスタントのアプリをインストールしていればOK。

Googleアシスタントを起動し上記ボタンを押して設定したら完了です。

 

基本的にSiriと同じ機能ですが、Googleと連携しているという点、便利さではGoogleアシスタントの方に軍配があがります。

「〇〇(地名)までどれくらい?」と聞けばGoogleマップで案内。

「今日の予定は?」と聞けば、Googleカレンダーから今日の予定を教えてくれる。

 

「12月の写真が見たい」と言えばGoogleフォトから探して見つけ出してくれる。

 

初音ミクトーク

また、「初音ミクトーク」と呼びだせば。初音ミクと会話も可能。

うたってもくれます。

その他機能

左下の羅針盤をタップすると、Googleアシスタントの機能を紹介してくれます。

 

 

さらにGoogleアシスタントの方が、Siriより音声入力精度が高く評価されています。

たとえば、英単語をボテボテの日本語で発音しても、英単語として認識し正しく変換してくれるのが「GoogleAssistant」

英単語を、ボテボテの日本語で発音しても、変換がうまくいかないのが「Siri」といった差があります。

Googleドキュメント

またGoogleかよ…と思わないでください。

冒頭でも説明しましたが、音声入力はブログの下書きにも有効です。

 

そこで音声入力と併用して使いたいのが、Googleドキュメント。

メモ帳と違い、Googleアカウントを同期しておけば、オンライン上でどの端末からでもアクセスできるため、ブログの下書きなどにもってこいなんです。

 

タイピングが苦手な人でも、音速で記事が書けちゃう。

 

また、目次や文字スタイル、テキストやタイトルを見出しに変更可能。

 

 

マルチプラットフォーム

 

Googleのサービスは、Windowsでも、Macでも、Androidでも、iPhoneでも、ほぼ全ての端末で同じデータを編集する事ができます。

ドキュメントで作成した文書や、Googleカレンダーの予定、Gmailなど…

音声入力ができて、共有も簡単、しかも音声認識も精度が高く、無料で利用できる。Googleの強みを最大限に利用しましょう。

音声入力で文字起こしは可能か

 

さて、これほど万能な音声入力ですが、まだまだ人間の耳の良さ、発音の認識能力には追いついていないのが現実です。

テレビジョンなどの報道や、ラジオのニュースなどの自動入力は多少変換の違いはありますが、可能といって良いでしょう。

しかし、テレビの漫才、ラジオパーソナリティの会話など、人の会話が行き交うシーンには向いていません。

 

また、更に生活音(ガサゴソした音など)が入ると、音声認識精度は著しく低下します。

こうした雑音が多い、会議やスピーチなどの場ではまだまだ発展途上のサービスです。

まとめ

以上、音声認識についてご紹介してきました。

正直全ての機能を紹介しようとなると、キリがないくらい出来る事が多いです。

音声精度はまだまだなところもありますが、とりあえず何かする前に一度「Siri」や「Google」に話しかけてみてはいかがでしょうか。

 

Twitter でsmapla_mediaをフォローしよう!