
音声入力×生成AIのブコメ返信
久しぶりに本しゃぶりを更新した。
たくさんブコメがついたので返信しよう。当然、返信は音声入力と生成AIの組み合わせで書いている。生成AIに出力させてから、不要な部分をカットし、わずかな修正を行なっての投稿。このnoteの最後には音声入力原文を載せ、AIの出力結果のリンクを貼っておく。
古いパラダイム
小学校の頃から文字の手書きがあまりに嫌いすぎて、即座にブラインドタッチを覚えて今に至るので、今では話すよりもキー入力の方が早くなってしまった。すべてはAIの登場が遅かったことが悪い。
話すことを頭でまとめるうちに文章のほうが楽じゃんってなっちゃう
否定的な反応で最も多かったのが「キーボード入力の方が効率的だ」という意見である。これらの意見を読んで思ったのは、なんとも古いパラダイムに縛られていることだろう、ということだ。なぜそう言えるのか。彼らは単に今までのキーボード入力を音声入力に置き換えるという発想しかしていないからである。
これは前にも取り上げた産業革命期の工場レイアウトの話に似ている。蒸気機関から電気モーターに動力が変わった時、最初は単に動力源を置き換えただけだった。しかし本当の革命は、電気モーターの特性を活かした工場全体のレイアウト変更にあったのだ。音声入力とAIの関係も同じなのである。
まず、ブラインドタッチが早いという主張を検討してみよう。確かに、机に向かって集中している状態では、熟練した人ならば音声入力より早く入力できる場合もあるだろう。だが、それは非常に限定的な状況でしかない。音声入力の真の強みは何か。それは「他のことをしながらできる」という点にある。
俺はこの返信へのメモだって、通勤の帰り道で歩きながら考えて、しゃべって入力している。キーボード入力ができるのは机の前に座っている時だけだ。しかし音声入力なら、散歩中でも、料理中でも、思いついたことをすぐに記録できる。一日の生産性で考えれば、圧倒的に音声入力の方が優れているのだ。
これは本を読むことと、オーディオブックを聴くことの違いに似ている。純粋な読書速度だけを比べれば、多くの人は目で読む方が早いかもしれない。だが、オーディオブックなら他の作業をしながら「読書」できる。結果として、忙しい日常の中でより多くの本に触れることができるのだ。音声入力もこれと同じである。
さらに、「頭の中でまとめる」という意見も、この手法の本質を見誤っている。従来の音声入力なら確かに、事前に何を話すか整理しておく必要があった。しかし現代のAIは違う。思いついたことを口に出せば、AIがそれを整理してくれるのだ。つまり「まとめる」という作業自体をAIに任せることができる。考えをまとめるのはAIの仕事であって、人間はただ思いついたことを話せばいいのである。
要するに、これらの意見は、新しい技術を古い使い方に当てはめようとする典型なのだ。真の革新は、ツールの変化に合わせて使い方自体を変えることにある。そこに気づかなければ、いつまでも古いパラダイムの囚人のままだろう。
つらつらと長文を喋れてすごい
最初につらつらと長文を喋ることができる能力がすごいと思った。うまく誘導してもらわないと自分が何喋ってるのか何を言いたいのかわからなくなる。
実は、俺もそんなに上手には話せない。記事の冒頭に実際の音声入力の例を載せたところ、あたかも俺が最初から完璧に構造化された内容を話せるように思われたようだが、真相は異なる。
ここから先は

人に対し何かをしてあげるという事は、全て「見返り」を期待しての行為だ。noteのサポートは文章を読むための「見返り」である。