こんにちは。フリーライターのクロオカです。オンラインミーティングの定着により、リアルタイムの文字起こしや議事録作成技術のニーズが高まっています。
経験豊富なライターの方は対面取材やオンライン取材など、状況に応じてさまざまなツールを使い分けていると思いますが、この記事では、文書作成ソフトはMicrosoftのWordしか使えない、使ったことがないというあなたの
●Wordで音声入力をおこなうにはどうすればいいの?
●Wordの音声入力は仕事で活用できるほど精度が高いの?
●Wordの音声入力は進化が期待できるの?
……といった疑問にお答えします。

そもそもWordで音声入力ができるの?
Microsoft 365のアプリケーションとして提供されているWordに限る
できます。ただし、MicrosoftのWordなら何でもOKというわけではありません。現在はMicrosoft 365のアプリケーションとして提供されているWordに限ります。
Microsoft 365は、Word、Excel、PowerPoint、Outlook、OneNote、Access、Publisherといったデスクトップアプリケーション(Microsoft Office)の最新版と、OneDriveやMicrosoft Teams、Exchange、SharePointなど最新版のグループウエアをセットで利用できるサブスク型のクラウドサービスで、個人や中小企業、大企業向けに複数のプランが用意されています。
対応OSは、Windows(11、10、8)、MacOs、iOS、Androidなど。1ユーザーあたり PC5台、スマートフォン5台、タブレット端末5台までOfficeアプリケーションをインストールできます。
Wordで音声入力をおこなうにはどうすればいいの?
PCの場合
ヘッドセットを用意し、USB、3.5mmのミニプラグ(ミニジャック)、Bluetoothなど、端子に合わせてPCに接続しましょう。マイクとスピーカを別々に接続してもいいですが、ヘッドセットがあれば、PCに取り込んだICレコーダーの音声をヘッドフォンで聞きながらWordの音声入力を利用できます。
ノートPCにはマイクとスピーカが内蔵されていると思いますが、Wordの音声入力ではヘッドセットを使った方が精度が上がり、スピードも速くなります。普段オンラインゲームなどを楽しんでいる人はゲーミング用のものをそのまま使いましょう。ちなみに僕は遠方での出張取材にも持っていけるように折りたたみ式のヘッドセットを愛用しています。
接続したら、PCのサウンド設定を合わせます。
Windowsは、タスクバー右下のスピーカーマークを右クリック→「サウンドの設定を開く」へ。そして「出力デバイスを選定してください」「入力デバイスを選定してください」のプルダウンを接続したヘッドセットに合わせます(僕のヘッドセットはUSB PnP Audio Deviceと表示されます)。
Macでは「サウンド環境設定」画面を開き、出力・入力タブをそれぞれ、あなたのヘッドセットに合わせます。
サウンド設定が完了したら、Wordを起動しましょう。
「白紙の文書」をクリックし、タブを左側にある「ホーム」に合わせると、上部右側にマイクのアイコンがあるはずです。それが音声入力(ディクテーション)のスイッチです。
クリックすると、設定、(マイク)、(ヘルプ)のアイコンが並ぶウインドウが表れます。ひとまずは「設定」で「句読点の自動挿入を有効にする」にチェックを入れておきましょう。そして「話し手の言語」を「日本語」に合わせます。「機密の語句をフィルター処理する」はひとまずオンのままで進めましょう。
マイクのアイコンクリックすれば音声入力がスタートします。デスクトップPCでヘッドセットの接続ができていないなど、問題がある場合は「マイクに問題があります。Officeがマイクからの音声の取り込みを開始できません」のメッセージが表示されます。
スマホの場合
スマホではMicrosoft 365のアプリを起動→右下の「+」をタップ。
続いて「Word」→「ディクテーション」の順にタップします。
すると「聞き取り中…始めるにはお話しください」のメッセージが表示されます。
タブレットの場合
タブレットでは、Microsoft 365のアプリを起動→右下の「+作成」をタップ。
続いて「Word」→「白紙の文章」の順に選択します。
左下にマイクのアイコンが表れます。
PC版と同様に設定マークをタップし、ディクテーションの設定画面で「句読点の自動挿入を有効にする」にチェックを。そして「話し手の言語」を「日本語」に。「機密の語句をフィルター処理する」はひとまずオンのままで進めましょう。
Wordの音声入力は仕事で活用できるほど精度が高いの?
コマンド入力がない文章でテスト
Wordのディクテーションには、句点や読点、かっこやクオーテーションをはじめとする特殊文字の入力、改行・段落の変更が可能なコマンド入力機能があります。
しかし、現状では精度がかなり低く、僕自身もインタビュー音声のテキスト化(下書き)を目的としています。そのためここでは、特殊記号や段落の変更がないサマセット・モームの短編小説『月と六ペンス』の冒頭を例文としました。「句読点の自動挿入を有効にする」に設定し、句読点が入るところは少し間を空けて読み上げています。
デスクトップPCの場合
ヘッドセット:ELECOM HS-HP20UBK(USB接続)
マシン:DELL XPS8930
OS:Windows 10 Home 64bit
CPU:第9世代 Intel Core i7 9700(コア:8/キャッシュ:12MB/最大:4.70GHz)
メモリー:32GB DDR4 2666MHz/ストレージ:1TB SSD+1TB HDD
GPU:NVIDIA GeForce GT 1030 2GB
日本語入力ソフト:ATOK
ノートPCの場合
●ヘッドセット接続(入力レベル7)
●内臓マイク(入力レベル7)
ヘッドセット:ELECOM HS-HP20UBK(USB接続)
マシン:MacBook Air(M1、2020)
チップ:Apple M1
メモリ:16G ストレージ:251GB
日本語入力ソフト:ATOK
タブレットの場合
iPad(第9世代)
ストレージ:64GB
スマホの場合
iPhone SE(第2世代)
ストレージ:64GB
使ってみた感想
PCとタブレットは〇 スマホは×
入力と変換のスピードには頼りなさを感じますが、僕のようにインタビューやweb会議の音声を下書きとしてテキスト化するのが目的なら十分な精度だと思います。
驚いたのはMacBook AirとiPadの安定性です。MacBook Airでは内臓マイクでもヘッドセット使用時と同等のレベル。iPadも外部マイクを試す必要もないと思える精度でした。
これらと比較すると、スマホの精度はかなり落ちますね。2度試してみましたが、読み取りと変換が間に合わずテキストが飛んでしまうところが複数ありました。スペックに左右される面もあると思いますが、現状では下書きレベルでも厳しいですね。同じMicrosoft製でiPhoneに限定すれば、AI文字起こしアプリ『Group Transcribe』の方に圧倒的なアドバンテージがあります。
AI文字起こしアプリで『Group Transcribe』をオススメする5つの理由
おわりに
確かなのは、数年前と比較するとWordの音声入力の精度とスピードは格段に向上しているということ。現状のレベルでも「タイピングが得意じゃない」「スマホの文字入力は早いがPC操作には慣れていない」というあなたの手助けになるはずです。
コマンド入力については「Wordの音声入力は仕事で活用できるほど精度が高いの?」のところで少し触れましたが、まだまだ改善の余地を残しています。
2021年にはAppleの音声アシスト「Siri(シリ)」に採用されているテクノロジーのベースを開発したニュアンス・コミュニケーションズ社を買収したMicrosoft。音声入力だけで完璧なテキストを作成できる日が来ることを期待しています。

コメント