Word トランスクリプトの使い方と精度 | クロオカノート
スポンサーリンク

Word トランスクリプトの使い方と精度

Word トランスクリプトの使い方と精度
<本ページはプロモーションが含まれています>

スポンサーリンク

はじめに

Wordには「ディクテーション」「トランスクリプト」という2つの文字起こし機能があります。
ここではICレコーダーで録音した音声ファイルやYouTubeなどの動画ファイルから文字起こしができる「トランスクリプト」機能を詳しく紹介します。

「ディクテーション」の機能紹介、レビューはこちら

Wordの音声入力(ディクテーション)でも、文字起こしは間違いなくラクになる!
Microsoft 365のアプリケーション「Word」の音声入力機能(ディクテーション)の現状をレビューします。

Word トランスクリプトについて

Microsoft Wordのトランスクリプトは、ICレコーダーやスマホのアプリでや録音した音声ファイル、YouTubeなどの動画の音声をテキストに変換する機能。

会議の記録、インタビューの書き起こし、講演の要約など、さまざまなビジネスシーンで活用でき、僕のように取材音声をいったん書き起こしてから文章を作成するライターにとっては不可欠なツール。20年以上前から待ち望んでいた機能です。

トランスクリプトで文字起こしできるファイル形式は
.wav/.mp4/.m4a/.mp3の4種類。
容量に制限はありません。

Word トランスクリプトが表示されない、使えない

Word トランスクリプトについて

トランスクリプトが使えるWordはMicrosoft 365だけです。

現在(2024年2月末)、トランスクリプトが利用できるのはMicrosoft 365のサブスクリプション版(Microsoft 365 Personal 月額1,490円~/年額14,900円~)だけです。「Microsoft Word 2021」「Microsoft Word 2019」などの製品版(ダウンロード購入した永続版など)や、アキハバラあたりで販売している海賊版ソフトには搭載されていません。

近年Microsoftは、Microsoft 365と生成AIサービスCopilotとの連携を強化しており、Copilotを優先的に利用できるパッケージサービスの評価が高まっている今、過去の製品版や海賊版にトランスクリプトが搭載される可能性はありません。

トランスクリプトを使いたい、試してみたいという方は、サブスクリプション版のMicrosoft 365を利用しましょう。

Microsoftの公式サイトでは特にアナウンスがありませんが、macOS、iOS環境ではMicrosoft 365のサブスクリプション版でもトランスクリプトが表示されません。

Word トランスクリプトの使い方

Word トランスクリプトの使い方

右側の「ディクテーション」タブをクリックすればトランスクリプトのウインドウが開きます。

それではトランスクリプトの使い方を解説します。

1.Microsoft365のWordを起動
2.【ホーム】画面にある【ディクテーション】タブ→【トランスクリプト】
3.画面右側の【Transcribe】ウインドウで【音声をアップロード】
4.任意の場所に置いた音声または動画ファイルを選択
5.OneDriveへのアップロードがスタート。「音声ファイルのトランスクリプトを作成中」のメーターのパーセンテージが上昇します。

OneDriveはMicrosoftが提供しているオンラインストレージサービスです。Microsoft365のユーザー登録をすると、1TBのクラウドストレージを無料で使うことができます(月額/年額利用料に含まれている)。
60分を超えるようなファイルだと、光回線でもアップロードに時間がかかったり、途中で止まったりすることがあります。辛抱強く繰り返しましょう。

6.【Transcribe】ウインドウの下に「トランスクリプトが保存されました。このウインドウとドキュメントを閉じて後でまた表示することができますとメッセージが出ます。
7.【ドキュメントに追加】で起こしたテキストがWordの新規ドキュメントに出力されます。

ドキュメントの出力形式
【テキストのみ】適度に改行されたテキストを出力
【話者】複数人が登場する場合、会話の冒頭に「話者1」「話者2」などと表記されて出力
【タイムスタンプを使用する】会話の冒頭にタイムスタンプが表示されて出力
【話者とタイムスタンプ】会話の冒頭に話者とタイムスタンプが表示されて出力

Word トランスクリプトの便利な機能

話者を一括で変換

画面右側の【Transcribe】ウインドウで話者の右側の鉛筆マークを選択すると、話者の名前を決めるこができます。たとえば話者1を「クロオカ」にしてすべて修正をチェックすれば話者1はすべて「クロオカ」に変換されます。

タイムスタンプをクリックして音声を確認

画面右側の【Transcribe】ウインドウでタイムスタンプをクリックすればその時点の会話を確認できます。話者の右側の鉛筆マークをクリックすればウインドウが開き、会話の内容を修正できますよ。

Word トランスクリプトの注意点

Word トランスクリプトは、画面右側の【Transcribe】ウインドウで話者や会話の内容を加筆・修正してからドキュメントを出力する仕様になっています。

【Transcribe】ウインドウで加筆・修正をおこなわず、【テキストのみ】を選択してドキュメントを出力してから修正することもできますが、出力されたドキュメントではEnterを叩くたびにOneDriveの画面が開いてしまいます。

Shift+Enterなら大丈夫ですが、普段はやらないアクションですので気を付けていてもイラつくことになるかもしれません。

ですので通常「Okoshiyasu」などの文字起こしツールとWordを組み合わせて使っている方は、出力したテキストをいったんテキストファイルにコピーしてからWordの新規ドキュメントにペーストすることをおすすめします。

Word トランスクリプトには音声を録音する機能もあります。録音してからファイルをアップロードしてテキスト化する、という流れになります。しかし、対面での取材や会議、講演会等で音声を録るならICレコーダーかスマホのアプリを使いますし、Web会議やリモート取材をWordで録ることはできません。いまのところ使い道がないので今回は割愛します。

Word トランスクリプトの文字起こし精度とChatGPTとの相性

では音声ファイルをアップロードして文字起こしの精度を確認してみましょう。
実際の取材で録音した音声ファイルを使用することはできませんので、ここでは複数の人がトークしているラジオの音声を使って検証します。

音声はこちら(ニッポン放送 サンドウィッチマン「ザ・レディオショー」)

出力されたテキストは以下のとおりです。
音声を聞きながら読むと現状の精度がよくわかります。

伊達/さあ、時刻はお昼の一時を回りました。どうもこんにちは。サンドイッチマン伊達勉強です。

富澤/富澤たけし。です。

伊達/サンドイッチマンthe radio show that day本日もニッポン放送キーステーションに宮城県tbcラジオ、福岡県rkbラジオ、長崎県佐賀県、nbcラジオの四局ネットで生放送でお送りして参ります。

富澤/最後までお楽しみください。

伊達/穏やかな週末をお過ごしでしょうか?どうでしょうか?

富澤/今日天気もいいです。 ねうん、

伊達/今日、僕はですね。あの子供の授業参観にちょっとパット行ってきました。

富澤/ほぼ

伊達/朝からうん、

富澤/どうでした?

伊達/頑張ってよ。

富澤/がんばってあげたりして

伊達/手上げるような授業ではなかった。んだけど、

富澤/どういう授業をして?

伊達/なんか今日はね、先生。 うん、レジ袋についてみたいな授業でしたね。レジ袋を。 あのいっぱい使うとどうなるとか

富澤/なんの授業

伊達/なんか、そういうホームルーム的な。 道徳みたいなやつあ、そうエスディージーズ。 みたいな話をね。 そうやるんだと思って。

富澤/授業参観で道徳の授業やって

伊達/なんか?本当は今日何時間かあって? うん、おれはもうこれあるからもう一時間だけ見てパッと帰って来て、

富澤/どれ見てもいいみたいな。

伊達/そうそう、土曜日あのね。

富澤/急になりましたけど、土曜日の。ね、土曜日ですね。

伊達/しょうがないだろ?お前の前に。

富澤/親御さんがこれ着やす。いうようにでしょうね、多分

伊達/だからたぶんね。うん、いや、がんばってましたけどね、うん。でも六年生だからさああのなんだろう。これまでも何回か行ってるんですけど、授業参観みたいな。 もう僕ってなんとなくわかる世代じゃない?

富澤/サンドイッチマン来てるぞみたいなことでしょう。

伊達/ちょっとこうサインくださいとかくるわけ。Noteビリビリって破ったようなやつ持ってさ可愛いんだよすごい。もう四年生とかもあがってくるわけだから、六年生の会にサンドイッチマンいる?って

富澤/噂を聞きつけて。

伊達/で遠くからアバナなんだばなな。 バナナマンじゃねぇよって言いながらね。

富澤/だからそのなんかタレントパワーランキングとかさ1位とかになってんのかな? でもさいまだにバナナマンだって言われる。って

伊達/バナナマン間違いは非常に多いです。 昔からね、うん。

富澤/なんだろう?そんなパワー無いなって。

伊達/めんどくさいoこんにちはって言うけどね、そのままね。

富澤/僕もだから宮澤さんとか言われるんだけど。 どうも。

伊達/宮澤さんある。

富澤/伊達さんっていうのもあるし。

伊達/お前に。俺に富澤さんは無いの?

富澤/うん、さださん。 申し訳ないけど。 これは無視しますよ。だってじゃないんで、あっちは感じ悪いと思うかもしれないですけど、だてじゃないんで、はいと。

伊達/とてさんじゃないからね、富澤だしね。

富澤/まあまあ俺を呼んでないよなってなるから、そこは申し訳ないです。

伊達/けど30,003万。 できたら?

富澤/蒸してしまえば300はない。

伊達/Hfas sandmanさんはあるけど、たまにねある30,003万サンドイッチマンですよってねうん。今日もタクシー待ってたらあの選んでいつも見てますっていう。 方と会ったりとか?

富澤/ああ普通の人、歩いてる人。

伊達/そうそう、歩いてる方、結構。 あるよ。うん。あのどっかの、高校の通学路になってるの? うちの近く。 すげえんだわあの人歩いてんの学生が。 でもいっぱいいっぱい言われる。

宮澤/ざわつく。 しょうがない。それ、お前はそういうとこ住んでるから。

伊達/いやまあ、しょうがないんだけど。 うんでもまあ写真撮ってんだろうなあっていう雰囲気もあったり。とか

宮澤/あそんなに人だからみたいな。

伊達/いうかね?そうそうそう。

宮澤/まあ、もう目そうやってやられるうちがね。ANAですから。

伊達/そうですよ。誰にも声かけなかったら終わりですからね。ラジオでなくなるよ。お前、誰だこのラジオ売ってるんですか? うん。まあまあ、そのまあ、今が花です。よね。

宮澤/だからそのなんか印象悪いって思う人も中にはいるかもしれないですけど。

伊達/うん、はい、はい。

宮澤/結構なんか、そのそっちの態度が悪いからだぞっていうの。 はちょっとあるけどね。

伊達/ああまああるね、それ。 ね、うん、うん。

宮澤/あっちの感じが悪いときはこっちも感じ悪くするんで、まずお前が感じ悪いんだなって。 ね、だからそういう人ってあったら、多分サンドイッチマンこの間あったけど、好感度いいとか言ってるけど、感じ悪かったよっていうじゃないっていうまずお前が感じ悪いんだからって。

伊達/お前の好感度ねーかな?

宮澤/そこをまず言いたいです。

話者の区別ができていなかったので、文頭に名前を付けて改行も入れてみましたが・・・二人のトークでは書き起こしの精度はかなり低いですね。

ChatGPTで下記のようなプロンプト(参照/DIME)を実行してみたものの、もとの文章のクオリティが低いせいか、良くなった感じはありませんでした。

#文章をケバ取り
以下の文書で不要な文字をカットし、整えてください。##不要な文字の例
・「あー」「えーと」「あの」「ああ」「ちょっと」など、
意味を持たない声や言いよどみ(間接詞・フィラー)
・「はいはいはい」「うんうんうん」「なるほど」など、
過剰な相づち、無意味な繰り返し
・「やっぱり」「あの」など、つっかけ、言葉の噛み
・「7日、いや8日」など、明らかな言い間違い、とちり
・「ですねー」など、語尾伸ばし
・「やっぱり明日は、やっぱり雨だと、やっぱり思います」など、
頻出する口癖##文章

ためしにニュース番組でも検証してみました。
音声はNHK東京「Nラジ NHKきょうのニュース」です。

出力されたテキストは以下のとおりです。
読みやすくするため改行を入れています。

武装反乱を起こした民間軍事会社ワグネルを巡る一連の情勢について、岸田総理大臣は昨日、国家安全保障局の幹部などから報告を受け、引き続き各国と連携しながら積極的に情報の収集や情勢の分析にあたり、臨機応変に対応するよう指示しました。その。 上で。

日月今後の動向について、おーきな関心を持って注視して行きたい。Gセブンのオンラインでの外相会合も開かれたと聞いておりますが、gセブンの連携、まあ、これはしっかりと確保しながら、今後の情勢に対応して行きたい。

さあ、今日も一日お疲れ様です。Nラジ真下貴です
こんばんは菊野理沙です。今週のコメンテーターは朝鮮半島、アメリカ社会などが担当のNHK解説委員。
慰霊碑ただしです。

この番組は皆さんのニュースの見方を募集します。関心を持ったニュース。
私は、このニュースをこう見るというご意見をお寄せください。メールfaxツイッターで受け付けています。Twitterのハッシュタグはnラジです。アルファベットのnにひらがなでラジです。

一緒にニュースを語りましょうェラチは、この後7時55分までお伝えします。

はじめはロシア、そしてウクライナをめぐる情勢です。 ロシアの民間軍事会社ワグネルの代表プリ御仁氏は、国防省との確執を深める中で武装反乱を起こし、首都モスクワに向けて部隊を進めましたが、その後一転して引き返させ、占拠していた南部の軍司令部からも舞台を撤収させました。

ロシア大統領府のペスコフ報道官は、プリ御仁氏が隣国のベラルーシに行くという見通しを示しました。が、プリコ人士は日本時間の昨日未明以降、SNSへの投稿を更新していません。

ロシアのネットメディアは25日午後、日本時間の昨夜、プリ御仁市の広報担当が彼は皆によろしくと伝えており、通常の通信ができるようになれば皆の問いに答えると回答したと出ていますが、その後の消息はわかっていません。

一方ロシア国防省は26日朝、日本時間の今日午後、ショイグ国防相が特別軍事作戦の前線の司令部を訪れたと発表し、ショイグ国防相が部隊の司令官から船橋などについて報告を受けたとする映像を公開しました。

醤油国防省を直接避難し、懐妊まで要求していたとされるプリ御仁氏が武装反乱を起こす間、植国防省の動静は伝えられていません。でしたが、ロシア、大統領府は武装反乱がウクライナでの軍事作戦にいかなる影響も与えないと主張していて。 食国防相が前線で指揮を執る映像を公開することで、ロシア軍部隊の動揺を抑える狙いもうかがえます。

こうした中、反転攻勢を続けるウクライナのマニュアル国防次官は26日、SNSに。 ここ1週間でウクライナ軍は東部で戦術的な成功をおさめたと統合しました。

選挙を分析しているイギリス国防省は26日、ウクライナはより広範な反転攻勢の一環として、東部ドネツク州のバハムト周辺での攻撃にはずみをつけたと指摘し。 ウクライナ軍は、プーチン政権の混乱を反転攻勢への追い風にしたいものとみられます。

ええカメゴムあと青いおっさんさんからはプリ御仁しどこ行ったん?ということでええ。まあ、これがまあ、今後の情勢にどう影響するかというところも。 注目ですね。

次はおととい発生したjr東日本のシステム障害について。 この障害について、jr東日本は高時の操作手順書に誤りがあり、現場の担当者もそれに気づかずに別のブレーカーが落とされ、電源が遮断されたことが原因だと明らかにしました。

Jr東日本ではおととい未明にシステム障害が発生し、駅の構内や券売機などでクレジットカードが使えなくなったほか、運賃の支払いなどを行うモバイルスイカでアプリでのチャージができないなど、影響は最大で12時間あまり続きます。

Jr東日本が詳しく調査した結果、システムサーバーの電源工事で操作手順書に誤りがあり、現場の担当者もそれに気がつかずに別のブレーカーが落とされ、電源が遮断されたことが原因だと明らかにしました。

このため、jr東日本は手順書をチェックする人数を増やしたり、工事の工程に照らして確認をより入念に行ったりするなど、再発防止を徹底するとしています。

また、システム障害ではネット上で新幹線の指定席などを予約する駅netも利用できなくなったため、キャンセルなどができなかった場合には全額を返金する対応を取ることにしています。

こちらはあー、えー、まあ、など、バリ取りの対象となる言葉も言いよどみもなく、はっきりした言葉で読み上げられているので変換ミスを除けば内容が理解できる文章になっていますね。

ただ、こうしたニュース番組のような音声や動画から文字起こしやライティングをしてほしいという依頼は皆無なので、普段の会話レベルの音声認識・テキスト化の精度をさらに高めてほしいですね。

コメント

タイトルとURLをコピーしました