文字起こし 書き起こし ツール Part1
スレッドが無いので作ってみました。
企業版のバカ高い奴は除いて、個人が仕事で使えそうなものをターゲットにしています。
・Voiter、Voiter Mini
・Automemo
・GooglePixel の録音アプリ
・スマホアプリ
・Teamsの書き起こし機能
その他いろいろあると思いますが、個人が使えそうな安価で品質のよい文字起こし、書き起こしツールを議論しましょう 自分が試したものはこちらです。
Voitermini
https://www.iflytek.co.jp/voiter-mini/
値段 1年目は無料(キャンペーン期間中)
ベーシックプラン 毎月1時間 無料
プレミアムプラン 毎月200時間 1750円
使い方
・スマホのアプリをインストールする。
・Voitermini本体で録音して、Bluetoothでスマホに転送して、スマホからwifiでサーバー転送して文字起こしを行う。
・文字起こししたテキストはクラウドに保存できるので、PCにてテキストファイルを編集できる。
良いところ
・試した中では文字起こしの品質は一番良い。
ただし、起こした文字だけ読んでも内容はなんとなく理解できるレベル。
他のツールに比べて、議事録を起こす際に手直しは一番少なくて済む。
・話者分離機能があって、完全ではないが会話ごとに内容が区切られている。
会話時間とともにテキスト化されるのはありがたい。
(Voiter には無く、Voiteminiだけの機能の模様)
会議から20分くらいに話したあの人の会話...と言うのを探しやすい。
・Web会議でも情報量を落とすことなく文字起こしをしてくれる。 悪いところ
・スマホアプリでは文字起こししたテキストと音声が同期できる。
ただし議事録を書く際はPCで行うことが多い。
PCでテキストを修正する場合は、スマホアプリで再生しながら確認するなど必要。
スマホとPCを行ったり来たりしなければならないので手間がかかる。
(自分は別途sonyのICレコーダーで会議録音を取り、再生ツールを使っています。
voiterminiの文字起こしテキストを編集して修正しています。)
・うまくサーバーまでデータが転送できないのか「アップロード中」と固まるときがある。
(サポートセンターに何度連絡しても改善されない)
・スマホ内に大量のログファイルが作成され、気が付いたらスマホのストレージがいっぱいになる。
ちょこちょこスマホ内のログファイルと音声ファイルを削除する必要がある。
アプリがいけておらず、スマホアプリ内のデータを1件ずつしか削除できない。
・アプリを起動せず、Voiterminiだけで録音して、あとでスマホアプリに転送して文字起こしも可能。
その場合スマホへの転送時間がかかる、
かつ転送に失敗することが多い。
文字起こしデータの取得に時間がかかったり、取得できないことがある。
・Voiterminiでの録音時にスマホアプリも同時に起動しておくと
録音終了後、すぐにサーバーへの転送が始まるが、
会議の間ずっとスマホが占有されてしまい、
何のためにVoiterminiのデバイスがスマホと別にあるのかわからない。
・FAQに文字起こしが20分で終わると書いてあるが、
サーバー側の処理が安定していないのか何時間もかかることがある。 自分が試したものはこちらです。
Automemo
https://automemo.com/
のうち、「オートメモ」
値段 3か月はプレミアムブラン無料(キャンペーン期間中)
プレミアムプラン 毎月30時間 980円
使い方
・本体の録音ボタンのオンオフのみ。
・スマホアプリで文字起こしテキストと音声を連動して再生することができる。
・事前に設定しておいたメールアドレスに文字起こしテキストが送信されてくる。
※以下は認識エンジンが2021年12月に新しくなる前の評価です。
良いところ
・(認識エンジンがよくなる前の)文字起こしの品質は悪い。
ただし、起こした文字だけ読んでも内容はなんとなく理解できるレベル。
他のツールに比べて、議事録を起こす際に手直しは一番少なくて済む。
・動作は安定していて停止ボタンを押した後、会議時間にもよるが20分程度で
文字起こしテキストがメールで送信されてくる。 自分が試したものはこちらです。
Automemo
https://automemo.com/
のうち、「オートメモ」
値段 3か月はプレミアムブラン無料(キャンペーン期間中)
プレミアムプラン 毎月30時間 980円
悪いところ
・(認識エンジンがよくなる前の)文字起こしの品質は悪い。
Web会議だとかなりの情報量が落ちる。
ビジネスの会議の文字起こしで放送禁止用語がテキスト化される。「ちんこをなめる」「おまんこ」など。
・メールではテキストが改行も会話時間も無く、会話だけがテキスト化されて送られてくる。
一旦スマホアプリで何分当たりの会話か探して、該当のテキストをPCで検索してから修正するなど手間がかかる。
・このツールで文字起こししたテキストを使って、議事録を作成しようとするとかなりの手間がかかる。
使い物にならない。
・会議終了後に停止ボタンを押し忘れても、ある程度の時間で止めてくれる機能は無い。
すぐに上限の時間に到達してしまう。
・一か月30時間と上限が低く、追加料金がそこそこ高い。 自分が試したものはこちらです。
Google Pixel6 の録音アプリの文字起こし機能
値段 本体の値段のみ。
使い方
・2021年12月の段階では、購入時は日本語の文字起こしは使えず、日本語の辞書?をダウンロードする必要がある。
それはググれは出てくる。
・普通に録音し、文字起こしをタップするとリアルタイムで音声がテキスト化される。
良いところ
・web会議でもそこそこ情報量を落とすことなく、テキスト化される。
・文字起こしの品質は良い。
・文の切れ目で区切ってくれるのでテキストを読みやすい。
・リアルタイムでテキスト化されるので、会議終了後すぐに文字起こしテキストを確認できる。
・一回本体を買ってしまえば、月額料金はかからない。
悪いところ
・Pixel上には文の区切りごとに会話時間が表示されているが、PCに共有すると時間が抜けてテキストだけが共有される。
今後のアップデートに期待。 >>6
>2021年12月の段階では、購入時は日本語の文字起こしは使えず
11月購入の時点で使えるっちゅうの googleドキュメントが5行くらいでオフラインでとまって使いもんにならん
回線糞なのが原因だろうが voiter mini のスマホアプリのvoiter notesは不具合多いな。
voiter mini本体のデータは一覧で削除できるけど、アプリ上のデータは一つずつしか消せない。しかも消そうとしても削除できませんと言われることがあり物凄くストレス。
一ヶ月に一回はスマホのストレージがパンパンになって動作が不安定になるので、何で一杯になってるのかと確認してみたらvoiterが作成しているログファイルが数十GB占めている。
手動で消すと、アプリ内のデータ表示にビックリマークがつく。
他にも不具合は多数ある。
文字起こしの精度は俺が知っているなかでも一番高いが、アプリの動作の不安定さが目立つ。 このスレへの誘導あったけど、「今ICレコーダー買うなら?」のスレは消滅したのか? Voiter、ネットワーク(社内のWiFiに繋がってる)が見つかりませんとかで文字起こししてくれなくなったんだけど、
これはサブスクしてないからでしょうかね >>14
voter miniでも「ネットワークに繋がってません。」のエラーがスマホアプリのvoiter notesに表示されますね。
家のwifiに繋がっているんですけどね。
エラーが出たり消えたりして、結果文字起こしデータが取得できたりできなかったり不安定でした。
サポートにいくら言っても対応してくれないですね。 録音音声を自動で文字化してくれる! ソースネクストのICレコーダー「Automemo S」 - 安蔵靖志 | Yahoo! JAPAN クリエイターズプログラム
https://creators.yahoo.co.jp/anzoyasushi/0300185664 オフラインで正確に文字おこししてくれるものはないのか・・ teams の書き起こし(トランスクリプト)使ってるけどまあまあ変換できてる
正式な議事録にするにはやっぱり手間がかかるけど内部の打ち合わせとかならそのままでも役に立つ teamsのlive captionは、ISの方針で使えないんだよな
それで、third party toolに流れるのは、本末転倒だと思うが。
英語は、otterが便利だよね お前ら和歌山県出身の下村拓郎様(35歳独身、元自衛隊)をご存知か、この方は将来素晴しい人物になるから覚えておいて損はないぞ 「ビデオ会議の声を無料で自動文字起こししてみた!」――急遽テレワークを導入した中小企業の顛末記(58)
「Googleドキュメント」や「Texta」など無料ツールで文字起こしは可能か
https://internet.watch.impress.co.jp/docs/column/teleworkstory/1333910.html ; AIボイスレコーダー「AutoMemo」、1万9800円から9900円に値下げ
https://www.itmedia.co.jp/mobile/spv/2203/01/news159.html
在庫余ってるんだなあ。良かった。値下げされる前にメルカリで高めに売っておいて。文字起こしの精度低すぎだもんなあ。
ビジネスじゃありえないような文言を文字起こしするもんだから、人に共有できるようなテキストじゃなかったもんなあ。 >>24
最近よくアマゾンからそれを勧めるメールが来るんだがそういう事か
ボイスレコーダーにしちゃ高いなと思ってたが文字起こし機能があったのね 【東海アマ】
「泊」をご覧いただきたい。
「心不全」が、日本全国平均の444%も増加している。
これは、まさに泊原発の城下町である。
泊原発が日常的に放出する放射能によって、北海道の民衆は、
寒冷地心筋梗塞のリスクを放射能汚染によって格段に上げている。
>>24
automemoはメルカリ見ると値崩れしてるね。しかもvoiterに比べて出品数が多く売れ残りも多い。
売れてる数が相対的に多いのかもしれないが、文字起こしの品質がやはりautomemoの方が良くないんだろうな。
他の文字起こしデバイスをよく知らんからこの二つしか比較できないけどね。 >>27
web会議でTeamsを使ってるならTranscriptで十分。
話者分離はTeams側で発言者抑えてるから完璧だし、発言日時もテキスト化される。書き起こし品質も悪くない。
何よりタダ。
pcのスピーカーから音を拾うより、システム内で直接書き起こししてるから、相手側の声が小さくてもきちんと文字起こししてくれる。
teams会議メインの人なら他のガジェットいらないんじゃないかな。 いろいろ試したけど、今のところ価格・精度ともにこれが一番なので共有↓
https://www.notta.ai >>30
名前からして、otter aiのパクリ感が凄いな。
中華製なのも、ちょい気になる やっぱりソフトよりwebのAIの方が精度はいいのだろうか。買ったソフトがアホみたいな精度で酷いんだよね。 スマホアプリはどれもこれもサブスクしかないのが腹立たしいな。
買い切りで良いアプリ無いものか >>34
上海問屋にありそうなデザインだけれど機能はすごいですね、安いし、pixel 6a買う予定だったけどどうしよう LineのCLOVA NoteはICレコーダーで録音した音源読ませると結構正確に起こせます >>36
CLOVA Note
https://clovanote.line.me/
か。ベータ版なんだね。今は無料だけど、正式リリースされたら価格がどうなるかだね。
PC版で試してみたら、結構正確に文字起こししてくれるね。
話者分離もしてくれていて発言した時間も表示されてる。これは使えそう。
月に600分だとちょっと足りないかな。
月20h~30hあると助かるなあ。 OpenAIからwhisperが出ましたね。ただcpuだと時間的制約が厳しい。個人的にはAzure speech to textが重宝しています。 GooglePixel7のレコーダアブリの文字起こし機能に話者分離が実装されたみたいだね。
まだ英語しか対応してないみたいだけど、アップデートで日本語にも対応してくれることを期待。
https://weekly.ascii.jp/elem/000/004/108/4108760/
今Googleストアでキャンペーンやってて下取りで数万円返ってくるからそれを使うのも手かも。
「数万円」と言っているのは、キャンペーン開始時には下取り最大61,500円だったが、今見たら50,000円になってる。
このキャンペーンを申し込んでいる人はとても多いらしく下取りキットが届くのに一週間かかった。 NottaとOtterどちらも使ったことある人いる?
英文の書き起こしの精度がどっちのが高いか知ってたら知りたいんだけども
Otterだけ使ったことがあって、Nottaも使ってみようか迷ってるんだよね
ちなみにwhisperを用いたwriteout.aiも使ってみたけど、精度で言えばOtterよりも高かったと思う
ただ10ファイルにつき20ユーロと少々高い >>45
>CLOVA Noteのアプリ版って消されたの?
アプリ版を普段使っていないのでわからないけど、PC版は普通にアクセスできるね。
https://clovanote.line.me/home >>46だけど、Notta使ってみた所感を書き残しておくよ
英語の書き起こしはOtterより上(声が重なる部分もだいたい書き起こしてくれる)、writeout.aiと同等くらいの精度。
でもNottaは月額2000円だから10ファイル20ユーロのwriteout.aiよりだいぶコスパがいい感じだった 今のところ文字起こしとして優秀なのはpixelのレコーダーなのかな? pixelが優秀なのは端末を入手してしまえば、いくら使っても無料な点だと思ってる でも高い…
6と7でも迷うけど、もう少し待って8pro買うのが一番いいのかね それから、既存の音声ファイル読ませて文字起こししたいけど
それはpixelじゃ無理か pixel の文字起こしはアプリの立ち上がり、文字起こしスピード、ネットに繋げなくても
機能する等、機動力は素晴らしい。
Notta、UDトークなどの有料アプリはタイムラグが酷すぎて今では使い物にならない。
あとはガヤガヤとした騒音がひどい所や、小さい声を拾ってくれたら良いんだけど すみません。スレ違いでした。
難聴者にとってpixelは、社会生活を送るうえで大変便利な物ですが
議事録作成の為に編集するのは大変だと思いますよ。他のソフトに比べて、どうでしょうかね? pixelは既存の音声ファイルを直接は扱えず、直接録音でしか対応していない点が、デメリット。認識率も凄い優秀ってことはない。ほどほど。
wordのトランスクリプトは、タイムスタンプの修正や削除が全く行えないので、認識率とは別に不便。認識率も高くない。
日本企業の法人向けのサービスは料金の高さのハードルから、個人では、性能を計れない。
韓国系のアプリや、中華系のアプリには、文字起こしの認識率の高さで驚異的なものを見つけた。しかし、逆にデータ漏洩のリスクがないことの裏付けが全くなくて、業務や個人情報に関わるものは認識率が高いゆえに危険過ぎて扱えない。
notta以上の認識率の精度と思われるので驚き。
中韓のアプリの精度の高いものは、本来の目的が企業情報等の収集が目的なのではないかという懸念がある。
文字起こしの認識率が、経験した中では過去最高レベルなのに、個人情報や音源の収集保持をアプリで明記されてるから、認識精度が高いのに、機微に触れる内容があるから使えない。
認識率が高いゆえに、翻訳アプリを通せば、外国に情報が筒抜けになる。
一方で、データを収集しないと記されていても、中華系アプリはそれを信用出来ない。
認識精度が高いのを見つけたのに、残念だ。 会議録文字起しに関連して5chにスピーカーフォンのスレってどこかにある?
AV機器板とか一通り探したけど見つけられなかった teamsで会議した録画の文字起こしに使える?
teamsのトランスクリプトって賢くないんで手直しが面倒すぎる 結局openai whisper v3をCPUのみで動かしている。実時間の2.5倍ぐらい時間かかるけど品質も満足しているし問題ない。がんがん打ち合わせを変換していてメモらなくなって。 PLAUD NOTE
https://jp.plaud.ai/
文字起こししたうえにChatGPTで要約までしてくれるらしい。
ただ、上記ページのyoutube動画見ると固有名詞については書き起こし精度が弱いとなっているので、要約が使い物になるのかどうか... 「録音データを“無料で文字起こし”できるツールを比較してみた」――急遽テレワークを導入した中小企業の顛末記(173)【テレワーク顛末記】 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/column/teleworkstory/1562838.html
●Sloos
https://sloos.qcore.co.jp/
●User Local 音声議事録システム
https://voice-dashboard.userlocal.jp/
●CLOVA NOTE
https://clovanote.line.me/
●SecureMemo
https://securememo-cloud.com/
無料で使える文字起こし機能をいろいろ使ってみたが、総合力では「SecureMemo」や「CLOVA NOTE」が一歩リードしている印象だった。
操作方法はファイルをアップロードするだけと単純で、発話者を識別してくれるのもポイントが高い。
ただ、「SecureMemo」はベータ版であるが故の無料提供、「CLOVA NOTE」は時間制限があることを考えると、無料で使い続けるにはいくつかのツールを使い分ける必要がありそうだ。「Sloos」と「User Local音声議事録システム」も後から手直しすれば、
議事録のたたき台などには使えるレベルなので、興味がある人は一度試してみてはいかがだろうか? >>62
使っているけど、whisper v3で文字起こししたほうが正確だな。。