文字起こし 書き起こし ツール Part1
スレッドが無いので作ってみました。
企業版のバカ高い奴は除いて、個人が仕事で使えそうなものをターゲットにしています。
・Voiter、Voiter Mini
・Automemo
・GooglePixel の録音アプリ
・スマホアプリ
・Teamsの書き起こし機能
その他いろいろあると思いますが、個人が使えそうな安価で品質のよい文字起こし、書き起こしツールを議論しましょう いろいろ試したけど、今のところ価格・精度ともにこれが一番なので共有↓
https://www.notta.ai >>30
名前からして、otter aiのパクリ感が凄いな。
中華製なのも、ちょい気になる やっぱりソフトよりwebのAIの方が精度はいいのだろうか。買ったソフトがアホみたいな精度で酷いんだよね。 スマホアプリはどれもこれもサブスクしかないのが腹立たしいな。
買い切りで良いアプリ無いものか >>34
上海問屋にありそうなデザインだけれど機能はすごいですね、安いし、pixel 6a買う予定だったけどどうしよう LineのCLOVA NoteはICレコーダーで録音した音源読ませると結構正確に起こせます >>36
CLOVA Note
https://clovanote.line.me/
か。ベータ版なんだね。今は無料だけど、正式リリースされたら価格がどうなるかだね。
PC版で試してみたら、結構正確に文字起こししてくれるね。
話者分離もしてくれていて発言した時間も表示されてる。これは使えそう。
月に600分だとちょっと足りないかな。
月20h~30hあると助かるなあ。 OpenAIからwhisperが出ましたね。ただcpuだと時間的制約が厳しい。個人的にはAzure speech to textが重宝しています。 GooglePixel7のレコーダアブリの文字起こし機能に話者分離が実装されたみたいだね。
まだ英語しか対応してないみたいだけど、アップデートで日本語にも対応してくれることを期待。
https://weekly.ascii.jp/elem/000/004/108/4108760/
今Googleストアでキャンペーンやってて下取りで数万円返ってくるからそれを使うのも手かも。
「数万円」と言っているのは、キャンペーン開始時には下取り最大61,500円だったが、今見たら50,000円になってる。
このキャンペーンを申し込んでいる人はとても多いらしく下取りキットが届くのに一週間かかった。 NottaとOtterどちらも使ったことある人いる?
英文の書き起こしの精度がどっちのが高いか知ってたら知りたいんだけども
Otterだけ使ったことがあって、Nottaも使ってみようか迷ってるんだよね
ちなみにwhisperを用いたwriteout.aiも使ってみたけど、精度で言えばOtterよりも高かったと思う
ただ10ファイルにつき20ユーロと少々高い >>45
>CLOVA Noteのアプリ版って消されたの?
アプリ版を普段使っていないのでわからないけど、PC版は普通にアクセスできるね。
https://clovanote.line.me/home >>46だけど、Notta使ってみた所感を書き残しておくよ
英語の書き起こしはOtterより上(声が重なる部分もだいたい書き起こしてくれる)、writeout.aiと同等くらいの精度。
でもNottaは月額2000円だから10ファイル20ユーロのwriteout.aiよりだいぶコスパがいい感じだった 今のところ文字起こしとして優秀なのはpixelのレコーダーなのかな? pixelが優秀なのは端末を入手してしまえば、いくら使っても無料な点だと思ってる でも高い…
6と7でも迷うけど、もう少し待って8pro買うのが一番いいのかね それから、既存の音声ファイル読ませて文字起こししたいけど
それはpixelじゃ無理か pixel の文字起こしはアプリの立ち上がり、文字起こしスピード、ネットに繋げなくても
機能する等、機動力は素晴らしい。
Notta、UDトークなどの有料アプリはタイムラグが酷すぎて今では使い物にならない。
あとはガヤガヤとした騒音がひどい所や、小さい声を拾ってくれたら良いんだけど すみません。スレ違いでした。
難聴者にとってpixelは、社会生活を送るうえで大変便利な物ですが
議事録作成の為に編集するのは大変だと思いますよ。他のソフトに比べて、どうでしょうかね? pixelは既存の音声ファイルを直接は扱えず、直接録音でしか対応していない点が、デメリット。認識率も凄い優秀ってことはない。ほどほど。
wordのトランスクリプトは、タイムスタンプの修正や削除が全く行えないので、認識率とは別に不便。認識率も高くない。
日本企業の法人向けのサービスは料金の高さのハードルから、個人では、性能を計れない。
韓国系のアプリや、中華系のアプリには、文字起こしの認識率の高さで驚異的なものを見つけた。しかし、逆にデータ漏洩のリスクがないことの裏付けが全くなくて、業務や個人情報に関わるものは認識率が高いゆえに危険過ぎて扱えない。
notta以上の認識率の精度と思われるので驚き。
中韓のアプリの精度の高いものは、本来の目的が企業情報等の収集が目的なのではないかという懸念がある。
文字起こしの認識率が、経験した中では過去最高レベルなのに、個人情報や音源の収集保持をアプリで明記されてるから、認識精度が高いのに、機微に触れる内容があるから使えない。
認識率が高いゆえに、翻訳アプリを通せば、外国に情報が筒抜けになる。
一方で、データを収集しないと記されていても、中華系アプリはそれを信用出来ない。
認識精度が高いのを見つけたのに、残念だ。 会議録文字起しに関連して5chにスピーカーフォンのスレってどこかにある?
AV機器板とか一通り探したけど見つけられなかった teamsで会議した録画の文字起こしに使える?
teamsのトランスクリプトって賢くないんで手直しが面倒すぎる 結局openai whisper v3をCPUのみで動かしている。実時間の2.5倍ぐらい時間かかるけど品質も満足しているし問題ない。がんがん打ち合わせを変換していてメモらなくなって。 PLAUD NOTE
https://jp.plaud.ai/
文字起こししたうえにChatGPTで要約までしてくれるらしい。
ただ、上記ページのyoutube動画見ると固有名詞については書き起こし精度が弱いとなっているので、要約が使い物になるのかどうか... 「録音データを“無料で文字起こし”できるツールを比較してみた」――急遽テレワークを導入した中小企業の顛末記(173)【テレワーク顛末記】 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/column/teleworkstory/1562838.html
●Sloos
https://sloos.qcore.co.jp/
●User Local 音声議事録システム
https://voice-dashboard.userlocal.jp/
●CLOVA NOTE
https://clovanote.line.me/
●SecureMemo
https://securememo-cloud.com/
無料で使える文字起こし機能をいろいろ使ってみたが、総合力では「SecureMemo」や「CLOVA NOTE」が一歩リードしている印象だった。
操作方法はファイルをアップロードするだけと単純で、発話者を識別してくれるのもポイントが高い。
ただ、「SecureMemo」はベータ版であるが故の無料提供、「CLOVA NOTE」は時間制限があることを考えると、無料で使い続けるにはいくつかのツールを使い分ける必要がありそうだ。「Sloos」と「User Local音声議事録システム」も後から手直しすれば、
議事録のたたき台などには使えるレベルなので、興味がある人は一度試してみてはいかがだろうか? >>62
使っているけど、whisper v3で文字起こししたほうが正確だな。。 teams会議の文字起こし(トランスクリプション)をDoc形式で保存すると、すごい
改行がおかしい文章が出力されるんだけど、これを読みやすいように変換するツールってありませんか?
Excel形式とかCSV形式とか。 iphoneでも文字起こしと要約機能追加だとさ
期待していいんだろうか plaudnoteが無料プラン発表したけど今使ってるやつが無料3ヶ月中なんだけど終わったら自動で移行するの?