NEW · 2026/05/18 ローンチ
音声を、文字に。
読み間違いを、自動で。
文字起こしサービス Kikitori は、音声ファイルを高精度に文字起こしし、 原稿との突合まで自動化する Speech-to-Text サービスです。
読み上げサービス と組み合わせれば、読み上げ品質の自動 QA ループが完成します。
💎Voice と同じプランで利用可能。新規契約・API キー発行は不要。
🎧 無料で試す
📁
音声ファイルをドラッグ&ドロップ
または、クリックで選択 (MP3 / WAV / FLAC, 5 MB 以下)
📝 原稿を入力 (任意 — 突合 diff を表示)
🎯
日本語に強い
Google Cloud Speech-to-Text の最新モデルを採用。固有名詞や金融用語にも対応。
🔍
原稿との突合
読み間違いを A/B/C で自動分類。要対応箇所だけがハイライトされます。
⚡
高速 API
1 分の音声を数秒で処理。読み上げサービス と同じ API キーで叩けます。
🛠️ API で使う
読み上げサービス と同じ API キーで叩けます。
curl -X POST https://yomiage.cloud/api/v1/transcribe \ -H "Authorization: Bearer yom_live_..." \ -F "audio=@narration.mp3" \ -F "reference=本日の市場では..." \ -F "diff=true"
API キーは ダッシュボード で発行。Personal プラン以上で利用可能。
💎 課金体系
Voice と Kikitori は 同じ月額プランの文字数プール を共有します。 新しいプランの契約や別 API キーの発行は不要です。
Voice (TTS)
1 文字 = 1 文字消費
Kikitori (STT)
文字起こし 1 文字 = 5 文字消費
※ STT の原価が TTS の約 5 倍のため (Google STT $0.024/min)
例: Personal プラン (50,000 文字/月) なら、Voice 30,000 字 + Kikitori 4,000 字 (4,000 × 5 = 20,000 消費) のような組合せで使えます。