NEW · 2026/05/18 ローンチ

音声を、文字に。
読み間違いを、自動で。

文字起こしサービス Kikitori は、音声ファイルを高精度に文字起こしし、 原稿との突合まで自動化する Speech-to-Text サービスです。
読み上げサービス と組み合わせれば、読み上げ品質の自動 QA ループが完成します。

💎Voice と同じプランで利用可能。新規契約・API キー発行は不要。

🎧 無料で試す

📁
音声ファイルをドラッグ&ドロップ
または、クリックで選択 (MP3 / WAV / FLAC, 5 MB 以下)
📝 原稿を入力 (任意 — 突合 diff を表示)
🎯
日本語に強い
Google Cloud Speech-to-Text の最新モデルを採用。固有名詞や金融用語にも対応。
🔍
原稿との突合
読み間違いを A/B/C で自動分類。要対応箇所だけがハイライトされます。
高速 API
1 分の音声を数秒で処理。読み上げサービス と同じ API キーで叩けます。

🛠️ API で使う

読み上げサービス と同じ API キーで叩けます。

curl -X POST https://yomiage.cloud/api/v1/transcribe \
  -H "Authorization: Bearer yom_live_..." \
  -F "audio=@narration.mp3" \
  -F "reference=本日の市場では..." \
  -F "diff=true"

API キーは ダッシュボード で発行。Personal プラン以上で利用可能。

💎 課金体系

Voice と Kikitori は 同じ月額プランの文字数プール を共有します。 新しいプランの契約や別 API キーの発行は不要です。

Voice (TTS)
1 文字 = 1 文字消費
Kikitori (STT)
文字起こし 1 文字 = 5 文字消費
※ STT の原価が TTS の約 5 倍のため (Google STT $0.024/min)

例: Personal プラン (50,000 文字/月) なら、Voice 30,000 字 + Kikitori 4,000 字 (4,000 × 5 = 20,000 消費) のような組合せで使えます。

料金プランを見る →
文字起こしサービス Kikitori — 音声を文字に / 読み上げ品質チェック | 読み上げクラウド