声のピッチ分析ツール
マイクで録音またはファイルをアップロードして、声のピッチ(基本周波数 F0)をリアルタイムにグラフ表示。YINアルゴリズムで高精度検出。イントネーション確認、声優練習、歌の音程チェックに。
マイクで録音またはファイルをアップロードして、声のピッチ(基本周波数 F0)をリアルタイムにグラフ表示。YINアルゴリズムで高精度検出。イントネーション確認、声優練習、歌の音程チェックに。
ピッチ(基本周波数 F0)とは、声帯の振動によって生まれる音の高さのことです。単位はHz(ヘルツ)で表され、男性の話し声は約80〜180Hz、女性は約160〜300Hzが一般的な範囲です。
ピッチの時間変化を可視化したピッチコンター(F0曲線)を見ることで、イントネーション(抑揚)のパターンを客観的に確認できます。
グラフには周波数(Hz)と時間(秒)の軸に加え、音名(C4, A4など)とセント値も表示されます。グラフ画像はPNGでダウンロード可能です。
本ツールはYINアルゴリズムを採用しています。YINは2002年にCheveigneとKawahara によって発表されたピッチ検出手法で、自己相関関数を改良した高精度な基本周波数推定を実現します。
すべての処理はブラウザ内(JavaScript)で完結し、音声データがサーバーに送信されることはありません。
歌声合成の歴史 ― VOCALOID 2003 から初音ミク、NEUTRINO、Synthesizer V AI まで
歌声合成 (Singing Voice Synthesis) はヤマハ VOCALOID (2003) から、Crypton 初音ミク (2007.8.31) で爆発的に普及。2018-2020 年の Synthesizer V と NEUTRINO の AI 革命で品質が一段上がった。コンカテナティブ→DNN→ニューラルボコーダの技術変遷と文化的影響を、Yamaha・Crypton・Dreamtonics・SHACHI の一次ソースから整理します。
Web Speech APIの仕組みとブラウザ音声合成の歴史 ― DECtalkからニューラルTTSまで
ホーキング博士のDECtalk、Microsoftの SAPI、GoogleのWaveNet ― 音声合成技術40年の歴史をたどり、ブラウザ内蔵のWeb Speech APIの仕組み・ブラウザ差異・Chrome15秒バグの対策まで完全解説します。
音声コーデックの進化 ― PCMからMP3、Opus、そしてAIコーデックへ
CD品質の1411kbpsがなぜ3kbpsで再現できるのか。PCM→MP3→AAC→Opus→Lyra/EnCodecまで40年の音声圧縮技術の進化を、仕組み・ビットレート比較・特許事情とともに完全解説します。
平均律と純正律 — なぜピアノのCメジャーコードは「微妙にずれている」のか
ピアノでCメジャーコード(C-E-G)を弾くと、数学的に完璧な和音からわずかにずれた音が鳴ります。その原因は12音平均律の設計にあります。本記事では、純正律との周波数比較、うなり(ビート)の物理、音律の歴史的変遷を一次資料から整理します。