読者です 読者をやめる 読者になる 読者になる

未踏作業日誌――余計なもの作るよ!

未踏の作業日誌的なものを書きましょうということで書くことにしました.余計なことばっかりしています.

修論は「エレキギターの入力信号から押弦位置と弾弦コードを推定するシステム」に決まりました

いや,なんかあとちょっとで出来るんじゃないかなって思ったから.この時期から修論変えるとかだいぶ極まってるけど.

 

とりあえず,FFTにかけるサンプル数は16384で,実際に用いるサンプル数は1024辺りに決まりました.足りないサンプル数はゼロで詰めて周波数分解能を無理やりにでも稼ぐ感じです.

というのも,DFTについて色々と考えていたのですが,GPUをフル活用しても実質的に20FPS出るか出ないかってレベルになりそうだったので,これはちょっとヤバイなと.せめて最悪でも10ミリ秒辺りに収まってくれれば僕も安心したのですがそうは問屋がおろさないそうです.

という訳で,メインで利用するのは相変わらずFFTって感じです.幸いなことに,ゼロ詰めして周波数分解能を稼いだところ,80Hz辺りのスペクトルが取れそうな予感がしました.これならばなんとか行けるでしょうと.

ただ,FFTで取れたスペクトルをウェーブレット変換するかどうか迷ってます.必要ないと言われれば必要ないのかもしれませんが,低周波周りになると山の形が非常に大きいので極めてやりにくいです.ウェーブレット変換をかけると,山なりの部分でもちゃんと成分が立っていればとても綺麗に信号が取れます.

ただ,この判断は僕がやりやすいかやりにくいかってだけの話なのでもにょる.

ウェーブレットでスペクトルを取ったら,基本周波数からの倍音を順番に殺していく感じです.オクターブ奏法などもありますが,倍音は減衰しやすいという過程のもと3倍音以降から殺されやすいファクターでも作ろうかな.

そんなことを考えながら修論進めようとしています.ギターの押弦位置を推定してから和音を推定する形になるので,他の手法と比べると確度が少し高いんじゃないかなぁと思います.もちろん,ギターに限定しての話ですが.

後は,音量のダイナミックレンジが広いとうまく検知できない気がするので困りました.あまりテクニカルな奏法を再現するのは課題が大きいかなと.僕ぐらい下手だとお行儀がいいので,簡単にMIDIインターフェースの代わりになりそうなのですが.

 

そういうわけで,今自宅にいるわけですね.そろそろ研究室に戻ろうと思います.帰りに来来亭でラーメン食べて,コンビニで牛乳買ってコーヒー飲んで,次の学会のポスターを作りながら息抜きに修論.これで本日の作業は終わりです.バイバイ.