Power Point ed.

Spike Density Estimation

- Histogram Method

- Kernel Method

Share it with your friend

Tweet

Next: 補遺統計的推測 Up: スパイク時系列モデルの推定（暫定版） Previous: スパイク時系列モデルの推定（暫定版）目次索引

Subsections

スパイク密度推定

ヒストグラム密度推定 (PSTH)

電気神経生理学の動物実験では感覚刺激・行動・注意等と神経細胞の発火頻度（レート）の相関関係がよく調べられる．広く使われているレート推定の手法に，同一刺激下で行われた複数回の試行のスパイク時系列を適当な時間幅をもつ区間に分割し，その中でのイベント生成率（発火率）を棒グラフとして表すPeristimulus Time Histogram (PSTH)がある．PSTHの形状は分割する区間の時間幅に依存するにもかかわらず，区間幅は多くの場合研究者により恣意的に与えられている．

ここでは平均二乗誤差最小化の観点から最適区間幅を決定する簡便な公式を導出する．またレートが一般の定常確率過程の場合の最適区間幅の理論値のスケーリング則を導出し，転移点近傍での振る舞いを調べる．この理論の応用としてコスト関数を外挿することで，データからヒストグラム作成に必要な最小試行数を求めたり，背後のレート過程がなめらかな過程か否かを推定することができる．

スパイク時系列からのヒストグラムの作成

長さの時間依存Poisson過程のレート（強度過程）を $\lambda_{t}$ ( $t\in\lbrack0,\,T]$ )とする．区間 $[0,\,\Delta]$ の棒ヒストグラムの真の高さは

$\displaystyle \theta=\frac{1}{\Delta}\int_{0}^{\Delta}{\lambda_{t}dt}.$

(3.1)

で与えられる．この区間内の

回の試行数の総スパイク数

は次のPoisson分布で与えられる．

$\displaystyle p(k\vert n\theta\Delta)=\frac{\left( n\theta\Delta\right) ^{k}}{k!}% e^{-n\theta\Delta}%$

(3.2)

従って ${\theta}$ の不偏推定量である ${{\hat{\theta}}}=k/(n\Delta)$ がデータから求められるヒストグラムの高さである．

平均積分二乗誤差及びコスト関数の導入

スパイク時系列のレート $\lambda_{t}$ とヒストグラム $\hat{\lambda}_{t}$ の当てはまりの良さは平均積分二乗誤差(Mean Integrated Squared Error，MISE)で評価する．十分長い定常なスパイク時系列が与えられた場合MISEは次式で与えられる[Shimazaki and Shinomoto, 2007]．

MISE	$\displaystyle \equiv\frac{1}{T}\int_{0}^{T}E\,(\hat{\lambda}_{t}-\lambda _{t})^{2}\,dt$	(3.3)
	$\displaystyle =\left\langle {E\left[ {\frac{1}{\Delta}\int_{0}^{\Delta}{(\,{\lambda _{t}-}\hat{\theta}\,)^{2}dt}}\right] }\right\rangle$	(3.4)

ここで $\left\langle \,\cdot\,\right\rangle$ はレート過程 $\lambda_{t}$ の経路によるアンサンブル平均を意味し， $E_{\Lambda }\left[ \,\cdot\,\right]$ はレート $\lambda_{t}$ の区間幅 $\Delta$ 内での時間平均 ${\theta}$ がである場合のスパイク数の条件付き確率分布(式3.2)による平均操作を表す．

MISEを区間幅 $\Delta$ 内でのレートのゆらぎとスパイク生成のゆらぎに分割し，さらに区間幅 $\Delta$ の選択に依らない項を除いたコスト関数を導入することができる．

$\displaystyle C(\Delta)$	$\displaystyle \equiv\mathbf{MISE}-\left\langle {\left( {\lambda_{t}% -\langle\theta\rangle}\right) ^{2}}\right\rangle$
	$\displaystyle =\left\langle E\left[ (\hat{\theta}-\theta)^{2}\right] \right\ran... ...ft\langle {\left( \theta{-\langle\theta\rangle}\right) ^{2}% }\right\rangle%$	(3.5)

式3.5は $\theta$ の分散を第２項に含んでいるので，観測量のみからなる式に書き直し次式を得る．

$\displaystyle C\left( \Delta\right) =2\left\langle E\left[ (\hat{\theta}-\theta... ...le E\left[ (\hat{\theta}% {-\langle\theta\rangle})^{2}\right] \right\rangle%$

(3.6)

ヒストグラムの最適区間幅決定の手順を以下にまとめる[Shimazaki and Shinomoto, 2007]．

(i)

回の試行により得られたスパイク時系列について，その観測期間

を幅 $\Delta$ の

個のビンに区切る．

番目のビンに入るスパイクの数を数え， $k_{i}$ とする．

(ii)

スパイク数 $\{k_{i}\}$ の平均と分散を計算する

$\displaystyle \bar{k}\equiv\frac{1}{N}\sum_{i=1}^{N}k_{i}$ ，and $\displaystyle \displaystyle v\equiv\frac{1}{N}\sum_{i=1}^{N}(k_{i}-\bar{k})^{2}.$

(iii)

コスト関数を計算する

$\displaystyle C_{n}(\Delta)=\frac{2\bar{k}-v}{(n\Delta)^{2}}.$

(iv)

異なるビン幅 $\Delta$ に対してi から iii を繰り返し，コスト関数 $C_{n}(\Delta)$ の最小値を与える $\Delta^{\ast}$ を探す．

最適区間幅の理論値のスケーリング則と発散

式3.5の第一項にCramér-Raoの不等式を適用することで，コスト関数の下限が $\Lambda$ の統計量で与えられる．

$\displaystyle C\left( \Delta\right) \geq\frac{\left\langle \theta\right\rangle ... ...\left\langle {\left( \theta{-\langle\theta\rangle}\right) ^{2}}\right\rangle%$

(3.7)

右辺の極値を考えることで，レートが平均 $\mu$ ，相関関数 $\phi(t)$ なる定常確率過程について最適幅の解析解が求まる．

が十分大きい場合， $\phi(t)$ の原点付近での展開式を用いて式3.7右辺の極値を与える $\Delta$ を求める． $\phi(t)$ が原点でCusp型となるときは漸近値 $\phi^{\prime}(0+)$ を用いて最適幅は $\Delta^{*} \sim \sqrt{{{ - 3\mu} \mathord{\left/ {\vphantom {{ - 3\mu } {\ph... ...ight)n}}} \right. \kern-\nulldelimiterspace} {\phi '\left( {0 + } \right)n}}}$ で与えられる． $\phi(t)$ が原点でなめらかなときは対称性から $\phi^{\prime}(0)=0$ であり，最適幅は $\Delta^{*} \sim\left( {{{ - 6\mu} \mathord{\left/ {\vphantom {{ - 6\mu } {\p... ...{1 \mathord{\left/ {\vphantom {1 3}} \right. \kern-\nulldelimiterspace} 3}}$ となる．

が小さい転移点付近では $\langle(\theta-\langle\theta\rangle)^{2}\rangle\simeq\mu/n_{c}(1/\Delta)-u(1/\Delta)^{2}+O\left( (1/\Delta )^{3}\right)$ と展開する( $n_{c}$ ，は定数)．このとき臨界点は $n_{c}$ でありランダウの２次相転移の理論が適用できる． $n>n_{c}$ では最適幅の振る舞いは $\Delta^{\ast}\sim nn_{c}/(n-n_{c})$ で表される．

ヒストグラム作成に必要な最小試行回数の推定

回の試行数のスパイク統計 $\bar{k}$ ，を用いて，試行数が回の場合の最適幅を，外挿したコスト関数

$\displaystyle C_{m}\left( \Delta\right) =\left( \frac{1}{m}+\frac{1}{n}\right) \frac{\bar{k}}{n\Delta^{2}}-\frac{v}{(n\Delta)^{2}}$

(3.8)

から推定することができる．これによりデータから次の２つの数値を推定できる．(i) スケーリング指数: 最適幅の試行数に関するスケーリング指数を調べることができる．指数が

のときは背後のレートは微分不可能であり，

のときには微分の存在するなめらかな確率過程であると推定される．(ii) ヒストグラム作成に必要な最小試行回数: 転移点で発散やとびを示す指標を用いることで，転移点を与える $n_{c}$ を推定することができる．これにより実験者は少ない試行数からヒストグラム作成に最低限必要な試行数を予測することができる．

カーネル密度推定

神経科学の古典的な実験では同一環境下で実験を繰り返し行う．記録されたスパイク時系列は刺激・行動などの開始時刻でそろえて表示する．これをラスタープロットという．これらスパイク時系列を重ね合わせたスパイク時系列データ ${t}_{i}$ ( $i=1,2,\cdots,N$ ) を次のようにデルタ関数を用いて表す．

$\displaystyle x_{t}=\frac{1}{n}\sum_{i=1}^{n}{{\delta\left( {t-t}_{i}\right) }},$

(3.9)

ここで

は繰り返し試行の数である．カーネル密度推定はこのデータ時系列 $x_{t}$ とカーネル関数

の畳み込み積分で与えられる．

$\displaystyle \hat{\lambda}_{t}=\int x_{t-s}k{\left( {s}\right) }\,ds. %$

(3.10)

以下積分 $\int$ は $\int_{-\infty}^{\infty}$ を表す．カーネル関数は密度の条件， $\int k(s)\,ds=1$ , を満たし，中心がゼロで， $\int sk(s)\,ds=0$ ，かつ有限のバンド幅を有する， $w^{2}=\int s^{2}k(s)\,ds<\infty$ ．

一般に良く用いられるのはガウスカーネルである．

$\displaystyle k_{w}(s)=\frac{1}{\sqrt{2\pi}w}\exp{\left( -\frac{s^{2}}{2w^{2}}\right) }, %$

(3.11)

ここで

がバンド幅である．以下このバンド幅を最適化する公式を導く．

カーネルバンド幅最適化

最適カーネルバンド幅は以下のコスト関数を最小化するバンド幅により得ることができる[Shimazaki and Shinomoto, 2010]．

$\displaystyle \hat{C}_{n}\left( w\right) =\frac{1}{n^{2}}\sum_{i,j}\int{k}_{w}{... ...right) }\,dt-\frac{2}{n^{2}}% \sum_{i\neq j}k_{w}\left( t_{i}-t_{j}\right) ,$

ガウスカーネルの場合，以下の公式を最小化するバンド幅を探すことで最適なバンド幅である．

$\displaystyle 2\sqrt{\pi} n^2 \hat{C}_n(w) = \frac{N}{w}+\frac{2}{w}\sum_{i<j}\... ...) ^{2}}{4w^{2}}}-2\sqrt{2}e^{-\frac{\left( t_{i}-t_{j}\right) ^{2}}{2w^{2}}}\}.$

(3.12)

最適幅推定のコスト関数の導出　MISE

MISE $\displaystyle =\int E[(\lambda\left( \mathbf{t}\right) -\hat{\lambda}\left( \mathbf{t}\right) )^{2}]dt,$

からコスト関数を導入する．

$\displaystyle C_{n}\left( w\right)$	$\displaystyle =$ MISE $\displaystyle -\int\lambda\left( t\right) ^{2}\,d\mathbf{x}$
	$\displaystyle =\int E\hat{\lambda}\left( t\right) ^{2}\,dt-2\int\lambda\left( t\right) E\hat{\lambda}\left(t\right) dt.$	(3.13)

第二項は

$\displaystyle Ex\left(t\right) E\hat{\lambda}\left(t\right) =E[x\left(t\right)... ...left(t\right) )(\hat{\lambda }\left(t\right) -E\hat{\lambda}\left(t\right) )],$

(3.14)

さらに上式の第二項は

	$\displaystyle E[(x\left(t\right) -Ex\left(t\right) )(\hat{\lambda}\left(t\right) -E\hat{\lambda}\left(t\right) )]$
	$\displaystyle =\int\int k{\left(t-s\right)} E\left[(x\left(t\right) -Ex\left(t\right) )\left( x\left(s\right) -Ex\left(s\right) \right) \right] \,ds$
	$\displaystyle =\int\int k{\left(t-s\right) }\left[\delta\left(t-s\right) \frac{{1}}{n}Ex\left(s\right) \right] \,ds$
	$\displaystyle =\frac{{1}}{n}{k}_{w}(0)Ex\left(t\right) .$	(3.15)

これらをコスト関数に代入して

$\displaystyle C_{n}\left( w\right)$	$\displaystyle =\int E\hat{\lambda}\left( t\right) ^{2}\,dt-2\int\lambda\left( t\right) E\hat{\lambda}\left(t\right) dt.$
	$\displaystyle =\int E\hat{\lambda}\left(t\right) ^{2}\,dt -2\int\left[ E[x\lef... ...t{\lambda}\left(t\right) ]-\frac{{1}}{n}{k}_{w}({0})Es\left(t\right) \right] dt$

サンプルからの推定は以下の式で与えられる．

$\displaystyle \hat{C}_{n}\left( w\right)$	$\displaystyle =\int\hat{\lambda}\left( {x}\right) ^{2}\,{x}-2\int\left[ s\left... ...{\lambda}\left( {x}\right) -\frac{{1}}{n}{k}_{w}({0})x\left(t\right) \right] dt$
	$\displaystyle =\int\hat{\lambda}\left(t\right) ^{2}\,d{x-2}\left[ \sum_{i}\hat{\lambda}\left(t_{i}\right) -\frac{{1}}{n}{k}% _{w}({0})N\right]$
	$\displaystyle =\sum_{i,j}\int k\left(t-t_{i}\right) k\left(t-t_{j}\right) dt - 2\sum_{i\neq j}k\left(t_{i}-t_{j}\right)$

対称なカーネルのコスト関数はさらに簡略化できる．

$\displaystyle \psi_{w}\left( t_{i},t_{j}\right) = \int k\left(t-t_{i}\right) k\left(t-t_{j}\right) dt$

(3.16)

として

$\displaystyle \hat{C}_{n}\left( w\right)$	$\displaystyle =\sum_{i,j}\psi\left(t_{i},t_{j}\right) {-2}\sum_{i\neq j}k\left( t_{i}-t_{j}\right)$
	$\displaystyle =\sum_{i}\psi\left(t_{i},t_{i}\right) +2\sum_{i<j}% \psi\left( t_{i},t_{j}\right) -4\sum_{i<j}k\left(t_{i}-t_{j}\right)$
	$\displaystyle =\sum_{i}\psi\left(t_{i},t_{i}\right) +2\sum _{i<j}\left[ \psi\left(t_{i},t_{j}\right) -2k\left(t_{i}-t_{j}\right) \right]$

ガウスカーネルの場合，

$\displaystyle \psi_{w}\left( t_{i},t_{j}\right) = \frac{1}{\sqrt{\pi}2w}% e^{-\frac{(t_{i}-t_{j})^{2}}{4w^{2}}}.%$

(3.17)

より前述の公式が得られる．

Next: 補遺統計的推測 Up: スパイク時系列モデルの推定（暫定版） Previous: スパイク時系列モデルの推定（暫定版）目次索引