鈴木研 実データ倉庫

必要に応じて,少しづつデータをアップしていきます.

---------------------------------------------------------------------------------------------
■カオス性の判定に用いる定番データ

ニューヨークの麻疹患者数(N=432): measles.txt
コバルトの黒体放射線量(ガンマ線)(N=21437): cobalt.dat
ニューヨークの水疱瘡患者数(N=532): chickenpox.txt
日本語母音/a/(N=400): vowel.txt
日経平均株価(1998/1/6∼2001/3/16)の増減ΔPt(N=788): Dstock.txt

---------------------------------------------------------------------------------------------
■日経平均株式市場の株価データ(約200社分)

OWARI.mat
code.txt

OWARI.mat の1~3列目は日付けが記載されており,4列目以降に各株価の終値を記録してあります.
各株価に対する企業名は,code.txtを参照してください.4列目以降の株価名が,順番に記載されています.
また,それぞれのデータはMatlab上で
>> load OWARI
>> load code
とすることで読み込めます.(ただしデータをworkフォルダに入れておく)

(注1)
各株価で最大値・最小値が異なります(つまり変動の規模が異なる).
なので,各データを同時に予測に用いる場合,各株価に対して「標準化」する必要があるでしょう.
標準化とは,各変量(株価)において,「平均値を引いて,標準偏差で割る」という操作をします.
そうすることで全ての変量の平均値を0に,標準偏差を1に統一することができ,
変動の規模に左右されずに,変量間で比較が出来るようになります.
※ 偏差値の概念は,この標準化からきています.
分からなければ,いろいろ調べてみてください.

(注2)
予測において,価格x(t+1)を予測するよりも,変動幅Δx(t+1)を予測した方が実践的でしょう.
※ Δx(t+1)=x(t+1)-x(t)

以上,分からないことがあれば聞いてください.
---------------------------------------------------------------------------------------------
■外国間為替変動データ

HFDF1996.zip
HFDF1993.zip

詳しくはREADMEを読んで欲しいのですが,HFDF1996.zip では,
1996年の主要25銘柄の為替取引データが30分おきに記録記録されています.
例えば,USD_DEM(アメリカドルとドイツマルクの取引レート)を予測する場合,
他のどの取引データを使うかをGAで決めるなどの問題設定が考えられます.

いろいろデータがあると思いますが,まずは以下のデータだけで良いと思います.
READMEファイルに記載されている
AUD_USD.GMT 〜 USD_ZAR.GMT の25ファイル.
いずれもtext形式で記録されているのでmatlabで読み込めます.しかし,少し前処理が必要でしょう.

前処理とは,Maltabのloadコマンドでは読み込めない記号を"スペース"に置換したり,
全角文字(日本語など)があれば行の先頭に"%"を挿入してコメント文にするなどをして,
Matlabが読める形式に変換することです.


研究室のHomeに戻る