このサンプルが中で何やってんのかざっと読んだ時のメモ。 LSTMの本実装部分は正直全然読み込めてない。 一旦ある程度自由に検証出来るようにいじれるぐらいまでの読み具合。 訓練データの分類 コード全体として、入力される訓練データは3種類ある。 train 学習に使われるデータ valid 誤差率を検証するためのデータ 誤差の数値はhistoryとして記録されている test 訓練とは独立して誤差検証に利用されるデータ 過学習が起きてないかどうかを検証するために使っているっぽい。 実訓練とは完全に独立して利用されている。 validのエラー率同様、testの誤差率もhistoryに記録される(後述) コードリーディング imdb.py データの準備、などを行っている。独自データを扱う際にはこの部分の拡張をするのが一番手軽。 prepare_data() 複数の訓練サンプルを受け取り、転置行列、