CNN for Sentence Classification 読んでみた

はおー

ちゃっす、てつです！！！最近はV tuberをみています。ヒメヒナガチ推しでございます。毎日ヒメヒナの動画を見ながら寝ています。

今回も、先輩からお勧めいただいた論文を読んだので、それについて書いていこうと思います。

CNN for Sentence Classification

はい、いつも通りの例のやつです。

CNNと事前学習を用いたベクトル表現で文のクラス分類をしてみようって話

シンプルなモデルに少しのハイパーパラメータ調整で他の洗礼されたモデルとおんなじくらいの結果を出せた

google News をデータに事前学習したword2vecのパラメータを動かさないベクトル表現(static)とパラメータを動かす(non-static)を使う

conv -> max-over-pooling -> fully conect -> softmax のシンプルなネットワーク

初期値ランダム、static、non-static、two channelの四つのモデルでおんなじデータセットを回した。 →　ランダムが一番低いから他のは良いモデル！！！他のモデルと大差のない結果を出せた。

word2vecにない単語の初期値をランダムにしているが、その範囲を事前学習の分散できめることで精度を上げることができる。 google newsからwikipediaにかえるとよくなったけど、これは正しいかは分らん

他のCNNを使ったNLPの論文をよみたいなあ

今回の論文はページ数も少なく、アーキテクチャも簡単なのでわかりやすいものでした！！！次はRNNかなああ

実装した記事も書きました、よければ見てね