モバゲーで配信されているゲーム「アイドルマスターシンデレラガールズ」のキャラ台詞を基に
作成したdoc2vecモデルです。
タグの付与としてキャラクター名と台詞idをいれています。
パラメータなどの詳細はプログラムをご確認ください。
分散表現を用いて台詞がどのキャラに分類されるのかや
対話システムの一部として組み込んでみるとどうなるのか試してみてください。
Python 3.5.1
mecab-python3 (0.7)
gensim (3.4.0)
パラメータへの理解が浅いため分散表現の学習が上手くできていない可能性があります。
分散表現が作成できたのでまずは文書分類問題として入力した台詞が
どのキャラに分類されるのかを調べていく