ver 0.1
C#+TwitterAPIで高専の研究室PCで動いていた時代
形態素のみ1階マルコフによる自然言語生成
形態素データはDB化していなかった
ver 1.0
GAE/Java+Twitter4Jによる完全リニューアル
品詞考慮あり1階マルコフによる自然言語生成
形態素はGAEのデータストア上にDBとして保存。
ver 1.5
品詞考慮あり時間考慮あり2階マルコフによる自然言語生成
ユーザ情報データベースおよび関連語データベースも保持
ユーザ情報に準じたfollow/remove操作の実装
非公式RTへの非公式RT返し機能を実装
アイコン(by key)←超重要
ver 2.0(これからのこと)
実装予定リスト
自由起点の3階マルコフによる自然言語生成アルゴリズムの
- 時間情報
- ユーザ情報
- 話題/関連語情報
- 品詞(文章構文)情報
- 話題遷移情報
自然言語生成時の利用不可単語(ブラックリスト)のDB化
話題遷移情報DBの構築
関連語DBの構築
DBのメタ情報の軽量化
ユーザ評価時のRTおよびReply、Hashtag、外国語の点数評価方式の変更
自発RTおよび自発Replyの実装
先見
もっと面白くて人間っぽい発言アルゴリズムの開発
利用できない単語、禁止ワード(いわゆるURLや勝手なリプライ、メルアドなど)をDB化して保持する
「foo」と言われたら「bar」と返す発言アルゴリズム、それ用のDB
関連語情報をDB化してより精度の高い話題推定
自分の発言をRTしてくれているのなら好評、他人のRTばかりする人は悪評
自分から相手にReply、RTを行うようにする
楽しいアイディア出すお友達が欲しいです(ボッチ)