超言理論

特に益もない日記である

よりひめver2.0までのまとめ

ver 0.1

C#+TwitterAPIで高専の研究室PCで動いていた時代
形態素のみ1階マルコフによる自然言語生成
形態素データはDB化していなかった

ver 1.0

GAE/Java+Twitter4Jによる完全リニューアル
品詞考慮あり1階マルコフによる自然言語生成
形態素はGAEのデータストア上にDBとして保存。

ver 1.5

品詞考慮あり時間考慮あり2階マルコフによる自然言語生成
ユーザ情報データベースおよび関連語データベースも保持
ユーザ情報に準じたfollow/remove操作の実装
非公式RTへの非公式RT返し機能を実装
アイコン(by key)←超重要

ver 2.0(これからのこと)

実装予定リスト

自由起点の3階マルコフによる自然言語生成アルゴリズム

  • 時間情報
  • ユーザ情報
  • 話題/関連語情報
  • 品詞(文章構文)情報
  • 話題遷移情報

自然言語生成時の利用不可単語(ブラックリスト)のDB化
話題遷移情報DBの構築
関連語DBの構築
DBのメタ情報の軽量化
ユーザ評価時のRTおよびReply、Hashtag、外国語の点数評価方式の変更
自発RTおよび自発Replyの実装

先見

もっと面白くて人間っぽい発言アルゴリズムの開発
利用できない単語、禁止ワード(いわゆるURLや勝手なリプライ、メルアドなど)をDB化して保持する
「foo」と言われたら「bar」と返す発言アルゴリズム、それ用のDB
関連語情報をDB化してより精度の高い話題推定
自分の発言をRTしてくれているのなら好評、他人のRTばかりする人は悪評
自分から相手にReply、RTを行うようにする

楽しいアイディア出すお友達が欲しいです(ボッチ)


Copyright © 2012-2016 Masahiro MIZUKAMI All Rights Reserved.