人工無脳ユウヤ - 42日目(嘘ニュースをどうするかー…)

ただいま調整中…なんだけどどうもうまくいかない。
ま、まあすぐにうまくいったら、みんなも苦労してないよね…


とりあえず、今の黒鈴の嘘ニュースが、かなり微妙になってきたので、保存する形式を変えようと思っています。
マルコフ連鎖のデータ保存の仕方はいろいろあると思うけど、今思いついてるのは三パターン。
「私、足の速さなら自信あるよ。今度、渋谷で開かれる大会に出るんだ!」
「おはよう!今日もいい朝だね。とってもいい気持だー!」
まあ例えばこの二つの文章で考えてみる。


1.長文ぶった切り
句読点など一小節で切るのが一般的かな。
「私、
足の速さなら自信あるよ。
今度、
渋谷で開かれる大会に出るんだ!」
「おはよう!
今日もいい朝だね。
とってもいい気持だー!」
あとは切ったものをつなげるだけ。
「おはよう!渋谷で開かれる大会に出るんだ!とってもいい気持だー!」
一小節で切るので、意味不明な言葉ができにくい。
カミナギとかはこのタイプ(+辞書とか)らしいけど…


2.5W1H
いつ、どこで、だれが、なにを、なぜ、どうした、の形で切って使う。
いつ:今度,今日
どこで:渋谷
だれが:私
なにを:大会に出るんだ!
なぜ:(無し)
どうした:(無し)
切ったものを使う。
「今日、私が渋谷で大会に出るんだ!」
うまくやれば意味不明な言葉ができにくい。
その代り感嘆文などの学習は難しいかも。
伺か。は大体このタイプのはず。


3.単語ぶつ切り
単語を分解してつなげる。マルコフ連鎖の基本型
「おはよう!今日もいい朝だね。今度、足の速さなら自信あるよ。とってもいい気持だー!」
たぶんこんな感じになる。
今の黒鈴がこのタイプ。


で、3.で困ってるので2.の伺か。タイプにしてみようかと思ってるんですが…なかなかむずかしくって…うぅ…
KAKASIだと限界があるのかも。品詞辞典ないし。
MeCabというのに乗り換えるかもしれません。