モラズbot の作り方
こちらあらBアドベントカレンダー 22日目の記事である。
モラズbot とは
福岡の妙齢の女モラズこと、謎のツイッタラーモラズのbot である(詳しいことは本人をフォローしてリプで聞いてみてください)
モラズbot は数年前(記憶薄い)に一度作って2019年3月くらいまでなんとなく運用していた。なぜ2019年3月で停まっているかというと運用していたクラウドにログインできなくなり泣く泣くインスタンスを削除したためである(杜撰な管理体制)
3月まで運用していた中身はモラズの過去ツイートにマルコフ連鎖を使ってなんとなくそれっぽい文章を確率的に生成するという Twitter の人気bot のしゅうまいくんとかで使われているものと同じ手法で作った。ググれば解説が出てくるので参考まで。モラズの過去ツイートの利用についてはモラズ本人に快諾をいただいている(モラズのツイートを広めよ頒布せよと)。
モラズbot のツイートをいくつか引用してみるとモラズ感(?)がそれなりに出ていることが確かめられる。
尚、文章が長くなると、カッコがでたらめになったり、文意がめちゃくちゃになったりする模様。
なんにせよモラズのツイートを雑に繋げるだけでそれなりに面白いものである。
モラズbot Ver.2
で、今年の秋頃モラズbot Ver.2 をなんとなく作っていたので、そのやり場のない供養先をこちらにと考えて、本記事を書こうと思った次第である(前振り長いなオイ)
モラズbot Ver.2 はどこが 2 なのかというと中身のアルゴリズムを深層学習(RNN)にしてモラズの過去ツイートを学習させてみたという点である。
結果を先にお見せすると次のような感じである。「わし」「妙齢」「ちび」というワードからツイート30個ずつさせてみた結果である。
結果をみてまず思うのが、そんなにマルコフ連鎖の結果と変わらなくない???わずかな差分としてはカッコが閉じられている場合が気持ち増えた点、長文でも若干文意が通るようになった点、モラズbot Ver.1に比べて若干でたらめ感が少ない感じがしないでもないくらいである(残念)
理由としては、上記 Google Colaboratory で2–3時間学習させたモラズモデルの結果である。そのため、まだ十分に学習が進んでいないモデルであるという点も要因の一つとしては考えられる。
ちなみに学習に用いたデータを下記に挙げておく。
- モラズの2023年12月くらいまでの全過去ツイートデータ:こちら
君だけのモラズbot を作ろう
モラズbot Ver.2 をリリースに踏み切れていない理由として、モラズbot Ver.1 との違いがそこまで感じられないという点がある。
そこで【ゆる募】君だけのモラズbot を作って良い感じのモラズbot できたら教えてほしい(丸投げ)
試行錯誤できそうな点としては例えば下記とか考えられる。
- 層数を1→2とか変えてみる
- 中間のノードをいろんな値に変えてみる
- 最適化アルゴリズムやハイパーパラメータを変更してみる
- エポック数を増やしてみる
またもっと上手くモラズbot が作れる/作ったという情報があれば嬉しいところである。
みなさま、年末年始の過ごし方として君だけの最強のモラズbot 作りなどいかがでしょうか(提案)