windowsでmecab-ipadic-neologdの導入に行き詰った.
スクレイピングしたツイートデータがあるので内容について探ってみようと形態素解析に手を出してみましたが,うまくいきませんでした....
筆者の確認不足で導入時に不備がありました...
デフォルトのshift-jisではなくUTF-8でインストールすることで無事動作しました.
助言頂いたHYT MachineWorks様ありがとうございました.
windows上でMongoDBやpythonなど開発環境を作っていたので,MeCabもwin上で動かしたいと思いこちら
hytmachineworks.hatenablog.com
を参考にさせていただきインストールしました.
一応文の分かち書きは出来るのですが,ツイート特有の口語や流行言葉などがあり標準辞書のipadicではうまく分かち書きがされていない場面も多々ありました.
解決策としてmecab-ipadic-neologdを使えば良くなるらしいので,インストールしよ...と思いきやwinには対応してないとのこと.
winでも抜け道としてlinuxからmecab-ipadic-neologdをインストール→ディレクトリごとwinへコピーすれば使えないこともないそうなのでやってみました.
結果,そんなファイルないよ!と怒られて使えない状況から抜け出せない.
ディレクトリをmecabのdic内にコピーして,辞書参照先であるファイルmecabrcをipadicからmecab-ipadic-neologdに書き換えたのにダメでした.
もちろんlinux上ではmecab-ipadic-neologdとipadic両方の辞書で使い分けが出来るのですが,win上では使えないです.
パスは間違っていないし考えられるとしたら,linuxでインストールしてコンパイルしたものを単純にwinにもってこれない何かがあるのかなぁとか...
生半可の知識(といってもネットの受け譲り)ではだめですね.勉強しないと...
ブログ始めました
タイトル通り、ブログ始めました。
自分の中でクリエイティブなことをしたいという想いが大きな理由です。
ブログって手軽だし、自分もブログから情報を得ることが多いので、自分の発信した記事が誰かの役に立てばいいかなって考えてます。
後は文章構成力をつけたいということで、、、
ジャンルは絞らず、書きたいことを書きなぐる使い方をして行こうと考えてます。
需要はないと思いますが、初回なのでどんな人が書いているか紹介します。
一浪(ひとなみ)で某国立大学へ進学し、現在大学院修士2年
ちゃんと研究している人には申し訳ないくらい肩書だけです。もはやニートです。
来年4月からSEとして勤務予定
一応就活は納得のいく就活!をしたつもりです。
研究内容については多く書けませんが、C言語やpythonを使ってコーディングしてます。
興味のある学習分野は統計、通信ネットワーク。
ミーハー気質で、何でも挑戦してみたくなるけど長続きしない、深い所まで到達しない人です。
ミラーレスカメラで写真撮影、革製品のケアをしているときが落ち着きます。
こんな感じです。
自分の好きな事を好きなペースで書いていきたいと思います。
どうぞよろしくお願いします。