2021/11/13:本文抽出+ノイズ除去済の「学問ノススメ」 ← 必要な方はこちらをクリック はじめに 前回の記事では「TF-IDF」によるワードクラウド描画にチャレンジしましたが、思い通りにならなかった点(以下)がありましたので、再度チャレンジしました。 scikit-learnの「TfidfVectorizer」というライブラリがうまく使えなかった… nlplot(自然言語可視化・分析ライブラリ)もフルで試せなかった 実力不足のため、苦労しましたが、なんとか任意のテキストデータで「Word Cloud」、「nlplotによる各種可視化」、「(TfidfVectorizer)によるTF-IDF計算」、「TF-IDFによるWord Cloud」が実行できるようになったたので、備忘も兼ね、記事にしたものです。 実行条件など ・Google colabで実行 ・青空文庫の「学問ノススメ」で実