solutions
文章を元にカテゴリの分類を行います。
入力する情報は日本語にも対応しております。
例えばデータ入力時の支援を行うとともに、入力ミスの検知にも使用可能です。
Mecabを利用して、日本語の形態素解析を行い単語を抽出します。
助詞、副詞等、分類に必要のない品詞を取り除きます。
カテゴリごとに抽出された単語の出現頻度を調べ、頻度の高い単語を対象とします。
絞込みにはTF-IDFを使用します。
fastTextを使用してカテゴリ分類を学習します。