ソリューション

solutions

自然言語処理

文章を元にカテゴリの分類を行います。
入力する情報は日本語にも対応しております。
例えばデータ入力時の支援を行うとともに、入力ミスの検知にも使用可能です。

技術要素

【対象業務】
  • データ入力サービス全般
【システム構成】
  • Webサーバ:指定無し
  • プラットフォーム:指定無し(GPU搭載が望ましい)
  • OS:指定無し
  • DB:Microsoft SQL Server(他のDBでも可能)
【開発ツール】
  • Python
  • Mecab
  • fastText

詳細

(1) 形態素解析

Mecabを利用して、日本語の形態素解析を行い単語を抽出します。
助詞、副詞等、分類に必要のない品詞を取り除きます。

(2) 出現頻度による絞込み

カテゴリごとに抽出された単語の出現頻度を調べ、頻度の高い単語を対象とします。
絞込みにはTF-IDFを使用します。

(3) カテゴリ学習

fastTextを使用してカテゴリ分類を学習します。


ソリューション一覧に戻る