対象バージョン
1.12.0 以降
クラスタリングについて
クラスタリングは、ラベル(教師データ)がないデータを「似た構造・特徴」をもとにグループ化(クラスタ)する手法です。本機能では、ベクトルファイルを用いることでクラスタを行っています。ベクトルファイルの仕様はXXXXを参照してください。
クラスタリング方法
EISS Tools を開き、左ペインの①「クラスタリング」をクリックします。

②キーワードファイルの選択をクリックし、キーワードファイルを選択します。このキーワードファイルは、分析済みデータから任意のルールに沿った文字列を抽出する方法 で作成したcsvファイルを用いることができます。または、それに準じたファイルを用いることができます。仕様はXXXを参照してください。

キーワードファイルを選択して、読み込みが完了すると、読込んだ内容が表に表示されます。

表は図のようにA、B、Cとあり、それぞれ、キーワード生成のもとになったファイル、キーワード、クラスタ番号となっています。クラスタリング処理が完了すると、同一クラスごとにクラスタ番号列に番号が割り振られます。

キーワードファイルが読込めたら、③「クラスタリング実行」をクリックします。

設定ダイアログが表示されるので、④「参照」をクリックしベクターファイルを指定します。また、分類する数(クラスター数)を⑤にて指定し、⑥「実行」をクリックします。

クラスター数は、2以上で、キーワードの種類以下である必要があります。1やキーワードの数であればクラスタリングする必要が無いので処理できないようにしています。

処理が開始されると、ベクターファイルの読み込み、クラスタリングの計算を実施します。ベクターファイルのファイルサイズが大きいと読み込みに時間を要します。また、気ワード数が多いとクラスタリングの計算に時間を要します。


処理が完了すると図の様な表示となります。同一クラスごとにクラスタ番号列に番号が割り振られます。

処理結果はファイルに出力することができます。⑦「ファイルへ出力」をクリックし、出力したいファイルを選択します。
図中Dの「CSVファイルへの出力」では、表示中の表をそのまま出力します。Eの「スクリプトファイルへの出力」では、キーワードによってリージョンを作成し、クラスタ番号ごとにグループ化するスクリプトファイルを出力します。これは、EISSで利用することができます。Fの「グループ・リージョン作成用ファイルへの出力」もEと同様にリージョン・グループを作成するファイルを出力します。これは、EISSToolsの「データ編集」の「グループ・リージョンの作成」で利用することができます。

以上