・概念選択『概念集合Kに属する全ての概念が付与されている文書集合Dの部分文書集合をD/Kと表す。あるひとつの概念kを示すことが明らかな場合はD/{k}のかわりにD/kと表記する。』 ・概念比率『概念集合Kに属する全ての概念が付与された文書集合Dの文書の比率をf(D,K)と表す。すなわち、f(D,K)=|D/K|/|D|である。Kが一つの概念を表すときは、概念集合{k}を用いてf(D,{k})と表記する代わりにf(D,k)と記述する。さらに、文脈上Dが明らかな場合は簡略化してf(k)ときじゅつする。』
・条件付き概念比率 『文書集合Dにおいて概念集合K2の概念が付与されている文書のうち、概念集合K1の概念も付与されている文書の比率をf(D,K1|K2)と記述する。Dが文脈上明らかな場合は簡略化してf(K1|K2)と表記する。』
・概念比率分布 『文書集合Dのうち概念集合Kに属する概念 x が付与されている文書の比率をFk(D,x)と表す。』
・条件付き概念比率分布 『Fk(D,x|K')は、文書集合Dの中で概念集合K'の概念が付与されている文書のうち、概念ノードKの下位概念 x が付与されている文書の割合である。』
・平均概念比率 『平均概念比率をa(D,k | n)と記述する。これは、概念階層構造における内部ノードnの直下にあるすべてのノードk'についてのf(D,k | k')の平均値である』
・平均概念分布 『階層構造における内部ノードnの下位ノードである任意のxについて、平均概念分布An(D,x | n)は、階層構造における内部ノードn'の各子ノードを含む文書数でxを含む文書数を割った比率の平均をとったものである。』
・サポート 全文書集合における頻出概念集合AとB両方の概念を含む文書の割合。
・確信度 Aの全ての概念を含む文書集合の中で、Bの全ての概念を含む文書の部分集合が占める割合
|
|