研究タイトル クラスター分析
各採択課題の課題名(タイトル)を多言語Embeddingモデル(paraphrase-multilingual-mpnet-base-v2)で意味ベクトルに変換し、UMAP で2次元に配置しています。意味の近いタイトルどうしが近くに集まり、密度ベースの HDBSCAN が自動でグループ分けします(どのまとまりにも入らない課題は「その他」)。各クラスターの名前は、そのグループに特徴的な語から自動生成しています。
各採択課題の課題名(タイトル)を多言語Embeddingモデル(paraphrase-multilingual-mpnet-base-v2)で意味ベクトルに変換し、UMAP で2次元に配置しています。意味の近いタイトルどうしが近くに集まり、密度ベースの HDBSCAN が自動でグループ分けします(どのまとまりにも入らない課題は「その他」)。各クラスターの名前は、そのグループに特徴的な語から自動生成しています。