技術 Juliaで日本語Word2vecを使ってみた(2) wikipediaデータ はじめに 以前の記事「Juliaで日本語Word2vecを使ってみた」でWord2vec(FastText)を使ってみました。FastTextには2つのデータが用意されています。二つの違いは学習元のテキストです。Common CrawlWi... 2022.08.09 技術
技術 Juliaで日本語Word2vecを使ってみた はじめに k-meansで、BOW、Tf-IDFをやってみましたが、そもそも文書数が少ないので、その中での情報だけを使って文書の特徴を出そうとするのには限界がありました。 そこで、事前に大量の文書を用いて計算されたWord2vecを用いるこ... 2022.08.02 技術