技術 Juliaでの文字列操作 – Pythonと比較 – はじめに 次の記事に触発されて書きました。いろんな言語での文字列操作の比較(VBA, Java, C#, PHP, Python, JavaScript)(Qiita) Juliaが含まれていません! ならばということで、以下、Python... 2022.07.27 技術
技術 Juliaでk-mean法(3) TF-IDF はじめに これまで、BOW形式のベクトルを使ってk-meansを試してきました。Juliaでk-mean法(1) Bag of Words / ニュース記事Juliaでk-mean法(2) 距離関数について しかし、BOW形式では、クラスタ... 2022.07.26 技術
技術 Juliaでk-mean法(2) 距離関数について はじめに 前回、BOW形式での単語ベクトルを使ってk-means法でクラスタリングしたところ、散々だったという報告をしました。 続いて、TF-IDFでの単語ベクトルで実験を行いました。実はこれでもあまり精度がよくないものの、BOWの時ほど悪... 2022.07.24 技術
技術 Juliaでk-mean法(1) Bag of Words / ニュース記事 はじめに Juliaでk-means法でのクラスタリングを行ってみます。 Bag of Wordsとは、文書中に出現する単語数をその文書の特徴とする方法で、単語の出現順序は考慮しません。具体的には、単語を各要素のラベルとして、その出現数の列... 2022.07.13 技術
技術 Juliaでジップの法則を確認(2) ニュース記事の場合 はじめに 以前の記事で、小説データを使ってジップの法則を確認しました。しかし、ジップの法則とはかなり乖離していることがわかりました。 それが、小説を題材にしたことによるものなのかどうかを確認するために、他のデータを使うべく、前回の記事におい... 2022.07.04 技術