在圖上可以看到,Chris Dyer 有一條非常明顯的上升曲線。其他過去五年來一直保持增長的作者:Preslav Nakov、Alessandro Moschitti、Yoshua Bengio 和 Anders Søgaard。
最后,我也決定做一張關(guān)于主題建模(topic modeling)的論文的圖。首先,我提取了所有論文的純文本,將其表征化和小寫化,并移除了 stopword。接著,我使用 LDA 對其進行了處理以發(fā)現(xiàn) 10 個隱主題(latent topic)。然后我使用 t-SNE 可視化了最靠前的作者,并基于它們的隱主題相似度將其做成了一張二維圖。最后,我手動為每一個聚類標注了一個詞(根據(jù) LDA 找到的排名最高的術(shù)語)。下面是前 50 位作者的可視化圖: