Image by Willi Heidelbach from Pixabay

自然语言处理

几种常用的语义相似度算法和模型

Posted by Yvan on September 19, 2021

整理一下工作学习期间用到的方法。

一 算法

  1. TF-IDF Term Frequency - Inverse Document Frequency

  2. Jaccard

  3. 词向量 Term Vector / Vector Space

二 词向量模型

  1. Google universal-sentence-encoder-multilingual

  2. spaCy

  3. sBert Multilingual-Models
    *(the original model only supports English, Multilingual-Models supports German)