原理介绍
fasttext是facebook开源的一个词向量与文本分类工具,在2016年开源,典型应用场景是“带监督的文本分类问题”。提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
fastText的架构和word2vec中的CBOW的架构类似,因为它们的作者都是Facebook的科学家Tomas Mikolov,而且确实fastText也算是words2vec所衍生出来的。
安装
重点说问题,上代码。
代码示例
训练数据和测试数据来自网盘:
https://pan.baidu.com/s/1jH7wyOY
https://pan.baidu.com/s/1slGlPgx
参考链接:
https://blog.csdn.net/john_bh/article/details/79268850
https://blog.csdn.net/grafx/article/details/78697881
https://blog.csdn.net/yick_liao/article/details/62222153
https://blog.csdn.net/sinat_26917383/article/details/54850933
https://blog.csdn.net/lxg0807/article/details/52960072
文章来源: 分类算法(二)―― FastText