|
这个软件含有几大块功能,他们的原理各不相同:
1,分词功能:使用隐马尔可夫过程相关的算法进行分词
2,情感分析:先切分句子,然后根据情感词库进行匹配,得到每个句子的情感得分,然后算出来整个内容的总得分
3,关键词抽取:根据text rank算法,算出来整篇内容的比较重要的关键词。还有其他一些算法,可以参看这些Jupyter Notebook: https://www.gooseeker.com/doc/thread-18414-1-4.html
4,文本分类:先设置类别和包含的关键词,对文本进行匹配和分类
|
|