优捷信达科技团队博客
woboy | 15 八月, 2012 14:31
文章作者:优捷信达研究员 Annie Qi
在上一篇题为《基于语义特征的网络舆情正负面监测》的文章中,本人结合在优捷信达科技的研究工作为您详细介绍了情感分析中与舆情正负面分析密切相关的“极性分类”。本文将延续这一主题,详细描述具体的正负面辨别方式,并分析其优缺点,以帮助您了解市场上流行的“舆情监测”、“口碑监测”、“消费者调研”等互联网海量信息处理系统的工作原理。
网络评价和信息的正负面识别,需要通过计算机提取具有情感倾向的相关词语,这叫做“特征提取”(feature extraction)。简单来说,计算机判别正负面,就是通过先提取句子中的正负面词语,进而分析这些词语的分布来判断文章的正负面倾向。
基于优捷信达科技的研究调查,目前业内主要特征提取技术有基于语义和词的出现及频率的两种模式。本文将重点介绍后一种模式,并讨论这种模式的优缺点。 (查看全文)
administrator | 07 八月, 2012 08:24
文章作者:优捷信达研究员 Annie Qi
在上一篇《网络舆情正负面信息识别的方法》文章中,结合本人在优捷信达科技研究工作,为您详细介绍情感分析中与舆情正负面密切相关的“极性分类”。本文将延续上一篇文章的主题,详细描述具体的正负面辨别方式,并分析优缺点,帮助您了解市场上流行“舆情监测”,”口碑监测“,“消费者调研”等信息处理系统的工作原理。
首先回顾上一章的介绍,网络评价和信息的正负面识别,包括优捷信达科技在内的技术领先型舆情口碑监测公司,都是通过极性分类(polarity classification)这一步骤来实现,极性分类首先将具有情感倾向的相关词语提取出来,叫做“特征提取”(feature extraction)。简单来说,如何通过计算机判别正负面,就是通过提取句子中的正负面词语,通过词语的正负面来判断文章的正负面倾向。 (查看全文)