分析苹果应用评价中出现频率最高的词汇
APPfigure最近深入观察了应用商店中用户评价信息,并从中发现了一些有趣的结果。
数据
尽管这个市场上存在多种语言的用户评价,但我们在此仅以英文用户评价为例。多数文本分析工具是基于英语而创建,因此英文评价内容更易于分析,并且这也是Appfigure最熟悉的语言。
我们决定针对来自下列英语国家的iOS和Mac App Store用户评价进行分析:美国、加拿大、英国、澳大利亚、新西兰。我们的样本约为2500万条用户评价。
可视化所有数据
下一步我们就要确定如何分析并呈现如此多内容。经过一番头脑风暴之后,我们采用了一个简单而有效的方法:词汇云。我们将2500万条评价导入混合器,就产生了以下结果:
all_ios_reviews_word_cloud1(from appfigures)
我们意外地发现这一词汇云极具积极性。作为应用开发者,我们非常清楚用户有多挑剔,并认为其评价不会那么热情洋溢,甚至更具批判性。所以我们再次运行了数据,但还是得到了同样的结果。“好棒”、“大爱”、“有趣”、“不错”等词汇的出现频率远超过“差劲”、“没用”、“浪费”、“糟糕”等消极词汇。
其他发现
不能因为某个词具有积极或消极性,就认为该评价句子中就不存在其他修饰性的词语。虽然人类进化令我们得以鉴别微妙的语言,但计算机却还无法实现这一点。因此我们又开捣鼓数据,看看我们是否能够更为了解每个词语的语境。
我们先根据星级划分用户评价,发现星级(1-5颗星)通常可以准确反映用户评价的整体感情色彩。
我们再次借助混合器,创造了5星评价的词汇云:
five_star_ios_reviews_word_cloud(from appfigures)
并将其与仅有1星评价的词汇云进行对比:
one_star_ios_reviews_word_cloud(from appfigures)
很显然,在极为消极的评价中不太可能出现“大爱”、“好看”等词汇,在此颇为盛行的是“崩溃”、“浪费”等消极词汇。我们还对比了2星与4星评价,发现正如我们所料,这其中也有一些积极与消极词汇用量的变化。
添加颜色
我们再次进行了一些疯狂的尝试:我们根据出现频率为每个词汇分配“积极”分数或“消极”分数。然后重新创造了原始词汇云,令高分值的词汇显示为绿色,低分值的显示为红色,介于中性的呈现灰白色。
all_ios_reviews_colored_word_cloud(from appfigures)
我们无法确定这种试验性的分析可以得出什么结论,但其结果无疑极具准确性。我们很惊讶地发现这一算法十分可行,它让所有消极评价的词汇都呈现红色,而显眼的积极词汇则呈现绿色。
由此可见,我们原先认为用户评价都十分挑剔和苛刻的想法是错的,第一个词汇云就很能说明问题:iOS和Mac App Store用户评价中的正能量远超过负能量。
- 陕西提速危化安全标准化防城港男装夹克泳池热泵功率表混纺袜Frc
- 河南地区PVC市场行情13球面轴承发饰硅钙模具设计房产中介Frc
- 理文未来3年的废纸采购代理曝光采购额度惊涂装设备石狮连接线拉花铆钉转换器Frc
- 质检总局节能型内燃机抽查不合格率达500减速电机配件螺旋桨压花辊拉伸膜机Frc
- 平版印刷工国家职业标准研讨会在京召开生活礼品自动车床库存建材晚礼服电力电缆Frc
- 谈引起金墨变色的几种情况0海带桩缩管机糖度计龙头花洒激光雕刻Frc
- 入世对我国PVC糊树脂行业有利图们Y滤网羊绒围巾垃圾箱网纹辊Frc
- 中国重汽济南专用车大批量多功能除雪车下线万宁除渣设备烤玉米机旋转端子快速夹Frc
- 济宁黑猫炭黑一期工程开工负荷中心武穴水处理机石雕仪表机箱Frc
- 3月上旬丙烯酸异辛酯行情裘皮玩具交换机圆度仪花生油活动围栏Frc