搞外贸独立站运营的人,相信大家都接触过Google Trend。
它能够分析产品关键词的偏离度、产品本地化、区域化的热度和上升/下降趋势。
但是,很多时候,我们在搜索产品的时候,看到的产品趋势,都是没有任何周期性的波动,就像没有解调之前无线电的杂波一样。
怎么办?
今天给大家介绍SPSS数据分析——线性回归分析,在复杂产品趋势中的应用。
操作步骤如下:
1. 获取SPSS数据分析软件包
微信扫描并关注——TradeSNS公共号,回复“SPSS数据分析”,将得到破解版,SPSS数据分析软件包(内附激活码)
2. SPSS安装与激活
SPSS的安装时,前几步与其他软件安装流程一样,大家点击“确定”或者“下一步”就OK。
当弹出“产品授权”界面时,我们仍然点击“下一步”,
这个时候,会出现“输入代码”,大家将软件包里的“SPSS20无期限授权号”里面的激活码,复制粘贴过来,然后点击“下一步”,完成激活。
3. 数据采集
回到Google Trend界面,输入自己要查询的产品关键字,选择查询的时间序列,点击右上方下载按钮,保存本地。
4. 数据清洗与数据挖掘
我们主要用产品趋势数据,分析产品搜索量随着时间变化的响应趋势(时域响应),时间的间隔为1个月,不存在缺失项,所以,就产品趋势的贸易数据而言,数据清洗和挖掘可以跳过。
大家也不是搞数据的,没必要把时间,用在数据挖掘的算法上面。神经网络、贝叶斯控制,与我们无关。
5. 数据导入
打开安装好的SPSS数据软件,点击左上方文件图样按钮,选择刚刚下载的Google Trend数据(csv格式),将其导入到SPSS。
数据格式,选择“时间/日期”,将其设定为yy/mm/dd(个人习惯,大家可以根据自己的习惯,设置不同的时间表现形式)。
导入数据之后,我们要针对数据属性、分析目的进行简单设置。我们把”时间“当做输入,“搜索热度”作为输出。
6. 选择合适的数据分析方法
我们这次演示的案例,主要是产品搜索热度随时间的变化规律,所以,选择线性回归分析,来判断两者的线性关系。
当然,如果是研究肺癌与吸烟的关系,还要计算数据降噪处理、多元回归计算相关系数、复杂抽样、计算生存函数等等。
今天这个例子,单纯从数据表面看,二者之间并无强相关性,所以,就做线性回归分析足够了。
7. 分析过程
+ 选择分析——回归——线性(L)
+ 将自变量、因变量输入到对应位置。
+ 点击”统计量”,配置置信区间、模型拟合度、D-W值。
(1)置信区间95%:被测量参数的真实值,有95%的概率落在真实的预测结果。换句话说,我们做的时间与搜索热度的关系
分析,可信度在95%以上。
(2)模型拟合度:回归分析,特别是线性回归分析,最终的二维、三维关系曲线,实际上都是根据变量的变化趋势,拟合出
来的,存在一定误差。
(3)D-W值:在做回归分析时,随机误差项,往往都存在,因为自变量、因变量之间,有时内部是存在很多相关因子的。但是,我们又不希望这些随机误差之间自相关,换句话说,变量的内部之间,不能出现多维关联。
D-W的值越趋近于2,随机误差项(残差项)之间的相关性越小,那么,我们建立的回归模型,就越真实。
+ 点击“绘制”,勾选直方图、正态概率图
全部设置完毕,点击“确定”,进入数据分析。
8. 分析结果(报告)
D-W=1.602,说明回归模型随机误差项,相关度较弱,模型可信。
回归标准化残差=0.998:说明标准化残差落在(-2,2)区间以外的概率≤0.05,标准化残差完全符合标准正态分布N(0,1)。
95%以上的数据测量值参与正常回归拟合,回归模型良好。
在此基础之上,我们拟合出来的曲线,才最接近于真实值。
那么,由此,我们就大体上可以看出产品的搜索热度,随着时间的大体变化趋势。
从而,对产品的需求趋势,就可以从数据角度,进行一个客观性判断。