大数据营销——建立模型:数据流漏斗原理

2020-05-27 11:02:10
经理先生
L先生
文章摘要: 能够从大量数据中挖掘出其中的规律,从而加深对行业的理解,这就是大数据分析技术的特点。谷歌正是因为用了这种简单的线性回归的分析方法,很容易对各项指标做出分析。

当企业利用多种平台抓取了各式各样的数据后,企业可以将收集来的数据搭建成数据模型,数据模型最常见的有三种,即层次模型、网状模型和关系模型,这三种模型各有优势,企业可以根据自己的形式来搭建最适合自己的模型。

谷歌为什么采用这么简单的分析模式?

谷歌对于电影票房的预测采用的是大数据分析中最为简单的模式之一:线性回归模式

线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,但是为什么如此精准的预测会采取如此简单的分析模式呢?

其一,线性模式虽然表面上看起来简单,但它的精准度却很高,简单且效果好,这是我们实际应用中一直追求的方法;

其二,简单的模型容易被人们理解和分析。这就是谷歌对于数据分析应用的高明之处。

能够从大量数据中挖掘出其中的规律,从而加深对行业的理解,这就是大数据分析技术的特点。谷歌正是因为用了这种简单的线性回归的分析方法,很容易对各项指标做出分析。

网状模型:蜘蛛策略

在现实世界中,事物之间的联系很多是非层次的,那么用具有层次的模型去表示非层次的结构就很困难,但如果利用网状模型去表达这样的结构就变得容易多了。

其中,在网状模型中最经典的就是蜘蛛策略。

每天,搜索引擎像蜘蛛一样抓取网页,蜘蛛在抓取网页地址时会按一定的网页分析算法将有用的链接进行排列,形成一个队形结构;

然后再调用算法程序按顺序传送给网贝下载器,接着再把每个新下载页面中包含的链接放在队列末尾,如此循环,这样整个蜘蛛网状系统便都由搜索引擎来完成。

关系模型的数据结构

关系模型的数据结构建立在数学的集合概念之上,有着严格的数学定义。

从用户观点来看,关系模型是由简单的数据结构构成,每一张二维表组成了关系数据的结构,由行和列组成,这张表可以描述实体间的联系,也可以描述实体自己。

在关系模型中,用关系来表示实体与实体之间的联系,当然,关系模型要求关系必须是规范化的,也要满足一定的规范条件。

对于规范条件的基本要求是:关系中的每个分量必须是不可再分割的数据项,也就是说,不允许表中还有表。

信息化软件服务网 - 助力数字中国建设 | 责编:莎莉
文明上网,理性发言!请遵守新闻评论服务协议
评论