什么是大数据
百度百科中的定义是这样的,大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
这个解释似乎有点“烧脑",下面给出通俗点的定义。
大数据(big data) ,指由海量数据组合而成的具有关联性的信息资产。
笔者小非在2012年的时候就接触到了大数据。当时笔者正在北京的网易总部上班。
在北京的五道口附近,经常有关于大数据的分享沙龙,笔者基本上都会参加。
而网易内部在2012年就已经开始组建大数据团队了。当时的网易大数据团队叫数据挖掘组,属于DB (数据库)这个团队。网易门户首页的“猜您喜欢”用到的大数据挖据技术,就是由这个团队完成的。之后,越来越多的大公司开始用“猜您喜欢”这种大数据应用。例如百度首页信息流推荐,今日头条原来的“猜您喜欢”、现在的“推荐栏目”等,用到的都是大数据技术。
大数据与网站优化SEO有什么关系呢?
我相信很多人都会有这样的疑问。笔者小非在网易工作时,网易公司内部有一套BI (商业智能)系统,笔者当时为了统计来自搜索引擎基于关键字到销量的完整数据,提出了这个统计需求,而这个需求最终落实到了DB团队来完成。当然,前提是得有数据。数据的提取和入库是由开发和运维团队负责。BI系统能够非常灵活地把相关的数据进行关联,并呈现出一系列可视化的图形和报表。网易的DB人员就是在BI系统里完成了笔者的这个需求。当笔者登录BI系统时,就能看到从搜索引擎到最终购买的整个流程和数据。
这里也运用到了漏斗模型,不同的是,这个漏斗叫SEO漏斗。看到这里大家又有疑问了,这与SEO又有什么关系呢?其实所谓的大数据,
无非就是一个超大型的数据库而已。它的存储方式就是数据库,不会脱离数据库而存在。因此,我们如果能将SEO的这些数据与网站搜集到的其他用户数据进行关联,就能挖掘出商业价值。
将SEO与大数据进行关联,在这方面做得比较好的就是百度。例如我们有时用百度搜索一些关键字,发现自己搜索的结果页面与其他用户搜索的结果页面有所不同,这就是基于SEO技术与大数据技术的结合。
再举一个例子。有时我们经常用搜索引擎搜索一些商品的名字,然后在其他网站上看到百度联盟的广告或淘宝联盟的广告里也会出现我们曾搜索过的商品个称或者商品图片,这里用到的其实也是SEO与大数据技术。