欢迎关注公众号数智化转型俱乐部
流量分析只比互联网诞生晚几年互联网需要有人提供服务同时也需要有人消费服务如果想要成功需要时刻关注来访人的情况
提到流量运营的历史我们首先需要简单介绍一下互联网的历史人类最伟大的构想往往都需要几代人不断地尝试和完善蒸汽机如此飞行器如此攻克癌症也将如此从1876年贝尔发明了电话起整个20世纪人类都在不断尝试如何远距离传输除语音以外的信息或者数据从20世纪初特斯拉即已经有了互联网的构想同时Otlet等一大批先驱在不断探索和完善信息的数字化存储和读写技术1960年MIT教授Licklider提出了IntergalacticComputerNetwork即IGCN理论为现代互联网概念奠定了基础直到1990年现代互联网才真正诞生英国人TimBernersLee提出并成功实现了基于客户端和服务端之间通信的HTTP协议
流量分析只比互联网诞生晚几年作为一个生态互联网需要有人提供服务同时也需要有人消费服务而在互联网上经营服务跟在线下经营五金店一样如果想要成功需要时刻关注来访问的顾客的情况今天有多少人来消费有多少人来了但是没有购买我的顾客有一些什么特点为什么今天的销售额比昨天少了很多
1993年在互联网诞生3年后全世界有大约600个网站如果你有幸成为这600个提供互联网服务的网站主之一要回答这些问题就没有这么容易了首先你面对的是你的服务器上的一大堆服务请求日志大概长成这样
如果你不是学计算机专业的基本不大可能从成千上万的日志中获得任何有用的信息有了痛点自然就有解决痛点的产品诞生此时历史的潮流将一家叫WebTrends的公司推向了沙滩这家公司今天依然存在当然技术上早就与时俱进了然而在1993年它仅仅为网站主提供了一个简单服务端日志解析和分析的服务可以认为就是设计了一个grep语句将这些日志的IP地址信息提取出来去重然后告诉网站主今天有多少人访问了网站这家公司因为这个idea在2001年卖了11亿美元同时这个idea催生了一个叫digitalanalytics流量分析的行业的诞生并且每年产生上千亿美元的revenue
划重点的1995年
1995年是互联网发展的重要一年AmazonCraigslisteBay领头的电子商务开始进入互联网Matchcom也将社交需求带到了网上Yahoo在之前一年已经上线随着互联网服务的日益丰富和多样化Windows95的火爆登场个人电脑大卖网民数量也出现了爆炸式增长WebTrends已经无法满足大的网站主洞察客户的需求
此时诞生了Analog一款免费的流量分析工具并且提供一定的可视化分析能力当然到目前为止互联网网页还是以静态页面为主如果一个用户访问了某网页我们可以认为他访问了整个网页的所有内容现在我们知道这个假设很快就变成了不对的1996年专业的互联网市场营销团队开始出现在一些大公司的组织架构中他们可以熟练使用Analog这款免费工具然而免费的工具在没有营收的支撑下总是难以满足高阶用户的需求此时更多的玩家进入了流量分析领域帮助网站主洞察流量和挖掘客户价值大的网站主也开始大量投资购买流量分析软件对服务端日志进行分析此时流量分析的四巨头出现WebTrendsWebcounterAccrueOmniture其中Webcounter开创了一种广为人知的的hitcounterservice它反向为之针对中小网站主和在免费host网站host网页的个人网站主他们没有读取服务端日志的权限国内的80后互联网使用者可能并不陌生
它的划时代意义在于让所有的网站主都可以做最直观的流量洞察真正让流量分析做到了零门槛网站主不需要懂如何读取服务端日志不需要懂日志管理不需要懂日志解析只需要在网站里面嵌入一段简单的PHP代码即可当然它没有fancy的分析功能也没有任何过滤爬虫的能力
Google上线的1997年
1997年互联网持续迭代发展此时的网站开始注重美观各种精装修技术开始盛行动态加载的网页技术开始出现服务端请求的次数跟网页的浏览次数也基本没有任何关联了服务端日志分析已经不能精确地洞察用户行为此时一种新的用户行为追踪技术诞生叫做JavascriptTagging它可以精确地追踪复杂网页的用户访问行为tag原来是指网络请求的那张看不见的照片它被有意嵌入在网页内的某兴趣点当指定的用户行为被触发时会向服务器请求这张图片资源顺便将相关的用户信息随着请求带上去随着网页技术的发展现在tag是指一段用来追踪用户行为的复杂的Javascript代码除了能够进行更加细粒度的页面元素追踪外tag还能收集到更加复杂的内容比如购物车内的商品信息屏幕有多大使用了什么浏览器视频看了多少等等
值得注意的是googlecom在这一年上线之后十几年互联网技术的重大发展基本跟它有点关系
此后的流量分析技术的发展基本可以用Urchin这家公司的发展来代替
这家公司最初在1995年创立进入前面提到的基于服务端日志解析的流量分析服务1997年开始发展Javascripttagging技术到1998年JStagging还是将日志发送到业务服务端进行日志分析为主其主要原因是各大互联网公司都已经投入大量资金购买流量分析软件成本的压力让这些公司暂时还不考虑转型此时最大的软件提供商就是Urchin但是同时一种新的商业模式开始诞生网站的流量数据不再发到自己的服务器而是发送给专业的流量分析服务商管理的服务器流量分析开始SaaS化这种解决方案在中小企业中非常流行同时大的host公司为中小企业或者个人提供网站托管服务也对此趋之若鹜新的商业模式结合了流量分析的易用性和功能性让Urchin成长成为了最大的流量分析服务提供商并于2005年卖给了Google成为了GoogleAnalytics
接下来从2005年到现在流量分析从主流的PageView过渡到了inpageanalytics再到UniversalAnalytics移动互联网的兴起再到各种纵深流量分析和运营能力构建crosssitemachinelearninglifetimevalue等流量运营出现了百家争鸣的业态
三大门户和导航站的黄金十年
1994年4月20日是中国互联网发展史上开天辟地的大日子通过一根64Kb注意是bit不是Byte的国际专线中关村地区教育与科研示范网络NCFC工程完成了与国际互联网的全功能IP连接这一年5月中国科学院高能物理研究所设立了国内第一台WEB服务器中国之窗服务于科研与教育的互联网用户主要是北京的科研院所和高校的人员
随后两年多时间里中国科技网CSTNET中国公用计算机互联网CHINANET中国教育和科研计算机网CERNET等相继开工建设开始了全面铺设中国信息高速公路的历程1996年中国第一个网吧电脑室在上海出现上网价格达40元小时上网冲浪只能是少数人的高科技休闲方式1997年中国电信面向普通家庭推出价格较为低廉的163网很容易猜到后来网易选用163com作为域名的缘由和169网全国各地的网吧如雨后春笋般涌现1998年中国网民开始成几何级数增长上网从前卫变成一种真正的需求一场互联网带来的变革很快传遍整个中华大地
1996年瀛海威的网络科教馆在中关村竖起的广告牌中国人离信息高速公路还有多远
随着上网的普及提供上网内容的ISP也越来越多但以复制海外的模式为主美国出现什么新网站中国会很快拷贝过来一开始目标肯定是精英3年后才会真正开始爆发流行这个阶段逐步诞生了占据中国互联网黄金十年的三大门户网易搜狐新浪这里不展开介绍它们的业务发展和上市历程从流量运营角度我们来看导航站和中国站长的发展他们成为这个时代中国互联网的特色之一
在互联网网站鼻祖雅虎刚上线时以网站分类导航的形式提供内容服务后来逐渐发展成搜索门户等产品同样得入口者得天下中国互联网也出现了简单到基本不需要技术的导航站这与中国网吧和网民特点密不可分1999年还是网吧管理员的李兴平发现找资料很困难而且要记住英文网址难度很大他就把中国排名前5000位的站点进行分门别类再按用途组合在一起做成一个网址大全式的网站这就是hao123网址之家的前身他要逐个检查链接去除死链和非法链接调整链接排序工作耗时逐渐增长到每天需要67个小时这就是中国站长的早期人工流量运营
2004年hao123成为众多网吧和家用电脑的开机首页甚至在全球权威的Alexa网络监测中成为全球流量极大的中文网站之一根据百度的统计来自hao123的搜索请求广告占到整个百度的搜索量的110而整个网站流量能占到百度的40因此这一年百度斥资1000多万现金加股票收购了hao123蔡文胜创办的比hao123晚了4年的265com也在2007年卖给的谷歌中国
随着这两家被收购网址导航的盈利模式被认可进入了群雄争鹿的高速发展期360依靠海量的安全卫士和浏览器装机量捆绑推广360网址导航瞬间挤入了网址导航的第二阵营2345依靠与热门网络应用捆绑以及强大的地推资源迅速崛起114啦依靠与自身雨林木风盗版系统推广结合也获得大量的用户随后的搜狗QQ也都相继推出了自身的导航网站网址导航逐渐成为各大公司的标配流量入口
站长三件套域名空间统计代码
言归正传在没有云计算和大数据的时代搭建和运营网站的门槛却是极低的国内出现了很多提供价格低廉设置免费的个人空间和二级域名服务的网站催生了一大批站长提供各式各样的论坛和网站他们开始学习如何用aspphphtml和css来装修完善自己的网站比如提供统计服务的就有热讯统计itsun等其中在站长服务中最有名的当属网易了提供了免费域名主页空间易数统计整套方案虽然有广告但做个初级网站还是非常容易网易这家公司让人佩服的是每个时代都能低调做出符合用户需求的产品诸如门户163邮箱梦幻西游网易云音乐考拉海购都成功收获大批用户
基础设施有了如何提升网站访问量成了站长们关心的首要问题在搜索引擎流量未成为主流时统计排行榜和换量联盟太极链51link等是站长们关注的重点甚至在2005年蔡文胜举办的第一届中国站长大会上站长们交流网站流量运营经验的同时也在交流在各个平台刷量的葵花宝典可见中国站长对商业化和盈利的渴望
来源分析和关键词分析
这个时期的统计分析工具已经进入了基于服务器日志解析的流量分析的技术架构除了统计网页PVUV的这些基础指标外做网站运营最关注的就是流量来源通过用户来源网站统计可以了解用户来自哪个网站的推荐哪个网页的链接如果是通过搜索引擎检索可以看出是来自哪个搜索引擎使用什么关键词进行检索以及你的网站索引出现在搜索结果的第几页第几项这些分析对于站长去做SEO尤为重要所以这里展开介绍一下来源和关键词分析的技术原理通常有两种技术来实现来源分析一种方案在来源页面链接加自定义参数来标注用户来源比如在hao123首页点击百度连接后会打开baiducomtn参数就是标识来源的字段另一种方案通过httpheader中的referer作为来源比如你在百度搜索网站hao123记为链接Abaiducoms点击跳转后hao123的首页记为链接Bhao123com就可以通过documentreferer来获取来源为记为链接Cbaiducomlink前一种比较适合在网站内部页面跳转中来使用因为需要所有来源都加上相应参数第二种更适合分析站外流量来源往往referer的url参数会比较长分析来源网站会截取域名段分析来源页面时通常会取之前的静态URL理论上链接A就是B可以获取到的referer也是说AC这样B就可以分析来源于搜索引擎的关键词了A链接中带了搜索关键词wdhao123这就是统计分析产品中提供关键词分析的基本原理但实际上A和C差异很大这是为什么呢懂点浏览器知识的观察下就明白其实在链接A页面上点击时并没有直接跳转到链接B而是加了跳转中间页链接C链接C也是百度的网页可以很灵活地控制URL中携带的参数屏蔽目标网页C做关键词分析Google早在2011年推广搜索https化时开始屏蔽来源关键词分析国内的百度是在2015年发布公告正式取消referer中关于关键词的显示宣称此举能够更好的保护站点流量关键词数据信息使站点数据更加私密化私密化的结果是你只能在百度统计分析中看到关键词分析你懂的
CNZZ和百度统计崛起
2005年后谷歌的GoogleAnalytics和雅虎量子统计逐步进入中国站长们见识了国际一流公司的产品但技术实力不是占领市场的第一要素有时体验更重要由于国际化的产品设计理念加上糟糕的中文翻译质量给了国内流量分析产品不少机会国内的创业者逐渐推出了51la51yescnzz等中国第二代流量分析产品也提供了实时在线用户统计等差异化的功能这个时期很多站长会同时集成GoogleAnalytics和国内流量分析工具使用各平台的特色功能的同时也可以核对各平台数据是否一致后来51la51yes由于服务稳定性一直被诟病广告过多和产品功能规划不明确逐渐被cnzz拉开差距cnzz将自己定位为专业权威客观的第三方数据统计这迎合了国内互联网市场的巨大需求到2008年上线4年的cnzz获得了60多万的站点用户当时据CNNIC统计国内网站数量在192万意味着cnzz已经覆盖了国内三分之一的站点
百度统计测试版在2007年11月发布2009年8月发布正式版商业公司提供的统计服务更加稳定安全专业在2010年逐渐成型后一统江湖成为国内流量分析工具百家争鸣时代的终结者随着国家工信部加强对域名和内容的备案审查中小站长开始衰落cnzz市场份额也逐步降低网站流量分析工具也跨入被搜索引擎寡头百度Google统治的时代
移动互联网兴起移动统计分析迅速崛起Flurry和友盟在中美各领风骚TalkingData神策阿拉丁等后起之秀异军突起
参考文献
abriefhistoryofwebanalytics
theearlydaysofwebanalytics
leadforensicscomweba
enwikipediaorgwikiN
enwikipediaorgwikiP
enwikipediaorgwiki欢迎关注公众号数智化转型俱乐部