大数据这种东西是伴随着人们在经手互联网业务的同时,产生了一种全新的技术。
试想一下,全世界的网页一共有多少内容?当某个人坐在电脑前。打开一个搜索界面,然后在搜索界面中进入一个关键词。
到底要把全世界网页中什么样的内容呈现给用户呢?
谷歌公司最早之所以能够迅速的占领市场。就在于他们给网页做出了一份评分机制。
按照以往的搜索概念来说,如果一个网页上满是关键词的话,那它的搜索排名应该靠前。
可事实上这样的搜索结果对用户来说一点用处也没有。
所以需要一套评价机制来评价,这个网页对用户来说是否有价值?
这就是搜索引擎最早对用户有用的地方。
然而随着搜索引擎不断的抓取数据,任何一个用户如果想要拿到自己有用的信息,都不得不对整个数据库进行筛查的话,那么等待的时间恐怕将会是一个相当漫长时间段。x33
而如何快速的在数据库中遍历并且进行搜索比对,呈现出最有用的信息给用户,就是另一项技术的问题了,那就是大数据。
但是有了这些数据之后,还需要进行分析整理,有可能做出新的业务。
比如某些用户在自己的社交媒体主页上所撰写的兴趣是宠物。
那么也许在社交网络上对他推荐一些同样喜欢饲养小宠物的用户,会让他觉得在这个社区能够认识更多有趣的朋友。
而眼下李海珍要面对的就是这个。
基于个性化的大数据服务。
现在搜索引擎技术已经到了,竞争的白热化。
大家已经解决了大规模数据的检索和筛查的问题。
可对数据的分析和应用还处于萌芽阶段。
而这需要一定的技术含量,甚至花费心血才能攻克这个难题。
从业务上来说,这是有可能带来全新增长点的新业务。
然而从技术上来说,目前对于这个算法模型还没有良好的解决办法。
人们解决大规模数据检索的办法是利用分布式规则进行检测,同样的这项技术也给基于个性化的推荐打开了一扇大门。但是整套算法必然会非常的复杂。而越是到最后,算法的强大程度将决定一家互联网企业是否具备核心的竞争力。
……
这也是为什么金正宇支持朱勇俊和李海珍联手解决这个难题的原因。
而