面。可这样的网页反而一点价值都没有。
正是这细小的评分系统,成就了谷歌的新一代搜索引擎。
而在h国这边因为朝族语的特殊性,所以,这套技术要重新开发,也就是说是用在朝族语组成的网页页面上,需要一套重新的评价系统来评估这个网页是否有价值推荐给用户。
相同的原理也可以运用在日语的网页上。
当用户在搜索框进入一个搜索词之后,爬虫获取的数据库就会在整个数据库中筛选出有价值的网页推荐给用户。
而每当用户量减少的时候,系统的爬虫又会在整个互联网上进行抓取,从而重新更新数据库里的内容。
这样周而复始的操作下来,便是一整套搜索引擎工作的基本原理。
而日语版的搜索引擎要修改的部分则是爬虫抓取的规则和评分部分。
所以从改动上来说并不是需要天翻地覆的变化。
只需要针对日语进行一些适配就可以了。
因为有了前期工作的参考,朱勇俊很快就找到了新版本搜索引擎的开发方向。
同时几个方案也在同时进行着开发,至于编程的工作,一旦算法和方案确定下来,实现只是时间问题。
而最后选择用哪一款方案?则要看在实际应用中搜索引擎的表现。
金在龙虽然没有规定时间,但是朱勇俊擅自把开发时间定在了一个月。
因为他知道等到一个月之后,李海珍那边就会收到很多用户的反馈数据,到时候整个团队又得重新投入到朝族语版本的搜索引擎二期开发中。
算法就是这么不断的被优化,不断的更改的过程中逐步变强的。
而现在never公司只开放了其中一部分,那就是开放关于问答方面的搜索。
由于这一部分的搜索本身是在自己运营的网站内部的数据库进行的,还没有对整个互联网进行抓取和搜索。所以前期工作压力其实不大。而且这也不是真正意义上的搜索引擎。
不得不说。
问答网站的确是一个好的方向。
原本很多人需要去bbs上查找自己感兴趣的话题。但是很快,答案被整理的很方便的never就进入到了人们的视线。
一开始是一些大公司的程序员,会查看李海珍发布的一些关于开发的文章。
到后面懂得分享的程序员,又开始自觉地上传一些新的答案。
然后这个正反馈的过程便被