且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

框计算垂直搜索之统计篇

更新时间:2022-09-27 09:09:23

在信息高速增长的时代,生活变得越来越简单。随便百度一下,都会有很多的结果。现在让我们困惑的不再是没有选择,而是在浩瀚的信息世界里茫然不知所措。如何能更准确更迅速的找到想要的答案,已经变得非常的重要和急迫。这个时候,如果有一个好的分类和统计信息摆在面前,相信很多人都会笑的乐开怀。

下面介绍一个简单的分类系统,希望能抛砖引玉,大家畅所欲言吧

 

合理的分类体系

要想有一个理想和有效的统计结果,就必须有一个完善合理的分类体系。这个体系不能太大,太大就失去了分类的意义,也不能过于精简,否则就让我们得不到想要的信息。别拿豆包不当干粮,村长也是***,如何把握和拿捏,需要实践和用户的检验。

对数据加以分类

有了一个好的分类,并不是万能的。如何把每个产品放到合适的分类里也是一门学问。一般一个鸡蛋放到一个篮子里我们都习以为常,但有的偏偏同时属于多个分类,就像一个人既是男人,又是父亲一样,我们也要坦然面对。

对结果进行统计

既然每个数据都有了自己的归属,那我们就要开始对海量的信息进行归类和统计了。既然每个数据都要参与,那么我们就要一次把活干完,就像人口普查一样,一次把信息都统计到位,否则隔几天查一下籍贯,又隔几天查一下年龄,又隔几天查一下配偶,于己于人,都不是什么好事。

统计信息的封装

有了统计结果,如何更快的传递给别人,如何以更简洁易懂的语言表达,变成了一个摆在面前的任务。如果只有一个分类,大家都可以轻松应对,如果多个分类,每个分类又有子分类,可能略加思考,也能想出结果。但如果每个子分类里又有子分类,子分类里还有子分类,我们又当如何?所以这个时候不能图一时简单,不看将来,做就做得彻底一点,兵来将挡,水来土掩,万事都要未雨绸缪,方才能临危不变,笑傲明天。

展示结果

万事俱备,只欠东风。货都备好了,如果不能友好的展现出来,也是竹篮子打水一场空。不是每一颗人参都能光宗耀祖,也有的还像萝卜一样流浪凡间。如何包装自己,如何让人更舒适的得到信息,变得尤为重要。

以上只是对于统计和分类的一个十分简单的理解,要想做好,还有很多的细节要去思考,有很多技术要去攻关,不管多难多险,勇于尝试,勇于进取,才是生存之道。

 

【本文首发于:搜索研发部官方博客http://stblog.baidu-tech.com/?p=350
关注百度技术沙龙









本文转自百度技术51CTO博客,原文链接:http://blog.51cto.com/baidutech/743771,如需转载请自行联系原作者