罗英、何文是“数据挖掘师”。但这份工作想做得好,单纯依靠算数据并不够,其实还要动用“情商”。比如,QQ音乐有一个功能叫“猜你喜欢”。根据用户的数据,软件会自动**一些陌生歌曲。这种**,显然是基于大数据平台。一般我们以为,只要提供一些算法,大数据平台照此运算就成,但事实没那么简单。
*当其冲的是准确率。“猜你喜欢”究竟能猜对多少*歌?不同的数据师,可能会设计不同的算法,有的人****比较好,他把“年龄”的数据用起来,而另外一个人没用,就会导致两者准确率差很大。
究竟需要考虑哪些数据维度,荐歌才会*符合心意呢?没有标准答案,不同数据师有自己的判断。同样的大数据库,一个运算下来比较准确,一个不准,其中**的变化就是人。第二个问题是,为什么有人能想到“年龄”,而有人却想不到?凭借的也是个人经验。或者说,凭借的是人对事物的理解,考验的正是数据师的“情商”。
“在我们行内有一个不等式:业务知识>数据>算法。”罗英解释,“而业务知识就是你的理解能力。”用同行的话来说,就是“你的架构是否合理。”*近,产品经理提出:能不能根据大数据,观察每座城市的人口迁移,随后做一份《城市年轻指数》报告?
数据师们给出了这样一些数据:用户的登录地,再比对他们的年龄信息等。*后给出来的数据,大家一看都觉得有价值,《城市年轻指数》报告就这样出炉了。当然,更多时候,理想很**,但运算出来的数据却没什么变化,被判定“数据价值不大”,议题便会不了了之。
“大数据就好像是一杯水,我们需要去厨房煮菜,水只是材料之一。”罗英形容。何文则说,他 工作的成就感,不在于运算大数据,而在于*终“能给出有价值的数据”。