第(1/3)页 “夏冬,我基于你之前开源的那个在线机器学习框架,写了个很简单的推荐算法原型。” “刚刚部署到了测试服务器上。” “你有空可以看一下。” 夏冬心里“咯噔”一下。 推荐算法? 他原本的计划里,V1.0版本是打算先上瀑布流,用内容的多样性来吸引用户。 推荐系统是个无底洞,太耗费计算资源,也需要海量的用户数据做支撑。 他打算等第一版上线后,赚到钱,数据也积累得差不多了,再慢慢搞。 没想到,陆奇竟然…… 他怀着一丝疑惑,点开了陆奇发来的测试链接。 页面还是那个熟悉的快看网页面。 他刷新了一下。 首页第一条新闻,是《神舟七号载人飞船发射成功,航天员首次出舱活动》。 第二条,《奥运冠军杨威大婚,迎娶队友杨云》。 第三条,《华尔街日报:雷曼兄弟申请破产保护,或引发全球金融海啸》。 夏冬皱了皱眉。 这些都是当前的热点新闻,没什么特别的。 他又刷新了一下。 这一次,首页的内容变了。 第一条,变成了《“魔兽世界”新资料片“巫妖王之怒”全球同步上线》。 第二条,《专访暴雪首席设计师:我们如何创造一个世界》。 第三... -->> 条,《盘点2008年最值得期待的十大PC游戏》。 夏冬的瞳孔,猛地收缩了一下。 他立刻明白了。 刚才,他在测试用户系统的时候,随手注册了一个账号。 在个人兴趣标签里,他勾选了“游戏”。 陆奇的这套推荐系统,捕捉到了这个标签。 并且,在他第二次刷新的时候,为他推送了完全不同的内容。 千人千面。 虽然只是最粗糙、最原始的版本。 但它……真的实现了。 夏冬在群里打字,手都有些微微颤抖。 “陆奇,你是怎么做到的?” “我们现在的用户数据,几乎为零。” 陆奇很快回复了。 “数据确实很少,所以我用的不是复杂的协同过滤,而是最基础的内容推荐。” “我写了个爬虫,抓取了你网站上所有文章的关键词,做了个简单的分词和权重计算。” “然后,根据用户注册时选择的兴趣标签,去匹配相应关键词权重的文章。” “算法非常简陋,而且计算资源消耗极小,几乎不增加服务器负担。” 第(1/3)页