淘宝猜你喜欢在哪里 淘宝的“猜你喜欢” 为啥猜的这么准
让我们回到淘宝推荐系统的改造现场。
三同告诉我,人的意图其实可以大致分为三类:
第一类是标签,它是静态的。
比如,如果你是一个“男人”,你很可能永远是一个男人,所以你很可能永远喜欢男装。如果你“有了孩子”,基本上你会一直有孩子,你会喜欢长期买儿童用品。
第二类是偏好,是偏动态的。
如果你是米仔,你会一直喜欢小米。如果你是花粉,你会一直喜欢华为。这是品牌偏好,会在一段时间内保持稳定。但是人们会一辈子只忠于一个品牌吗?很明显,大多数人都不会。今天夸安卓好,明天就有很多人捧着苹果,说真香。
第三类是真实意图,动态性很强。
比如偶尔在路上看到一个漂亮的耳机。你拿出淘宝找,找到后马上下单。到了办公室,听到同事介绍一家不错的方便面。你计划下订单,在家里储存一个盒子。看完觉得吃这么多方便面没营养,就放弃了。这种思想的闪光,它来去无踪。
这三种意图就像“选择题”、“填空题空题”和“大题”。只有做对了,用户才会觉得人工智能懂自己。
但是对于人工智能来说,这三个问题的难度和计算量是不一样的。感受人类的标签,是Easy模式,一个月数一次就够了;感受人的喜好是Hard模式,可能一周算一次;感受人的意图,也就是地狱模型,需要时时刻刻,分秒必争的计算。
因此,为了纠正这张试卷,我们主要测试两种技术:“算法”和“计算能力”。
所谓算法主要是解题能力:无数的数据都进来了,那么如何才能把这些复杂的数据变成一个“意图”呢?如果算法不细化,用户原本想要黄瓜,但如果你判断用户想要茄子,答案全错了,也就是说不管多快。
所谓计算能力主要是答题速度:如何在最短的时间内运行这个算法。一个用户搜索一件衣服,可能一秒钟后想看你给她的推荐,但是如果淘宝数一个小时,这个用户已经退出淘宝了。。。
其中,计算能力的问题相对容易解决,解决方案叫做阿里巴巴云。阿里巴巴云的本质是很多不知疲倦的电脑,它的计算能力可以被阿里巴巴自己使用,也可以向外界提供服务。其实阿里巴巴辛辛苦苦做出来的阿里巴巴云,首先是为了满足自己的计算需求。
然而,算法的改进是一个非常缓慢的过程。为此,认知智能团队招募了许多国际顶级算法。他们做了许多尝试。
例如:
如果你看到一个产品出现在屏幕上,它可能会很快被越过。这时,你的快速划水应该被算法认为是你对这款产品不感兴趣的一个因素。
虽然你为了一些商品停留了很长时间,但这只是停留,没有检查,并不意味着你对商品感兴趣。
算法越好,可以考虑的情况就越精细,结论就越接近现实世界。
近年来,认知智能团队在顶级会议上发表了很多论文,都是在踩坑的过程中得出干货的结论。人们也会发现,淘宝的推荐在很多方面还是有进步的空,但进展缓慢且坚定。
“认知智能”就像媒人,不仅认识女生,也认识男生。这个女孩代表“消费者”,而男孩代表“商品”。
我刚才说的是消费者的理解。现在来说说对商品的理解。
理解商品的难度主要集中在商品的图片上。理解图片包括两个方面:
一是画面有瑕疵;
第二,画面美。
图片中的内容可以通过图像识别技术来判断,但图片是否美观则是见仁见智。
一件商品有两个属性:“事实分类”和“情感分类”。
所以这组技术宅需要开发一套算法来计算什么样的人喜欢什么样的图片。如果你是喜欢简约的商务人士,给他一个简约画风的钱包;如果是放荡不羁的女生,给他看看会晕车的花纹裙。