推荐系统应用研究:网上书店

除了分类查找和主动搜索,推荐系统也是用户浏览商品的重要途径,能帮助用户发现类似并感兴趣的产品,增加商品的访问量,将访问者转化为购买者,引导用户购买。最终产生的价值是提升用户购物体验和用户粘度,提高订单量,如Amazon30%的订单来自推荐系统。

相比于精准营销广告,推荐系统产生的信息更为自然,同样能起到推销商品的目的。但是如果推荐系统的信息过于密集或者不精准,也会有成为垃圾信息之嫌。如在当当网已登录情况下查看《Web信息架构:设计大型网站》,边栏和底部有以下几种形式的推荐系统:

  1. 购买本商品的顾客还买过
  2. 浏览本商品的顾客还看过
  3. 看过商品的顾客会买
  4. 浏览更多同类商品
  5. 您的浏览历史
  6. 最佳拍档
  7. 广告
  8. 和您兴趣相似的顾客还关注

推荐系统中存在重复得数据,如1、2和6都推荐《About Face 3交互设计精髓》,并且个人已经购买了这本书。喜欢的歌曲可以重复播放,已购买的书籍不可以重复推荐,而是把用户的购买记录作为主要的推荐依据。重复的数据会削弱推荐的有效性,过多的推荐形式和数据会大大稀释推荐的精准度。

个人曾是当当的忠实用户,已在当当网下过27次订单,购买过90本图书,推荐系统对购买的帮助几乎可以忽略不计,也没有对个人的购买记录加以利用。在购物车页面准备下订单时登录当当网,页面会跳转到首页,在下订单页面点击返回也会经常出现订单丢失的情况。

jindu

当当网的送货进度时间平均4-5天,下订单之后可以查看送货的进度。根据个人的设计经验,一般是明显让用户感觉到慢或者操作步骤多的时候才会使用进度条,稍微缓解用户的等待感,而卓越明确告知用户货物会在哪天送达。

am

由于嫌弃当当送货太慢,改用卓越,在未登录情况下查看《Web信息架构:设计大型网站》图书页面,突出显示“购买本商品的顾客还买过”,共推荐100本书籍,约50本是个人感兴趣或者已在当当网购买过的。由于主要使用一种形式的推荐,很好地避免了重复数据。

“购买本商品的顾客还买过”比“浏览本商品的顾客还看过”更能获得用户的信任,其使用的是item-to-item协同过滤系统,通过余弦计算商品的相似度来推荐,比起传统的协同过滤(Collaborative filtering),解决了冷启动的问题,不会过度地依赖用户的浏览和购买记录,在用户第一次查看图书时也能进行推荐。

鼠标停留在当当网推荐的书籍上显示的书籍封面图片和价格,而卓越显示书籍的评分、评价人数和价格,按照用户购买商品的过程,书籍的评分更能吸引用户浏览并产生购买欲望。

卓越的邮件中会带有图书推荐,图文并茂提供了有用的信息,并不会被个人当成垃圾邮件,看到感兴趣的数据可以查看或者直接购买,非常方便。而当当以文字形式邀请评论,收到第一份的时候会打开看看,其余30份内容一样的邮件直接被当成垃圾邮件删除。

两个网站的广告可以更精准些,没有按照书籍的标签相应显示广告,购买计算机类的书籍多是男性,当当网显示标签为女性的胸罩广告,卓越网显示高跟鞋和女性内衣的广告,也许能分散男同胞的注意力和点击次数,但是不会增加广告的转换率,显示数码产品的广告会更适用在此类图书页面。

重复和垃圾信息损害用户体验,推荐的信息在于精确和有用,不宜过多地显示。

移动设备简史

本文由江南大学设计学院在读研二硕士Tony译自Brian Fling所写《Mobile Design and Development》中的第一章《A Brief History of Mobile》。

我喜欢将移动行业的历史比作为Umberto Eco 的工作:你知道了是怎么回事,但在这个过程中却很伤脑筋。移动网络演化、运行移动网络的设备和我们每天使用的服务以惊人的速度迅速发展着,就如早期的手机更像二战时期的收音机发展到今天的超时尚的时装报表。

如果有一个关于移动设备的基本原则,那就是每一个事物都有自己的成因。它可能不是一个很好的理由,但仍然不失为一个理由。这样的历史或者背景给予了移动设备设计师与开发人员足够的耐心和激情来处理他们在移动生态系统中经常面临的问题。移动通信行业是一个没有耐心与热情就很难进入的行业。

本章将从设备的角度出发,也是移动生态系统中最普遍的方法来讨论移动媒介的发展。

继续阅读移动设备简史

推荐系统应用研究:音乐电台

推荐系统很少有单独的产品形态,多是和其他产品相结合,起到辅助的使用效果。如个人平时使用较多的推荐系统有输入法的字词联想、购书网站中书籍推荐、音乐电台的猜用户喜欢的音乐和谷歌阅读器的推荐条目。

douban

对于豆瓣音乐频道使用较少,虽然对音乐没什么研究,也不会买什么专辑或者听演唱会,但是很喜欢听音乐,有边工作边听音乐的习惯。豆瓣电台迄今累计收听13670首、喜欢136首和不喜欢666首,算是电台的重度用户吧,个人操作行为有:

  • 作为工作时间的背景音乐,处于后台运行状态。有时候工作入神,只要不是特别讨厌或者特别喜欢的歌曲一般不会去访问电台网页。
  • 离开工位的时候,拿下耳机不关闭音乐,1万多首歌里起码有30%没有真正听。
  • 听到广告和“哈狗帮”之类吵闹的音乐会找到电台的网页,选择不喜欢,无法停止的广告直接点击关闭电台,因为很容易导致走神影响工作。
  • 听到喜欢的音乐60%的概率会找到电台网页点击“喜欢”。
  • 发现特别喜欢或者寄希望能推荐相关歌曲时会去点击“喜欢”。
  • 听到不怎么喜欢的音乐也会选择点击“下一首”。

豆瓣电台推荐新歌力度比虾米网强,操作也更方便,不需要像虾米网的初始化时选择喜欢的歌手和选择喜欢音乐之后要选择标签,更加智能化,减少操作步骤。虾米的歌库好像不够全,多是推荐大众化的歌曲,但推荐的形式比豆瓣更丰富和取巧。

豆瓣不支持按歌手和专辑听歌,如果连续点击三次“不喜欢”没有听到喜欢的音乐或者经常播放讨厌怨女情歌,可能会选择听虾米网歌手专辑。如果能选择只听自己已经选择喜欢的100多首歌曲,或许不会切换到其他产品。

douban2

豆瓣电台通常作为浏览器的书签单独存在,通常直接访问豆瓣电台而不会从豆瓣主页再访问豆瓣电台,从电台返回到豆瓣主页只能手动修改网址或者点击专辑的链接查看专辑再返回主页。把喜欢歌曲的红心去掉,是不是意味着用户不再喜欢这首歌并要跳到下一首歌。

豆瓣电台在开始做之前,已经有了比较完善的初始化的数据,大部分专辑都有标签和评分,如专辑《我们是五月天》的相关元数据为:

  • 9592人平均评分为9.3。
  • 标签有:五月天(2450),台湾(701) MAYDAY(644),我们是五月天(374),摇滚(338),我们是:),五月天(264),rock(201),pop(160)
  • 每首歌收藏的人数。

从以上的标签可以看出,歌手、地区和音乐风格是用户的常用标签,可以假设这三个标签是影响用户选择的最主要元数据。英文MAYDAY、五月天、我们是五月天和我们是:),五月天是等价的标签,摇滚和rock是等价的标签,不存在像谷歌挑歌那样的互斥性标签(如节奏的舒缓和强烈)。从这个例子也可以看出用户语言具有模糊性,有必要使用受控词表来控制同义标签的不同语言表达方式。

豆瓣的用户群比较小众化,添加的标签质量比较高,使用标签可以简单地组织歌曲之间的联系,利用评分、收藏人数和标签数目可以确定推荐的优先级。

如用户在电台中选择喜欢专辑《我们是五月天》中的歌曲《拥抱》,那可能依照歌手推荐会更可靠,用户选择多首五月天的歌曲,那可以认定是五月天的粉丝了,歌库中添加了五月天的新歌,自当第一时间推荐。

与风格相比,地区的影响程度更低,但是不排除部分用户有这方面的偏好,比如只听华语的歌曲,这需要经过决策树之类方法多次推荐才能论证。选择风格“摇滚”,可以推荐标签为摇滚并且评分比较高的歌手,逐步确认用户的音乐喜好模型。在大力推荐歌曲之前,可以先完成对用户喜欢歌曲的收集。在不确定的情况下,可以多播放已喜欢的音乐或者喜欢歌手的热门歌曲。

用户喜欢的歌手有很多,但是喜欢的风格不会很多,同一风格下有很多歌手,用户喜欢的风格比歌手更复杂和模糊。歌手之间是并列的标签,而风格会形成明显的偏向。随着时间的改变,风格也会发生改变。

另外,标签要和歌曲更吻合,听到电台推荐杂音多的五月天演唱会歌曲,会选择不喜欢或者跳到下一首。系统或许会依此误以为用户不喜欢这首歌,低质量的歌曲会影响系统推荐的准确性。