豆瓣电影推荐

起因


起因只是因为晚上太无聊了,趴在台子上想瞌睡一会儿,又睡不着,想看电影又不知道看什么,好吧最终决定自己丰衣足食造个电影推荐出来。做个原型很快,大概一个晚上就搞定了,但结果整整耗了我两个学期来完善它。

现状


只需要输入豆瓣主页就能得到相关电影的推荐,完全能够满足寻找电影的要求。
但是这个只是远没有成型的版本,可能存在一些bug,在功能改进单上已经罗列了二十几条了(汗!)。

原理


原理其实也很简单,根据你在豆瓣上过往打四星五星的电影来判断你喜欢的影人,那些你喜欢的影人一起演的电影也更有可能是你喜欢的。这个其实在观影中非常普遍,看电影的乐趣之一就是发现“啊啊这个家伙以前演过XXX,哟哟哟这妹子以前是演XXX的嘛!”当然最终结果也会和影片的评分,电影的类型相关联,以及去除某些类型的电影(所以影视剧就不包括了)。

实现


整体用python实现,网页框架使用django 买了个vps(准备跑多个个人项目),后台是常规的Nginx+gunicorn,爬虫方面是用Beautifulsoup,为了加快速度使用并发的gevent。

为什么不用豆瓣猜?


这是我和别人说起这个东西的时候大家的第一反应,当然豆瓣猜做的很不错但是,也有我觉得要改进的地方
1. 豆瓣电影推荐隐藏的很深,我完全会无视这个功能,但是寻找适合自己的好电影却是看电影最重要的刚需。
2. 豆瓣猜的推荐算法具体怎么实现的我无从而知,可能我的方法是一个子集,也有可能是他们没有考虑的,但至少是另一个角度。
3. 豆瓣电影推荐的页面很难勾引起人观影的欲望, 这也是我最看重的,推荐电影要同时提供为什么会引起兴趣的原因,我考虑的角度是一个页面只有一部电影推荐,另外加入你喜欢的电影人和导演还有豆瓣上有用的短评。未来会添上“在线观看”的快捷键按钮这更能促使你选择电影。