『壹』 为啥豆瓣高分电影里几乎全是剧情或文艺片
豆瓣电影TOP250中,前25,22部都有剧情的标签,我相信往后看也可以说是几乎,而剧情片的网络是这样的:
剧情片(Feature film),是其中一种片种。剧情片一般长度在30分钟或以上,以电影院作为发放对像。相对于其他片种如动作片或爱情片以动作或爱情带动故事的推进,剧情片主要以故事的剧情变化或角色性格的发展带动整套电影的进行。
剧情片 (FEATURE FILM)
剧情片=故事片英文均为feature film
剧情片是指电影的卖点主要是其剧情,而不同于动作片的精彩打斗,场面的宏大,爱情片的缠绵,喜剧片的搞笑。
剧情片的节奏往往比较的慢,但是情节相对紧凑,往往是一种社会现象和一定人群的生活状态的写照,容易使观看者产生情感上的共鸣。
这样的分类,不外乎了
『贰』 Python爬虫实战(1)requests爬取豆瓣电影TOP250
爬取时间:2020/11/25
系统环境:Windows 10
所用工具:Jupyter NotebookPython 3.0
涉及的库:requestslxmlpandasmatplotlib
umpy
蛋肥想法: 先将电影名称、原名、评分、评价人数、分类信息从网站上爬取下来。
蛋肥想法: print数据列表后发现电影原名、分类信息等存在不需要的字符,需预先处理;同时因为后续想做一个豆瓣电影TOP250的维度分布图,而同一电影存在多个发行国家、类型(如“法国 美国 / 剧情 动作 犯罪”),为了简(偷)便(懒),这里均取第一个作为记入的数据;最后将数据保存为xlsx。
蛋肥想法: 蛋肥想知道在豆瓣电影TOP250中年份、国家、类型的维度数据,为了练手,使用刚才保存成xlsx的数据,并分别画成雷达图、柱形图、扇形图。