Sitio web de resúmenes de películas - E-sports - Solicitudes de práctica del rastreador de Python (1) para rastrear las 250 películas TOP de Douban

Solicitudes de práctica del rastreador de Python (1) para rastrear las 250 películas TOP de Douban

Tiempo de rastreo: 25/11/2020

Entorno del sistema: Windows 10

Herramientas utilizadas: Jupyter Notebook\Python 3.0

Involucradas bibliotecas: request\lxml\pandas\matplotlib\numpy

Idea de grasa de huevo: primero, rastree el nombre de la película, el nombre original, la calificación, el número de revisores y la información de clasificación del sitio web.

Idea de Danfei: después de imprimir la lista de datos, descubrí que hay caracteres innecesarios en el nombre original de la película, información de clasificación, etc., que deben procesarse con anticipación; porque quiero hacer un mapa de distribución dimensional de las 250 películas TOP de Douban, y la misma película existe. Hay varios países y géneros de publicación (como "Francia y Estados Unidos/Crimen de acción dramática) en aras de la simplicidad (robo"). ) y conveniencia (pereza), el primero se usa como datos grabados y finalmente los datos se guardan como xlsx.

Idea de Danfei: Danfei quiere conocer los datos dimensionales de año, país y género en las 250 películas TOP de Douban. Para practicar, use los datos que acaba de guardar como xlsx y dibújelos en un gráfico de radar. y un gráfico de columnas respectivamente, gráfico de abanico.