Solicitudes de práctica del rastreador de Python (1) para rastrear las 250 películas TOP de Douban
Tiempo de rastreo: 25/11/2020
Entorno del sistema: Windows 10
Herramientas utilizadas: Jupyter Notebook\Python 3.0
Involucradas bibliotecas: request\lxml\pandas\matplotlib\numpy
Idea de grasa de huevo: primero, rastree el nombre de la película, el nombre original, la calificación, el número de revisores y la información de clasificación del sitio web.
Idea de Danfei: después de imprimir la lista de datos, descubrí que hay caracteres innecesarios en el nombre original de la película, información de clasificación, etc., que deben procesarse con anticipación; porque quiero hacer un mapa de distribución dimensional de las 250 películas TOP de Douban, y la misma película existe. Hay varios países y géneros de publicación (como "Francia y Estados Unidos/Crimen de acción dramática) en aras de la simplicidad (robo"). ) y conveniencia (pereza), el primero se usa como datos grabados y finalmente los datos se guardan como xlsx.
Idea de Danfei: Danfei quiere conocer los datos dimensionales de año, país y género en las 250 películas TOP de Douban. Para practicar, use los datos que acaba de guardar como xlsx y dibújelos en un gráfico de radar. y un gráfico de columnas respectivamente, gráfico de abanico.