¿Cómo captura Python el texto de DIV en una página web?
Determine el destino de descarga, busque la página web y busque el contenido requerido en la página web. Datos de proceso. Guarde los datos.
2. Descripción de los puntos de conocimiento:
1) Determine la información necesaria en la red, abra la página web y use F12 para abrir el modo de desarrollador.
Puedes ver mucha información en Internet. Toda la información de texto que vemos en la página se guarda en un archivo html. Haga clic en el archivo para ver la respuesta, con información de texto incluida en la respuesta.
Para ingresar la información, puede usar Ctrl F para buscar. Vea qué campos específicos se incluyen antes y después de la información.
Para extraer el hipervínculo, puede hacer clic en el hipervínculo con la flecha situada más a la izquierda. En este momento, Elements abrirá la información con un hipervínculo y determinará la información que se extraerá. Desde la perspectiva de descargar novelas, extraiga el enlace y el nombre del capítulo de la novela de la página del directorio.
2) Preste atención al formato de codificación
El juego de caracteres de entrada debe estar configurado en utf-8. La mayoría de las páginas están en el juego de caracteres GBK. Si no se establece, el código será confuso.