in

¿Cómo organizar datos extraídos de la web en una tabla usando R?

A continuación se muestra el código utilizado para extraer datos sobre películas de IMDB. Estoy luchando para organizarlo en una tabla

Código original:

biblioteca (netstat)

biblioteca (RSelenium)

biblioteca (tidyverse)

obj<-rsDriver(browser="chrome",chromever="101.0.4951.15",verbose=F,port=free_port())

remDr<-obj$cliente

remDr$navegar(‘https://www.imdb.com/search/title/?year=2022&title_type=feature&’)

Título<-remDr$findElements(using='css','.lister-item-header a')

lapply(Título,función(x) { x$getElementText()%>% unlist() })

o/p:

[1]

1 «Doctor Extraño en el Multiverso de la Locura»

[[2]]1 «Último año»

.

.

.

Mis intentos de organizar los datos en forma tabular-

  1. películas=datos.fotograma(Título,cadenasAsFactors=FALSO)

    ver (películas)

    Error en as.data.frame.default(x[[i]]opcional = VERDADERO): no se puede forzar la clase ‘estructura («webElement», paquete = «RSelenium»)’ a un data.frame

  2. películas=data.frame(x,stringsAsFactors=FALSO)

    ver (películas)

    Error en data.frame (X, stringsAsFactors = FALSE): objeto ‘X’ no encontrado

  3. Parte del código original modificado-

    lapply(Título,función(x) {
    t<-lista(x$getElementText()%>% deslistar())
    })

    l=datos.frame(«película»=t,stringsAsFactors = FALSO)

    ver (l)

    Error en as.data.frame.default(x[[i]]opcional = VERDADERO): no se puede obligar a la clase ‘»función»‘ a un data.frame

Salida deseada-

Salida deseada

0

¿Te ayudó la respuesta?

Subscribirse
Notificar por
guest
0 Comentarios
Inline Feedbacks
Ver todas las Respuestas

Alojamiento automatizado de Firebase a través de un error de Github

¿Qué sería una prueba de razón de verosimilitud basada en modelos de regresión logística multinomial anidados para pruebas de distribuciones categóricas de una muestra?