Tools to Work with the 'Splash' JavaScript Rendering Service in R
Du kannst nicht mehr als 25 Themen auswählen Themen müssen entweder mit einem Buchstaben oder einer Ziffer beginnen. Sie können Bindestriche („-“) enthalten und bis zu 35 Zeichen lang sein.

83 Zeilen
3.2 KiB

vor 7 Jahren
% Generated by roxygen2: do not edit by hand
vor 5 Jahren
% Please edit documentation in R/render-html.R
vor 7 Jahren
\name{render_html}
\alias{render_html}
\title{Return the HTML of the javascript-rendered page.}
\usage{
render_html(splash_obj = splash_local, url, base_url, timeout = 30,
resource_timeout, wait = 0, proxy, js, js_src, filters,
allowed_domains, allowed_content_types, forbidden_content_types,
viewport = "1024x768", images, headers, body, http_method, save_args,
load_args, raw_html = FALSE)
vor 7 Jahren
}
\arguments{
\item{splash_obj}{Object created by a call to \code{\link[=splash]{splash()}}}
vor 7 Jahren
\item{url}{The URL to render (required)}
vor 7 Jahren
\item{base_url}{The base url to render the page with.}
vor 7 Jahren
vor 7 Jahren
\item{timeout}{A timeout (in seconds) for the render (defaults to 30). Without
reconfiguring the startup parameters of the Splash server (not this package)
the maximum allowed value for the timeout is 60 seconds.}
vor 7 Jahren
\item{resource_timeout}{A timeout (in seconds) for individual network requests.}
\item{wait}{Time (in seconds) to wait for updates after page is loaded (defaults to 0).}
vor 7 Jahren
\item{proxy}{Proxy profile name or proxy URL.}
vor 7 Jahren
vor 7 Jahren
\item{js}{Javascript profile name.}
vor 7 Jahren
vor 7 Jahren
\item{js_src}{JavaScript code to be executed in page context.}
vor 7 Jahren
vor 7 Jahren
\item{filters}{Comma-separated list of request filter names.}
vor 7 Jahren
vor 7 Jahren
\item{allowed_domains}{Comma-separated list of allowed domain names. If present, Splash
won’t load anything neither from domains not in this list nor from subdomains of
domains not in this list.}
vor 7 Jahren
vor 7 Jahren
\item{allowed_content_types}{Comma-separated list of allowed content types. If present,
Splash will abort any request if the response’s content type doesn’t match any of
the content types in this list. Wildcards are supported.}
vor 7 Jahren
vor 7 Jahren
\item{forbidden_content_types}{Comma-separated list of forbidden content types. If
present, Splash will abort any request if the response’s content type matches
any of the content types in this list. Wildcards are supported.}
vor 7 Jahren
vor 7 Jahren
\item{viewport}{View width and height (in pixels) of the browser viewport to render the
web page. Format is “<width>x<height>”, e.g. 800x600. Default value is "full".}
vor 7 Jahren
vor 7 Jahren
\item{images}{Whether to download images.}
vor 7 Jahren
vor 7 Jahren
\item{headers}{HTTP headers to set for the first outgoing request.}
vor 7 Jahren
vor 7 Jahren
\item{body}{Body of HTTP POST request to be sent if method is POST.}
vor 7 Jahren
vor 7 Jahren
\item{http_method}{HTTP method of outgoing Splash request.}
vor 7 Jahren
vor 7 Jahren
\item{save_args}{A list of argument names to put in cache.}
vor 7 Jahren
vor 7 Jahren
\item{load_args}{Parameter values to load from cache}
\item{raw_html}{if \code{TRUE} then return a character vector vs an XML document. Only valid for \code{render_html}}
}
\value{
An XML document. Note that this is processed by \code{\link[xml2:read_html]{xml2::read_html()}} so it will not be
vor 7 Jahren
the pristine, raw, rendered HTML from the site. Use \code{raw_html=TRUE} if you do not want it
to be processed first by \code{xml2}. If you choose \code{raw_html=TRUE} you'll get back a
vor 7 Jahren
character vector.
vor 7 Jahren
}
\description{
Similar (i.e. a dynamic equivalent) to \code{rvest::read_html}.
vor 7 Jahren
}
vor 7 Jahren
\references{
\href{http://splash.readthedocs.io/en/stable/index.html}{Splash docs}
}
vor 7 Jahren
\seealso{
Other splash_renderers: \code{\link{execute_lua}},
\code{\link{render_har}}, \code{\link{render_jpeg}},
\code{\link{render_json}}, \code{\link{render_png}}
vor 7 Jahren
}
vor 6 Jahren
\concept{splash_renderers}