dc.contributor.advisor | Beránek, Ladislav | |
dc.contributor.author | Chvostová, Petra | |
dc.date.accessioned | 2025-03-06T08:43:44Z | |
dc.date.available | 2025-03-06T08:43:44Z | |
dc.date.issued | 2022 | |
dc.date.submitted | 2022-09-23 | |
dc.identifier.uri | https://dspace.jcu.cz/handle/20.500.14390/46358 | |
dc.description.abstract | Tato diplomová práce se zabývá takzvaným web scrapingem, specificky ukazuje možnou cestu, jak extrahovat data produktů z webu a webových stránek na zvoleném příkladu.
Teoretická část se věnuje popisu webu a jeho zdrojového kódu. Aby bylo možné stahovat data, je nejdříve potřeba těmto informacím rozumět. Dále je představeno prostředí jazyka R a některé metody, které jsou následně využity v praktické části při extrakci webu.
Praktická část obsahuje postupy (analýzu a návrh) pro tvorbu nástroje využívaného ke stažení. Z konkrétního e-shopu jsou stažena data, u kterých je zkontrolována jejich úspěšnost extrahování. Poslední část je věnována porovnání funkčnosti vytvořeného nástroje na jiném e-shopu. | cze |
dc.format | 79 s. | |
dc.format | 79 s. | |
dc.language.iso | cze | |
dc.publisher | Jihočeská univerzita | cze |
dc.rights | Bez omezení | |
dc.subject | web scraping | cze |
dc.subject | extrakce | cze |
dc.subject | RSelenium | cze |
dc.subject | dynamický web | cze |
dc.subject | atributy produktu | cze |
dc.subject | Web scraping | eng |
dc.subject | extraction | eng |
dc.subject | RSelenium | eng |
dc.subject | dynamic website | eng |
dc.subject | product attributes | eng |
dc.title | Návrh aplikace pro automatizovanou extrakci atributů produktů webů | cze |
dc.title.alternative | Design of application for automated extraction of products attributes from Web sites | eng |
dc.type | diplomová práce | cze |
dc.identifier.stag | 57496 | |
dc.description.abstract-translated | This thesis deals with the so-called web scraping, specifically showing a possible way to extract product data from the web and web pages on a chosen example.
The theoretical part is devoted to the description of the website and its source code. In order to download data, you first need to understand these information. Next, the R language environment and some methods, which are subsequently used in the practical part during web extraction, are introduced.
The practical part contains procedures (analysis and design) for the creation of the tool used for scraping. Data is downloaded from a specific e-shop, and its extraction success is checked. The last part is dedicated to comparing the functionality of the created tool on another e-shop. | eng |
dc.date.accepted | 2022-10-11 | |
dc.description.department | Ekonomická fakulta | cze |
dc.thesis.degree-discipline | Ekonomická informatika | cze |
dc.thesis.degree-grantor | Jihočeská univerzita. Ekonomická fakulta | cze |
dc.thesis.degree-name | Ing. | |
dc.thesis.degree-program | Systémové inženýrství a informatika | cze |
dc.description.grade | Dokončená práce s úspěšnou obhajobou | cze |