Návrh aplikace pro automatizovanou extrakci atributů produktů webů

Chvostová, Petra

dc.contributor.advisor	Beránek, Ladislav
dc.contributor.author	Chvostová, Petra
dc.date.accessioned	2025-03-06T08:43:44Z
dc.date.available	2025-03-06T08:43:44Z
dc.date.issued	2022
dc.date.submitted	2022-09-23
dc.identifier.uri	https://dspace.jcu.cz/handle/20.500.14390/46358
dc.description.abstract	Tato diplomová práce se zabývá takzvaným web scrapingem, specificky ukazuje možnou cestu, jak extrahovat data produktů z webu a webových stránek na zvoleném příkladu. Teoretická část se věnuje popisu webu a jeho zdrojového kódu. Aby bylo možné stahovat data, je nejdříve potřeba těmto informacím rozumět. Dále je představeno prostředí jazyka R a některé metody, které jsou následně využity v praktické části při extrakci webu. Praktická část obsahuje postupy (analýzu a návrh) pro tvorbu nástroje využívaného ke stažení. Z konkrétního e-shopu jsou stažena data, u kterých je zkontrolována jejich úspěšnost extrahování. Poslední část je věnována porovnání funkčnosti vytvořeného nástroje na jiném e-shopu.	cze
dc.format	79 s.
dc.format	79 s.
dc.language.iso	cze
dc.publisher	Jihočeská univerzita	cze
dc.rights	Bez omezení
dc.subject	web scraping	cze
dc.subject	extrakce	cze
dc.subject	RSelenium	cze
dc.subject	dynamický web	cze
dc.subject	atributy produktu	cze
dc.subject	Web scraping	eng
dc.subject	extraction	eng
dc.subject	RSelenium	eng
dc.subject	dynamic website	eng
dc.subject	product attributes	eng
dc.title	Návrh aplikace pro automatizovanou extrakci atributů produktů webů	cze
dc.title.alternative	Design of application for automated extraction of products attributes from Web sites	eng
dc.type	diplomová práce	cze
dc.identifier.stag	57496
dc.description.abstract-translated	This thesis deals with the so-called web scraping, specifically showing a possible way to extract product data from the web and web pages on a chosen example. The theoretical part is devoted to the description of the website and its source code. In order to download data, you first need to understand these information. Next, the R language environment and some methods, which are subsequently used in the practical part during web extraction, are introduced. The practical part contains procedures (analysis and design) for the creation of the tool used for scraping. Data is downloaded from a specific e-shop, and its extraction success is checked. The last part is dedicated to comparing the functionality of the created tool on another e-shop.	eng
dc.date.accepted	2022-10-11
dc.description.department	Ekonomická fakulta	cze
dc.thesis.degree-discipline	Ekonomická informatika	cze
dc.thesis.degree-grantor	Jihočeská univerzita. Ekonomická fakulta	cze
dc.thesis.degree-name	Ing.
dc.thesis.degree-program	Systémové inženýrství a informatika	cze
dc.description.grade	Dokončená práce s úspěšnou obhajobou	cze

Soubory tohoto záznamu

Název:: DP_ChvostovaPetra.pdf
Velikost:: 2.514Mb
Formát:: PDF
Popis:: Plný text práce

Zobrazit/otevřít

Název:: CHVOSTOVA-Petra-DP-ved.pdf
Velikost:: 17.40Kb
Formát:: PDF
Popis:: Posudek vedoucího práce

Zobrazit/otevřít

Název:: CHVOSTOVA-Petra-DP-op.pdf
Velikost:: 17.40Kb
Formát:: PDF
Popis:: Posudek oponenta práce

Zobrazit/otevřít

Název:: E18348.pdf
Velikost:: 300.9Kb
Formát:: PDF
Popis:: Průběh obhajoby práce

Zobrazit/otevřít

Tento záznam se objevuje v

Ekonomická fakulta

Zobrazit minimální záznam