Informationsextraktion von Webseiten via RoadRunner Informationsextraktion von Webseiten via RoadRunner

Informationsextraktion von Webseiten via RoadRunner

    • € 13,99
    • € 13,99

Beschrijving uitgever

Das Web hat sich in den letzten Jahren zum größten existierenden und frei verfügbaren Daten- und Informationsbestand entwickelt.
Im Netz, wo es ein absoluter Datenüberfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach benötigten Informationen wird durch unzählige Dokumente gestöbert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. Während die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert können, bleibt ein sehr großer Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zurückgeführt. Die gesuchten Informationen sind nicht mehr statisch verfügbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt.
In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden können. Im nächsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.

GENRE
Professioneel en technisch
UITGEGEVEN
2009
9 december
TAAL
DE
Duits
LENGTE
15
Pagina's
UITGEVER
GRIN Verlag
GROOTTE
2,1
MB

Meer boeken van Pawel Broda

Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung
2011
Wortbildungslehre nach Erben und Naumann - ein kontrastiver Vergleich Wortbildungslehre nach Erben und Naumann - ein kontrastiver Vergleich
2005
Die Domänen des Sprachgebrauchs am Beispiel Südtirols Die Domänen des Sprachgebrauchs am Beispiel Südtirols
2012
Das Gerundium und seine Umsetzung ins Deutsche Das Gerundium und seine Umsetzung ins Deutsche
2012