Freiwilliger englischsprachiger Zusatzkurs "Web-Scraping" im SoSe25 [31.03.25]
Du interessierst sich dafür, wie man aus dem Internet automatisiert Daten erhebt? Dann klicke auf...Liebe Studierende,
im Rahmen des Artificial Intelligence and Data Science Certificate Hohenheim (AIDAHO)-Programms biete ich im SoSe 25 einen englischsprachigen Kurs zum Thema "Web-Scraping“ an. Dieser Kurs bietet eine Einführung in das Thema an, im Kurs arbeiten wir mit der Software R. Zu Beginn des Kurses gibt es für diejenigen, die R noch nicht kennen, eine Kurzeinführung.
Falls SIE INTERESSIERT SIND am Thema „Web-Scraping“, lade ich Sie herzlich zur freiwilligen Teilnahme ein. Auch wenn Sie nicht am AIDAHO-Programm teilnehmen, wird Ihnen die Teilnahme am Modul von mir bescheinigt. Eine Anerkennung des Moduls im normalen Studienprogramm ist leider nicht möglich.
Location: PC-Raum 3
Tag: Donnerstag
Uhrzeit: 14:15-15:45 Uhr
Sie können sich ohne Passwort im ILIAS-Kurs des Moduls „Web-Scraping“ registrieren:
ilias.uni-hohenheim.de/goto.php/crs/1703330
Für Rückfragen stehe ich gerne zur Verfügung.
Beste Grüße
Jens Vogelgesang
P.S.
## Module Description
Hop on the data scraping adventure! This hands-on course is all about the nitty-gritty of using data science in real life, exploring the goldmine of data hidden on the internet and digital platforms. We're basically swimming in data that can answer old and brand-new questions. The tricky part? A lot of this data is kind of a hot mess or just barely put together. Take website content, like press releases, as an example. To analyze this, you need to get under the hood of the website’s HTML code to find and extract the information you need. The same goes for PDFs, like annual reports, which might require a bit of optical character recognition magic (OCR) to turn images of text into actual data you can work with. Then there’s the world of semi-structured data, served up through application programming interfaces (APIs). These APIs, like Spotify's Web API for fetching track features offer a more organized way to access data for analysis. If you are more interested in time series data, APIs also gain access to databases for stock market trends or biological process. Once we've scraped or pulled down the data, we're going to roll up our sleeves and get into statistical text analysis and number-crunching with stats to get to the bottom of our project questions.
## Target Audience of the Seminar
This course is a part of the AIDAHO study program but it’s wide open to Bachelor's and Master’s students from all disciplines. We’ll be using R/RStudio and specific R libraries to unearth data from the web, PDFs, and APIs. If you’ve got experience with R/RStudio, great! If not, don’t sweat it – your curiosity and willing-ness to learn are what count most.