Follower

Mittwoch, 31. Januar 2018

Geschichtsforscher werten Archive mit maschinellem Lernen aus

Immer mehr staatliche Archive werden online gestellt – und das stellt Geschichtswissenschaftler vor die Frage, wie sie am besten auszuwerten sind. Ein Forscherteam an der New Yorker Columbia University hat nun neue statistische Verfahren entwickelt, berichtet Technology Review in seiner Online-Ausgabe ("Data Mining nach historischen Ereignissen").

Möglich wurde die Arbeit auch dadurch, dass das amerikanische Außenministerium Verschlusssachen schon seit 1973 elektronisch speichert. Viele dieser Materialien aus den Jahren 1973 bis 1977 sind mittlerweile öffentlich zugänglich und bestehen aus 1,4 Millionen freigegebenen Drahtnachrichten (diplomatic cables), die von Botschaften aus aller Welt stammen. Zudem stehen Metadaten von 400.000 Dokumenten bereit, die per US-Diplomatengepäck verschickt wurden.

Diese elektronischen Daten sind alle mit Stichwörtern (Tags) versehen, die zu ihrem Thema passen. So werden etwa Nachrichten zum Thema Südvietnam mit "VS" bezeichnet, zur UN-Hauptversammlung zugehörige Informationen mit "UNGA" und solche zu Finnland mit "FI". ... [mehr] https://heise.de/-3940801

Keine Kommentare: