KI-Traffic und sinkende Nutzer: Wikipedia stellt neue Regeln auf

2 months ago 3

Künstliche Intelligenz und Wikipedia haben eine komplizierte Beziehung. Einerseits sind die riesigen Datenmengen der Online-Enzyklopädie eine wichtige Ressource für das Training von Sprachmodellen. Andererseits sorgt genau diese Nutzung nun bei der Betreiberstiftung für handfeste Probleme, die das Ökosystem von Wikipedia bedrohen. Die Wikimedia Foundation, die Organisation hinter dem Projekt, hat in einem Blog-Beitrag dargelegt, wie sie sich die Zukunft dieser Beziehung vorstellt.

Wie die Stiftung berichtet, sind die „menschlichen Seitenaufrufe“ im Jahresvergleich um 8 Prozent gesunken. Gleichzeitig verzeichnete man im Mai und Juni einen ungewöhnlich hohen Traffic, der die Server stark belastete. Nach einer Aktualisierung der Bot-Erkennungssysteme fand man dann auch schnell die Ursache: Ein Großteil dieses Traffics stammte von KI-Bots, die versuchten, ihre Herkunft zu verschleiern und die Inhalte im großen Stil abzugreifen – sogenanntes Scraping eben.

Als Reaktion darauf hat die Foundation nun Richtlinien für KI-Entwickler veröffentlicht. Man fordert einen „verantwortungsvollen“ Umgang mit den Inhalten:

  • Quellenangaben und Attribution: KI-Systeme, die Wikipedia-Inhalte nutzen, sollen dies klar kenntlich machen. Plattformen sollen deutlich machen, woher die Informationen stammen.
  • Nutzung der Enterprise-Plattform: Für die Nutzung von Inhalten im großen Maßstab, wie es beim Training von KI-Modellen üblich ist, verweist die Stiftung auf ihr bezahlpflichtiges Angebot „Wikimedia Enterprise“.

Bei Wikimedia Enterprise handelt es sich um ein Opt-in-Produkt, das speziell für Unternehmen konzipiert wurde, die Wikipedia-Inhalte im großen Umfang benötigen. Technisch stellt das dortige Angebot die Daten effizient und skalierbar bereit, ohne die Server der öffentlichen Webseite zu überlasten, wie es beim Scraping der Fall ist. Finanziell unterstützen die Einnahmen aus diesem Produkt direkt die gemeinnützige Mission der Organisation. Explizite rechtliche Schritte oder Strafen für das anhaltende Scraping wurden bislang nicht angedroht.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

Read Entire Article