Effiziente HTML-Bereinigung für LLMs
WebShift ist eine Rust-Bibliothek und ein MCP-Server, der dazu dient, unübersichtliche Webseiten in klaren, strukturierten Text für die Verarbeitung durch große Sprachmodelle (LLMs) umzuwandeln. Es entfernt störende Elemente wie Skripte, Werbung und Navigation, sodass nur relevante Inhalte übrig bleiben. Die Software erlaubt die Anpassung an verschiedene Anwendungsfälle, darunter HTML-Denoiser, Text-Umformulierung und Webinhaltsabfrage. Nutzer können je nach Bedarf verschiedene Funktionen aktivieren, um die Leistung zu optimieren.





