Mitarbeit willkommen! Bitte schau unter Hilfe:Benutzerkonto oder informiere Dich über Populus.Wiki.

Populus:DezInV: Unterschied zwischen den Versionen

Aus Populus DE
Zur Navigation springenZur Suche springen
Zeile 1: Zeile 1:
  +
DezInV is a project to create, search and share a decentralized index and web archive of a focused set of internet sites.
DezInV steht für "dezentrale Indexverwaltung" (siehe [[Populus:DezInV/Name]]).
 
 
DezInV ist ein Projekt zum Betreiben von dezentralen Suchmaschinen und Internetarchiven.
 
   
 
__TOC__
 
__TOC__
   
Seiten unterhalb dieser Ebene: {{Special:Prefixindex/DezInV/|namespace=4|stripprefix=1}}
+
Pages in this area: {{Special:Prefixindex/DezInV/|namespace=4|stripprefix=1}}
   
 
== Vision ==
 
== Vision ==
   
  +
T. wants to retrieve an article they read some time ago. Their DezInV-Instance indexes websites they regularly read and their outlinks. So the article was quickly found again.
T. will einen Artikel wiederfinden, den er vor zwei Jahren gelesen hat. T. betreibt eine DezInV-Instanz, die alle Webseiten indiziert, die er regelmäßig ließt, sowie verlinkte Seiten. Dort kann er de gesuchten Artikel schnell wiederfinden.
 
   
  +
T. wants to read an article found in DezInV but which meanwhile has been censored. The article can however still be recovered from DezInV's archive.
T. will auf ein Suchergebnis aus seiner DezInV-Instanz zugreifen. In der Zwischenzeit wurde die Webseite allerdings zensiert. T. kann die Webseite aber noch im Archiv seiner DezInV-Instanz finden.
 
   
  +
T.'s DezInV-instance is paired with a couple of other instances from trusted peers. Thus T. can actually search through a considerably large corpus of sites.
T. hat seine DezInV-Instanz mit den Instanzen von ein paar Freunden verbunden. Er kann sich nun aussuchen, ob er nur Suchergebnisse seiner eigenen Instanz oder auch von anderen Instanzen sehen möchte.
 
   
=== Anforderungen ===
+
=== requirements ===
   
  +
* DezInV creates and updates a search index over a few hundred domains with around 100000 pages per domain.
* DezInV verwaltet einen Index über wenige hundert Domains vorrangig von Nachrichtenportalen.
 
  +
* DezInV archives crawled pages for later display.
* DezInV verwaltet ein Archiv der indizierten Webseiten, so dass Seiten aus dem Archiv jederzeit wieder angezeigt werden können.
 
* DezInV kann seinen Index und sein Archiv mit anderen Instanzen teilen.
+
* DezInV can peer with other instances to mutually share index and archive.
   
  +
out of scope:
Keine Anforderungen sind:
 
   
  +
* JavaScript execution - it is expected that pages contain their interesting content in plain HTML
* Es wird davon ausgegangen, dass kein JavaScript ausgeführt werden muss, um Webseiten zu indizieren oder aus dem Archiv wieder herzustellen.
 
  +
* reputation is mainly relying on the fact that domains have been manually provided. Thus reputation can rely on distance from manually added domains .
* Reputation basiert vorrangig darauf, dass Domains manuell zur Indizierung vorgesehen wurden oder höchstens 2-3 Weblinks von solchen Domains entfernt sind.
 

Version vom 7. Dezember 2023, 08:14 Uhr

DezInV is a project to create, search and share a decentralized index and web archive of a focused set of internet sites.

Pages in this area:

Vision

T. wants to retrieve an article they read some time ago. Their DezInV-Instance indexes websites they regularly read and their outlinks. So the article was quickly found again.

T. wants to read an article found in DezInV but which meanwhile has been censored. The article can however still be recovered from DezInV's archive.

T.'s DezInV-instance is paired with a couple of other instances from trusted peers. Thus T. can actually search through a considerably large corpus of sites.

requirements

  • DezInV creates and updates a search index over a few hundred domains with around 100000 pages per domain.
  • DezInV archives crawled pages for later display.
  • DezInV can peer with other instances to mutually share index and archive.

out of scope:

  • JavaScript execution - it is expected that pages contain their interesting content in plain HTML
  • reputation is mainly relying on the fact that domains have been manually provided. Thus reputation can rely on distance from manually added domains .