Ich vermute es geht um das inhaltliche Auffinden von Dokumenten.
Horland FoundX würde genau das erledigen ohne ein einziges PDF verändern zu müssen.
FoundX durchsucht ganze Verzeichnisse nach PDFs und erzeugt über OCR einen extrem schnellen Index über den Dokumenteninhalt.
https://www.horland.de/foundx.html